当前位置:资讯 > 正文

AI大潮之下,我们需要什么样的数智底座?

2024-04-16 14:38:00  来源:今日热点网

在AI大潮的推动下,基础设施市场正在复苏。戴尔科技近期发布了截止于2月3日的2024财年第四季度财报,第四财季营收为 93 亿美元,环比增长 10%。戴尔科技业绩回升主要得益于AI优化的服务器业务的增长,本季度AI服务器订单增长了40%,积压订单近乎翻倍达到29亿美元,而前一季度仅为16亿美元。

戴尔科技的AI服务器业务增长是整个基础设施市场最新变化的一个缩影。去年以来企业对人工智能应用的热情不断高涨,ChatGPT、Sora的先后爆火更是为人工智能热火上加油,带动了对AI基础设施的强劲需求。为了满足这些需求,以戴尔科技为代表的基础设施厂商推出了不少创新的产品和技术来帮助企业拥抱AI。

AI应用普及推动基础设施升级

在过去的几年里,AI应用场景越来越丰富,智能化水平不断提升。一个明显的变化是,从过去集中在以图像识别、视频分析为主的感知智能逐渐扩展到以ChatGPT为代表的认知智能,文档检索、文档生成成为了新的主流应用场景,同时,以Sora为代表的多模态AI技术也开始方兴未艾。

蓬勃发展的生成式AI应用背后离不开底层基础设施的支持。以大模型的训练和推理为例。大模型的参数量已经从数十亿增加到几百亿、几万亿甚至更高,更大的模型带来了更大的AI算力需求。有数据显示,AI所消耗的算力平均每3~4个月就会增长一倍,而这部分增长的算力需求大部分将被GPU承担,这直接带动了异构计算的普及。

另一方面,计算规模越来越大,越来越多地通过集群来承载,万卡、十万卡GPU规模的数据中心也不鲜见。与计算规模扩大同时增加的还有网络通讯需求,让高带宽、低延迟网络交换设施成为AI系统的必要组成部分。

与此同时,新兴的AI应用对存储系统的要求也被提高了。功能更强、规模更大的算法模型需要搭配数量更多、质量更高、要更加多元化的训练数据才可能达到预期效果,否则很容易因训练数据不足造成模型欠拟合,而这意味着存储系统性能更高、更稳定,同时成本更低。

市场的需求基础设施厂商都看到了,以戴尔科技为代表的很多基础设施厂商也推出了大量创新的产品和技术。

多元化AI计算平台,加速智能跃迁

众所周知,传统数据中心的典型架构是以CPU为中心,而今天在大模型训练和推理需求的推动,CPU+GPU为代表的异构计算正在成为主流,GPU成为越来越多服务器的标准配置。顺应市场的最新需求,戴尔科技推出了多款PowerEdge服务器,它们专门针对GPU计算设计和优化,能支持英特尔等不同品牌的GPU加速卡,可满足不同应用场景的需求。

“围绕AI 应用的GPU加速,戴尔科技能提供像GPU池化、GPU分布式训练、GPU集群管理和资源调度、边缘AI计算等GPU加速计算解决方案。”戴尔科技集团信息基础架构解决方案事业部企业技术架构师、全球CTO大使吴跃表示。

他介绍,PowerEdge 服务器设计中有很多针对GPU的专门设计。比如,多矢量散热技术的应用可以保证均匀冷却服务器各部件;电源增强设计(即瞬时功率)可以达到电源标称功率的1.4到1.7倍,以应对GPU开机过程中的启动风暴。这些设计都是为了确保GPU在服务器内达到最佳运行状态。

在AI的公开基准测试中戴尔科技PowerEdge表现优异。MLPerf是当前AI领域关注度和参与度最高的计算性能基准测试,在去年9月份发布的MLPerf Inference V3.1的推理基准测试中,共有26个厂商提交了超过13500条的测试记录。在20个数据中心项目赛道中戴尔科技取得了7个项目的第一名,另外4个项目的第二名。在所有参与评测的GPU服务器产品中取得最好的综合成绩。

除了多款GPU服务器外,戴尔科技推出的搭载英特尔Xeon Max处理器的PowerEdge服务器也值得一提。目前戴尔科技有三款服务器可以支持Xeon Max处理器,包括2U 两路的计算平台PowerEdge R760、1U 两路的计算平台PowerEdge R660以及2U 4节点PowerEdge C6620。

Xeon Max处理器是英特尔推出的业内首款集成HBM的x86 CPU,其中集成了64GB的HBM,内存带宽可达到1TB/s,无需GPU加速卡就可实现内存带宽密集型应用的加速,如模型推理与模型微调等。

相关测试表明,单个Xeon Max处理器即可完成60亿、130亿规模的大语言模型的加载和应用;对于对话式AI的场景,会话首个token生成延迟小于3秒钟,下一个token生成延迟小于100毫秒。而且,由于所有主流AI框架与加速库都支持x86计算,在CPU上运行AI模型可以减少代码改动量,大大简化了AI应用的开发和部署。

吴跃介绍,为了持续引领AI基础设施技术创新,加速AI应用的落地,戴尔科技还成立了AI HPC创新实验室,专门从事AI计算、并行计算的前沿技术研究、效能的基准测试等相关工作。超级计算机Ratter就是戴尔科技AI&HPC创新实验室打造的GPU超算集群。戴尔科技很多AI以及使用GPU加速的HPC解决方案(如CAE、分子动力学、生命科学等)也是在Ratter集群上首先进行测试和优化的。

从边到端,让AI算力无处不在

实际上,基础设施相关的技术创新不只是发生在计算领域,也发生在存储和网络领域,同时,也不只是在云端和数据中心,还发生在端侧,并正在酝酿一场从云到端、全面的升级。

比如,为了减少数据传输的延迟,戴尔科技PowerScale今年新增了Multipath Client driver(多通道客户端驱动程序),借此单个客户端就可以能实现40GB/s的峰值带宽,可为高密度的GPU算力服务器提供充沛的后端存储性能;OneFS是戴尔科技自研的文件系统,全闪PowerScale搭配OneFS 9.7文件系统,存储的流式读性能是上一代平台的两倍,流式的写性能是上一代平台的2.2倍,可以有效提高GPU在模型预训练和微调阶段的工作效率。

当然,在端侧的创新同样不少。从去年9月份英特尔推出AI PC概念以来,AI PC迅速被市场接受。IDC的预测,今年新增PC中一半以上将是AI PC;2027 年将进一步提升至 84.6%。戴尔科技也全面拥抱AI PC,今年新发布的AI工作站Precision 7960单台将支持4块双宽的GPU,最高配置4TB的内存和152TB的本地存储,为AI落地工作站提供强力支持。

谈到AI在边缘端的落地,英特尔不可不提。除了发力AI PC之外,英特尔还在其他方面持续优化CPU面向AI应用的性能,也为戴尔科技丰富自己的产品线提供更多选择。比如,英特尔从第四代至强可扩展处理器开始新增AMX加速器,无需GPU就可显著提升AI推理和训练的性能。根据英特尔的资料,AMX对于INT8精度有8倍的性能提升,对BF16精度有16倍的性能提升。而且由于AMX内置于CPU中,因而无需专门构建解决方案。

另一方面,英特尔也联手合作伙伴推出面向边缘的AI解决方案参考设计。英特尔Edge AI Box 就是其中之一,AI-BOX在搭载英特尔酷睿处理器的单一计算盒内集成了视频解码和分析功能,既可作为连接到 IP 摄像头或网络录像机 (NVR) 等视频源的独立设备,实时进行边缘视频分析,也可以连接到网络并充当网络上的独立 AI 服务,按需运行离线深度学习分析,部署非常方便。

“围绕边缘AI的落地和部署,英特尔联合戴尔科技等合作伙伴共同打造了很多基于英特尔软硬件栈的边缘AI解决方案,以支持无处不在的AI应用。”英特尔中国解决方案部AI架构师俞巍表示。

实际上,除了英特尔外,戴尔科技还与很多厂商有合作,其中与ISV合作研发面向细分领域的解决方案就是一种重要的合作方式。

当下,向量数据库+大模型的RAG(检索增加)非常热门。因为RAG既可以发挥大模型的语言生成能力,又可以借助向量数据库解决大模型的幻觉问题,被认为是一种非常有应用前景的AI落地形式。达观数据一家专注于智能文本处理技术的国家级专精特新“小巨人”企业,其智能知识管理系统在行业内拥有不少用户,现在戴尔科技就在和达观数据合作,共同探索RAG技术与智能知识管理的融合解决方案。

另外,戴尔科技推出的经过验证的各种参考设计(AI Validated Design Solution)以及配套的技术白皮书和效能的验证,其中就离不开各种合作伙伴的支持。

“随着AI技术的迭代,AI场景与AI模型规模越发复杂,对AI算力与AI训练数据的需求也会更加地旺盛,AI基础设施未来几年将会持续成为全球IT投资的热点之一。”吴跃表示,作为领先的基础设施供应商,戴尔科技会和合作伙伴一起积极拥抱AI,通过技术创新推动基础设施的升级,加入AI应用的普及。


关键词:

推荐阅读

月壤形成的主要原因 月壤与土壤有什么区别

月壤形成的主要原因月壤形成过程没有生物活动参与,没有有机质,还极度缺水干燥;组成月壤的矿物粉末基本是由陨石撞击破砰形成,因此,粉末 【详细】

域名抢注是是什么意思?投资角度来看什么域名好?

域名抢注是是什么意思域名抢注是通过抢先注册的方式获得互联网删除的域名的使用权。域名是由点分隔的一串数字,用于标记一台计算机或一组计 【详细】

捷达保养费用是多少?捷达是哪个国家的品牌?

捷达保养费用是多少?全新捷达的保修期为2年或6万公里,以先到者为准,新车可享受一次免费保养,首次免费保养在5000-7500km或1年内进行。如 【详细】

天然气泄露会造成爆炸吗?天然气泄漏怎么办?

天然气泄露会造成爆炸吗?家里用的天然气如果泄露是会发生爆炸的。当空气中含有混合天然气时,在与火源接触的一系列爆炸危险中,就会发生爆 【详细】

四部门明确App收集个人信息范围 个人信息保护范围判断标准

四部门明确App收集个人信息范围近日,国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合印发《常见类型移动互联网 【详细】

相关新闻

AI大潮之下,我们需要什么样的数智底座?

在AI大潮的推动下,基础设施市场正在复苏。戴尔科技近期发布了截止 【详细】

智能引领发展 信息链接未来 2024新材料行业数字化转型峰会成功举办

4月12日,由中国软件行业协会信息主管(CIO)分会、多氟多新材料股 【详细】

2024德施曼全球新品发布会:三大突破性技术、多款旗舰新品重磅首发!

智能锁的AI+时代,将以何种方式“解锁”?4月11日,以“EXPLORE•未 【详细】

信仰联动!QQ飞车手游官宣ROG 8 Pro成为S联赛官方比赛用机

4月8日,ROG官方正式宣布,其旗下电竞手机ROG 8 Pro正式与《QQ飞 【详细】

聚焦新质生产力,共绘产业新蓝图,新质南翼·新极未来发展大会成功举办

4月8日,泉州南翼国家高新区(厦泉金合作发展区)南安片区“新质南 【详细】

米系高管+奇瑞技术,iCAR品牌之夜和年轻人交个朋友

4月12日,奇瑞集团“新势力”品牌iCAR将于北京开启品牌之夜活动,全新 【详细】

用重力走路

中国 四川 张辅文(下里)(个人原创,版权所有。欢迎引用或转载,请 【详细】

助力初创“小苗”长成硬科技“大树” 5亿元规模芯创二期基金设立

本报讯(记者 孙奇茹)记者昨天从中关村集成电路设计园(IC PARK 【详细】

“王者性能”不可撼动 ROG 8 Pro登顶鲁大师2024手机Q1性能榜

4月8日,鲁大师2024年手机Q1季报正式公布。在关注度颇高的手机性能 【详细】

卓翼智能解决方案与智能系统获编《2024中国低空经济行业研究报告》

3月29日,2024中国低空经济新质生产力高质量发展论坛在深圳成功举办 【详细】

“性能怪兽”再度霸榜 ROG 8 Pro拿下安兔兔3月安卓手机性能榜首

4月1日,安兔兔官方正式发布3月份安卓旗舰手机性能排行榜。搭载最新 【详细】

“道地灵芝,千年传承” ——首届灵芝产业学术研讨会在芝神堂药业召开

金寨县是中国革命的重要策源地、人民军队的重要发源地,被誉为“红 【详细】

以“智”提“质”,芒果探索AI技术全链路赋能内容生产

3月28日,第十一届中国网络视听大会在成都开幕。近年来,随着生成式 【详细】

三地同选!仰韶彩陶坊酒礼敬中华人文始祖黄帝

“三月三,拜轩辕”,每年农历三月三,新郑黄帝故里都举行隆重的拜 【详细】

用AI趣表达,三星S24的AI进阶之路

在当今科技飞速发展的时代,生成式AI不断出圈,大大提升了人们的工 【详细】

DePIN赛道热门项目Statter Network(STT)强势登陆Gate.io

据Gate io官方公告,Statter Network(STT)将于2024年3月30日12:0 【详细】

凡音优眠睡眠健康管理师认证培训正式启动

今年321世界睡眠日的主题是“健康睡眠人人共享”,而好睡眠这一 【详细】

国家金融人才(宜宾三江)中心授牌仪式成功举行

3月21日上午,国家金融人才(宜宾三江)中心暨川西南金融人才(三江 【详细】

张军院士荣获欧洲自然科学院洪堡奖章

2024年3月6日,欧洲自然科学院向国家稀土功能材料创新中心首席专家 【详细】

SUSE加强容器管理产品组合,以帮助平台工程团队规模化管理,支持AI/ML工作负载

SUSE加强容器管理产品组合,以帮助平台工程团队规模化管理,支持AI 【详细】

关于我们  |  联系方式  |  免责条款  |  招聘信息  |  广告服务  |  帮助中心

联系我们:85 572 98@qq.com备案号:粤ICP备18023326号-40

科技资讯网 版权所有