欢迎大家来到IT世界,在知识的湖畔探索吧!
雷刚 发自 凹非寺
量子位 报道 | 公众号 QbitAI
AI超算怎么搞?老黄祭出联谊招。
在国际超算大会上,英伟达宣布正式支持Arm CPU,为高性能计算行业开辟了一条全新途径,以构建具有极高能效水平的百万兆级AI超级计算机。
具体方面,英伟达将在年内为Arm态系统提供全堆栈的AI和HPC软件。
该堆栈为600多个HPC应用程序和所有AI框架提供加速。
其中包括了所有英伟达CUDA-X AI和HPC库、GPU加速的AI框架和软件开发工具,如支持OpenACC的PGI编译器和性能分析器。
堆栈优化完成后,英伟达将为所有主要CPU架构提供加速,包括x86、POWER和ARM。
英伟达创始人黄仁勋说,英伟达CUDA加速和ARM的高效能CPU架构结合,一定可以推动超算的大幅提升,目标是百万兆级。
据称英伟达和ARM CPU联手的超算,将率先在预测气候变化和核武器系统建模等领域展开试水。
英伟达官方还专门提到了节能,Arm CPU的开放性之外,节能也是这次联手的题中之义。
在最新发布的Green500排行榜,全球最节能的25款超级计算机中,有22款都得益于英伟达的支持。
需要说明的是,这也不是英伟达和Arm首次联手。
之前英伟达用于便携式游戏、自动驾驶汽车、机器人和嵌入式AI计算的系统级芯片产品,其实都采用了ARM。
One more thing
最后,也还是在法兰克福超算大会。
英伟达还发布了一款专为自动驾驶汽车打造的超算:DGX SuperPOD。
全球最新排名第22.
整个系统搭建只需要3星期,采用96台NVIDIA DGX-2H超级计算机与Mellanox互联技术。其处理能力高达9.4 petaflops,能够用于训练安全自动驾驶汽车所需要的海量深度神经网络。
DGX SuperPOD内含1,536颗NVIDIA V100 Tensor Core GPU。
英伟达方面称,该套系统能够不间断运行,优化自动驾驶软件,并以前所未有的周转时间(turnaround time)反复训练神经网络。
例如,DGX SuperPOD软硬件平台能够在不到2分钟的时间之内完成ResNet-50训练。
此外,具备同等性能的其他TOP500超级计算机系统都由数千台服务器构建而成,而DGX SuperPOD占地面积更少,其体积比这些同等系统小400倍左右。
— 完 —
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ’ᴗ’ ի 追踪AI技术和产品新动态
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://itzsg.com/38182.html