英伟达(NVDA.US)为巩固AI主导地位又添利器——“世界上最快的内存”GH200
智通财经APP获悉,英伟达(NVDA.US)发布了一款更新的人工智能(AI)处理器,以增强芯片容量和速度,进而巩固公司在这个新兴市场的主导地位。据了解,英伟达在洛杉矶举行的Siggraph大会上表示,图形芯片和处理器相结合的Grace Hopper超级芯片(下称GH200)将从一种新型内存中获益。该产品依赖于高带宽存储器3(即HBM3e),后者能够以每秒钟高达5TB的速度访问信息。英伟达表示,这款名为GH200的超级芯片将于2024年第二季度投产。
(资料图)英伟达的股价今年上涨了两倍多,估值约为1.1万亿美元,是2023年费城证券交易所半导体指数成分股中涨幅最大的公司。尽管英伟达周二下跌了约2%,但在宣布推出GH200芯片后,该公司短暂收复了失地。
GH200内存增3.5倍、带宽增三倍
英伟达CEO黄仁勋在Siggraph大会上发表主题演讲时表示,GH200是“世界上最快的内存”。他称,为了满足生成式 AI 不断增长的需求,数据中心需要有针对特殊需求的加速计算平台。新的GH200 Grace Hopper 超级芯片平台提供了卓越的内存技术和带宽,以此提高吞吐量,提升无损耗连接GPU聚合性能的能力,并且拥有可以在整个数据中心轻松部署的服务器设计。
黄仁勋表示,在AI时代,英伟达的技术可以替代传统数据中心,投资800 万美元的新技术可以取代用旧设备建造的1亿美元设施,而且用电量可以减少20倍。“这就是数据中心在向加速计算转变的原因。你买的越多,越省钱。”
此外,英伟达的超大规模和高性能计算主管Ian Buck介绍,GH200比英伟达基于H100 的数据中心系统配备了更多内存和带宽。它采用的英伟达的Hopper GPU,并结合基于Arm架构的英伟达Grace CPU。
相比前代平台,新GH200 Grace Hopper平台的双芯片配置将内存容量提高3.5倍,带宽增加三倍,一个服务器就有144个Arm Neoverse高性能内核、8 petaflops 的 AI 性能和282GB的最新HBM3e内存技术。
HBM3e是一种高带宽内存,带宽达每秒5TB。该内存比当前的HBM3快50%,可提供总共每秒10TB的组合带宽,使新平台能运行比前代大3.5倍的模型,同时通过快三倍的内存带宽提高性能。
工具包AI Workbench+升级版Omniverse平台 企业入门AI项目不再复杂
据悉,除了GH200之外,英伟达周二还发布了新的统一工具包AI Workbench,以及对英伟达Omniverse软件服务的重大升级。
英伟达称,AI Workbench让企业的AI项目入门不再复杂。通过在本地系统运行的简化界面进行访问,它让开发者能使用自定义数据微调Hugging Face、GitHub 和 NGC 等常用存储库中的模型,然后可以在多个平台上轻松共享模型。
借助AI Workbench,开发者只需点击几下即可自定义和运行生成式AI,而且他们能够将所有必要的企业级模型、框架、软件开发套件和库整合到一个统一的开发者工作区中。
AI Workbench为开发者提供了统一且便于使用的工具包,可在个人电脑(PC)或工作站上快速创建、测试和微调生成式AI模型,然后将其扩展到几乎任何数据中心、公共云或者英伟达的DGX云。
此外,英伟达还将生成式人工智能添加到其Ominverse产品中,这是一个旨在支持虚拟世界风格的虚拟世界的平台,该公司正利用这项技术帮助企业客户创建工厂和车辆等现实世界物品的网络版本。
据悉,升级版Omniverse平台是一个高性能3D场景描述技术OpenUSD的原生软件平台,用于跨3D工具和应用的连接、描述和模拟,能加快创建虚拟世界和工业数字化高级工作流程。Cesium、Convai、Move AI、SideFX Houdini 和 Wonder Dynamics现已通过 OpenUSD 连接到 Omniverse。
新平台的亮点包括更新开发原生OpenUSD应用及扩展的引擎——Omniverse Kit,以及英伟达Omniverse Audio2Face基础应用和空间计算功能的更新。
Omniverse 和模拟技术副总裁 Rev Lebaredian表示,更新后的Omniverse 让开发人员可以通过OpenUSD利用生成式AI强化他们的工具,并且让工业企业能构建更大、更复杂的世界级模拟,作为其工业应用的数字测试场。
为了鼓励其他人使用这项技术,英伟达认可了一种名为“通用场景描述”的标准,这一标准最初是由迪士尼公司(Walt Disney Co.)旗下的皮克斯(Pixar)开发的。这家芯片制造商已经与皮克斯、欧特克公司、奥多比公司和苹果公司结成联盟,试图加速采用该技术。
在硬件方面,英伟达发布了三款新的工作站RTX显卡。英伟达表示,RTX 5000现在的售价为4000美元,将使生成人工智能和图像渲染的速度提高一倍以上。这家芯片制造商还推出了基于L40S图形芯片的新服务器,以及使用四块RTX 6000卡的顶级工作站设计。