黄仁勋的野心:英伟达纵横AI软硬件全栈式布局
南方财经全媒体记者江月上海报道北京时间8月8日晚间,英伟达创始人兼首席执行官黄仁勋在SIGGRAPH年会上发表了主题演讲。
(资料图片仅供参考)
SIGGRAPH 由 ACM SIGGRAPH(计算机协会计算机图形图像特别兴趣小组)举办,是计算机图形学的年度顶级会议,其对于英伟达意义非凡。2018年,黄仁勋曾在此舞台上介绍了RTX系列芯片的诞生,也推动了新一代图像技术的升级。
本次演讲中,黄仁勋介绍了英伟达的最新技术突破:超级芯片GH200 Grace Hopper再次升级,用上了最新的存储技术HBM3e,预计2024年第二季交付;软件方面,英伟达则推出了OpenUSD、云上API等重磅武器,在与Adobe、苹果、Pixar、Autodesk等公司的紧密合作中不断推动人工智能和生成式AI走向下一个浪潮尖峰。
“当我们用AI重塑了GPU时,也意味着我们用GPU重塑AI。”黄仁勋称。
在8月8日举行的吹风会上,英伟达元宇宙及仿真技术副总裁Rev Lebaredian还向南方财经全媒体记者介绍称,英伟达在AI上的布局不限于硬件,而是纵横软硬件的全栈式布局。
在人工智能浪潮中,英伟达所领军的GPU市场供应量和技术将是行业发展的关键引擎,该公司年内股价也已在7个月内暴涨超过200%。
硬件功能狂飙
近期,“GPU短缺”所引发的人工智能发展危机惹人关注,促进GPU在有限产能下进行技术升级或是解决方式之一。黄仁勋在演讲中宣布,今年5月刚有第一代产品面世的超级芯片GH200 Grace Hopper在2个月内已经完成了初次升级,此次在存储技术上有了重大升级——升级至HBM3e。
黄仁勋再度提到了今年5月台北电脑展上发布的GH200系统。GH200是一款用于数据中心、被认为是当今全球性能最强的运算器产品、可以满足训练AIGC所需要的“超大规模大模型”。利用英伟达自研发命名为NVLink的连接技术,256块英伟达Grace CPU和H100 GPU进行了无缝连接。
5月公布的GH200版本芯片已经全面投产,HBM3e版本的GH200预计会在2024年二季度交付。HBM世代差异主要以速度区分,其中传输速度8Gbps的HBM3e是当前最快的一代新技术,比上一代HBM3提升50%。
升级存储速度,是提升GH200的关键步骤。尤其是在先进的芯片制造端产能短缺背景下,由英伟达进行技术升级,也是保障未来大模型训练芯片“够用”的关键。新版GH200能令单一服务器具备144 Arm Neoverse核心、8个petaflops的AI计算速度以及282GB的HBM3e存储。
此前,OpenAI联合创始人Andrej Karpathy介绍了上一代人工智能模型的硬件需求。GPT -4大约用了1万至2.5万张A100芯片,Meta大约用了2.1万张A100芯片,特斯拉大约用了7000张A100芯片,Stability AI大约用了5000张A100,Falcon-40B大约使用了384张A100芯片。还有一些市场推算指出,眼下各大公司的总AI训练芯片需求高达43万张H100,这大约相当于上一代模型训练总需求的10倍。
除了GH200这种用在大型数据中心上的芯片,个人开发者、一般公司对升级桌面型GPU产品亦有需求。英伟达所推出的新的RTX工作站,及RTX 5000、RTX 4500和RTX 4000来应对上述消费级市场的需求。
据介绍,新的RTX工作站是专为生成式AI和数字化时代的开发和内容创建而设计的,BOXX、戴尔科技、惠普和联想等将进行相关的系统开发。该RTX系统硬件主要基于4张英伟达的RTX 6000 Ada GPU,每个配备48GB内存,单个桌面工作站可以提供高达5828 TFLOPS的AI性能和192GB的GPU内存;软件则依靠英伟达AI Enterprise 和Omniverse Enterprise。
软件发展亦飞速
在8月8日举行的吹风会上,英伟达元宇宙及仿真技术副总裁Rev Lebaredian还向南方财经全媒体记者介绍称,英伟达对AI进行了纵横软硬件的全栈式布局,并致力于和软件开发者紧密相连的社区建设。针对软件部分,英伟达推出了元宇宙API、OpenUSD等产品,预计将把更多的AI及元宇宙软件开发者吸引到英伟达的产品生态中。
OpenUSD是指“通用场景描述”,黄仁勋将OpenUSD比喻为新时代的HTML。“正如HTML点燃了2D互联网的重大计算革命一样,OpenUSD将引发协作3D和工业数字化的时代。”他表示。
与此同时,英伟达又推动OpenUSD走向云端,推出了四个云上API,这包括ChatUSD、RunUSD、DeepSearch和USD-GDN Publisher。其中ChatUSD 实际上是一个面向开发人员的大型语言模型 (LLM)copilot工具,可以回答USD知识问题或生成Python-USD代码脚本。
RunUSD主要用于生成完全路径追踪的渲染图像,DeepSearch用于在大量未标记资产数据库进行快速语义搜索,而USD-GDN Publisher可以将云图形交付网络(GDN)用实时流式传输到 Web 浏览器和移动设备。
英伟达还创立了OpenUSD联盟(AOUSD),成员包括Pixar、Adobe、苹果公司和Autodesk等。这意味着英伟达正在集结元宇宙和AI中最强大的一批产品开发商进行商业化探索。
黄仁勋还称,OpenUSD将服务于电影、动画、工业等领域。眼下,业界可以用OpenUSD开发可交互操作的制造设计管道、创建工厂实时数字孪生模型,或培训和验证自动驾驶汽车等。
(文章来源:21世纪经济报道)
关键词: