来源:
编辑宋梓侨
生成式AI的爆发,让成立近30年的英伟达再次迎来了一个高光时刻。
3月22日,在英伟达举办的一年一度的GTC开发者大会上,其CEO黄仁勋发表了题为“不要错过AI的这个决定性时刻”的演讲。在78分钟的视频中,他用“iPhone时刻”四次描述了AI目前的发展状况,并表示“这将是我们迄今为止最重要的GTC大会”。
英伟达没有让大家失望。会上不仅发布了可以将ChatGPT速度提升10倍的专用GPU芯片,还向芯片制造业抛出了一枚技术“核弹”。
▌ChatGPT专用GPU来了,处理速度提高了十倍。
针对需要巨大计算能力的ChatGPT,英伟达发布了NVIDIA H100 NVL,这是一款针对大型语言模型(LLM)的特殊解决方案,拥有94GB内存和加速变压器引擎,并配备了PCIE H100 GPU,具有双GPU NVLINK。
英伟达H100 NVL
黄仁勋表示,目前真正能处理ChatGPT的GPU只有英伟达HGX A100(OpenAI就是用A100 GPU来训练运行ChatGPT),H100 GPU的处理速度比A100 GPU快十倍,可以将大型语言模型的处理成本降低一个数量级。
此外,为了加速生成式AI的开发和部署,Nvidia宣布推出四款全新的推理GPU——L4张量核GPU、L40 GPU、H100 NVL GPU和格蕾丝·赫柏超级芯片(见下图),分别擅长AI视频、图像生成和ChatGPT等大型语言模型的推理加速和推荐系统,以及大型语言模型的AI数据库。
▌用云服务创造了一种新的商业模式。
值得注意的是,英伟达现在力推AI云服务,已经被比喻为今天AI系统的“操作系统”。会上,英伟达宣布与谷歌云、微软Azure和甲骨文云联合推出DGX(AI超级计算机)云服务,以及加速企业创建大模型和生成式AI的云服务NVIDIA AI Foundations,并宣布与日本三菱联合打造日本首台加速制药研究的生成式AI超级计算机。
使用H100芯片的云服务已经上线,OpenAI将通过微软Azure超级计算机使用H100。
简单来说,英伟达的新商业模式就是通过几大云来推广自己的AI产品。黄仁勋表示,这一合作伙伴关系将英伟达的生态系统带到了云服务提供商的手中,并扩大了英伟达的市场规模和覆盖范围。企业将能够每月租用DGX云集群,以确保他们能够快速轻松地扩展大规模多节点人工智能培训。
现有企业从中受益。
英伟达周二证实,Getty Images正在使用英伟达的毕加索AIGC模型生成云服务,并建立自营图片和视频来生成AI;另一个照片版权库Shutterstock也在使用NVIDIA的服务来创建3D生成模型。此外,Adobe周二发布的“萤火虫”AI是该公司结合英伟达的应用程序创建的。
▌用软件改造芯片制造业,将计算光刻速度提高了40倍。
光刻是芯片制造过程中最复杂、最昂贵和最关键的环节。会上,英伟达宣布了一项改变光刻行业的应用——通过光刻计算库cuLitho将计算光刻加速40倍以上,大大提高了芯片代工厂在这一过程中的效率,为2nm和更先进工艺的到来做准备。
黄仁勋说NVIDIA H100 GPU需要89个掩膜。在CPU上运行时,处理一张掩膜需要两周时间,而在GPU上运行cuLitho只需要八个小时。此外,通过在500台DGX H100系统上使用cuLitho加速,TSMC可以将功耗从35MW降至5MW,而不是以前用于计算光刻的40,000台CPU服务器。使用cuLitho的晶圆厂每天可以多生产3-5倍的光掩模,仅使用当前配置功率的1/9。
TSMC、艾尔、新思科技等公司都参与了合作并引进了这项技术。其中,TSMC将于6月开始对cuLitho进行生产资质认证。
黄仁勋曾在接受美国消费者新闻与商业频道采访时说:“10年前我们发现这种制作软件的方式可以改变一切,所以我们从各个角度改变了公司,我们生产的每一个芯片都专注于AI。”
现在,随着其“迄今为止最重要的GTC大会”的开始,英伟达展现了一个雄心勃勃的自己——在AI方面的参与度进一步提高,不再定位于硬件供应商,而是“软硬件结合体”。在不断迭代GPU、DPU等芯片的同时,还将帮助企业加速定制生成式AI模型的云服务建设。
正如黄仁勋所说,“生成式AI正在推动AI的快速应用,重塑无数行业...我们将成为全球云领域最优秀的AI销售人员...让AI模型遍地开花。”
温馨提示:注:内容来源均采集于互联网,不要轻信任何,后果自负,本站不承担任何责任。若本站收录的信息无意侵犯了贵司版权,请给我们来信,我们会及时处理和回复。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:goldenhorseconnect@gmail.com