台积电 4 奈米打造辉达 Blackwell 架构 GPU,建构迄今最强 GB200

台积电 4 奈米打造辉达 Blackwell 架构 GPU,建构迄今最强 GB200

GPU 大厂辉达 19 日清晨在美国加州圣荷西召开的 GTC 2024,发表号称迄今最强 AI 晶片 GB200,今年稍晚出货。GB200 采新 Blackwell 架构 GPU,辉达创办人暨执行长黄仁勋表示,两年前 Hopper 架构 GPU 已非常出色,但现在需要更强大的 GPU

辉达每两年更新频率,升级一次 GPU 架构,大幅提升 AI 晶片性能。辉达 2022 年发表 Hopper 架构 H100 AI 晶片后,引领全球 AI 市场风潮。如今再推采 Blackwell 架构的 AI 晶片性能更强大,更擅长处理 AI 任务,Blackwell 架构是以数学家 David Harold Blackwell 之名命名。

台积电 4 奈米打造辉达 Blackwell 架构 GPU,建构迄今最强 GB200 AI与大数据 图2张

黄仁勋表示,Blackwell 架构 GPU 的 AI 运算性能在 FP8 及 NEW FP6 都可达 20petaflops,是前一代 Hopper 架构运算性能 8petaflops 的 2.5 倍。NEW FP4 更可达 40petaflops,是前代 Hopper 架构 GPU 运算性能 8petaflops 5 倍。取决于各种 Blackwell 架构 GPU 设备的记忆体容量和频宽配置,工作运算执行力的实际性能可能会更高。黄仁勋强调,有额外处理能力,使人工智慧企业训练更大更复杂的模型。

台积电 4 奈米打造辉达 Blackwell 架构 GPU,建构迄今最强 GB200 AI与大数据 图3张

Blackwell 架构 GPU 的体积庞大,采台积电 4 奈米(4NP)打造,整合两个独立制造的裸晶(Die),共 2,080 亿个电晶体,透过 NVLink 5.0 介面像拉链绑住晶片。辉达用 10TB/sec NVLink 5.0 连接两块裸晶,官方称介面为 NV-HBI。Blackwell complex 的 NVLink 5.0 介面为 1.8TB 频宽,是前代 Hopper 架构 GPU NVLink 4.0 介面速度的两倍。

台积电 4 奈米打造辉达 Blackwell 架构 GPU,建构迄今最强 GB200 AI与大数据 图4张

辉达最新 GB200 AI 晶片,含两个 Blackwell GPU 和一个 Arm 架构 Grace CPU,推理模型性能比 H100 提升 30 倍,成本和能耗降至 25 分之一。

辉达还对有大型需求的企业提供服务器成品,提供完整服务器出货,如 GB200 NVL72 服务器,提供 36 个 CPU 和 72 个 Blackwell 架构 GPU,完善一体水冷散热方案,可实现总计 720petaflops 的 AI 训练性能或 1,440petaflops 推理性能。电缆长度累计近 2 英里,共 5,000 条独立电缆。

台积电 4 奈米打造辉达 Blackwell 架构 GPU,建构迄今最强 GB200 AI与大数据 图5张

亚马逊 AWS 计划采购 2 万片 GB200 晶片组建的服务器集群,部署 27 兆个参数模型。除了亚马逊 AWS,DELL、 Alphabet、Meta、微软、OpenAI、Oracle 和 TESLA 成为 Blackwell 系列的采用者之一。

(首图来源:影片截图)

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。