NVIDIA 于本日发布推出 NVIDIA Blackwell 平台以赋能计较新时代。该平台可以使天下各地的机构都能够在万亿参数的大言语模子(LLM)上构建和运转及时天生式 ,其本钱和能耗较上一代产物下降多达 25 倍。
Blackwell GPU 架构搭载六项变更性的加快计较手艺,这些手艺将助推数据处置、工程模仿、电子设想自动化、辅佐药物设想、量子计较和天生式 AI 等畛域完成打破,这些都是 NVIDIA 眼中的新兴行业机缘。
NVIDIA 创始人兼首席执行官黄仁勋暗示: “三十年来,咱们始终深耕加快计较畛域,力图实现像深度进修和 AI 如许的变更性打破。天生式 AI 是咱们这个时期的决定性手艺,Blackwell GPU 是推进新一轮工业反动的引擎。经由过程与环球最具活气的企业分工,咱们将完成 AI 赋能各行各业的许诺。”
许多企业都在规划接纳 Blackwell,此中包孕亚马逊云科技、戴尔科技、google、Meta、微软、OpenAI、Oracle、和 xAI。
Alphabet 和google首席执行官 Sundar Pichai 暗示: “经由过程扩大google搜刮和 Gmail 等办事以服务于数十亿用户,咱们关于若何治理计较根底办法有了加倍深刻的懂得。跟着公司营业进入 AI 平台转型期,咱们将连续为本身产物和办事以及云客户扩充根底办法投资。咱们有幸与 NVIDIA 建立了长时间分工火伴瓜葛,并期待着将 Blackwell GPU 的打破性功能带给咱们的云客户以及包孕 谷歌 DeepMind 在内的google团队,以加快将来的索求历程。”
亚马逊总裁兼首席执行官 Andy Jassy 暗示: “咱们与 NVIDIA 的深度分工能够追溯到 13 年前,其时咱们在 AWS 上推出了环球首个 GPU 云实例。往常,咱们在云端供应了最为普遍的 GPU 解决计划,以支撑环球那些技术上最进步前辈的加快事情负载。正因云云,NVIDIA Blackwell GPU 可以或许在 AWS 上运行得云云卓越,NVIDIA 也抉择与 AWS 配合开辟 Project Ceiba,将 NVIDIA 新一代 Grace Blackwell 超等与 AWS Nitro System 的高等虚构化和超倏地的 Elastic Fabric Adapter 网络连系,以用于 NVIDIA 本身的 AI 研发。经由过程 AWS 与 NVIDIA 的配合起劲,咱们将继续立异,使 AWS 成为每个想要在云端运转 NVIDIA GPU 的用户的最好抉择。”
戴尔科技董事会主席兼首席执行官 Michael Dell 暗示: “天生式 AI 关于建立更智能、更靠得住和更高效的体系相当首要。戴尔科技与 NVIDIA 将联袂塑造将来科技。跟着 Blackwell 的
宣布, 咱们将连续为用户供应新一代加快产物和办事,以供应推进跨行业立异所需的对象。”
google DeepMind 联结创始人兼首席执行官 Demis Hassabis 暗示:“AI 的变更后劲使人难以相信,它将赞助咱们解决世界上那些最首要的迷信题目。Blackwell 突破性的技术性能将供应所需的关头,从而赞助那些世界上最智慧的大脑绘制新的迷信蓝图。”
Meta 公司创始人兼首席执行官 Mark Zuckerberg 暗示: “从咱们的大言语模子到内容保举、告白和平安体系,AI 已经在赋能统统,并且 AI 在将来将会日趋首要。咱们等待经由过程 NVIDIA Blackwell 赞助锻炼咱们的 Llama 模子,打造下一代 Meta AI 和花费产物。”
微软施行董事长兼首席执行官 Satya Nadella 暗示: “咱们致力于为客户供应最进步前辈的根底办法,以赋能其 AI 事情负载。始终以来,咱们致力于为云端优化 NVIDIA GPU,经由过程在咱们的环球接纳 GB200 Grace Blackwell ,咱们得以在这一历程中再进一步,助力天下各地的构造完成 AI 落地。”
OpenAI 首席执行官 Sam Altman 暗示: “Blackwell 完成了伟大的功能飞跃,并将加快咱们供应尖端模子的才能。咱们很庆幸能连续与 NVIDIA 分工,配合晋升 AI 计较。”
Oracle 董事长兼首席手艺官 Larry Ellison 暗示: “Oracle 与 NVIDIA 的慎密分工将推进 AI、机械进修和数据分析畛域完成质和量的打破。为了让用户可以或许猎取更多拥有可操作性的洞察,正需要像 Blackwell 如许专为加快计较和天生式 AI 而打造的、更壮大的引擎。”
特斯拉及 xAI 首席执行官 Elon Musk 暗示:“当下的 AI 畛域,NVIDIA无可比较。”
新架构以留念 David Harold Blackwell 定名,他不仅是一名特地研讨博弈论和统计学的数学家,也是第一位当选美国国度科学院的黑人学者。这一新架构是继两年前推出的 NVIDIA Hopper™ 架构以来的全新架构。
凭仗六项变更性的手艺,Blackwell 可以或许在领有高达 10 万亿参数的模子上完成 AI 锻炼和及时 LLM 推理,这些手艺包孕:
- 环球最壮大的芯片:Blackwell 架构 GPU 拥有 2080 亿个,接纳特地定制的双倍光刻极限尺寸 4NP TSMC 工艺创造,经由过程 10 TB/s 的片间互联,将 GPU 裸片连接成一块对立的 GPU。
- 第二代 Transformer 引擎:得益于全新微张量缩放支撑,以及集成于 NVIDIA TensorRT™-LLM 和 NeMo Megatron 框架中的 NVIDIA 进步前辈静态局限治理算法,Blackwell 将在新型 4 位浮点 AI 推理才能下完成算力和模子巨细翻倍。
- 第五代 NVLink:为了晋升万亿级参数模子和混杂专家 AI 模子的功能,最新一代 NVIDIA NVLink® 为每块 GPU 供应突破性的 1.8TB/s 双向吞吐量,确保多达 576 块 GPU 之间的无缝高速,餍足了现今最庞杂 LLM 的需要。
- RAS 引擎:接纳 Blackwell 架构的 GPU 包括一个用于保证可靠性、可用性和可保护性的公用引擎。另外,Blackwell 架构还增加了多项芯片级性能,可以或许应用 AI 预防性保护来运转诊断并展望可靠性相干的题目。这将最大水平地延伸体系失常运转时候,进步大规模 AI 安排的弹性,使其可以或许继续不间断运行数周甚至数月,同时下降运营本钱。
- 平安 AI:进步前辈的秘要计较性能能够在不影响功能的情况下维护 AI 模子和客户数据,而且支撑全新当地接口加密和谈,这关于医疗、金融办事等高度看重隐衷题目的行业相当首要。
- 解压缩引擎:公用的解压缩引擎支撑最新花样,经由过程加快数据库查问供应极端壮大的数据阐发和数据迷信功能。将来几年,每一年需求企业破费数百亿美圆的数据处置将越来越多地由 GPU 加快。
NVIDIA GB200 Grace Blackwell 超等芯片经由过程 900GB/s 超的片间互联,将两个 NVIDIA B200 Tensor Core GPU 与 NVIDIA Grace 相连。
为了完成超高的 AI 功能,搭载 GB200 的体系可与同在本日宣布的 NVIDIA Quantum-X800 InfiniBand 和 Spectrum™-X800 平台连贯。这两个平台都可供应速率高达 800Gb/s 的高性能网络。
GB200 是 NVIDIA GB200 NVL72 的关头组件。NVIDIA GB200 NVL72 是一套多节点机架级扩大体系,适用于高度计较密集型的事情负载。它将 36 个 Grace Blackwell 超等合在一路,此中包括经由过程第五代 NVLink 互相连贯的 72 个 Blackwell GPU 和 36 个 Grace CPU。另外,GB200 NVL72 还内置 NVIDIA BlueField®-3 数据处理器,可在超大范围 AI 云中完成云网络加快、组合式存储、零相信平安和 GPU 计较弹性。关于LLM 推理事情负载,相较于异样数目的 NVIDIA H100 Tensor Core GPU,GB200 NVL72 最高可提供 30 倍的功能晋升以及多达 25 倍的本钱和能耗下降。
该平台可作为一个单 GPU,拥有 1.4 exaflops 的 AI 功能和 30TB 的倏地内存,是构成最新一代 DGX SuperPOD 的根底模块。
NVIDIA 供应的 HGX B200 是一个经由过程 NVLink 连贯 8 块 B200 GPU 的主板,支撑基于 x86 的天生式 AI 平台。基于 NVIDIA Quantum-2 InfiniBand 和 Spectrum-X 以太网网络平台,HGX B200支撑高达 400Gb/s 的网络速率。
AWS谷歌 Cloud、Microsoft Azure、Oracle Cloud Infrastructure 将成为首批供应 Blackwell 驱动实例办事提供商。同时 NVIDIA分工火伴规划的公司 Applied Digital、CoreWeave、Crusoe、IBM Cloud 和 Lambda供应上述办事。Indosat Ooredoo Hutchinson、Nebius、Nexgen Cloud、Oracle EU Sovereign Cloud、Oracle US, UK, and Australian Government Clouds、Scaleway、新加坡电信、Northern Data Group 的 Taiga Cloud、Yotta Data Services 的 Shakti Cloud 和 YTL Power International 等主权 AI供应基于 Blackwell 架构办事根底办法。
GB200 还将经由过程 NVIDIA DGX™ Cloud供应,NVIDIA DGX™ Cloud 是一个当先办事提供商配合设想的 AI 平台,可为企业开辟职员供应特地根底办法造访权限,使他们可以或许构建安排进步前辈天生式 AI模子。AWS谷歌 Cloud 和 Oracle Cloud Infrastructure 计划在往年晚些时间托管接纳 NVIDIA Grace Blackwell 的新实例。
Cisco、戴尔科技遐想和 Supermicro 预计供应基于 Blackwell产物打造种种服务器。Aivres、永擎电子、华硕、Eviden、Foxconn、技嘉、Inventec、和硕、QCT、Wistron、纬颖和 ZT Systems供应基于 Blackwell 的服务器另外,越来越多的软件制造商网络包孕工程仿真畛域环球领导者 Ansys、Cadence 和 Synopsys应用基于 Blackwell 的处理器加快其用于设想和仿真电气机器创造体系整机的软件。他们的客户能够更低本钱、更高能应用天生式 AI加快计较加快产物上市。
Blackwell产物组合出产级 AI操纵体系 NVIDIA AI Enterprise支撑。NVIDIA AI Enterprise包括同日宣布的 NVIDIA NIM™ 推理办事以及 AI 框架、程序库对象,企业能够安排在由NVIDIA供应加快的云、数据中央事情站上懂得对于 NVIDIA Blackwell 平台的更多信息寓目 GTC 主题演讲回放并注册 GTC列入由 NVIDIA 和行业领导者带来集会。本届 GTC继续举行至 3 月 21 日。