亚马逊云科技 re:Invent — 太平洋时间 2023 年 11 月 28 日 — NVIDIA 今日宣布推出一项生成式 AI 微服务,支持企业将自定义大语言模型与企业数据相连接,使其 AI 应用能够提供高度准确的响应。
NVIDIA NeMo™ Retriever 是 NVIDIA NeMo(一个用于构建、自定义和部署生成式 AI 模型的框架和工具系列)的一项全新服务,通过企业级检索增强生成(RAG)功能,帮助组织加强其生成式 AI 应用。
作为一项语义检索微服务,NeMo Retriever 借助经 NVIDIA 优化的算法,帮助生成式 AI 应用作出更加准确的回答。使用该微服务的开发者,可以将其 AI 应用与位于各个云和数据中心的业务数据相连通。该服务为 AI 代工添加了 NVIDIA 优化的 RAG 功能,并被整合到亚马逊云科技 Marketplace 上的 NVIDIA AI Enterprise 软件平台中。
Cadence、Dropbox、SAP 和 ServiceNow 等公司已率先与 NVIDIA 合作,将生产就绪型 RAG 功能整合至其自定义生成式 AI 应用和服务中。
NVIDIA 创始人兼首席执行官黄仁勋表示:“具有 RAG 功能的生成式 AI 应用是企业的下一个杀手级应用。借助 NVIDIA NeMo Retriever,开发者可以创建自定义生成式 AI 、AI 助手和摘要工具。它们能够访问企业的业务数据,通过准确且有价值的生成式 AI 智能来提高生产力。”
电子系统设计领导厂商 Cadence 为超大规模计算、5G 通信、汽车、移动、航空航天、消费和医疗市场的企业提供服务。该公司正与 NVIDIA 合作,为工业电子设计领域的生成式 AI 应用开发 RAG 功能。
Cadence 总裁兼首席执行官 Anirudh Devgan 表示:“生成式 AI 引入了创新方法来满足客户需求,比如能在设计流程早期发现潜在缺陷的工具等。我们的研究人员正在与 NVIDIA 合作,使用 NeMo Retriever 进一步提高生成式 AI 应用的准确性和相关性,以便发现问题,并帮助客户更快地将优质产品推向市场。”
与开源 RAG 工具套件不同,NeMo Retriever 是通过具有商业可行性的模型、API 稳定性、安全补丁和企业级支持,来为生产就绪型生成式 AI 赋能。
经 NVIDIA 优化的算法使 Retriever 的嵌入模型能够产出准确性最高的结果。经过优化的嵌入模型能够捕捉单词之间的关系,使 LLM 能够处理和分析文本数据。
企业可以使用 NeMo Retriever 将 LLM 连接到多个数据源和知识库,这样用户就可以轻松地与数据交互,并通过简单的对话指令获得准确且最新的答案。通过使用由 Retriever 驱动的应用,企业可以使用户安全地访问多种数据格式的信息,如文本、PDF、图像和视频等。
借助 NeMo Retriever,企业能够以更少的训练获得更准确的结果,加快产品上市时间,并减少生成式 AI 应用开发产生的能耗。
通过 NVIDIA AI Enterprise 实现可靠、简单且安全的部署
企业可以在几乎任何数据中心或云端的 NVIDIA 加速计算上部署由 NeMo Retriever 驱动的应用,以便在推理过程中运行。NVIDIA AI Enterprise 可支持通过 NVIDIA Triton 推理服务器™、NVIDIA TensorRT™、NVIDIA TensorRT-LLM 及其他 NVIDIA AI 软件进行加速的高性能推理。
开发者可以注册并抢先体验 NVIDIA NeMo Retriever。