资讯详情

阿里云弹性计算专家张新涛:视觉计算的思考与实践

4 月 21 阿里云弹性计算产品专家张新涛 2022 英伟达数字孪生技术应用论坛题为阿里云弹性计算 XR 分享业务应用实践。以下是根据他的演讲组织的。

触摸视觉计算从云计算开始

2019 在阿里云北京峰会上,阿里云和我们的一个重要合作伙伴发布了一个新的图形 GPU 计算实例 vGN6i,演示场景是通过支付宝小程序模拟一个购车用户接入现实的汽车试驾 3D 空间,这个 3D 汽车和驾驶空间位于云上,购车用户在平板电脑上完成了试驾体验。这也是阿里云弹性计算业务最早接触数字孪生客户的场景。

在合作过程中,我们逐渐意识到数字双胞胎是提高全社会创造力和生产力的关键技术,然后我们明确增加了对图像和流媒体相关产品和技术的投资和积累。时间到了 2021 年,此时 “VR/AR/MR” 这些概念再次流行起来,甚至变得炙手可热业创造了各种Verse描述概念,但在我们看来,它仍然存在 XR 视觉计算阶段。

说明:VR/AR/MR 实现的人机界面差异很大,但应用场景重叠度高,业界统称XR。 在这里插入图片描述

作为阿里云第一次触摸XR”和"数字孪生"的产品团队之一,我们也在内部开始与各个团队分享针对 XR 上图是对工业新浪潮的看法 2021 年 8 月,“AR/VR/MR”以及各 Verse 正当火热的时候,我们解释内部团队 XR 工业时的一页,当时,我们的认知角度主要是基于对新产业热点对整个行业影响的认知。

XR 每个人都对新的信息交互方式充满期待,但是如何通过云计算赋能各个行业呢?产业的配合关系是怎样的?在工业体系中,每个参与者的需求是什么?云计算应该贡献什么价值?我们不知道,但我们开始在商业实践中更积极地思考和探索。当时我们提到了一个概念:视觉计算计划,8 一个月后的今天,我们有了新的视角。

借助互联网上非常流行的Metaverse 产业七层系统图说明了产业系统,顺便也看了云计算要承载的社会价值。可以看出,图片从最接近C端用户的体验场景需求延伸到行业顶尖基础设施技术的需求。与过去信息产业的每一次变化相比,这一次尤为复杂。我们也可以从图中体会到,XR 及各类 Verse 这是利用现有和现有的技术和商业手段,全面升级人类感官体验,通过这一升级浪潮,实现全行业创造力和生产力的重大飞跃。

当我们把左图中的产业需求映射到右侧云计算专注提升并可以贡献价值的领域时,我们发现这 5 云计算域是云计算必须突破和挑战的领域,这是云计算产业需求的全面挑战。

算力迎接 XR 及 X-Verse 的产业挑战

这 5 事实上,各个方向的挑战也是相互影响的。牵引力来自应用程序交互体验升级的需求。在交互体验飞跃的需求下,应用程序将使用更多的人机接口模式,这直接导致计算和通信的复杂性急剧增加,并与如此多的交互模式兼容,这些都是技术挑战。更大的挑战来自于工业生态。如果我们期待着这种新的互动体验的升级,我们需要一套匹配的经济生态来驱动它,这过去的每一次 IT 技术创新带来的商业生态变化是一样的。

关注牵引方:应用。早期的人机界面是纸带和打孔机,现在我们最常用的智能手机可以通过 2D 图像、声音、指纹、手势、红外线、摄像头、触摸屏、声音、振动、个人传感器等与我们互动,更先进的手势识别、触摸手套也开始小规模商业使用。如今,与纸带时期相比,应用程序的开发复杂了数万倍,应用覆盖范围扩大了数万倍,计算和通信需求增加了数万倍,支持的经济规模也扩大了数万倍,开发者数量大幅扩大。事实上,它驱动着一个巨大的工业生态。

因此,我们这次遇到的 XR 及各类 Verse 还是这样,这不是一个简单的使用 XR 这是一场工业革命,设备取代了其他终端。

为什么是工业革命,因为目前的技术能力和商业模式不能支持我们理想的数字虚拟世界的实现。例如,我们的行业仍然不能使用它 AI CG AI 驱动 物理引擎的方式实现一个完全意义的虚拟人,其中很大限制来自于计算能力不足,带宽和延时的挑战依然存在,以及如何组织一个集人类信息技术大成的开发团队来完成。

然后,在计算性能和规模、通信带宽和延迟、生态效率和开放性方面,我们在问题层面上取得了飞跃。

  • 在计算方面,需要解决行业中几个关键的计算问题,比如比目前的计算性能和规模大10倍以上,比如性能更高AI训练推理,实时光跟踪性能更高,编码性能更高。
  • 在通信方面,解决通信带宽和通信延迟问题需要十倍以上的通信性能,以帮助高性能异构加速计算,实现云与端的无缝协调。
  • 在生态学方面,我们需要建立一个开发人员合作系统和商业生态系统,以创建一个可以影响各行各业的开发人员生态系统。多年来,我们一直在解决前两个问题,而第三个问题正在解决。

在过去的几年里,阿里云通过神龙架构,GPU 实例迭代,创新 GPU 通过大规模的计算和产品手段解决计算和通信性能挑战的问题 GPU 解决产品商业化运营问题 GPU 计算能力规模问题。

在 2021 年云栖大会发布的第四代神龙架构 IO 功能和性能的巨大飞跃继续实现,实现 eRDMA 大规模组网,并将延迟降至最低 5us,并且网络 IO 用硬件加速;VPC 网络可以实现 5000 万 PPS 的吞吐和 16us 低延迟通信。这意味着后来实现的虚拟人可以识别人类更微妙的表虚拟人的微妙表达。

2021 我们还发布了第七代 GPU 例子,不管是 XR 及各类 Verse 大规模多模模型训练和推理,或实时 3D 渲染、实时光跟踪、性能显著增长。

在计算规模层面,截至去年 5 月,云上的 GPU 总算能力已经超过 1000 PFLOPS,它仍在快速增长,这将成为我们未来数字虚拟世界基本计算能力池的一部分。

虽然计算性能、通信性能和计算规模大幅增长,但生产关系和生产力仍存在问题。我们需要建立一个合作的生态系统。

不断创新,输出坚实的计算能力

要繁荣一个行业,我们必须创新生产力和生产关系。我们希望在云技术、产品和商业生态的帮助下,阿里巴巴云的基础设施多年来逐步完善,不断为全社会提供更多优秀的服务 IaaS 产品,但在异构计算层面,还需要做更多。

异构加速计算通常很难使用,这相信每一种使用 GPU 或者 FPGA 在过去服务客户的实践中,我们通过创新的软件和云服务逐步解决这些问题。

例如,我们提高用户 GPU 计算中 GPU 推出了使用效率 AIACC 在许多大规模的帮助下,帮助用户加速 AI 通常会有训练和推理场景 50% 帮助用户减少数倍的加速效果 TCO。我们还通过 Windows 实时渲染场景下的渲染容器解决方案 GPU 计算弹性共享的问题等等。

我们通过代码解决用户的常见问题,并逐渐沉淀为解决整个行业问题的平台工具和软件。目前,我们正在利用各领域合作伙伴的能力,在阿里云的软硬件产品上建立生态产品,以解决整个行业的问题,这是我们正在做的。根据一年的全行业沟通,我们将整个行业的需求分为三个层次:一般层、行业层和生态层。

  • 一般层:一般层是为帮助整个行业在云上建立业务提供更原子化的能力,如:云 XR 平台和云 3D 编辑器是这一级别的关键产品。
  • 行业层面:关于行业层面,我们的目标理念是为各行各业提供编辑工具,可以提高整个行业的生产效率。通过编辑工具,各行各业可以更简单、更有效地创造适合这个行业的工具 XR 及数字孪生应用,通过这种方式来赋能全行业。我们还邀请个行业发出邀请,希望致力于解决某个行业潜在问题的合作伙伴能够与我们合作。目前,我们在这里积累了很多合作伙伴。他们拥有一流的产品,正在帮助许多行业创建这个行业 XR 数字孪生应用。
  • 生态层:生态层尤为重要。如果把行业层比作火箭,生态层就是火箭的燃料,各行业都在建设这个行业 XR 数字双胞胎应用程序需要大量的材料和数据资产。如何有效地创建和使用这些数字资产尤为重要,也是繁荣开发者社区的关键环节。

在构建这些能力的同时,我们仍然会巩固我们 IaaS 为了使产品更好,我们将一如既往地为客户提供持续的优质产品和服务。

再聚焦到产业看需求。上图中有一个常见的应用场景,我们经常在媒体上理解 XR 及各类 Verse 概念是绑在一起的,目前对上述场景的认知仍在视觉计算的范围内。这些场景来自不同的行业,帮助行业创造新的业务需求或优化生产力。虽然这些场景目前看起来非常复杂,但当我们从视觉计算的角度整合上述场景时,它们仍然会落在我们定义的产品能力板上。

上图是我想介绍的关键产品部分之一:云 XR 平台。

云 XR 平台是目前最直接的云,XR 数字孪生应用和 XR 平台服务的平台服务,云 XR 平台可以通过云与应用,云与端的标准接口实现事实上的产业标准统一,这一点对于产业发展有非常大的意义,对于供给侧,大家在约定好的接口上开发产品,实现互操作,效率更高,而在应用侧,用户不会担心供应侧的任何变化和升级会导致以前的投资不可用。

在这个平台上,我们为国内一所大学的客户实现了云上的热工仿真实验室,学生可以 PC 在终端或平板电脑上实现对发电厂各种能量转换装置的模拟实验,如操作汽轮机进行实验、操作变电站进行实验等;我们还与创新的虚拟客户实现了数百人参加的虚拟音乐会。目前,越来越多的行业和行业已经开始尝试使用云 XR 业务创新和产业升级的方式,同时我们也在推动这个产品赋能更多的行业。

各行各业如何落地?端 XR 业务?

这里就引出了我们另一个基于生态伙伴的平台产品:云实时 3D 编辑器平台。

如大家所熟悉的,我们开发不同平台的软件,就需要不同平台的代码编辑器、代码编译器,开发 XR 平台上的应用软件,就需要实时 3D 的编辑器。但是,要使用这类软件并不容易,开发者需要购买昂贵的高性能 GPU 工作站硬件,还需要购买实时 3D 编辑器的昂贵授权,这对于开发者,都是一笔极大的开销。与此同时,这类的大型应用,通常需要一个团队来完成,就需要随时协同开发,并且开发过程中,诸多计算环节极其耗时,受限于 GPU 工作站的计算能力,开发者只能等待。

因此,我们与国际顶尖的实时 3D 编辑器软件供应商正在推出联合产品,以便将实时 3D 的开发环节也搬到云上,这样开发者就可以在无任何环境依赖的前提下,快速展开业务,实现跨地域协同,并且实现耗时计算的快速计算。(正文完)

阿里云弹性计算专家张新涛:视觉计算的思考与实践

标签: 弹出传感器不可用

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

 锐单商城 - 一站式电子元器件采购平台  

 深圳锐单电子有限公司