资讯详情

【AI简报20210813期】 西人马首次发布一体式 AI SoC 芯片、三星发布5nm可穿戴处理器...

AI 芯片

1. 西人马首次发布了一体式 AI SoC 芯片 FT1700

原文:

https://www.laoyaoba.com/n/789308

近日,西人马科技发布FT1700芯片是西人马推出的第一款集成芯片AI SoC芯片。

FT基于异构多核处理器架构的1700芯片集成了4个CPU和4个DSP,也就是说,实时系统控制还集成了8个核心处理器;视觉AI DSP此外,还有4个高性能机器视觉计算阵列K高性能有线/无线数据接口可用于传输实时音频/视频流。

该芯片可提供0.5T~1T可用于工业检测、边缘计算、机器视觉、智能制造、自动数据采集系统(ADAS)、工业机器人控制、工业无人机等AI应用场景。

FT1700 芯片专门用于物流仓储、智能监控、边缘计算、工业检测ADAS/DMS、汽车驾驶记录仪、工业无人机等多种应用设计一体化SoC芯片。它具有多核心并行计算的优点,具有超高的计算能力,可以快速识别图像、图形、视频和音频,然后做出判断。

2. GPU性能提升10倍!三星发布了全球首款5nm可穿戴处理器

原文:

https://mp.weixin.qq.com/s/ATfTNw1aixF0lwsw627QDA

三星近日推出Galaxy Watch4系列智能手表配备了最新的可穿戴处理器ExynosW920。Exynos W920处理器是业内首次使用5nm EUV该工艺是专门为可穿戴设备制造的处理器。该处理器可以支持三星和谷歌共同打造的可穿戴平台,并率先应用于即将到来的三星Galaxy Watch系列新品。

目前,高通公司在市场上使用最广泛的两种芯片Snapdragon Wear 3100和Snapdragon Wear 4100 Plus,它们分别建立在28纳米和12纳米节点上。ExynosW与这些竞争对手相比,920提供了更新Arm Cortex而且节点尺寸要小得多,可想而知,它能实现更高的集成度和更小的尺寸。值得注意的是,这是从最初开始的Galaxy Watch三星手表首次升级处理器。如上一代三星可穿戴产品Exynos 9110相比,Exynos W920声称性能提高了20%,图形性能提高了10倍。

总之,这些可穿戴硬件的改进标志着该领域的一个非常积极的方向。

3. 特斯拉 AI Day 最新消息将发布Dojo自研超算芯片

原文:

https://baijiahao.baidu.com/s?id=1707950006087618803&wfr=spider&for=pc

马斯克在推特上宣布特斯拉AI Day它将于北美时间8月19日正式举行。根据他之前的推特,新闻发布会将介绍特斯拉在人工智能领域的软硬件进展,特别是在(神经网络)的培训和预测推理方面,并将吸引相关人才。

根据之前发布的预热图,芯片采用非常规的包装形式,第一层和第五层铜结构为水冷散热模块;红色圆圈的第二层结构为5*5阵列由25个芯片组成;第三层是25个阵列的核心BGA封装基板;第四层和第七层应仅附着在物理承载结构上的一些导热性;蓝圈的第六层应为电源模块和垂直的黑色条,很可能是通过散热和芯片进行高速通信的互联模块;

从第二层结构的圆角和25个芯片结构来看,非常相似Cerebras公司的WSE猜测特斯拉可能使用超大处理器TSMC(台积电)InFO-SoW(集成风扇系统)设计。

如果不出意料,这次新闻发布会将会举行Dojo芯片介绍软硬件作为最关键的内容;当然也会覆盖FSD Beta相关进展介绍,但就目前的信息而言,很有可能推出基于7的新进展nm技术的HW4.0硬件。

AI 热点

4. 「假黄仁勋」刷屏后,英伟达官方辟谣:只有14秒是虚拟的

原文:

https://mp.weixin.qq.com/s/p5PvVDyZHufxI9R5p_8n1Q

不要太高,GTC 2021 在新闻发布会上,你看到厨房里的老黄不是假的,发布的显卡也不是假的,但视频中有14秒「假黄仁勋」!

最近举行的计算机图形顶级会议 ACM SIGGRAPH 2021 上面,英伟达介绍了自学 3D 仿真模拟和协作平台 Omniverse,不久前就发布了「合成版老黄」建造过程。新闻在很短的时间内引起了科技界的轰动,很多人甚至在那里 Youtube、今年比利比利等平台反复回放 4 月 GTC 老黄的 Keynote 试图区分视频「真假黄仁勋」。毕竟一旦接受了「新闻发布会上的老黄是假的」这个设置会开始怀疑:发布的显卡都是假的吗?否则为什么根本买不到?

而且在这里将近两个小时 Keynote 视频中,黄仁勋的皮衣与内搭款式来回切换,立领、翻领、翻领 T 过了一会儿,t恤又变成了 Polo 衬衫,引发了更多的猜测。

然而,英伟达官方否认,只有一小部分视频是虚拟的。英伟达的官方博客也进行了补充说明(之前的版本没有详细说明),并给出了数字替身的明确时间段。换句话说,在 1 小时 48 分钟的 Keynote 视频中,只有其中 14 秒属于合成,下图是合成部分的截图。

相信电影《头号玩家》中游戏的实现只是时间问题!

AI 前沿

5. 工号001,中国跳水 “国家队AI教练”

原文:

https://mp.weixin.qq.com/s/wCevQGDjhSuGUyAu9jjb_A

在东京奥运会上,中国跳水队以7枚金牌和5枚银牌结束,在4个单项中获得冠军和亚军,在4个双项中获得3枚金牌。在获得奖牌的球队背后,有一个看不见的特别教练——AI教练”。

跳水难度高,1~2秒内完成整套动作往往会让人觉得眼睛跟不上。为了准确测量运动员的动作,完美打磨,中国国家跳水队引进了3D AI国家队跳水训练系统还颁发了001工号AI教练工作证。

简单来说,这个系统的作用是让跳水动作看得清楚、准确、完整、理解。

首先,训练场馆内的高速相机等设备收集运动员的动作,清晰完整地记录每一帧,并在回放时随时冻结,使动作清晰可见。之后,软件系统对人体姿势进行了三维重建和定量评估,以便教练能够准确地看到它。这将模糊的起跳稍低就可以变成精确定量的起跳高度低于标准12.5厘米”。

此外,在运动员完成跳跃之前,教练只能从一个固定的角度观察,系统完全记录了跳水动作和场地细节,可以自由旋转360度,实现全面观察。

当然,记录数据并不是最终目的,AI教练不仅可以识别跳水动作和难度系数,还可以通过算法对动作进行质量评分,分析当前问题的原因,并协助教练制定解决培训中实际问题的计划。

在这次奥运会上,跳水队不仅得到了3D AI训练体系的重要支持,其他体育项目背后也有很多黑科技的帮助。比如卢云秀获得金牌的女子帆板RS:X赛前还对科技团队提供的风水等方面进行了分析和预测。

6. 国产CPU、国内操作系统!长城、百度联合开发的首款PKS”国产AI 正式发布服务器

原文:

https://mp.weixin.qq.com/s/ZcMW8dV0t72xvqFJ9yGgFg

8 月 3 日消息 中国长城今天表示,与百度联合开发的首款PKS”国产 AI 服务器 ——AI-TF2000 飞桨一体机正式发布。AI-TF2000 桨式一体机的外观与普通服务器没有太大区别。预设桨式模型库可以为二次开发提供百度的预训练模型。

中国长城表示,AI-TF2000 飞桨一体机PKS”技术架构进行设计,采用了飞腾 CPU 麒麟国内处理器和操作系统。百度自研昆仑同时集成在机内 AI 加速卡可扩展支持升腾、寒武纪、比特大陆等国内 AI 加速卡是第一个实现单一实现的卡 Switch 支持两个全高全国 AI 加速卡的 2U 整机服务器。

此外,该产品还内置了飞桨企业版 BML 全功能 AI 支持培训和推理各种数据精度的开发平台。

AI 研究综述

7. 2021年小目标检测最新研究综述

原文:

https://mp.weixin.qq.com/s/OOlq9wSfME2qB9VPc2fmRg

论文:

http://sjcj.nuaa.edu.cn/sjcjycl/article/html/202103001

长期以来,小目标检测一直是计算机视觉的难点和研究热点。在深度学习的驱动下,小目标 在国防安全、智能交通交通、工业自动化等领域取得了重大突破。进一步促进小 本文全面总结了小目标检测算法的发展,对现有算法进行了分类、分析和比较。首先,定义小目标,总结小目标检测面临的挑战。然后,从数据增强、多规模学习、上下文学习、生成对抗学习和无锚机制等方面重点阐述了提高小目标检测性能的方法,并分析了这些方法的优缺点和相关性。之后,全面介绍了小目标数据集,并在一些常用的公共数据集中对现有算法进行了介绍 性能评估。最后,本文展望了小目标检测技术未来的发展方向。

了解目标检测方向的前世今生,就去看看这篇论文吧。

AI 开源项目

8. 霸榜GitHub!人脸融合黑科技来了!七夕表白的另外一种方式!

原文:https://mp.weixin.qq.com/s/g7cVeLnA3ArrWCTiUmwnNQ

Github:https://github.com/PaddlePaddle/PaddleGAN/stargazers

七夕不知道如何表白?送花吃饭太没新意又太露骨?那就试试 paddlepaddle 的一个人脸融合黑科技项目,能够,让你不仅凡尔赛地炫个技,还能巧妙风趣地表个白:我觉得咱俩挺合适,可以一起为人类向更美的方向进化作出杰出贡献。

不信?那就上图了:

让我们来谈谈这个黑科技的原理吧。这个炫酷的黑科技是由开源界频上Trending的所提供,里面内置的分别实现人脸融合与让人脸动起来的效果。

PaddleGAN中提供的人脸融合能力是由组成的。

  • Fitting模块是根据已有的图像反推出解耦程度较高的风格向量,可用于人脸融合、人脸属性编辑等任务中。

  • Mixing模块是对上述Fitting模块中生成的风格向量实现不同层次和比例的混合。

  • StyleGAN V2则根据Mixing模块中生成的混合向量生成新的人脸。

    因此,人脸融合任务可以分为三个步骤进行实现:

  1. Fitting模块提取两张人脸图片的风格向量

  2. Mixing模块对两种风格向量进行混合

  3. StyleGAN V2根据混合后的风格向量生成混合后的人脸

在项目首页转了一圈发现,人脸融合、人脸表情迁移竟然只是PaddleGAN数十种能力的一种,PaddleGAN还提供语音转唇形(声音对口型)、视频/照片修复(上色、超分、插帧)、人脸动漫化、照片动漫化、图像生成、图像风格迁移等十余种能力,令人大开眼界!这里就不一一展示效果,有兴趣的同学可以自行到 Github 上阅览。

9. Github标星13.6k!一行代码从PDF提取Excel文件

原文:

https://mp.weixin.qq.com/s/HvOn8SZ2uPjekkDd4VB-9A

Github:

https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.2/ppstructure

我们在工作生活中经常会遇到表格识别的问题,比如导师说,把下面PDF文件里面的表格取出来整理成Excel表。只要稍微会一点Python,这个开源项目神器几行代码解决!

如图所示,针对一张完整的PDF图片,这个开源项目可以对文档图片中的文本、表格、图片、标题与列表区域进行分类。同时还可以利用表格识别技术完整地提取表格结构信息,使得表格图片变为可编辑的Excel文件。不仅仅是PDF文件转excel,如果编程能力再强一些,结合版面分析技术,PDF转Word都不在话下。而且使用也是非常方便,在完成Python whl包安装之后,简单几行代码即可完成快速试用。

10. 动手画个二次元老婆,上科大团队这个APP刚上线就火出圈,手残党的福利!

原文:

https://mp.weixin.qq.com/s/Qjwodgetc-hBfNIpEAvdPg

Github:

https://apchenstu.github.io/sofgan/

论文:

https://arxiv.org/pdf/2007.03780.pdf

想给自己画个二次元老婆,但发现自己是个手残,怎么办?问题不大,这里有个神器,你只需要涂抹出轮廓,剩下的交给 AI。二次元老婆生成器的名字叫做「WAND」,现在已经在苹果应用商店上线了,目前提供 iPhone 和 iPad 两类设备的限时免费下载,登上了AppStore图形与设计榜下载量Top1。

「WAND」刚发布就火出了圈。在社交网络上看,很多人已经率先试用了,作品是这样的:

看完了 APP 效果,我们来看下背后的技术。据项目介绍,该软件基于上海科技大学 ACM Transactions on Graphics 2021 的一篇研究论文实现。

尽管生成对抗网络(GAN)已被广泛用于人像图像生成,但在 GAN 学习的潜在空间中,不同的属性,如姿态、形状和纹理风格,通常是纠缠在一起的,这使得对特定属性的显式控制变得困难。为了解决这个问题,该研究提出了一个名为 SofGAN 的图像生成器,将人像的潜在空间解耦为两个子空间:几何空间和纹理空间。从两个子空间采样的潜在代码分别馈送到两个网络分支,一个生成具有规范姿态的人像的 3D 几何图形,另一个生成纹理。对齐的 3D 几何图形还带有语义部分分割,编码为语义占用字段(semantic occupancy field,SOF)。SOF 能够在任意视图渲染一致的 2D 语义分割图,然后将其与生成的纹理图融合并使用语义 instance-wise(SIW)模块将其风格化为人像图像。该研究通过大量实验表明该系统可以生成具有独立可控几何和纹理属性的高质量人像图像。此外,该方法还可以很好地推广到各种应用中,例如外观一致的面部动画生成等。

11. AI“读图会意”首超人类!阿里达摩院刷新全球机器视觉问题纪录

原文:

https://mp.weixin.qq.com/s/CO4z-2OjCke9fjMzEaI4wA

Github:

https://github.com/alibaba/AliceMind

给出一张图,让人类来猜这张图里面内容是什么,这对人类来说,太简单不过。但是对于 AI 呢?AI 在这视觉问答方面能和人类相比吗?

答案来了——历时6年,在机器视觉问答领域,第一位得分超越人类的AI选手诞生了!

国际权威机器视觉问答榜单 VQA Leaderboard出现关键突破:阿里巴巴达摩院以81.26%的准确率创造了新纪录,让AI在“读图会意”上首次超越人类基准。继2015年、2018年AI分别在视觉识别及文本理解领域超越人类分数后,人工智能在多模态技术领域也迎来一大进展。比较难得的是,3年前,让中国AI在文本理解领域历史性超越人类的,同样是达摩院AI研究团队。

在测试中,AI需根据给定图片及自然语言问题生成正确的自然语言回答。这意味着单个AI模型需融合复杂的计算机视觉及自然语言技术:首先对所有图像信息进行扫描,再结合对文本问题的理解,利用多模态技术学习图文的关联性、精准定位相关图像信息,最后根据常识及推理回答问题。

今年8月,达摩院以81.26%的准确率创造VQA Leaderboard全球纪录,首次超越人类基准线80.83%。

面对更开放的现实世界,AI一定会遇到新的挑战,需要喂更多的数据、进一步提升模型。但和 CV 等领域的发展一样,这一结果依然具有标志性意义,相信VQA技术在现实中的表现提升只是时间问题。

文末福利

12. 干货!结合工作整理的MCU芯片级的ESD防护及设计讲义(非常详细)

原文:

https://mp.weixin.qq.com/s/awOMDjV5n0dRKTTWO31eUQ

干货链接:

http://bbs.eetop.cn/thread-437264-1-1.html

这份讲义是EETOP网友 结合自己工作整理的MCU芯片级的ESD防护及设计,共61页。结合工作整理的资料自然是相当干货满满,希望对各位有兴趣的同学有所帮助。讲义全文可以通过上述链接下载。

13. 从SGD到NadaMax,十种优化算法原理及实现

原文:

https://mp.weixin.qq.com/s/XzzZmbOeUTEDEqrxKVCw0g

无论是什么优化算法,最后都可以用一个简单的公式抽象:

是参数,而

是参数的增量,而各种优化算法的主要区别在于对的计算不同,本文总结了下面十个优化算法的公式,以及简单的Python实现:

  1. SGD

  2. Momentum

  3. Nesterov Momentum

  4. AdaGrad

  5. RMSProp

  6. AdaDelta

  7. Adam

  8. AdaMax

  9. Nadam

  10. NadaMax

原文总结了SGD、MomentumNesterov、Momentum、AdaGrad…等十种优化算法,每一种算法的讲解都附有详细的公式过程以及代码实现。图文并茂,适合上下班通勤时间阅读,加深对深度学习中优化算法的理解。

你可以添加微信17775982065为好友,注明:公司+姓名,拉进 RT-Thread 官方微信交流群!

????

标签: polo继电器

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台