资讯详情

未来MCU设计的几个方向

,不要错过精彩的内容

5601eb51931198c6fb63b62bc977605c.gif

转自 | 电子工程专辑

随着AI和IoT微处理器的发展与融合(MCU)设计也更加复杂,逐渐从传统的单功能微控制器转向系统级芯片,集成更多的功能特性和更强的计算性能(SoC)。

分析师团队认为未来MCU设计的发展方向将是:

自2017年开始,MCU厂商尝试在MCU中添加AI功能。ST的Project Orlando作为实验性质的项目MCU超低功耗AI瑞萨于2018年发布了加速器单元MCU协处理器重构协处理器DRP。在需要AI使用专用计算能力的应用场景AI加速器通常比提高处理器性能更有效。

2020年10月,Arm发布Ethos-U65 microNPU这种微型神经处理单元NPU很小NPU,只针对嵌入式系统和物联网设备,尺寸有限。Ethos-U65是Arm早前发布的Ethos-U55的升级,NXP选择Ethos-U55 microNPU作为Cortex-M系统。Ethos-U55是专门为微控制器设计的Cortex-M处理器以及MCU中的系统SRAM和flash可提供协同工作MCU所需的性能和效率组合。

通过NXP与Arm技术合作,Ethos-U55的性能大大提高,不仅是最原始的MAC(乘法和累积)性能翻倍,达到1TOPS(1GHz在工作频率下,可以正确调整系统总线的尺寸,使数据输入输出到microNPU。但这还不够,MCU通常是基于SRAM与闪存混合,但基于Cortex-A通常有应用处理器DRAM。DRAM提供更高的数据速率和容量,但成本延迟更长。microNPU为了适应这种延迟,需要更新设计,这就诞生了Ethos-U65。

与Ethos-U55一样,Ethos-U65 microNPU可以与NXP的i.MX家里已有Cortex-M内核和片上SRAM协同工作。它继承了Ethos-U55的所有MCU水平能效,与传统NPU相比,Cortex-M和Ethos-U结合提高了面积和功率效率,从而开发了经济高效、高性能的边缘计算AI芯片。

从应用的角度来看,。从具体算法和模型的角度来看,少数模型正在集中,如机器视觉(人脸识别、物体识别)和语音唤醒词所需的卷积神经网络,以及一些更先进的语音识别所需的循环神经网络(RNN)。三年前,AI算法和应用生态前景不够明确,因此出现了专用化(AI加速器)或通用化(加强处理器性能和可编程协处理器)的两难选择。今天的应用和相关算法已经非常集中,AI加速器已经成为一个明确的选择。一方面,使用专用化AI另一方面,芯片设计的门槛并不太高,加速器可以提供最佳的能效比。事实上,编译器和相关软件/模型优化是对设计能力的更大考验。

ARM在短时间内连续发布两代MCU的microNPU,一方面说明MCU市场对于AI和AI另一方面,我们也看到了对加速器的强烈需求MCU和MPU甚至CPU它们之间的性能差距正在缩小,这将是未来的智能MCU生态带来新的变化。

计算和处理性能的不断提高MCU设计工程师和开发商的不懈追求。过去,我们都跟着我们。Arm同步加强发展步伐MCU芯片性能,但近年来出现了匹敌RISC-V。让我们分别梳理一下这两个MCU微处理器内核性能提升线路图。

ARM Cortex分为三个系列,分别针对:,对应的核心是Cortex-M、Cortex-R和Cortex-A 系列。ARM Cortex-M处理器是一系列高效、易于使用的处理器核心,旨在帮助开发人员满足未来的嵌入式应用需求,如提供更多的功能,不断增加连接,提高代码重用,提高能效。Cortex-M该系列对成本和功耗敏感MCU优化了终端应用(如智能测量、人机接口设备、汽车和工业控制系统、大型家用电器、消费品和医疗设备)的混合信号设备。

Cortex-M系列基于ARMv7-M架构(用于Cortex-M3和Cortex-M4),而较低Cortex-M0 基于ARMv6-M架构。首款Cortex-M处理器于2004年发布,当一些主流MCU供应商选择这个内核,开始量产MCU芯片后,Cortex-M处理器很快受到市场的青睐。可以说,Cortex-M之于32位MCU就像8051到8位MCU,迅速成为行业标准微处理器的核心MCU供应商根据核心开发自己,在市场上提供差异化产品。例如,Cortex-M能够实现系列FPGA它被用作软核,但更常见的用途是作为集成存储器、时钟和外设MCU。

对于成本特别敏感的应用或从8位迁移到32位的应用,Cortex-M该系列的最低端产品可能是最佳选择。虽然Cortex-M0 的性能仅为0.95 DMIPS/MHz,比Cortex-M3和Cortex-M性能较低,但仍能与同系列其它高端产品兼容。Cortex-M0 采用Thumb-2指令集的子集,这些指令大多是16位操作数(尽管所有数据都是32位操作),这使得它们能够很好地适应Cortex-M0 二级流水线服务。通过减少分支映射,系统可以节省整体功耗,在大多数情况下,装配线将保留以下四个指令。Cortex-M0 还具有专用的总线用于单周期GPIO,这意味着设计师可以使用位置控制GPIO确定接口(就像8位)MCU这样),但数据是用32位核的性能处理的。

Cortex-M0 另一个重要的特点是增加了微跟踪缓冲器(MTB)。外设可以让设计师在调试过程中使用一些片RAM存储程序分支。这些分支可以返回到集成开发环境,并可以重建程序流程。该功能提供了没有扩展跟踪宏单元的初步指令跟踪能力(ETM)功能的Cortex-M3和Cortex-M4更有意义。从Cortex-M0 提取的调试信息等级明显高于8位MCU,这意味着难以解决的调试问题变得更容易解决。

Cortex-M3和Cortex-M4是非常相似的核心,两者都有1.25 DMIPS/MHz配备3级流水线,多个32位总线接口,时钟速率可达200MHz,并配备了非常有效的调试选项。两者最大的区别是,Cortex-M4的核心性能是针对的DSP。Cortex-M3和Cortex-M4.相同的架构和指令集(Thumb-2)。然而,Cortex-M增加了一系列特殊处理方法DSP饱和运算和算法优化SIMD指令。以每0.5秒512点运行一次FFT例如,如果分别在同类量产中Cortex-M3 MCU和Cortex-M4 MCU上操作,完成同样的工作,Cortex-M3所需功耗约为Cortex-M四是所需功耗的三倍。另外,也有Cortex-M4实现单精度浮点单元(FPU)的选项。如果应用涉及浮点计算,则在Cortex-M4上完成比在Cortex-M三上完成要快得多。也就是说,对于不使用,Cortex-M4上DSP或FPU就功能应用而言,其性能、功耗和功耗Cortex-M3相同。如果使用DSP选择功能Cortex-M4。否则就选择Cortex-M3完成工作。

伴随着Arm Cortex-M提高了系列内核的性能,MCU芯片制造工艺也在升级。例如,ST新一代高性能MCU STM32F4基于Cortex-M33内核,具有200MHz性能更先进,40nm工艺制造。此外,MCU制造商也在尝试从MCU跨境产品领域MPU领域。如今,许多用户不仅使用它MCU,还有很多用途MPU。MPU它不仅带来了产品本身的性能改进,还带来了更多的软件选择,因为它是基于开源的Linux生态带来中间件,OS更多的选择和丰富的生态应用层。

Arm阵营只有Arm一家提供处理器内核的公司RISC-V阵营则是百家争鸣。

作为RIC-V微处理器的开路先锋,SiFive提供的RISC-V内核正好对标Arm的3个系列内核,分别是:

  • E核 -- 32位嵌入式内核,针对边缘计算、AI和物联网应用,对标ARM Cortex-M系列;

  • S核 -- 64位嵌入式内核,针对存储、AR/VR和机器人应用,对标ARM Cortex-R系列;

  • U核 -- 64位应用处理器,面向数据中心、通信网络等领域,对标ARM Cortex-A系列。

每种类型的内核又按照数字标号从低端到高端做了不同种类,包括2系列、3/5系列、7系列,对标Cortex A、R、M编号从低到高可用于不同的场景。可以说是从横向和纵向都对标了Arm系列。

本土RISC-V处理器内核开发商芯来科技也推出了四个不同性能级别的处理器内核,分别是:

  • N100系列处理器内核主要面向极低功耗与极小面积的场景而设计,非常适合传统的8位内核或16位内核升级需求,可广泛应用于模数混合、IoT或其他超低功耗应用场景;

  • N200系列32位超低功耗RISC-V处理器为物联网IoT终端设备的感知、连接、控制以及轻量级智能应用而设计;

  • N300系列32位超低功耗RISC-V处理器面向机制能效比高且需要DSP和FPU特性的场景而设计,适用于IoT和工业控制等场景;

  • N600系列32位RISC-V处理器面向实时控制或高性能嵌入式应用场景,适用于AIoT边缘计算、存储或其他实时控制应用。

  • 22内核应用于小型物联网及穿戴设备等入门级MCU,效能达同级别间最高的 3.95 Coremark/MHz,其高性能和精简设计,适合处理以高数据传输率运行中的协定封包;

  • N25F内核适合浮点密集型的多元应用,例如声音处里、先进马达控制器、卫星导航、高精度传感器融合以及高阶智能电表等;

  • 45系列内核均采用有序的8级双发射超标量技术,N-系列支持RTOS的应用,D-系列则支持RISC-V的SIMD / DSP指令集(P扩展指令集)。

阿里旗下的平头哥半导体主要针对下一代云端一体芯片新型架构开发数据中心和嵌入式IoT芯片产品,其E902处理器采用2级极简流水线,兼容RISC-V架构且对执行效率等方面进行了增强,并可进一步选配安全执行技术以增强系统安全性,适用于对功耗和成本极其敏感的IoT、MCU等领域。

消费电子、可穿戴设备及其它电池供电的物联网终端都低功耗都有严格的要求。系统功耗是物联网部署的主要考虑因素之一,很多应用场景下的IoT设备都是电池供电,而且要求可持续使用10 年以上。在很多应用中,MCU大部分时间都是处于低功耗睡眠模式,只是偶尔被唤醒读取传感器发送的一些数据,或处理和传送数据。

MCU子系统的功耗包括两部分——MCU工作时的动态功耗(与处理器主频成正比),以及MCU在睡眠状态下与漏电流相关的静态功耗(大部分是恒定的)。因此,总功耗受工作模式电流、睡眠模式电流和工作模式持续时间的影响。如果应用在大部分时间都处于关闭状态,睡眠电流甚至比工作电流更重要。32位MCU一般主频更高些,工作电流相应也大,但其处理速度也快,可以通过更快地完成处理任务和更快地进入睡眠模式来节省电量。此外,睡眠模式、发送和接收模式下的无线收发器电流消耗也是决定整体系统功耗的重要因素。

如果允许外围设备相互通信,并在不唤醒 CPU 的情况下可以监控传感器,这样可以大大降低系统的总功耗。Silicon Labs 的EZR32无线MCU就是一个很好的例子,它具有外设反射系统,允许外设在不唤醒 CPU 的情况下相互通信,其低功耗传感器接口可以在 CPU 处于深度睡眠状态下监控多达16个传感器。MCU和射频收发器节能技术的结合使得无线MCU成为物联网应用中电池供电传感器节点的理想选择。

为满足客户的低功耗需求,ST从2009年发布第一颗基于Cortex-M3的L1,到2014年基于M0的L0产品,一直到2015年、2017年持续给用户提供基于M4内核的L4和L4+。国内自主品牌的可穿戴手表有90%是基于L4和L4+这个产品线。去年ST发布了第一个基于Cortex-M33的STM32L5产品线,提升了整体安全性能和能效比,同时今年第一季度又发布了第一个基于40nm工艺的STM32U5产品线。

STM32U5产品线从宽度和高度两个维度来提升低功耗特性。宽度是指集成度,过去低功耗MCU最大集成的是2MB的Flash。在U5的最新规划中,今年会发布集成4MB Flash的产品。高度是指它的主频,过去不管是L4还是L5,产品线最高主频120MHz,现在会提升到160MHz主频。

开始注重安全问题乃是一个领域发展到高级阶段的体现,因为安全的技术投入和产出经常不成比例,很多时候还影响开发进度,但安全的缺失却足以造成致命打击。从MCU层面开始融入安全技术,让供应链下游的开发者将安全融入到开发生命周期中去,本身对MCU生态就是个比较积极的信号。

现在几乎每个MCU厂商都在MCU层面采取一些安全措施。比如,Silicon Labs旗下BG22蓝牙产品的安全性加强包括:专门硬件加速的加密、真随机数发生器、信任根安全启动、启动工程密码校验、Secure Debug with Lock/Unlock,以及Arm核本身支持的TrustZone。

国民技术是本土厂商中专门做“安全MCU”的企业,其安全芯片是一种为MCU融入安全技术,或者说增加相关安全模块的芯片产品。除了常规的MCU组成部分,其特点在于加强了芯片关键信息存储、运算过程的保护和抗攻击能力。下图中的红色部分即是国民技术为其安全芯片增加的安全模块。

相对典型的安全机制有安全存储技术,就是把明文的bin以密文的方式存储,程序执行时自动解密,每颗芯片的Key也各不相同,这与手机高级应用的数据保护措施颇为相似。还有比较典型的存储器分区隔离保护技术,这种技术会将Flash分成多个区,各区之间不能相互访问data与code。这一点针对不同层级做开发,比如语音识别厂商要将算法灌入MCU,方案整合商需要将应用场景整合进去,终端设备制造商又要修改人机界面。彼此藉由API访问,并不影响开发本身,同时做到防复制、防篡改、防擦除,保护多用户开发应用下的核心知识产权。

再比如各类密码算法硬件加速引擎的加入(包括国密算法)、时钟安全系统(外部时钟晶体失效时自动切换到内部RC振荡器)、固件安全更新(固件签名认证),以及一些防侧信道攻击的方案(典型如指令功耗平衡,因为攻击者通过功耗、发热等侧信道攻击方式是可以进行算法推断,进而获取资产的,指令功耗平衡可以切断这些侧信道攻击的可行性)。

过去几年,物联网 (IoT) 设备和无线连接产品(如无线传感器、智能电表、智能家居和可穿戴设备)出现了爆炸式增长。传感器和处理器等电子器件的成本逐渐降低,同时无线连接功能和AI性能的加持让许多产品变得更加“智能”,无需人工干预即可相互通信。然而,成功的AIoT产品必须满足特定应用的要求,比如低功耗、长无线连接范围,以及更高的计算处理能力等。

我们以一个典型的无线智能电表为例,其网络拓扑由多个简单的传感器节点(比如冰箱、空调和微波炉等)组成,这些节点通过传感器收集电量使用数据并将其传输到中央控制器或网关(Collector),从而保持与互联网和云服务平台的网络通信。这些节点和网关的设计必须最大限度地降低功耗、提供稳定可靠的网络连接,并尽可能扩展无线连接范围。

这一物联网系统的核心是微控制器 (MCU),负责处理数据并运行与无线收发器件接口的软件堆栈以实现无线连接和数据传输。MCU和无线器件的功能特性视特定的应用和系统要求不同,智能化的传感器节点集成传感器功能,并使用8位或32位MCU来运行小型的射频 (RF) 协议栈。这些物联网设备通常由电池供电,并通过无线连接到网关,由网关进行更繁重的处理和数据传输。

MCU厂商可以通过增加高精度ADC或AI功能来提升其产品的竞争力,但集成无线连接功能及对各种无线协议(比如WiFi、蓝牙、Zigbee等)的支持将是决定MCU芯片在物联网应用市场能否成功的关键。

无线MCU将成为AIoT时代的标准处理器芯片,像Silicon Labs这样的国际厂商数年前就开始专注于IoT应用市场,甚至将其它业务剥离出去,而100%投入物联网,他们在各种无线连接通信协议的集成和支持上是值得关注的。而像乐鑫科技和联盛德等国内芯片厂商也开始在其芯片中集成更多的无线连接特性,他们有望把握住新兴的物联网机会,而成为AIoT时代的领导厂商。

为迎合物联网应用的需求,MCU开发商需要在性能、功耗和尺寸(PPA)三方面达到最佳平衡。前面我们大致介绍了高性能和低功耗设计,现在来探讨一下小尺寸的设计挑战。IoT 终端节点的基本要求是小尺寸,因为这些器件通常被限制在很小的基底面内。例如,可穿戴设备的设计,体积小和重量轻是获得客户认可的关键。

在小尺寸MCU的发展历史上,2004年Microchip推出的全球最小单片机是采用SOT-23-6封装的PIC10F系列。时至今天,该芯片仍然处于在产供应状态,这说明市场对MCU小尺寸需求的重视。

小封装 MCU 是控制体积受限型 IoT 终端节点应用的理想元件。许多MCU还有其它功能,可将一个功能非常强大的设计轻松放入引脚受限的形状内。灵活的引脚分配、自主运行以及智能化外设互连器件是小引脚数 MCU 先进特性的一些示例,它们进一步提升了MCU的适应能力。

------------  ------------

后台回复『』『』『』阅读更多相关文章。

回复“”按规则加入技术交流群,回复“”查看更多内容。

点击“”查看更多分享,欢迎

标签: 超低功耗微功率无线传感器模块u型光式传感器系列

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台