资讯详情

【阅读笔记】【端侧AI】Smart at what cost? Characterising Mobile Deep Neural Networks in the wild

系列文章目录


文章目录

  • 系列文章目录
  • 【阅读笔记】【端侧AI】Smart at what cost? Characterising Mobile Deep Neural Networks in the wild
  • 摘要
  • 1 引言
  • 2 研究问题&结果
  • 3 Methodology
    • 3.1 DNNs提取
    • 3.2 离线DNN分析
    • 3.3 模型评测
  • 4 数据集收集&分析
    • 4.1 数据集
    • 4.2 设备上模型的分布
    • 4.3 ML框架
    • 4.4 模型类别
    • 4.5 模型唯一性分析
    • 4.6 跨快照时序分析
    • 4.7 移动DNNs的层和运算
      • DNN层和运算类型
      • DNN运算和参数
  • 5 端侧DNNs运行分析
      • 5.1 On-Device DNN 延时
    • 5.2 能耗
      • 5.2.1 设备上的能耗和功耗
      • 5.2.2 能耗由场景驱动
  • 6 可用的优化
    • 6.1 优化模型级别
      • 权重聚类(weight clustering)
      • 剪枝
      • 量化
    • 6.2 优化系统级别
      • BatchSize的影响
      • 线程数的影响
      • 目标通用性和设备优化
      • 特定加速硬件
      • 优化机会
    • 6.4 基于云的DNN模型
  • 7 相关工作
  • 8 讨论&之后工作
    • 8.1 影响&趋势
    • 8.2 局限性
  • 9 结论


【阅读笔记】【端侧AI】Smart at what cost? Characterising Mobile Deep Neural Networks in the wild

阅读笔记,非全文翻译


  1. 了解NAS
  2. 什么是
  3. 什么是cloud offloading

摘要

  • 本文对自然场景DNN通过跟踪模型和相应的移动设备,对其应用进行了全面研究。
  • 分析了谷歌Play中超过16k个App使用和性能
  • 测量模型的功耗
  • 总结实验过程,开发gaugeNN,移动设备的自动部署、测量和分析DNN支持不同平台和框架的工具
  • 本文的研究也研究差距,以及DNN优化动态和异构移动生态系统的必要性。

1 引言

  • 把DNN对移动设备部署的相关研究:
    • 研究人员设计不同设备专用网络架构,或者通过自动设计。
    • 或通过重量稀疏或剪枝量化等操作。
    • 为移动SoCs核优化技术的设计。
    • 技术,把DNN按层分开,云与本地分开计算。
  • 由于移动设备太多,开发人员很难评估性能并优化硬件。
  • 本文贡献:
    • 设计了gaugeNN,自动提取、分析和评估(benchmark)最受欢迎的自然场景app中的DNN模型。
    • 用gaugeNN分析了16k个app和DNN模型分析了云的使用、架构、层算子和优化DNN API的调用。
    • 分析过去一年GooglePlay app分析结果。
    • 数百种不同设备的不同能力DNN运行时测量模型并分析它们
    • 分析了现有工具对模型和系统级别的优化方法,并提出了指导开发者如何优化的建议DNN。

2 研究问题&结果

三个研究问题:

  • 考虑前沿ML在移动场景下,研究和部署了许多工具和设备的模型app上?被开发者用在哪个任务上?
  • 这些模型是如何部署在各种智能手机生态系统中的?它们能有效地执行不同的任务和目标吗?
  • 普通的模型优化和系统层面的优化是如何让手机在自然场景中推理得更快的?还能改进吗?

  • 使用端侧开发者模型,或对某项任务进行微调,并依赖于大型任务
  • 低档设备DNN相关任务明显较慢。
  • 随着代际的增加,设备的代际增加,因为SoCs集成硬件加速。
  • 但是电池技术没有这样的曲线。
  • 使用主流框架的现成模型级优化往往不会带来推理延迟或内存延迟,而是关注模型的压缩能力。
  • SoC厂商定制的工具能提供显着的运行时的帮助,但限制了使用的推广
  • 针对特定目标的模型部署在自然场景中没有发现。

3 Methodology

在这里插入图片描述

3.1 DNNs提取

find, extract, and validate

  • 与69个已知框架已知框架进行比较。
  • 移除非DNN模型的文件;加密和混淆模型没有被实验分析;程序自动从GP省略了下载模型;

3.2 离线DNN分析

App两种计算方法:①本地计算;②将计算转移到其他资源设备(云等)。

标签: 318安全传感器

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台