智能手机AI跑分哪家强?苏黎世公布最新排名:华为P20“为AI而生”拔得头筹

Evelyn Zhang

近日,苏黎世联邦理工大学的新研究调查了Android平台上的深度学习(DL)的现状,对现有框架和编程模型进行了排名,并确定了在智能手机上运行AI的限制,依此公布了超过10000部安卓手机和芯片的AI Benchmark深度学习处理性能分数。

0

研究人员研究了四个主要移动芯片组平台的加速资源:高通、海思半导体、联发科和三星,同时还比较了各种SoC的实际性能结果。AI Benchmark收集了涵盖所有主要现有硬件配置的结果。

在一系列测试中,华为P20 Pro拔得头筹,“AI-Score”超过6000分,几乎是第二名的三倍。P20 Pro具有巨大的优势,成为第一款配备最先进的麒麟970 SoC芯片的设备,该设备专为AI应用而设计。

OnePlus、HTC和三星也纷纷跻身前五。

1

为了确定特定智能手机是否功能强大且足够快以运行最新的深度神经网络来执行基于AI的任务,研究人员对在野外运行的10,000部手机中的九项关键AI任务进行了测试:

测试可分为两组。在第一个(测试1,2,4,5,8,9)中,研究人员使用完全由Android神经​​网络API(NNAPI)支持的CNN模型,因此测试可以在具有合适芯片组及驱动程序的移动设备上进行硬件加速。作为中间层,NNAPI处理更高级别的机器学习框架与设备的硬件加速资源之间的通信。

此外,使用NNAPI避免了有问题的情况,例如系统无法自动检测AI加速器,而是在CPU上执行计算。

第二组测试(3,6,7)涉及完全在CPU上运行的神经网络。这些测试用于检查基于CPU的性能的速度。此外,在缺少NNAPI驱动程序的第一组测试中,使用此指令集将计算恢复为CPU。

1

AI基准测试中使用的深度学习模型的总结特征

2

几款Android设备的基准测试结果

3

几个SoC的基准测试结果

表1总结了本Benchmark包含的所有深度学习架构的细节。表2与表3中的结果和网络的相对处理时间以及内存消耗的理论期望高度一致。尤其是,第一个测试的量化MobileNet CNN相比相同的浮点模型仅需要1/3到1/4的RAM,并且其在CPU上的运行速度比Inception-V3 CNN快了一个数量级。第三个人脸识别测试处理的是两倍大的图像,并且比第二个测试需要大约两倍的推理时间,意味着Inception-ResNet-V1和Inception-V3的性能是相当的。

AI Benchmark的研究人员对Android设备上AI算法的硬件加速前景保持中立态度。他们相信2019年初的情况会变得更加清晰,届时配备强大新款麒麟980、联发科技P80、高通和三星Exynos高级SoC的首款智能手机都会上市。

在系统优化和面向开发者布局方面,华为有HiAI、苹果有Core ML,而高通则有AI Engine。

智能手机和平板电脑的计算能力水平正迅速迭代,一些甚至已经接近市场上新型台式电脑的水平。虽然移动设备很容易运行所有标准的智能手机应用程序,但是今天的AI算法对于高端设备来说也可能过于庞大。

AI独立处理单元的加入,全面提升了智能手机的用户体验。在拍照、解锁、游戏等智能手机的广泛应用中都会应用到AI处理模块的运算能力,对手机运算速率的提升有极大的影响。

与此同时,基准测试结果已经表明,移动设备上神经网络的发展仍然是一个不成熟的业务,框架不完整,芯片组混合支持网络,结果难以可靠地进行基准测试。

在移动设备上运行人工智能是苹果和三星等供应商之间竞争的热门领域,正如苹果公司继续强调其iPhone中“A系列”处理器中的“神经引擎”电路所显示的那样。

在华为、苹果头部玩家的引领下,拥有先发优势的玩家们,则更为积极地在AI芯片道路上飞速奔跑。先是8月的最后一天,华为在德国IFA展上率先推出了新一代的AI芯片麒麟980芯片,半个月后,苹果在新款iPhone上搭载了新一代的仿生芯片A12。几天前,华米推出了全球智能可穿戴第一颗AI芯片黄山一号。

但作为一种技术,移动神经网络推理仍然是一个需要经过适应并逐步开始发展的领域。

神经网络的硬件加速水平仍然参差不齐。最近的研究正凸显了在谷歌Android操作系统上运行神经网络的努力有多么不平衡。

本周在arXiv上发表的题为《PIRM智能手机感知图像增强挑战》的论文中,苏黎世联邦理工学院计算机视觉实验室的Andrey Ignatov和Radu Timofte描述了他们如何对与不同类型的在Android手机上运行的神经网络。

正如Ignatov和Timofte所解释的那样,产生一系列激烈竞争的原因在于——目前人工智能开发主要由PC和服务器上使用的方法主导,很少考虑智能手机受限操作环境中的需求。 

“在这些竞赛中取得最佳成绩的一般方法非常相似:更多层/过滤器,更深层次的架构以及对数十个GPU的更长时间的培训。”

他们认为,也许可以通过使用更小、资源效率更高的网络来实现非常相似的感知结果,这些网络可以运行在智能手机或平板电脑等常见的便携式硬件上。”

如果网络在CPU计算网络所花费的时间(以毫秒为单位)最短最高效,以及对所形成的工作质量的一些度量,对结果进行排序。

该竞赛是与9月中旬在德国慕尼黑举行的欧洲计算机视觉会议同时举行的。

参与者们面临的任务和挑战时提出网络元素的几何体,例如例如卷积神经网络(CNN),以执行基本的图像任务,例如改善手机上拍摄的照片的外观。他们的网络需要用谷歌的TensorFlow框架编写,必须安装在不超过100兆字节的文件中,并且必须在不超过3.5千兆字节的DRAM中运行。

这些模型由Ignatov和Timofte在两个设备上运行:其中一台式2017年的摩托罗拉“Razer手机”,在Android 7.1.1上运行; 另外是从今年4月开始测试华为P20。

他们指出,对网络进行编程的最简单方法是使用谷歌的“TensorFlow Mobile”框架,但该框架不支持“Android神经​​网络API”的新版本库,即“Android NNAPI”。 NNAPI旨在从高通、联发科、华为和三星中选取出各个处理器的硬件细节。

谷歌已经提出了一个新的库TensorFlow“Lite”来取代移动版本,它确实支持NNAPI,但Lite有其自身的局限性:截至报告时,它处于“预览”版本中,因此它缺乏对许多神经网络操作的“完全支持”,包括“批处理和实例规范化”。

他们还发现Lite也可以使用比Mobile版本更多的DRAM。至于NNAPI,它不支持所有类型的神经网络。例如,CNN将全部部署在设备或GPU中的AI加速器上,但其他类型的网络不得不求助于在CPU上运行。

总之,神经网络的硬件加速“现在发展得非常快”,但“目前缺乏标准化要求和公开可用的规范并不总是能够客观地评估它们的真正优势和局限性。”

应用AI化正在升级,拼质量拼生态将是未来手机AI芯片的一大趋势。据Gartner列出的人工智能手机的十大“高影响力”应用,在2020年,搭载以下10种AI功能的智能手机将走入我们的生活:

AI芯片在智能手机中的应用,已经从在拍照中的物体识别、场景识别(如华为P20 Pro中AI摄影大师),发展到针对视频中人体姿态、动作进行实时AI分析的全新功能(如今年IFA展上,华为基于麒麟980推出的“慧眼2.0”),竞争门槛也进一步拉高。

为了将AI芯片的计算能力开放给更多的开发者使用,玩家们一边在布局AI芯片硬件的同时,一边也在进行系统级的AI优化。玩家们也会推出对应的AI模块、框架、API给开发者,便于开发更丰富的应用,通过获得更好的AI性能,最大程度上发挥AI硬件的性能。

本研究中的AI Benchmark标准

AI Benchmark 是一款安卓应用程序,旨在检测在移动平台上运行 AI 和深度学习算法的性能和内存限制。该 Benchmark 包含由直接在安卓设备上运行的神经网络执行的几项计算机视觉任务。测试使用的网络代表了当前可部署在智能手机上的最流行、最常用的架构,其详细描述及应用程序的技术细节如下。

苏黎世联邦理工学院的研究展示了超过10000部移动设备的定量Benchmark结果。每部设备/SoC 的分数见表 2、表 3,包含每个测试/网络对一张图像的平均处理时间、可用SRCNN 模型处理的最大可能图像分辨率,以及总计AI分数。这些分数是通过对应设备/SoC的所有结果去除异常值之后取平均得到的。

以下为各大智能手机移动端芯片AI性能评测完整排名:

1

2

3

4

5

6

7

8

9

10

可行性研究报告

广告、内容合作请点这里:寻求合作

咨询·服务

评论

0条)

“1.2亿+”企业数据查询

网友评论仅供其表达个人看法.

相关阅读

精彩推荐