华为消费者业务CEO余承东在2018德国柏林消费电子展(IFA)上发表“The Ultimate Power of Mobile AI”的主题演讲,面向全球推出华为最新一代卓越人工智能手机芯片—麒麟980。
似乎已经好久没有收听到国内有哪些重大事件发生了,然而在8月的最后一天,华为似乎带着不可辜负的使命,让天朝再次成为世界的焦点!
8月31日晚八点,华为在德国IFA 2018展会上正式揭晓了新一代移动SoC处理器“麒麟980”。
一向自信的余承东直言:“基于多项技术突破和方案创新,麒麟980不仅在性能、能效、移动通信连接等方面领先业界,同时增强了AI运算力及丰富了AI应用场景,将再次引领手机全面进入智慧时代。”
不吊任何胃口,余承东直接公布了麒麟980的六个世界第一。
翻译成中文就是:
全球最早商用的台积电7nm工艺的手机SoC芯片 -
全球首次实现基于ARM Cortex-A76开发的商用CPU架构,最高主频可达2.6GHz -
全球首款搭载双核NPU -
全球最新采用Mali-G76 GPU -
全球最先支持LTE Cat.21,峰值下载速率1.4Gbps,达到业内最高 -
支持全球最快LPDDR4X颗粒,主频最高可达2133MHz,同样业内最高 -
世界第一个7nm制程工艺SoC。
整个芯片尺寸仅为14mm*14mm,相比业界普遍采用的10nm制造工艺,性能可提升20%,能效提升40%,晶体管密度提升到1.6倍,实现性能与能效的双重提升。由台积电代工。
世界第一个ARM A76架构CPU
首次实现了基于Cortex-A76的开发商用,在指甲盖大小的尺寸上塞进69亿个晶体管,与上一代相比单核性能提升75%,能效提升58%。
此外,Kirin CPU子系统推出了Flex-Scheduling智能调度机制,创造性地设计了2超大核(基于Cortex-A76开发)、2大核(基于Cortex-A76开发)、4小核(Cortex-A55)的三档能效架构,提供了更为精准的调度层次,让CPU在重载、中载、轻载场景下灵活适配,让用户获得更高性能体验的同时获取更长的续航体验。
世界第一个双NPU
在双NPU的移动端算力加持下,麒麟980能做到人脸识别、物体识别、物体检测、图像分割、智能翻译等AI场景,采用更高精度的深度网络具备更佳的实时性,从而获得更优体验。麒麟980实现每分钟图像识别4500张,识别速度相比上一代提升120%。
全新一代的 NPU 设计,在 AI 性能上远超过现有其他强调 AI 的竞争产品。
世界第一个商用Mali-G76 GPU
与上一代相比性能提升46%,能效提升178%。麒麟980引入了AI调频调度技术,能够实时学习帧率、流畅度和触屏输入变化,预测手机任务负载,动态智能感知手机使用过程中存在的性能瓶颈,及时进行调频调度。
在游戏场景下,使用AI调频调度技术预测游戏每帧负载,预测准确性可以提升30%以上,有效提升了游戏平均帧率,大幅降低游戏抖动率,减少游戏卡顿,为手游用户带来操作流畅、不卡顿的优秀游戏体验。
世界第一个1.4Gbps Cat.21基带
在网络支持方面,麒麟980支持LTE Cat.21,支持业界最高的下行1.4Gbps速率。此外,麒麟980配套使用手机WiFi芯片Hi1103,率先支持160M带宽,理论峰值下载速率可达1.7Gbps,是业界同期水平的1.7倍,同时,Hi1103支持业界领先的L1+L5双频GPS精准定位,L5频段下定位精度提升10倍,有效改善手机定位精准度。
世界第一个支持LPDDR4X-2133内存
麒麟980采用的是2大核+2中核+4小核设计,配合2133MHz内存,带宽提升了20%、延迟降低了22%。
另外,在拍照能力上,麒麟980采用自研ISP,像素吞吐率比上一代提升46%,能够分区域调节图像色彩与灰阶,支持更多摄像头,全新HDR色彩还原,能够分区域调节图像色彩,实现照片色彩与细节的平衡。
在演讲的最后,余承东宣布了HUAWEI Mate 20系列将于10月发布。作为首个搭载麒麟980芯片的智慧手机。
从麒麟 970 到麒麟 980,最新架构的引进大幅改进能效表现
麒麟 970 这款在 2017 下半年推出的芯片对华为而言极具有战略意义,其推动的华为产品布局与 AI 应用生态,夺走了许多消费者的眼光,也顺势推动华为的许多产品的销售。
然而,从麒麟 970 的设计理念中,还是能看出华为为了节省成本而做的努力。首先,其 CPU 架构采用 4 个Cortex-A73 搭配 4 个 Cortex-A53,是当时的主流高端架构,但是在 GPU 方面,却只采用了 12 核心的Mali G72,并通过提升运行频率以强化其性能表现。这种作法相当简单粗暴,但是对于降低芯片面积以及 IP 授权成本有一定的效果,只不过还是有些副作用出现,首先,由于频率较高,将直接挑战架构和工艺本身的功耗墙,一旦超过边界极限,那么功耗和温度就会直线上升,影响持续性能输出表现和稳定性,手机也会明显发热。
为了控制成本,麒麟芯片通常会使用少核心高频的手段来取得成本和效能的平衡,但功耗效能上的表现多少都会受到影响。为了解决这个问题,华为利用软件优化手段,也就是 GPU-Turbo 手法,针对性的瞄准特定游戏应用来优化其功耗与性能表现,的确发挥了不错的效果,就连高通也希望仿效这种作法来改善其硬件的表现,对业界整体而言,华为的确带起了一波技术革新与示范作用。
而麒麟 970 的另一个重点在于全球首发的 AI 硬件 NPU 设计,其AI算力很强,可以在 1W 功耗下达到4TOPS 的性能表现,不止相关应用的性能与效果超出高通的异构计算,甚至苹果 NPU 也自叹不如,而其他的“纯软件模拟 AI 方案”就更不用说了。
而此次在 IFA 大会上发布的麒麟980,采用的是 Cortex-A76。Cortex-A76 是在今年 6 月才发布,官标的数据方面,基于台积电 7nm 工艺的 3GHz A76 核心比 10nm 2.8GHz 的 A75 核心性能提升 35%、省电40%、机器学习的负载能力提升 4 倍。
在 GeekBench 4 跑分方面,整数和浮点相较于 A73 提升了 90% 和 150%,最终得分提升 35%。
A76 同样支持 DynamIQ 拓扑特性,官方建议 1+7/2+6 这样的 Big.little 大小核设计。通过使用最新核心,麒麟 980 的性能表现也达到惊人的程度,另外在 GPU 部分,同样也采用了最新的 Mali-G76,其性能密度提升了 30%,节电 30%,用于手机的图形性能会提高 50%,现在可以支持最高 8K 分辨率的屏幕了。不过由于成本考虑,虽然核心数量只有 10 个,较麒麟 970 少了 2 个,但性能是相当于 20 个旧版核心。
但值得注意的是,由于必须考虑到成本架构,华为在麒麟 980 的架构设计上依然还是偏重成本控制,所以除了使用最新架构外,核心数量或者是自定核心并没有太过积极的动作,因此,在同业对手的方案相继跟上 7nm 脚步后,华为要面对的竞争态势也将会有所改变。
不过在重点的 AI 单元,华为将继续使用专用 NPU 的方案,并使用了双核配置,性能达前代方案的 135%。而且其设计原生为 7nm 工艺优化,更能适合麒麟 980 的设计方向,而这点也将成为麒麟 980 能否领导未来手机 AI 方案的重要关键。
其他 AI 手机方案竞争者
即将引入硬件 NPU 的高通
作为全球最大的手机方案供应商,高通过去通过 Hexagon 与 GPU、CPU 协同工作,达成对主流AI 框架的计算加速能力,虽然在效率上还是明显落后苹果与华为的硬件方案,但总是给市场一个交代。
然而,异构计算(Heterogeneous computing)虽然弹性高,且可以有效利用芯片中的不同类型计算架构,但目前 AI 计算方案讲求的是更高的能效表现,而在手机等移动终端上,更显重要,虽然高通的异构计算已经属于相当高效的技术,但仍与 ASIC 有一定的落差,也因此,在使用针对 AI 加速框架进行性能的评比应用时,高通很明显要落后采用硬件 NPU 的竞争对手,未来如果 AI 模型往更复杂的方向发展,或者是同时需要执行多种 AI 服务,那么在发展空间上就可能会明显不如竞争对手了。
不过,高通也不是不知应变,根据市场传闻,其在下一代中高端方案骁龙 700 系列中,将引入硬件 NPU 设计,而如果成真,其下一代高端方案,也就是骁龙 855,也将可能沿用同样的方式。
而目前高通也引进了包含商汤等多家 AI 算法设计公司所设计出来的应用框架,想要快速冲刺相关市场,不过高通目前的 AI 性能还有相当大的改善空间,如果要负载更复杂、多元的 AI 计算,恐怕还是要等到下一世代的 AI 设计问世。而根据 DT 君得到的信息,高通将在 12 月正式发布新一代的高端 AI 手机方案,按照往例,明年初就可以见到实际终端产品。
三星从抄袭到走出自己的路,Exynos的半软半硬 AI 亦然
三星作为全球最大的手机厂商,其势力涵盖终端、消费、云端服务、半导体制造与设计等领域,而其中,手机市场是其最重视的一块,而为了推动其手机市场的布局,三星过去亦步亦趋的追随包含苹果与高通的步伐,并将学习到的设计精髓转化为自有的方案设计。
目前三星主要的芯片来源包含了自行设计的 Exynos 系列、高通的骁龙系列、联发科的低端 MT 系列,以及展讯的 SC 系列,市场从最高端,到最低等级,可能会被我们直接当作电子垃圾的产品,几乎都有覆盖。
目前 Exynos 9810 是三星的主力自产高端产品,今年的 Galaxy S9 系列、Note9 系列都可见到其身影,其采用的 AI 计算方式与高通类似,主要是通过 DSP、GPU 与 CPU 的协同计算,不过三星有个特殊的作法,那就是视觉相关的处理交由硬件,而非异构计算。
目前的 9810 采用脱胎自 Cortex-A75 的 M3 定制架构,并搭配 Cortex-A55 作为小核心,而与华为最大的不同是,三星在 GPU 规模上相当舍得下工本,其 Mali-G72 核心数量配置高达 18 个,比麒麟 970 多出 6 个,虽然芯片成本会较高,但可以在较低的时钟水频达到更稳定、更好的效能表现,换言之,能效也更好。
而 9810 中有个 VPU 计算单元,顾名思义,是用来处理视觉方面的计算工作,这个单元应该是硬件设计,但只能用来处理比较固定的功能,三星也未公开发布任何支持该计算单元的可编程或开发套件框架。
而其他的 AI 计算工作就如高通般,是使用异构计算,统 GPU 与 CPU 来达成,这方面可能主要是沿用 Arm 的软件资源,三星也同样没有发布任何相关的开发套件给第三方开发者。
而下一代方案,也就是 Exynos 9820,将会采用 ARM DynamIQ 架构设计,并且将以“2+2+4”三丛集形式打造,其中两组大核将采用三星自主架构“M4”,第二道两组大核则以 ARM Cortex-A75 构成 (也可能以 Cortex-A76 取代),而小核部分则将以 4 组 ARM Cortex-A55 构成。
AI 部分则将可能维持 9810 的作法,那就是采用 VPU 硬件处理单元来处理部分视觉计算工作,并搭配既有的异构计算方式来处理标准 AI 计算框架,也就是半软半硬的方式。
最后,9810 采用的是三星 10nm工艺,而 9820 将可能是三星 7nm 方案首发,但因为三星的 7nm 采用 EUV 技术,目前还在调试中,真正量产最快也要今年底或明年初,这也可能让 9820 成为最晚推出的次世代 AI 手机芯片方案。
赚走最多钱的手机公司搞 AI——苹果
苹果基本的手机芯片布局是每年一款,当然,为了配合如平板电脑或者是手表等其他终端的产品时程,也会在不特定的时间点发布相关方案。而苹果最新的手机芯片是去年发表的 A11 Bionic,内建的硬件 NPU 是最大特色。而苹果在其芯片中往往都使用较少的核心,相较对手都已经走到 8 核以上,苹果 A11 还只是个 6核产品,但其表现出来的性能数据却远远超越所有竞争对手,其原因包括苹果对其使用的 Arm 架构深度定制化,并舍得为了特定性能目的来堆加更多晶体管,因此其芯片制造成本往往也都比同时期的手机芯片方案更高。但此策略成功推动手机的销售,并创造更高的获利,因此每一代方案苹果也就更舍得堆料,形成正向发展。
A11 使用的是台积电 10nm 工艺,这也是少数几次没有使用到三星代工工艺的苹果芯片,由于目前苹果的开发套件中,只开放 GPU 计算能力给开发者,而 GPU 也负担包括第三方 AI 应用的训练或推理的工作,对苹果而言,GPU 的份量也越来越重要,这也是之所以苹果要推动自有 GPU 架构的发展。
虽然目前所采用的 PowerVR 架构在性能与菜单现上相当出色,该公司也愿意配合苹果进行高度定制工作,但这对于苹果而言仍远远不足,而展望未来苹果对其 GPU 架构的布局,将可能是个结合绘图、计算以及推理、训练的全功能 AI 优化设计,当然,为了能耗表现,推理工作可能还是维持独立的 NPU 单元来进行。
而未来 A12 将会如何?其实在现阶段也只能猜测,唯一能确定的只有使用 7nm 制造工艺这点。而在架构方面,根据过去的惯例,性能的增长肯定是不能忽略的,毕竟对手也都在积极追赶,今年对手的主流方案都已经在整体性能上有相当大的改善,也拉近了与 A11 的距离,A12 肯定会在CPU 与 GPU 方面进行更深度的改造,不论是增加更多的处理管线,更优化 CPU 或 GPU 内部的流水线设计,亦或者粗暴的堆加核心,都是可能的作法。
至于在关键的 AI 硬件单元方面,除了强化效率以外,也可能就规模方面进行扩展,借以压制华为或高通等即将面世的下一代 AI 方案。
专注中低端的联发科
联发科 2018 年主打的 AI 手机方案 P60,具备 AI 专用计算模块的APU(AI specialized Processing Unit),基于 DSP 计算架构,而 CPU 则是采用Cortex-A73 搭配 Cortex-A53 的四大四小设计,虽然不是采用最新的 Cortex-A76,但性能表现仍有一定水准,GPU 方案则是使用 Mali-G72 这款相当稳定的 GPU 架构,不过可惜的是,联发科为了成本考虑,只采用 MP3 配置,并以高频率运作来补足性能表现,因此在运行游戏时,可能会对电池寿命产生负面影响。目前 P60 已经被应用在包含 OPPO 等多款手机产品当中,虽后的小改版产品也已经箭在弦上。
目前,中国前几大手机厂商都是联发科的客户,产品多分布在中低端,包含华为、OPPO、VIVO、小米、魅族,以及其他二三线厂商,基本上都摆脱不了联发科,毕竟中低端手机中具备成本优势,产品线完整且技术更新还能跟上市场脚步,且能提供最好技术支持服务的,就属联发科了。而在前两年,联发科也打入三星的供应炼,通过使用一定比重的三星芯片代工工艺服务,三星也在其低端手机中采用联发科的方案作为交换。
联发科的方案成本相对较低,且过去在包裹 TurnKey 服务方面口碑极好,在中国的支持人力也最广泛,虽然是 AI 生态的后进者,但是在商汤等 AI 大公司的协助之下,或许第一时间就能够提出够成熟的语音与视觉 AI 方案,对客户而言,联发科一直都是便宜又大碗的选择。
特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。