苹果自研CPU为什么这么强?

他们都知道苹果有三大暗鞘晶片系列产品:面向全国智能手机iPhone的A系列产品(Chavanges是A16)和面向全国 MacBook Air、Mac Mini、MacBook Pro、iMac 即使 iPad Pro晶片的M系列产品,在操控性上依次Axat终端应用领域战神AMDSnapdragon和PC应用领域的新贵雄霸AMD/AMD。苹果原因在于怎样的毅力,让暗鞘CPU那么强?

撕破天的A16人造CPU

苹果每月9月单厢举行新机见面会,最抢眼的即是新一代iPhone系列产品正式发布。苹果已经开始倚靠实用性和结构设计差别给新机多层,去年的iPhone 14系列产品延用了前代iPhone的A15人造CPU,虽然A15操控性也算坚挺,但吃货极难忽视它是前代晶片的历史事实,iPhone 14 Pro系列产品上的A16人造CPU才是王炸。

当他们谈及新iPhone实用性升级换代,他们主要在谈及什么?或许,最重要的是晶片和照相。iPhone 14 Pro系列产品上的A16人造CPU,操控性参数介绍呵呵:

选用三星电子4nm工艺技术晶片,耗电较之A15减少20%,往后他们非议的高热情况如果也能很大明显改善(参照AMDSnapdragon8+ Gen1);软件系统了160万个电晶体,选用6核中央CPU、5核绘图CPU;A16的6核CPU较之A15的操控性提高了42%,GPU操控性提高了35%,显卡频宽提高50%;NPU保有16个核心理念,可实现每秒钟17PFLOPS演算……

▲图源:Apple官方网站

写手钟文泽对iPhone 14 Pro系列产品的A16人造晶片试验结论如下表所示:

在Geekbench 5中,A16人造晶片R51875分,多核5454分,A15人造晶片R5战绩1731,多核战绩4758。从战绩来看,A16对比上一代A15晶片,虽然有点挤牙膏式创新的嫌疑,但遥遥领先安卓阵营,堪称撕破天。作为对比,安卓阵营Snapdragon8+R5战绩不到1400分,多核战绩在4300分左右。

此外,A16搭载先进的图像信号CPU,驱动四合一像素传感器带来广阔的创作空间,其搭载的神经网络引擎演算能力接近每秒钟17PFLOPS,可逐颗像素分析并优化照片。值得注意的是,苹果A16晶片保有安全隔区,守护用户的面容ID数据、通讯录等个人信息安全。

操控性炸裂的M1 & M2系列产品

苹果暗鞘 M1 晶片于2020 年末正式发布,它被塞进了 MacBook Air、Mac Mini、MacBook Pro、iMac 即使 iPad Pro 里。之后,以 M1 晶片为构架基础的 M1 Pro 与 M1 Max 全面替代了之前苹果笔记本里的 CPU。在很多操控性试验跑下来,不到 1/3 的耗电即可获得与传统电脑同样的操控性,让消费者大赞。2022 年 3 月正式发布的 M1 系列产品的最高型号 M1 Ultra,操控性与 Intel 刚刚正式发布的 12900K 桌面CPU不分伯仲。

M1晶片在执行任务时有哪些优势?

苹果是从 2004 年起把自家笔记本的 CPU 从 IBM 的 Power 系列产品换到了 Intel 的酷睿系列产品,原因是 Intel 的 CPU 的操控性耗电比远超过 IBM。2020 年,苹果又完全舍弃 Intel,用上了自己的 CPU,原因如出一辙,暗鞘 CPU M1系列产品在操控性耗电上比 Intel 好一大截。

本质上,苹果 M1 系列产品 CPU 与 Intel 酷睿系列产品和AMD 的 Zen3 系列产品,构架上高度类似,但为何 M1 会强那么多?

CPU 在执行任务时,会遵循取指令 – 指令译码 – 指令执行 – 对内存的读取 – 结论写回这 5 个步骤进行。

取指令这个步骤中,取来的指令会放在一级缓存里,所以如果一级缓存够大,就有利于 CPU 提高操控性。M1 的一级缓存是 192 KB,比 Intel 和 AMD 的 32 KB 大了 5 倍。指令译码是将外部指令翻译成 CPU 可以看懂的语言。数量上,M1 设置了 8 个解码器,Intel 酷睿是 5 个,AMD Zen3是 4 个。这 3 款 CPU 内部都运行 RISC指令(精简指令集,每一条的长度、执行时间固定,不能太复杂,如果要完成复杂动作,需要堆叠多条 RISC 指令)。而苹果M1输入 CPU 的指令 RISC 指令,Intel 酷睿和 AMD Zen3是 X86 指令(CISC指令,复杂指令集,长度不固定、执行时间也不固定,可用一条指令执行较复杂的任务,而不用堆叠好多条)。显而易见,Intel 和 AMD 的 CPU 比苹果M1多出一道把 CISC 翻译成 RICS的手续,耗能、耗时间。指令执行的执行单元越多,速度越快,整体操控性越高。以浮点演算这个当今对操控性影响最直接的指标来看,M1、Intel 和 AMD 规划了一样多的资源,2 个 256 bit 的执行单元。但寄存器(临时存放整数和浮点部分的单元), M1 更强,是一个 354 + 384 的结构,而 Intel 是 180 + 168,AMD 是 192 + 168。苹果M1 规划了巨大的二级缓存资源,每个核心理念都布设了 3 MB 的二级缓存。Intel 是每核心理念 1.25 MB,AMD 是每核心理念 0.5 MB。二级缓存大,意味着有更多的将被使用的指令可以提前预备好,送进 CPU 的速度更快。M1通过软件系统更大的缓存减少延迟,而传统CPU靠读取内存条,速度自然就满了。苹果M1拉大了与传统CPU内存频宽上的差距。M1 Ultra 可以达到 800 GB/s,M1 Pro 和M1是 200 GB,而 Intel 和 AMD 大约只能有 50 GB/s – 60 GB/s。于是,在高清视频剪辑这种每秒钟都有几十 GB 实时数据传递的任务里,苹果笔记本的处理效率就非常高。当他们在2022 年 6 月 7 日,苹果在 WWDC 见面会上正式发布了自己的 M2 CPU。较之 M1 CPU的那次见面会来说,M2 的影响要小得多。但他们还是可以从 M2 的应用和介绍中,看出苹果公司的产品思路和半导体行业的突破方向。

M2CPU的规格和背后的含义

去年6月,苹果在 WWDC (全球开发者大会)上正式发布了暗鞘的M2 CPU。M2 选用三星电子第二代 5nm 工艺技术,从 N5 工艺技术升级换代到 N5P 工艺技术,在相同的耗电下,第二代比第一代操控性强 5%。

这种提高算大还是算小呢?2012 年之前,结构设计耗电相同的情况下,下一代产品操控性提高 25% – 50%;即便在后来操控性挤牙膏的年代,下一代比上一代操控性提高 10% 是一个及格的门槛。是什么因素让苹果有毅力将不到及格门槛的提高,当作下一代产品正式发布?

毅力来自M2 CPU的电晶体数量。M2 的电晶体数量是 200 亿, M1 是 160 亿,数量上提高了 25%。再叠加工艺技术上 5% 的提高,综合起来操控性比 M1 提高了 18%。

神经引擎的数量,M1 和 M2 都是 16 个核心理念,但 M2 的速度快了 40%,提高较大,很可能与频率的提高有关。

新增加的 40 万个电晶体都增加在哪里了呢?主要是两方面 ——绘图核心理念从 8 个增加到 10 个,提高了 25%;内存从 16GB 提高到 24GB。因此,M2 实际上就是扩大版的 M1。

苹果的见面会上还提到了,M2 和新一代的其他品牌的 10 核心理念 CPU 较之,在 15 瓦耗电下,操控性是对方的 1.9 倍。而如果对比峰值操控性,那个 10 核 CPU 耗电在 30 瓦时释放的操控性,对 M2 来说,只需要不到 8 瓦就能实现。听起来好像是 M2 优势炸裂,但实质上这些优势主要源于 M1 的操控性提高,M2 较之 M1 来说,只有微小的改进,也就是由那 5% 的工艺技术改进带来的提高。而前一代CPU M1 在能耗表现上为何那么出色,一是 M 系列产品CPU不计成本的堆料,从而获得了超级操控性,二是在指令翻译过程中利用格式统一的优点节省了大量能耗。

苹果CPU为何敢不计成本地堆料?

Intel 和 AMD 的CPU一直以来都在比拼最高操控性,有时即使不惜让耗电增加一倍换来操控性 10% 左右的提高。这就导致了一种现象的出现,内置Intel/AMD CPU 内核的笔记本,插上电源和不插电源的时候,操控性会相差 30% – 40%。在插上电源时,系统按最大操控性运行;而只用电池续航时,系统会强制 CPU 和 GPU 以低频、低压运行,操控性巨幅下降。

使用 M1 构架的苹果笔记本完全不存在这样的设定,用电池和用电源时的操控性都完全一样,可以不用带电源适配器,办公一整天也绝对保证续航。

CPU 的操控性优劣,并不是靠在某个环节上猛堆料实现的。因为计算过程是一条流水线,线上任何一点的瓶颈都决定了 CPU 的最大操控性。M1 比传统 CPU 好就好在,它在任何环节都堆了猛料。

一分钱一分货,苹果M1 堆料的结论就是,这颗 CPU 的成本要比 Intel 和 AMD 的贵上几倍到十几倍。业内分析,M1 Ultra 的制造成本在 350 美元左右,而 Intel 和 AMD 顶级 CPU 的成本也就只有几十美元。

为何苹果敢做那么贵的 CPU ?本质原因在于苹果卖整机而不卖 CPU。

如果 Intel 和 AMD 的CPU制造成本就要 350 美元的话,研发成本假设按 50 美元/颗计算,总成本就是 400 美元,售价估计直奔 2000 美元。而今天市场上,最畅销的 CPU 型号的售价普遍在 200 – 400 美元之间。所以,Intel 和 AMD 都不会规划那么豪华的构架。

苹果高价位只卖整机,5000 – 8000 美元一台,在最关键部件分配 350 美元成本是合理的。

苹果CPU的发展方向

WWCD见面会上还透露,M2 的进阶款,也就是 M2 Pro、M2 Max 会在之后量产,而且工艺技术会提高到 3nm。三星电子给出的参照是,3nm 对应的N3工艺技术,它在同耗电下的操控性比 N5P 提高 10% – 15%。仅从这一点看,就已经是比较可观的提高了。

只卖成品笔记本、平板或者智能手机的苹果,可以通过M1构架的不断堆叠,堆 2 倍、堆 3 倍、堆 7 倍,从终端端到笔记本再到台式机再到一体机,各种平台通用。通过大幅度地使用一款基础产品,通过扩大规模来平移到各个产品之中,进一步压缩研发费用,这一点也只有苹果可以做到。

他们是否可以期待苹果的 M 系列产品CPU的飞跃式的提高吗?答案似乎是否定的。预测在苹果的有生之年,CPU的提高将会一直是稳步小幅的态势。今后的 M2、M3、M4 较之前一代的提高,大约单厢与M2较M1的提高类似,成品状态下最多提高 25%。当前的苹果暗鞘CPU是根据自身需求高度定制化的,其他厂商已经全都不能满足苹果的要求了。而暗鞘的CPU从 2020 年量产后,就马上应用到苹果几乎全部的主力产品。目前,其他CPU在耗电比上大幅超越苹果的可能性几乎没有,苹果即没有市场需求也缺乏自身动力来推动CPU操控性大幅提高。

半导体行业的突破

从苹果 M2 映射出的半导体行业工艺技术改进对CPU操控性提高的作用变得越来越小了。在 2012 年之前的五十多年里,整个行业基本遵循摩尔定律,维持每 18 个月电晶体密度提高 100% 的速度。而 2020 年之后,最好情况是每 18 个月提高 30%,未来,这个提高的速度今后还会越来越慢。留给传统材料的半导体在工艺技术上可改进的空间已经不多了。

以三星电子为例,从 2020 年末量产 5nm 到 2022 年末量产 3nm,24 个月里,电晶体密度从 1.73 亿 / 平方毫米提高到 2.9 亿 / 平方毫米,相当于每 18 个月提高 29%。按三星电子的规划,2nm 会在 2025 年末量产,较之于 3nm 的 2022 年末正好是 36 个月,2nm 的电晶体密度是 4.9 亿 / 平方毫米。从 3nm 升级换代到 2nm 的速度,相当于每 18 个月提高 34%。这是全球半导体工艺技术水准最好的三星电子的水平,三星和AMD的速度低于30%。

半导体行业飞跃式的突破,只有在换用其他材料做CPU的开关管后才能发生。他们期待新一代半导体材料为行业带来突破。

未经允许不得转载:头号研究社-海外苹果ID购买注册|海外苹果礼品卡及Arcade订阅|海外账号购买、教程 » 苹果自研CPU为什么这么强?

赞 (0) 打赏

评论

4+9=

觉得文章对您有帮助请打赏,谢谢

支付宝扫一扫打赏

微信扫一扫打赏