作者 | 淡定的葱粉(酷友) 本文写给比我还白的小白,大神轻喷,做一些简单科普,从 soc 的角度给予垃圾佬和等等党一些购买建议,尽量避开涉及架构细节的术语(因为我也不是很懂)如果有人想看之后可以试着写一些。 首先我们要明确的什么是一个好的 soc,从芯片设计的角度来说 ,PPA(power performance area)是衡量一个架构的重要指标 ,相同面积下相同功耗能否做出更优秀的性能可以区分一个架构设计水平的高低。 各家标称工艺节点的实际水平,来自@mebiuw 工艺节点图 然后我们要明确芯片功耗和性能之间的关系 ,影响功耗的因素分为:静态,动态功耗和热效应 在同一种工艺节点下 ,相同面积的芯片静态功耗通常是一致的,目前还没有一种很好的办法可以便捷的测试出手机的单芯片功耗,手机评测通常测试的是整机功耗或动态功耗(满载功耗 - 静息功耗)自 finfet 技术应用之后 漏电现象得到了很好的控制 现在绝大多数手机的静息功耗都在 0.4w 左右 这其中还包含了大量周边芯片组,针对单 soc 讨论动态功耗即可。 A12 大核心整个频率区间对应的功耗表现 理论上频率和功耗是一个线性递增关系 ,而电压和功耗是 ^2 级别的递增关系 ,为了保证芯片高频运行的稳定性通常要施加更高的电压 ,所以实际的曲线很难用单一公式表达,只能通过各个频率的功耗离散点进行拟合。 通过这个图我们可以看到 A12 大核心在台积电 N7 节点下的甜点频率在 2.2ghz 附近 而苹果给 A12 的睿频在 2.5ghz 为了最后 15% 的频率提升付出了三倍的功耗差距。 由于苹果灵活的调度策略和强大的小核心 超高的单核功耗在日常需要高并发短时间负载时并不会造成严重发热,而我们在进行游戏这种长时间中高负载的性能需求时 ,就会影响到性能的长期释放。 这就是省电模式是苹果游戏模式的由来 与其给予过剩的性能造成更多的空载时钟 还不如直接限制性能,留足性能释放的散热余量,让处理器稳定的跑在一个高能效比区间。(缺点就是爆发性能不足,在某些场景会出现小卡顿,而对于原神这样对 cpu 本身要求就很高的游戏会提升平均帧率) 简单说一下热效应 当芯片温度过高触发降频和手动限制频率到同一个性能时功耗是不一样的,温度会影响芯片的电气性能,提升漏电率,所以需要更高的电压来维持 cpu 的稳定运行。 一些旗舰芯片 spec2006 的性能功耗表现 我个人认为用 soc 在 spec2006 上的表现对一个 cpu 的性能来进行评价是非常客观的 ,使用多个子项目全方位测试 cpu 各项性能指标 ,不同的子项目有不同的性能指标敏感点,例如有的子项目是访存延迟敏感型,有的则比较吃缓存命中率和缓存容量大小 。 在这个图上,左边柱状图长度代表整个测试流程消耗的能量(越短越好),右边则代表所有项目完成时间的倒数再乘一个特定系数(越长越好)。 我们可以看到即使是 A12 大核心在为了换取最后 15% 频率提升的情况下(频率提升不等于性能提升,即使是同一芯片,原因等下说)高于其在 2.2ghz 三倍功耗(我认为 2.2ghz 足以血虐 到时候的柱状图反而更加震撼...)依然做到了几乎和 855 大核心相同的能效比 而小核心在性能是 7nm 工艺节点下 1.8ghzA 55 2.5 倍的情况下 ,能效比是 A55 的两倍,峰值功耗也仅高了 20% 左右 (A12 的小核心 tempest 亦是源于 A6 的 swift 架构 同样的乱序三发射(A75 也是乱序三发射),各个子项目的表现也是出奇相识...... )而 A55 架构源于 A53 的改良版(一个双发射顺序架构,不谈后端利用率,仅从吞吐量上就拉开了差距)优点是现行主流架构中最低的静态功耗,缺点..... 性能羸弱。 苹果残暴的小核心带来的直接影响是什么呢? 拿 A11 和 835 这两个功勋处理器来对比一下(这两款处理器分别带来了苹果和安卓阵营的变革)A11 的小核心集群拥有着 835 大核心集群的性能 只有后者 40% 的功耗,更形象的说就是 835 大核心集群的的单多核性能 (暂时不考虑多核利用率和缓存结构带来的影响)625 不到一半的多核功耗。而 A12 的小核心在 A11 的基础上功耗降低了三分之一。 总结一下 A11 小核性能 A12 小核心性能 835 大核心性能 ,A13 小核心性能略低于 845 小核心性能 但是有着比 A12 小核心更低的功耗,而 A14 的小核心....1.25 倍 845 大核心的性能 ,和麒麟 810 相同单核心性能 ,三分之一的单核功耗 ,specint 分数高达恐怖的 20.06。 安卓的 A55/A53 就没什么好说的了 835 大核心四分之一的功耗 ,40% 的性能。 苹果的大核心除了 A13 的提升不太满意以外,其他都是性能能效全面提升提升,而安卓自 835 之后在 cpu 部分做到全面提升的只有 865(本质上来说 A76 架构具有划时代意义 从 A77 到 A78 甚至今天的 X1 乃至于 X2 都是 A76 的增量更新)。(只考虑高通设置频率在峰值性能的情况下,如果涉及到同性能下的功耗表现而跑在特定的性能区间,即使是拉垮的 845 和 888 也可以小幅度领先 835 和 865)。 海思和天玑就不展开说了 ,涉及到架构的细节有点多,有人想看的话之后可能会写,有小朋友很好奇为什么海思和高通用着同样的 arm 公版架构(不要说什么高通定制架构 花大价钱找 arm 定制的结果和公版也只能打个 7788 最鲜明的对比就是 980 和 855 也是在这时候高通才琢磨过来,865 老老实实用公版不是非常优秀嘛),这里我们就要在引用一个概念 —-ipc(Instruction Per Clock)也就是每个时钟的指令执行数量 ,在同一架构下 通常和仿存延迟和缓存容量有关 ,涉及到厂商的话和芯片设计团队的设计功底甚至和 eda 版本都有关系,仅从 980 995 9000 和同代高通对比的话 ,高通做的会稍微好一些 ,同频 5% 左右的差距吧 。 接下来浅谈 adreno 和 mali 还有苹果 gpu ,架构方面暂时不谈了 ,EU 结构也都不一样,(a 和 m 采用的还是立即渲染 苹果是延后渲染),不同的 EU 结构对不同接口的支持和利用率都不相同 ,所以下面只谈各家相比自己上一代在规模和利用率上的改进。g76 可以说是 mali 阵营划时代的进步 相比前代 g72 计算单元翻倍(这样做可以优化驱动开销和前端控制逻辑,缺点是不能对性能释放做出更精确的控制),g76 对计算单元利用率的大幅度提升以及对新硬件特性的支持(曲面细分与各向异性渲染),配合 7nm 节点的优秀表现加上划时代的 A76 造就了 980 这颗神 U。 有小朋友可能会问,为什么之前不合并计算单元要到 G76 再合并 ,是这样的,由于工艺节点的不同,在不同的密度和栅极宽度下有着不同的设计思路,例如今年 intel 混乱的 11 代酷睿生产线 其实从架构上来说 11 代酷睿没有问题,最后的结果就是 11 代桌面端纷纷变硅渣,就是因为 intel 10nm 产能和性能双双不如预期,最后变成了旧架构用新工艺,新架构用旧工艺然后双双翻车的场面,让隔壁 amd 笑掉大牙。 G77 以及 G78 都是 G76 的小改,没有增加单核心规模 ,小幅度增加的利用率和优化了驱动开销以支持的更大的核心数。 总之 mali 在 G76 之后的优秀表现大大缩小了其和 adreno 的代差,在不同的子项目上可以打的有来有往。 而 adreno... 从优秀的 540 之后... 只有 650 正常过那么一下..... 820 和 835dieshot ip 块标注 835 的封装面积仅 72.3mm^2 结合三星 10nm 工艺节点的密度指标 在 gpu 方面做到了一个迄今为止所有旗舰芯片都难以企及 ppa 巅峰。 845dieshot 从 845 开始 adreno 便进入了怼规模的路子 845 直接比 835 多了 50% 的规模 从 256alu 到 384alu 同时伴随着 58% 的峰值性能提升和大约 20% 的功耗提升,收益还算不错,而接下来的 855 让我十分惊讶(A14 的 gpu 也是同样的原因) ,在 7nm 这么优秀的节点下 ,发布会的 ppt 闭口不谈能效提升幅度,只是放出来一个 20% 的峰值性能提升,在 768alu 的规模下带来这么可怜的性能提升,功耗却没有好看多少。 845 的 gpu 频率为 710mzh 而 855 是 585mhz ,也就是说 855 在规模大涨 工艺大幅度进步的情况下 ,还要对 gpu 进行降频才能带来这点性能提升,(我愿称之为 adreno 之耻,没错,比 888 还要耻辱,888 还算情有可原,在工艺缩水频率大幅度提升的情况下相对来说还可以了)。 adreno 650 算是把 640 的拉垮拉回到一个合格的水平,配合优秀的 A77 以及 n7p 在高频的打磨优化,成为 835 之后的又一代神 U 。 tsmc 节点表现及预测 通常来说 每个大节点跨越要经历两年时间,台积电就要拿出在这之间拿出上一代节点的优化版本,同一节点可以沿用上一代的架构设计(设计厂商可以偷懒), 所以通常情况下不要对优化版本抱有太大的希望 ,除了 865 让我如此颠覆认知。 大节点的跨越通常会大幅度提升密度 ,所以更方便设计高吞吐量的内核和怼 gpu 和缓存规模,优化版本通常适合在频率上和利用率上做一些文章。 gpu 测试 简述一下上面这张表 ,苹果每代 gpu 基本都能在过热情况下获得上一代的峰值性能 ,而在峰值性能下获得和上一代过热之后相同的能效(A14 除外,根据 A14 的 gpu 规模一度怀疑是不是犯了和 855 一样的错误,另外这是过热触发降频的测试,结合我们刚才讲到的热效应,在省电模式下应该更加优秀)。 888 的 gpu 在峰值情况下达到了和 855 相同的能效,相当于 855 的两倍 gpu 性能,两倍功耗,结合我们刚才说到的高频对电压和功耗带来的影响,显而易见的是 888 在和 855 相同的 gpu 性能释放的情况下功耗一定会优于 855 ,而在图表中可以看到在过热情况下的 888 在 2.91w 的功耗下的性能只是略低于 865 在 3.91w 的功耗。 麒麟 9000 在过热情况下的能效水平达到了目前移动端天花板(A14 在过热情况下的水平)但是性能还是略低于 A14 ,大概 15% 的样子,但实际上的差距还是会非常大,9000 拥有非常恐怖的 24c g78 规模 静态功耗一定不会低 ,在省电模式下大概在 500mhz 左右的运行频率,没有大多的性能调度区间,而 A14 高达 1.36ghz 的 gpu 有着充分的性能调度区间....(太可怕了) 有小朋友懒得看上面这一堆废话,所以下面会通俗易懂的给出一些建议,也是根据上面提到的内容针对各个处理器的汇总。从高通开始 835 :身兼 big.little 和 A53 这种山顶洞人架构的上古遗老,却因为同时代甚至放在今天相比新中端 soc 也不落后的出色能效(相比 A10 和 960)支撑着一代又一代的钉子户和垃圾佬。 建议 :峰值性能瓶颈 可以买来作为备机和播放器。 845:装备了跨时代的 A55 和 dynamiq 架构,理论上性能调度要比 835 灵活的多,(可惜没有几个厂商愿意打磨,后来高通就用缓存规格和密度库差异区分了大核和中核)属于上限很高下限也不低的 soc,放在今天 (A75 成为了制约他的最大瓶颈,让强大的 gpu 无处发挥,今天的主流游戏还是偏 cpu 负载为主 ,例如在和平精英流畅极限画质下 8 个核心可以全部满载 而 gpu 在 257mzh 的最低频率下也只有 50% 左右的占用率(亲测)) 。 建议 : CPU 瓶颈 ,可玩性比较高 可以买来刷 win11 855: 装备了跨时代的 A76 ,还特地给了一个满配的 A76 和高性能密度库来刷分(bushi)。 855cpu 部分 ip 块,来自 b 站 Up xian333c 视频截图 我们可以看到 855 的超大核心 的面积要明显大于其他三个中核心 ,然而区区 256kb 的缓存无法达到这样的面积差异 ,这是由于超大核心采用了高性能密度库 (降低晶体管密度改善高频积热 - 通俗来讲就是更贵性能更强的工艺),再加上不同的缓存配置,所以超大核心在整个性能区间的综合表现都要强于中核心 ,同时把频率拉到 2.84ghz 冲一下单核峰值,而三个 L2 减半的 A76 跑在 2.42ghz 的中高频 卡一下频率甜点,同时避免高频对缓存容量的敏感,带来不必要的能效下降。 gpu 拉垮的原因刚才说过了。 建议:可以买 ,现在价格比较香,gpu 提升只能说不符合预期,但是谈不上翻车 相比 CPU 巨大的提升来说 算是各方面都得到了稳定的发挥 属于半步神 U 865:A77 算是非常成功的小改 在引入初代 lpddr5 这种高延迟内存之后,没有影响到 cpu 的发挥,让我非常惊讶,可能和翻倍的三级缓存有关 ,由于 n7p 优化了高频表现 865 的 cpu 部分获得了一个令人欣喜的提升(这种提升在后摩尔定律时代真的不多见)大核心在性能同频提升超过 20% 之后功耗小幅度下降,中核心不管是性能和能效都要超过使用了更先进工艺 7nmeuv 的 995 大核心 (2.42ghz A77>2.86ghz A76)在 A11 大核心 60% 的功耗下基本接近了 A11 大核心的水平 (只是性能水平,实际架构水平差异巨大),而 gpu 部分大幅度提升了利用率 极大程度提升了 GPU 能效(如果没有 865gpu 的优秀表现 ,再结合我前面说的,大家也就不会觉得 888 翻车了),综合上来说算是非常接近 A12 了(差距主要在小核心,但优秀的中核心和多核性能可以弥补一些)。 建议:非常推荐购买 至于 865 + 和 870 :推荐购买 870 但不推荐 865+,870 可以视为 n7p 后期工艺节点已经很成熟,可以保证高频能耗比下超到 3.2ghz 的特挑产物,能达到 3.2ghz 证明体质一定是整体优于 865 的平均水平的,在 865 的性能区间上应该有着比 865 更优秀的表现。 888:其实我觉得 888 真的被黑的过于惨了,单看 X1 在功耗略低于 A11 的情况下基本达到了 A12 的峰值性能,结合更高的主频有着更丰富的性能调度区间,问题就在于 这种爆发策略的 U 都是上限极高下限极低的产物,再加上 888 的上限也高不到哪去....... 结合不同批次的巨大体质差异,(最多也就是小胜 865,大概半代差距),A78 属于那种 区分产物 (就很迷,我没搞明白)而 gpu 表现也谈不上拉垮 其实同频性能也是要略微强于 865 的 并不是完全由 865 的 gpu 超频得来,明显是小改了架构,也许是高通的 gpu 利用率走到了瓶颈期吧。 建议:可以买 ,但不是很推荐 ,888 + 也可以买,应该属于 5lpe 三批之后体质好一些的。苹果 A11 :提升幅度仅次于 A9 的一代 尤其是 CPU 把 ipc 拉到一个安卓阵营难以企及的高度,缺点就是静态功耗也很难看 因为大核心太胖,省电模式在 1.3ghz 下只有小超 845 大核心满载的水平了(说的是人话么) 小核心在前面说过了 ,总之在 cpu 部分表现非常优秀,体现了苹果架构团队优秀的设计功底,而 gpu 和工艺都比较拉垮 gpu 峰值高达 8.3w 而在 A11 之后基本都控制在 6w 的水平 建议:不推荐,一方面是处理器,另一方面机器都过于老电池和各元器件都老化严重 ,不是很好捡,喜欢 home 键的山顶洞人可以买 se2。 A12:非常谦虚的一代 实际提升也是非常大,gpu 峰值相比 A11 提升实际高达 70%,数据源于苹果对开发者介绍 gpu 硬件特性的视频 而 CPU 整体提升也在 25% 左右 (官方宣称 15%)。峰值功耗略高于 A11,但在 n7 节点的优秀表现下,同性能功耗下降十分显著,小核心在维持 A11 残暴性能的同时功耗大幅度降低。gpu 部分提升巨大 首次支持了内存压缩(原来苹果之前都不支持内存压缩的么......)在 n7 密度暴涨的基础上堆到了 4 核心 ,频率也拉高到了 1.1ghz 左右... 建议:推荐 整体非常优秀,相比 A14 也不逞多让 只推荐 xr 和平板。 A13:提升让我有些惊讶的一代 大核心部分的改动说实话有些失败 ,看上去也是改了不少 ,实际只提升了 7% 的 ipc,在 2.66ghz 下功耗有些炸 ,4 代里最高,(很好奇 A15 怎么样)小核心提升比较大(从 835 提升到 845),增大到 96/48 的 L1,4mb 的 l2(其他的时间细说吧,乏了)提升了 15% 的性能 功耗甚至降低了 0.03w。 gpu 表现非常优秀,也是远远超过官方宣传的 20% (CPU 不到 20% 只有 16.5%,浮点倒是接近这个水平)A12 虽然 GPU 提升很大 ,但是功耗曲线并不好看,静态功耗有些高,A13 得益于 16mb 的 slc(展示不清楚 gpu 在 slc 上的受益情况,不过这是人干的事?)更优秀的内存控制器,GPU 在低频能效比和峰值性能上相比 A12 进步非常大(从我接触的 Xr 和 11 以及 11pm 来说 A13 在省电模式上的游戏体验远优于 A12,A12 明显发热更高)应该是 A13 对于 gpu 架构的改进以及 N7p 的原因,让 gpu 工作在一个更低的电压曲线上。 建议:除了大核心功耗有点高以外都挺好的 ,最推荐打开省电模式的一款,即使是日常使用。 A14:提升官方都不好意思说的一代(bushi),其实还好 ,有点类似于 845 到 855 的提升(暗示 A15 是 865?),因为 CPU 进步其实挺大的,从 A11 开始的七发射时代进入了 8 发射 可惜 ipc 只有 5% 的提升,不知道后续 A15 有没有优化的空间,如果没有说明单核心性能提升已经到了理论并行度的极限,已经不是提升单核心执行单元数量和吞吐能力可以进步的了,整体得益于在高频并不是很拉垮的 n5 (惊讶)大核心提升在 20% 左右,而小核心进入到了四发射时代.... 高于 A76 但低于 A77 的 ipc(没吃饱 ,吃饱应该比 A77 还强不少),性能提升高达 35%,功耗还能控制在 0.44w。 gpu 就有些拉垮了 从 gb5 的图形分(gk5 着重测试应用计算单元)以及 A14 单 gpu 的面积增长幅度再结合 n5 的密度提升,肯定是堆计算单元了,落实到渲染能力上就是峰值提升了 10% 的性能,频率来到了 1.36ghz,省电模式下能效提升 20%,同能效性能提升 20%(听说 A15 有 35% 的 gpu 性能提升,期待一下吧)。 建议:买吧 挺好的,cpu 提升合格,小核强到爆裂,gpu 提升不符合预期罢了。 补点图 性能功耗汇总 来自@小扁蓝超威 汇总 最后谈一下对 895 和 A15 的展望,对 895 我是不抱任何期待的,在 arm 的 ppt 上 x2 A710 A510 的性能功耗曲线都是和上一代同定位架构重合的....(新一代大雷,希望到时候打我的脸吧)gpu 倒是终于要到 7 系了,(目前没什么其他消息稍微期待一下吧),arm 现在给我的感觉就是黔驴技穷,反正高通也把 nuvia 买了,期待高通带着新的大核心架构重返 tsmc ,王者归来,不过这两年是没戏了。 苹果在我看来 在 gpu 和小核心上还是有很大发展潜力的 cpu 大核心目前看来是走到头了 不知道后面能不能拿出什么天顶星科技 如果你认真了解一些关于架构的知识,会发现苹果的大核心架构相比 arm 公版有压倒性的优势,相比这方面的优势 小核和 gpu 更是让 arm 望尘莫及,要知道 A14 的 gpu 可是跑在 1.36ghz..... 还能在 5.6w 做到小幅度超越 888 和 9000 的 gpu 峰值性能..... 就算之后 gpu 不改架构靠着堆规模和吃制程红利都能啃几年老本(不会被我奶中了吧)。 现在 soc 的发展进入了 cpu 提升的瓶颈期 而 gpu 发展还是在一个正常的节奏上 (主要是代工厂的密度提升速度远远超过了本身节点对于栅级宽度的提升需求,靠堆叠层数给摩尔定律续命,频率一直止步不前), 而现在的主流手游可以都可以榨干 cpu (高刷普及) ,相对来说对 gpu 的需求提升并不快,不同的游戏 ,不同的性能需求侧重点,吃通用计算单元的比例要远远超过渲染和纹理。 不知不觉写了这么多了 ,其实还有很多很多东西没有提,明天早上还要去我妈单位搬砖,先睡了。 文章为作者本人观点,不代表酷安立场