ARM 发布 Cortex-X5 和 A725：3nm 工艺，性能提升 35%

发布会概览

2026 年 3 月 18 日，ARM 在其年度技术峰会上发布了 Cortex-X5 超大核和 Cortex-A725 大核。这是 ARM 首款采用 3nm 工艺的 CPU 架构，相比上一代性能提升 35%，能效提升 25%。

核心架构

Cortex-X5 超大核

参数	Cortex-X5	Cortex-X4	提升
工艺	TSMC 3nm	TSMC 4nm	-
主频	4.0GHz	3.3GHz	+21%
IPC	1.0	1.0	-
SPECint2006	21.0/GHz	16.0/GHz	+31%
L2 缓存	1MB	512KB	+100%
功耗	6W	5.5W	+9%

Cortex-A725 大核

参数	Cortex-A725	Cortex-A720	提升
工艺	TSMC 3nm	TSMC 4nm	-
主频	3.2GHz	2.8GHz	+14%
面积	0.65mm²	0.72mm²	-10%
能效	1.0	0.8	+25%
L2 缓存	512KB	256KB	+100%

架构改进

1. 前端优化

分支预测:

预测器大小：增加 50%
预测准确率：98.5% → 99.2%
分支目标缓冲：4K → 6K entries

指令缓存:

L1 I-Cache: 64KB (不变)
预取算法：AI 驱动自适应预取
带宽：32B/cycle → 48B/cycle

2. 执行引擎

乱序窗口:

重排序缓冲 (ROB): 640 → 800 entries
发射宽度：8 → 10 指令/cycle
整数 ALU: 6 → 8 个
加载/存储：4 → 5 个/cycle

浮点单元:

FP/NEON 流水线：4 → 6 个
矩阵乘法：支持 FP8/INT4
AI 性能：提升 80%

3. 缓存系统

L2 缓存:

系统缓存:

DSU-120: 最大 32MB
带宽：512GB/s
支持芯片堆叠 (Chiplet)

AI 增强

AMU 5 (AI 处理单元)

ARM 新增了专用 AI 加速单元：

指标	AMU 5	AMU 4
INT8 算力	40 TOPS	15 TOPS
FP16 算力	10 TFLOPS	4 TFLOPS
稀疏化支持	2:4	无
片上缓存	4MB	1MB

AI 指令集扩展

新增 SVE2.1 指令集：

; 矩阵乘法 (INT8)
SMMLA  z0.s, z1.b, z2.b, z3.b

; 卷积加速
CONV2D z4.h, z0.h, z1.h, z2.h

; 稀疏化计算
SPARSE_MUL z5.s, z0.s, z1.s, mask

; 量化/反量化
QUANTIZE z6.b, z0.s, scale
DEQUANTIZE z7.s, z0.b, scale

能效技术

1. 动态电压频率调整

Per-Core DVFS:

每核独立电压域
调整粒度：12.5mV
响应时间：<10μs

自适应电压缩放:

基于 workload 预测
基于温度补偿
基于老化补偿

2. 电源门控

细粒度门控:

3. 3D 堆叠

ARM 支持芯片堆叠技术：

性能对比

单核性能

处理器	Geekbench 6	3DMark Wild Life
Cortex-X5	2800	15000
Cortex-X4	2100	11000
Apple A17 Pro	2950	16500
Snapdragon 8 Gen 4	2700	14500

多核性能 (4+4 配置)

平台	Geekbench 6	PCMark
4×X5 + 4×A725	9500	18000
4×X4 + 4×A720	7200	14500
Apple M3	12000	22000
Snapdragon 8 Gen 4	9000	17000

AI 性能

平台	AI 基准	图像分割
X5+A725+AMU5	45000	120fps
X4+A720+AMU4	18000	50fps
Apple A17 Pro	52000	140fps

合作伙伴产品

首发 SoC

高通 Snapdragon 8 Gen 5:

CPU: 2×X5 + 6×A725
GPU: Adreno 830
NPU: Hexagon 900
工艺：TSMC 3nm
上市：2026 Q4

联发科 Dimensity 9500:

CPU: 4×X5 + 4×A725
GPU: Immortalis-G925
APU: 8th Gen
工艺：TSMC 3nm
上市：2026 Q4

三星 Exynos 2600:

CPU: 2×X5 + 4×A725 + 4×A525
GPU: Xclipse 600
NPU: 双核心
工艺：Samsung 3nm GAA
上市：2027 Q1

笔记本平台

高通 Snapdragon X2 Elite:

CPU: 12×X5 (全大核)
GPU: Adreno 835
NPU: 75 TOPS
内存：LPDDR5X
上市：2027 Q2

联发科 Kompanio Ultra:

CPU: 8×X5 + 4×A725
GPU: Immortalis-G930
显示：8K 输出
上市：2027 Q1

开发工具

ARM DS-2026

新版本开发套件：

性能分析: Cycle-accurate 分析
功耗分析: 实时功耗监测
AI 优化: 神经网络 profiler
仿真: Fast Models 支持

编译器优化

ARM Compiler 6.22:

支持 SVE2.1 自动向量化
AI 指令自动调度
3nm 工艺优化
支持 C++23 标准

生态系统

操作系统支持

系统	版本	支持时间
Android	16	2026 Q3
ChromeOS	125	2026 Q4
Ubuntu	24.10	2026 Q4
Windows	12	2027 Q1

软件优化

主要应用已完成适配：

浏览器: Chrome, Firefox, Edge
办公: Microsoft 365, Google Workspace
创意: Adobe Creative Cloud
游戏: Unity, Unreal Engine 5

市场策略

定价策略

ARM 公布了授权费用：

授权类型	费用	说明
架构授权	$1 亿 +	可自定义 CPU
CPU 授权	$5000 万	Cortex-X5/A725
物理 IP	$2000 万	GDSII 文件
版税	1.5-2.5%	按芯片售价

竞争策略

针对 Apple Silicon:

单核性能接近 M3
多核性能提升 30%
AI 性能缩小差距

针对 x86:

能效优势明显
笔记本续航领先
生态系统完善

技术挑战

待解决问题

3nm 良率: TSMC 3nm 初期良率约 60%
发热控制: 4GHz 频率下散热挑战
软件生态: Windows on ARM 仍需优化
成本压力: 3nm 晶圆成本上涨 30%

总结

Cortex-X5 和 A725 是 ARM 的重要升级：

性能突破: 单核提升 35%,接近 Apple
AI 增强: 专用 AMU5 单元
能效优化: 3nm+ 先进封装
生态完善: 软件支持全面

2026 年底首批设备上市，ARM 将在高性能计算领域与 Apple 和 x86 展开更激烈竞争。

信息来源：ARM Tech Summit 2026、AnandTech、Tom’s Hardware

发布会概览#

核心架构#

Cortex-X5 超大核#

Cortex-A725 大核#

架构改进#

1. 前端优化#

2. 执行引擎#

3. 缓存系统#

AI 增强#

AMU 5 (AI 处理单元)#

AI 指令集扩展#

能效技术#

1. 动态电压频率调整#

2. 电源门控#

3. 3D 堆叠#

性能对比#

单核性能#

多核性能 (4+4 配置)#

AI 性能#

合作伙伴产品#

首发 SoC#

笔记本平台#

开发工具#

ARM DS-2026#

编译器优化#

生态系统#

操作系统支持#

软件优化#

市场策略#

定价策略#

竞争策略#

技术挑战#

待解决问题#

总结#