发布会概览

2026 年 3 月 18 日,ARM 在其年度技术峰会上发布了 Cortex-X5 超大核和 Cortex-A725 大核。这是 ARM 首款采用 3nm 工艺的 CPU 架构,相比上一代性能提升 35%,能效提升 25%。

核心架构

Cortex-X5 超大核

参数Cortex-X5Cortex-X4提升
工艺TSMC 3nmTSMC 4nm-
主频4.0GHz3.3GHz+21%
IPC1.01.0-
SPECint200621.0/GHz16.0/GHz+31%
L2 缓存1MB512KB+100%
功耗6W5.5W+9%

Cortex-A725 大核

参数Cortex-A725Cortex-A720提升
工艺TSMC 3nmTSMC 4nm-
主频3.2GHz2.8GHz+14%
面积0.65mm²0.72mm²-10%
能效1.00.8+25%
L2 缓存512KB256KB+100%

架构改进

1. 前端优化

分支预测:

  • 预测器大小:增加 50%
  • 预测准确率:98.5% → 99.2%
  • 分支目标缓冲:4K → 6K entries

指令缓存:

  • L1 I-Cache: 64KB (不变)
  • 预取算法:AI 驱动自适应预取
  • 带宽:32B/cycle → 48B/cycle

2. 执行引擎

乱序窗口:

  • 重排序缓冲 (ROB): 640 → 800 entries
  • 发射宽度:8 → 10 指令/cycle
  • 整数 ALU: 6 → 8 个
  • 加载/存储:4 → 5 个/cycle

浮点单元:

  • FP/NEON 流水线:4 → 6 个
  • 矩阵乘法:支持 FP8/INT4
  • AI 性能:提升 80%

3. 缓存系统

L2 缓存:

C----C----oorrtteex111x561-M221-1408XB86A2B5B7K/:(/2Bcc5yy:ccllee2MB)

系统缓存:

  • DSU-120: 最大 32MB
  • 带宽:512GB/s
  • 支持芯片堆叠 (Chiplet)

AI 增强

AMU 5 (AI 处理单元)

ARM 新增了专用 AI 加速单元:

指标AMU 5AMU 4
INT8 算力40 TOPS15 TOPS
FP16 算力10 TFLOPS4 TFLOPS
稀疏化支持2:4
片上缓存4MB1MB

AI 指令集扩展

新增 SVE2.1 指令集:

; 矩阵乘法 (INT8)
SMMLA  z0.s, z1.b, z2.b, z3.b

; 卷积加速
CONV2D z4.h, z0.h, z1.h, z2.h

; 稀疏化计算
SPARSE_MUL z5.s, z0.s, z1.s, mask

; 量化/反量化
QUANTIZE z6.b, z0.s, scale
DEQUANTIZE z7.s, z0.b, scale

能效技术

1. 动态电压频率调整

Per-Core DVFS:

  • 每核独立电压域
  • 调整粒度:12.5mV
  • 响应时间:<10μs

自适应电压缩放:

  • 基于 workload 预测
  • 基于温度补偿
  • 基于老化补偿

2. 电源门控

细粒度门控:

------AFLLP2UU/::<1μs)

3. 3D 堆叠

ARM 支持芯片堆叠技术:

---:CPUL3IC/lCOuascDthieeer361nn2mmnm

性能对比

单核性能

处理器Geekbench 63DMark Wild Life
Cortex-X5280015000
Cortex-X4210011000
Apple A17 Pro295016500
Snapdragon 8 Gen 4270014500

多核性能 (4+4 配置)

平台Geekbench 6PCMark
4×X5 + 4×A725950018000
4×X4 + 4×A720720014500
Apple M31200022000
Snapdragon 8 Gen 4900017000

AI 性能

平台AI 基准图像分割
X5+A725+AMU545000120fps
X4+A720+AMU41800050fps
Apple A17 Pro52000140fps

合作伙伴产品

首发 SoC

高通 Snapdragon 8 Gen 5:

  • CPU: 2×X5 + 6×A725
  • GPU: Adreno 830
  • NPU: Hexagon 900
  • 工艺:TSMC 3nm
  • 上市:2026 Q4

联发科 Dimensity 9500:

  • CPU: 4×X5 + 4×A725
  • GPU: Immortalis-G925
  • APU: 8th Gen
  • 工艺:TSMC 3nm
  • 上市:2026 Q4

三星 Exynos 2600:

  • CPU: 2×X5 + 4×A725 + 4×A525
  • GPU: Xclipse 600
  • NPU: 双核心
  • 工艺:Samsung 3nm GAA
  • 上市:2027 Q1

笔记本平台

高通 Snapdragon X2 Elite:

  • CPU: 12×X5 (全大核)
  • GPU: Adreno 835
  • NPU: 75 TOPS
  • 内存:LPDDR5X
  • 上市:2027 Q2

联发科 Kompanio Ultra:

  • CPU: 8×X5 + 4×A725
  • GPU: Immortalis-G930
  • 显示:8K 输出
  • 上市:2027 Q1

开发工具

ARM DS-2026

新版本开发套件:

  • 性能分析: Cycle-accurate 分析
  • 功耗分析: 实时功耗监测
  • AI 优化: 神经网络 profiler
  • 仿真: Fast Models 支持

编译器优化

ARM Compiler 6.22:

  • 支持 SVE2.1 自动向量化
  • AI 指令自动调度
  • 3nm 工艺优化
  • 支持 C++23 标准

生态系统

操作系统支持

系统版本支持时间
Android162026 Q3
ChromeOS1252026 Q4
Ubuntu24.102026 Q4
Windows122027 Q1

软件优化

主要应用已完成适配:

  • 浏览器: Chrome, Firefox, Edge
  • 办公: Microsoft 365, Google Workspace
  • 创意: Adobe Creative Cloud
  • 游戏: Unity, Unreal Engine 5

市场策略

定价策略

ARM 公布了授权费用:

授权类型费用说明
架构授权$1 亿 +可自定义 CPU
CPU 授权$5000 万Cortex-X5/A725
物理 IP$2000 万GDSII 文件
版税1.5-2.5%按芯片售价

竞争策略

针对 Apple Silicon:

  • 单核性能接近 M3
  • 多核性能提升 30%
  • AI 性能缩小差距

针对 x86:

  • 能效优势明显
  • 笔记本续航领先
  • 生态系统完善

技术挑战

待解决问题

  1. 3nm 良率: TSMC 3nm 初期良率约 60%
  2. 发热控制: 4GHz 频率下散热挑战
  3. 软件生态: Windows on ARM 仍需优化
  4. 成本压力: 3nm 晶圆成本上涨 30%

总结

Cortex-X5 和 A725 是 ARM 的重要升级:

  1. 性能突破: 单核提升 35%,接近 Apple
  2. AI 增强: 专用 AMU5 单元
  3. 能效优化: 3nm+ 先进封装
  4. 生态完善: 软件支持全面

2026 年底首批设备上市,ARM 将在高性能计算领域与 Apple 和 x86 展开更激烈竞争。


信息来源:ARM Tech Summit 2026、AnandTech、Tom’s Hardware