发布会概览

2026 年 3 月 18 日,ARM 在其年度技术峰会上发布了 Cortex-X5 超大核和 Cortex-A725 大核。这是 ARM 首款采用 3nm 工艺的 CPU 架构,相比上一代性能提升 35%,能效提升 25%。

核心架构

Cortex-X5 超大核

参数 Cortex-X5 Cortex-X4 提升
工艺 TSMC 3nm TSMC 4nm -
主频 4.0GHz 3.3GHz +21%
IPC 1.0 1.0 -
SPECint2006 21.0/GHz 16.0/GHz +31%
L2 缓存 1MB 512KB +100%
功耗 6W 5.5W +9%

Cortex-A725 大核

参数 Cortex-A725 Cortex-A720 提升
工艺 TSMC 3nm TSMC 4nm -
主频 3.2GHz 2.8GHz +14%
面积 0.65mm² 0.72mm² -10%
能效 1.0 0.8 +25%
L2 缓存 512KB 256KB +100%

架构改进

1. 前端优化

分支预测:

  • 预测器大小:增加 50%
  • 预测准确率:98.5% → 99.2%
  • 分支目标缓冲:4K → 6K entries

指令缓存:

  • L1 I-Cache: 64KB (不变)
  • 预取算法:AI 驱动自适应预取
  • 带宽:32B/cycle → 48B/cycle

2. 执行引擎

乱序窗口:

  • 重排序缓冲 (ROB): 640 → 800 entries
  • 发射宽度:8 → 10 指令/cycle
  • 整数 ALU: 6 → 8 个
  • 加载/存储:4 → 5 个/cycle

浮点单元:

  • FP/NEON 流水线:4 → 6 个
  • 矩阵乘法:支持 FP8/INT4
  • AI 性能:提升 80%

3. 缓存系统

L2 缓存:

Cortex-X5:
- 容量:1MB (可配置至 2MB)
- 带宽:128B/cycle
- 延迟:12 周期
- 关联度:16 路

Cortex-A725:
- 容量:512KB
- 带宽:64B/cycle
- 延迟:10 周期
- 关联度:8 路

系统缓存:

  • DSU-120: 最大 32MB
  • 带宽:512GB/s
  • 支持芯片堆叠 (Chiplet)

AI 增强

AMU 5 (AI 处理单元)

ARM 新增了专用 AI 加速单元:

指标 AMU 5 AMU 4
INT8 算力 40 TOPS 15 TOPS
FP16 算力 10 TFLOPS 4 TFLOPS
稀疏化支持 2:4
片上缓存 4MB 1MB

AI 指令集扩展

新增 SVE2.1 指令集:

; 矩阵乘法 (INT8)
SMMLA  z0.s, z1.b, z2.b, z3.b

; 卷积加速
CONV2D z4.h, z0.h, z1.h, z2.h

; 稀疏化计算
SPARSE_MUL z5.s, z0.s, z1.s, mask

; 量化/反量化
QUANTIZE z6.b, z0.s, scale
DEQUANTIZE z7.s, z0.b, scale

能效技术

1. 动态电压频率调整

Per-Core DVFS:

  • 每核独立电压域
  • 调整粒度:12.5mV
  • 响应时间:<10μs

自适应电压缩放:

  • 基于 workload 预测
  • 基于温度补偿
  • 基于老化补偿

2. 电源门控

细粒度门控:

执行单元门控:
- ALU 空闲时关闭
- FPU 空闲时关闭
- 加载/存储单元独立门控

缓存门控:
- L2 缓存分区门控
- 数据保留模式
- 快速唤醒 (<1μs)

3. 3D 堆叠

ARM 支持芯片堆叠技术:

┌─────────────────┐
│   CPU Cluster   │  ← 3nm
├─────────────────┤
│     L3 Cache    │  ← 6nm
├─────────────────┤
│      I/O Die    │  ← 12nm
└─────────────────┘

优势:
- 减少互连延迟
- 降低功耗
- 提高带宽

性能对比

单核性能

处理器 Geekbench 6 3DMark Wild Life
Cortex-X5 2800 15000
Cortex-X4 2100 11000
Apple A17 Pro 2950 16500
Snapdragon 8 Gen 4 2700 14500

多核性能 (4+4 配置)

平台 Geekbench 6 PCMark
4×X5 + 4×A725 9500 18000
4×X4 + 4×A720 7200 14500
Apple M3 12000 22000
Snapdragon 8 Gen 4 9000 17000

AI 性能

平台 AI 基准 图像分割
X5+A725+AMU5 45000 120fps
X4+A720+AMU4 18000 50fps
Apple A17 Pro 52000 140fps

合作伙伴产品

首发 SoC

高通 Snapdragon 8 Gen 5:

  • CPU: 2×X5 + 6×A725
  • GPU: Adreno 830
  • NPU: Hexagon 900
  • 工艺:TSMC 3nm
  • 上市:2026 Q4

联发科 Dimensity 9500:

  • CPU: 4×X5 + 4×A725
  • GPU: Immortalis-G925
  • APU: 8th Gen
  • 工艺:TSMC 3nm
  • 上市:2026 Q4

三星 Exynos 2600:

  • CPU: 2×X5 + 4×A725 + 4×A525
  • GPU: Xclipse 600
  • NPU: 双核心
  • 工艺:Samsung 3nm GAA
  • 上市:2027 Q1

笔记本平台

高通 Snapdragon X2 Elite:

  • CPU: 12×X5 (全大核)
  • GPU: Adreno 835
  • NPU: 75 TOPS
  • 内存:LPDDR5X
  • 上市:2027 Q2

联发科 Kompanio Ultra:

  • CPU: 8×X5 + 4×A725
  • GPU: Immortalis-G930
  • 显示:8K 输出
  • 上市:2027 Q1

开发工具

ARM DS-2026

新版本开发套件:

  • 性能分析: Cycle-accurate 分析
  • 功耗分析: 实时功耗监测
  • AI 优化: 神经网络 profiler
  • 仿真: Fast Models 支持

编译器优化

ARM Compiler 6.22:

  • 支持 SVE2.1 自动向量化
  • AI 指令自动调度
  • 3nm 工艺优化
  • 支持 C++23 标准

生态系统

操作系统支持

系统 版本 支持时间
Android 16 2026 Q3
ChromeOS 125 2026 Q4
Ubuntu 24.10 2026 Q4
Windows 12 2027 Q1

软件优化

主要应用已完成适配:

  • 浏览器: Chrome, Firefox, Edge
  • 办公: Microsoft 365, Google Workspace
  • 创意: Adobe Creative Cloud
  • 游戏: Unity, Unreal Engine 5

市场策略

定价策略

ARM 公布了授权费用:

授权类型 费用 说明
架构授权 $1 亿 + 可自定义 CPU
CPU 授权 $5000 万 Cortex-X5/A725
物理 IP $2000 万 GDSII 文件
版税 1.5-2.5% 按芯片售价

竞争策略

针对 Apple Silicon:

  • 单核性能接近 M3
  • 多核性能提升 30%
  • AI 性能缩小差距

针对 x86:

  • 能效优势明显
  • 笔记本续航领先
  • 生态系统完善

技术挑战

待解决问题

  1. 3nm 良率: TSMC 3nm 初期良率约 60%
  2. 发热控制: 4GHz 频率下散热挑战
  3. 软件生态: Windows on ARM 仍需优化
  4. 成本压力: 3nm 晶圆成本上涨 30%

总结

Cortex-X5 和 A725 是 ARM 的重要升级:

  1. 性能突破: 单核提升 35%,接近 Apple
  2. AI 增强: 专用 AMU5 单元
  3. 能效优化: 3nm+ 先进封装
  4. 生态完善: 软件支持全面

2026 年底首批设备上市,ARM 将在高性能计算领域与 Apple 和 x86 展开更激烈竞争。


信息来源:ARM Tech Summit 2026、AnandTech、Tom’s Hardware