发布会概览
2026 年 3 月 18 日,ARM 在其年度技术峰会上发布了 Cortex-X5 超大核和 Cortex-A725 大核。这是 ARM 首款采用 3nm 工艺的 CPU 架构,相比上一代性能提升 35%,能效提升 25%。
核心架构
Cortex-X5 超大核
| 参数 | Cortex-X5 | Cortex-X4 | 提升 |
|---|---|---|---|
| 工艺 | TSMC 3nm | TSMC 4nm | - |
| 主频 | 4.0GHz | 3.3GHz | +21% |
| IPC | 1.0 | 1.0 | - |
| SPECint2006 | 21.0/GHz | 16.0/GHz | +31% |
| L2 缓存 | 1MB | 512KB | +100% |
| 功耗 | 6W | 5.5W | +9% |
Cortex-A725 大核
| 参数 | Cortex-A725 | Cortex-A720 | 提升 |
|---|---|---|---|
| 工艺 | TSMC 3nm | TSMC 4nm | - |
| 主频 | 3.2GHz | 2.8GHz | +14% |
| 面积 | 0.65mm² | 0.72mm² | -10% |
| 能效 | 1.0 | 0.8 | +25% |
| L2 缓存 | 512KB | 256KB | +100% |
架构改进
1. 前端优化
分支预测:
- 预测器大小:增加 50%
- 预测准确率:98.5% → 99.2%
- 分支目标缓冲:4K → 6K entries
指令缓存:
- L1 I-Cache: 64KB (不变)
- 预取算法:AI 驱动自适应预取
- 带宽:32B/cycle → 48B/cycle
2. 执行引擎
乱序窗口:
- 重排序缓冲 (ROB): 640 → 800 entries
- 发射宽度:8 → 10 指令/cycle
- 整数 ALU: 6 → 8 个
- 加载/存储:4 → 5 个/cycle
浮点单元:
- FP/NEON 流水线:4 → 6 个
- 矩阵乘法:支持 FP8/INT4
- AI 性能:提升 80%
3. 缓存系统
L2 缓存:
系统缓存:
- DSU-120: 最大 32MB
- 带宽:512GB/s
- 支持芯片堆叠 (Chiplet)
AI 增强
AMU 5 (AI 处理单元)
ARM 新增了专用 AI 加速单元:
| 指标 | AMU 5 | AMU 4 |
|---|---|---|
| INT8 算力 | 40 TOPS | 15 TOPS |
| FP16 算力 | 10 TFLOPS | 4 TFLOPS |
| 稀疏化支持 | 2:4 | 无 |
| 片上缓存 | 4MB | 1MB |
AI 指令集扩展
新增 SVE2.1 指令集:
; 矩阵乘法 (INT8)
SMMLA z0.s, z1.b, z2.b, z3.b
; 卷积加速
CONV2D z4.h, z0.h, z1.h, z2.h
; 稀疏化计算
SPARSE_MUL z5.s, z0.s, z1.s, mask
; 量化/反量化
QUANTIZE z6.b, z0.s, scale
DEQUANTIZE z7.s, z0.b, scale
能效技术
1. 动态电压频率调整
Per-Core DVFS:
- 每核独立电压域
- 调整粒度:12.5mV
- 响应时间:<10μs
自适应电压缩放:
- 基于 workload 预测
- 基于温度补偿
- 基于老化补偿
2. 电源门控
细粒度门控:
3. 3D 堆叠
ARM 支持芯片堆叠技术:
性能对比
单核性能
| 处理器 | Geekbench 6 | 3DMark Wild Life |
|---|---|---|
| Cortex-X5 | 2800 | 15000 |
| Cortex-X4 | 2100 | 11000 |
| Apple A17 Pro | 2950 | 16500 |
| Snapdragon 8 Gen 4 | 2700 | 14500 |
多核性能 (4+4 配置)
| 平台 | Geekbench 6 | PCMark |
|---|---|---|
| 4×X5 + 4×A725 | 9500 | 18000 |
| 4×X4 + 4×A720 | 7200 | 14500 |
| Apple M3 | 12000 | 22000 |
| Snapdragon 8 Gen 4 | 9000 | 17000 |
AI 性能
| 平台 | AI 基准 | 图像分割 |
|---|---|---|
| X5+A725+AMU5 | 45000 | 120fps |
| X4+A720+AMU4 | 18000 | 50fps |
| Apple A17 Pro | 52000 | 140fps |
合作伙伴产品
首发 SoC
高通 Snapdragon 8 Gen 5:
- CPU: 2×X5 + 6×A725
- GPU: Adreno 830
- NPU: Hexagon 900
- 工艺:TSMC 3nm
- 上市:2026 Q4
联发科 Dimensity 9500:
- CPU: 4×X5 + 4×A725
- GPU: Immortalis-G925
- APU: 8th Gen
- 工艺:TSMC 3nm
- 上市:2026 Q4
三星 Exynos 2600:
- CPU: 2×X5 + 4×A725 + 4×A525
- GPU: Xclipse 600
- NPU: 双核心
- 工艺:Samsung 3nm GAA
- 上市:2027 Q1
笔记本平台
高通 Snapdragon X2 Elite:
- CPU: 12×X5 (全大核)
- GPU: Adreno 835
- NPU: 75 TOPS
- 内存:LPDDR5X
- 上市:2027 Q2
联发科 Kompanio Ultra:
- CPU: 8×X5 + 4×A725
- GPU: Immortalis-G930
- 显示:8K 输出
- 上市:2027 Q1
开发工具
ARM DS-2026
新版本开发套件:
- 性能分析: Cycle-accurate 分析
- 功耗分析: 实时功耗监测
- AI 优化: 神经网络 profiler
- 仿真: Fast Models 支持
编译器优化
ARM Compiler 6.22:
- 支持 SVE2.1 自动向量化
- AI 指令自动调度
- 3nm 工艺优化
- 支持 C++23 标准
生态系统
操作系统支持
| 系统 | 版本 | 支持时间 |
|---|---|---|
| Android | 16 | 2026 Q3 |
| ChromeOS | 125 | 2026 Q4 |
| Ubuntu | 24.10 | 2026 Q4 |
| Windows | 12 | 2027 Q1 |
软件优化
主要应用已完成适配:
- 浏览器: Chrome, Firefox, Edge
- 办公: Microsoft 365, Google Workspace
- 创意: Adobe Creative Cloud
- 游戏: Unity, Unreal Engine 5
市场策略
定价策略
ARM 公布了授权费用:
| 授权类型 | 费用 | 说明 |
|---|---|---|
| 架构授权 | $1 亿 + | 可自定义 CPU |
| CPU 授权 | $5000 万 | Cortex-X5/A725 |
| 物理 IP | $2000 万 | GDSII 文件 |
| 版税 | 1.5-2.5% | 按芯片售价 |
竞争策略
针对 Apple Silicon:
- 单核性能接近 M3
- 多核性能提升 30%
- AI 性能缩小差距
针对 x86:
- 能效优势明显
- 笔记本续航领先
- 生态系统完善
技术挑战
待解决问题
- 3nm 良率: TSMC 3nm 初期良率约 60%
- 发热控制: 4GHz 频率下散热挑战
- 软件生态: Windows on ARM 仍需优化
- 成本压力: 3nm 晶圆成本上涨 30%
总结
Cortex-X5 和 A725 是 ARM 的重要升级:
- 性能突破: 单核提升 35%,接近 Apple
- AI 增强: 专用 AMU5 单元
- 能效优化: 3nm+ 先进封装
- 生态完善: 软件支持全面
2026 年底首批设备上市,ARM 将在高性能计算领域与 Apple 和 x86 展开更激烈竞争。
信息来源:ARM Tech Summit 2026、AnandTech、Tom’s Hardware