TA的每日心情 | 擦汗 2026-3-17 22:01 |
|---|
签到天数: 1133 天 [LV.10]大乘
|
沙发

楼主 |
发表于 2026-2-26 21:43:21
|
只看该作者
后来想了想,我让龙虾爬了一个分析全球AI数据中心建设和运营成本的报告,内容如下:" i' b% b7 n/ Z
% l9 |5 x/ [" ?: n8 x% |" n
一、总体分析框架与核心结论, B1 x3 C& Z+ p+ J
1.1 分析框架概览
& w S8 u4 G0 h拆分维度
$ d! w$ M; D; {0 M& ~+ ]$ @5 u( Y3 ]3 e6 `6 I6 z
阶段:
) T' a+ h4 Y" h5 p0 A# _- M建设期(CAPEX):土地/建筑、供电与配电、制冷、IT 硬件(GPU/TPU/加速卡)、网络与其他基础设施
; |2 z/ c2 X! Q r1 o运营期(OPEX):电力、水、运维人员、场地/托管、维护与更新、网络带宽等
2 o4 U) e7 M) u+ z2 h3 a I5 j' R区域:" `, n2 A+ t; e( H6 L/ @# E9 h5 g
中国、美国、欧洲、中东(以海湾地区/UAE 为代表)
: E Q1 w% u; e/ l0 u技术方案:
* M" G4 ?% y0 n6 k1 L$ aNVIDIA(H100 / H200 / B200 / GB200 NVL72 等)4 E- d: ~+ I2 i9 Y! f- C' f2 ?2 P
Google TPU(v5e/v5p/Trillium 等), b3 \5 B3 u' a5 k. t7 b
中国芯片:华为昇腾 910B / 910C 系列、阿里平头哥真武 810E(PPU)
D2 w5 R; S* A4 Z" Z) ]算例基准
7 ~2 J3 s+ F* l; K& s/ u1 [+ F
8 _$ W, W1 {& K以400 MW 级 AI 数据中心为统一标尺(与 ChinaTalk BOTEC 分析保持一致)[1]:2 x- i1 O, M6 o/ Z& x% [
其中 IT 有效功率约 360 MW:GPU/AI 加速约 312 MW,CPU/存储约 48 MW& p- f* Z% t ~+ f$ i
PUE 假设约 1.11(高效液冷场景)[1][29]0 \/ `. _4 x e d% r) m- H; b
时间窗口:3–5 年运营期(与行业 TCO 分析和硬件折旧相匹配)[28]7 r* C$ @- l* O; S2 s
关键指标) k3 [3 W' r8 o1 P3 f0 V5 e
4 C: s! e3 r+ H; E; |9 r
$/MW 建设成本(含/不含 IT 硬件)8 e8 [+ J' R3 c6 r! D
$/kWh 电力成本、L/kWh 水耗4 j. m4 M; {5 J. ]8 P, j& r: x
$/token 或 $/百万 token 的综合成本 f/ o! w! } K8 {1 f5 T
Token-per-watt / Joule-per-token 作为能效基准[17][18][26]
' r+ I. Y" e2 L$ m. v8 {3 Y* E- M项目 IRR/回收期、吨位级 TCO 对比(自建 vs. 云租)! O8 o4 S7 i$ ^& q
1.2 高层结论(供决策快速参考)
+ L, A) d, t$ f' n( a建设成本:AI 数据中心相对传统云数据中心成本翻倍! L7 c+ S- D1 S5 L9 o# ^6 ?9 _
2 ^! p# ?" v/ L1 S! g4 x$ }) C
传统云数据中心壳体+机电平均约 $10.7M/MW (2025),预计 2026 升至约 $11.3M/MW[2][41]。7 L6 ] x1 N; o9 w) {$ k- t
AI 优化数据中心(高功率密度 + 液冷)壳体+机电可高达 $20M/MW 甚至更高[41]。! B L7 }9 C0 G |! E6 E' [! }
按 Accenture/Soben 研究,传统云 DC 为 $8–10M/MW,而 GW 级 AI 数据中心可达 $17M/MW(仅壳体+机电,不含 GPU)[3]。
7 Q5 P. M* W& U$ ]0 j( V3 e区域 CAPEX:中东≈中国 < 美国≈欧洲 < 高端 AI 园区1 T* q f$ R* I; U4 i) F3 _" V
- l; _8 {' T4 |
中国:$5.5–6.5M/MW,400 MW 约 $2.4B[1][13]
0 P1 U( V: y/ ^# K; T美国:$8–12M/MW,400 MW 约 $4.0B[1]
0 x/ r' B. P1 b$ m0 z欧洲:接近全球平均 $10.7–11.3M/MW[2][41]
+ J5 _# D7 @: C/ K中东(UAE Stargate 5 GW):总投资超 $30B,约 ≥$6M/MW[20]5 s% h" C" [8 q( Q9 r$ B
结论:中国与中东的壳体+机电 CAPEX 明显低于美国/欧洲,同等规模下节省约 30–40% 构筑成本。" a- D$ F5 ?1 V/ G2 u
OPEX:电价与人工决定区域优势# ? ?- o) }0 ]6 q; B3 ?3 K" z" O- {
! t9 H, L* K9 a) K/ z# f; l+ h* ^
电价(2025–2026 工商业大致区间):
# B5 q5 G( [, \; \中国:约 0.8–1.1 元/kWh ≈ $0.08–0.11/kWh,部分算力基地可通过长协拿到 ≈3 美分/kWh[12][73]0 ]: m8 C7 w6 ^7 _: N5 Z- e
美国:工业用电约 $0.085–0.09/kWh[44]8 C: a( M, ^& G8 J2 l, y* ~
欧洲:非居民平均 €0.19/kWh ≈ $0.20+/kWh[45]
: x; Q% Q" S1 L# f中东/UAE:工业用户 $0.07–0.13/kWh[47]
, P* e: {2 V7 f) u' Z0 x人工:
7 m3 Q/ ~( |- V O4 k) y& l- I) N中国数据中心运维:约 $22k/人/年
) W) W: B2 R" x美国数据中心运维:约 $120k/人/年[1]
' n# i) \% Q2 Z结论:电价上中国西部/北部与中东有显著优势,人工成本上中国远低于美欧。% O" q9 t# r; v, C0 i4 w* U1 a, R
能耗与每 token 能源成本:能效差异远大于电价差异
7 e9 S, @% ^, A1 s: g8 b N) I8 f9 K- W; H
IEA:2022 全球 DC+AI+加密耗电 460TWh,2026 可能至 620–1050TWh[86][90];AI 专用服务器约 90TWh 量级[30][90]。4 t) x( K2 Q9 q z: e X6 y
大规模 LLM 推理能耗估算:H100 集群训练 GPT-3 175B 约 2.46–3.63 J/token(训练)[10][16];经推理优化后,Inference 端典型可做到 0.4–1.0 J/token 级别[17][26]。: v, f/ Q, N$ {4 x
将 token 能耗约化为统一口径:4 X: f0 H- q' U9 g0 c6 z
粗略取 1 J/token = 2.78×10⁻⁴ Wh/token。若电价为:
4 \; `+ a; Z3 w- b中国 0.3 元/kWh ≈ $0.042/kWh:电费 ≈ 1.17×10⁻⁸ $/token ≈ $0.0117/百万 token5 e( l" s0 G; w7 a
美国 $0.30/kWh(题设):电费 ≈ 8.34×10⁻⁸ $/token ≈ $0.0834/百万 token) A+ T4 s2 H% Z- n% y) }( H! m
对比:OpenAI GPT‑4.1 / GPT‑5.2 系列对外 API 输出侧价格 $8–168/百万 token[62],电费占比 远低于 1%,真正决定成本差异的是硬件 TCO 和利用率,而非电价本身。
9 F/ a- f+ Z2 N6 E6 p" y不同芯片方案的核心差异
9 m7 N8 Q- s6 n5 E, x% M7 \. r" d p+ F* }/ R% I
NVIDIA Blackwell/B200 & GB200 NVL72:2 o6 U3 Y2 B, n7 o8 \: R- ^+ \
单 B200 GPU 峰值 ~4.5 PFLOPS FP4/FP8,功耗 600–1000W[68][69]。
: Y: b7 B' M; _/ h* lGB200 NVL72 整机架售价约 $3.0–3.35M,72 GPU[34][69],GPU 约占整个 AI 数据中心总 CAPEX 的 39% 左右[36]。& B1 c% a& C9 z2 I$ \5 r2 b
Google TPU v5e/v5p/Trillium:" [$ C( a) p8 m. d" d$ O$ s
TPU v5e 8 芯推理:约 2,175 tokens/s(Llama2‑70B,INT8)[67];功耗显著低于 H100,同负载下能耗可降约 5 倍[67][52]。
* T5 }: B+ B, wGoogle 内部披露 TPU v5 能效约为 H200 的 1.46×,Trillium/TPU v7 更高(约 2× 甚至以上)[52][65]。
7 s$ O4 d: K' D# ^7 G+ e/ S华为昇腾 910B:
$ W+ Z i4 W4 o# i4 gFP16 算力 320–376 TFLOPS,INT8 640 TOPS,TDP ≈ 310W[80][81][82];能效接近甚至超过 A100,在长序列推理上 token-per-watt 可超 H200[71]。6 M- Q `4 I, E, m# @: E
单芯片成本约 5 万元人民币 ≈ $7k[60],显著低于受限版本 H20/H100。
3 j& ~( f" o* n# h' o# [阿里平头哥真武 810E(Zhenwu PPU):) m, }6 w$ j: L. D: f, U. u# J4 A5 k1 M
96GB HBM2e、700 GB/s 互联带宽[59][111],功耗约 400W 级别[102],整体性能对标 NVIDIA H20/A800,并已形成万卡集群部署[59][111]。
2 o7 W* m6 r3 ^2 d- T, [' C. V+ ~结论:
9 ^/ f- M6 s1 i1 N/ g能效(tokens/J 或 tokens/W)排序大致为:Google TPU v7/Trillium > NVIDIA B200/GB200 > TPU v5e/H200 ≈ 华为 910B ≈ 阿里真武 > H100/A100。
2 W- D7 A9 z7 B7 E0 T2 T- V4 L3 Q单芯片/整机价格排序:华为/平头哥 < TPU 自用成本(Google 内部) < NVIDIA 公版(H100/B200/GB200)。
+ X' W1 d: t$ v# j; \6 C对中国市场,在算力性能足够的前提下,昇腾 + 真武 方案的 CapEx/每 token 成本有 30–60% 的价格优势。7 ^- ^% b+ ~( H' \! u$ q
自建 vs 云租的 TCO 与 token 成本
4 F5 m# o. N3 N* F& ]. s4 g' l! H+ Z$ F, s' w
LenovoPress 对 8×H100/H200/B200/B300 本地 vs AWS/Azure/GCP 的 5 年 TCO 对比[28]:
- l0 q m( b3 ~5 S1 C8×B300(Config D)自建 5 年 TCO ≈ $1.01M;
- }" }- s/ c; q4 u& `等价 AWS p6‑b300.48xlarge(24/7)5 年 ≈ $6.24M,节省 83.8%。
6 P/ H Y8 ~, E; ]# W' ]5 ]) B* a5 ]1 F8×H100(Config A)自建对 Azure On‑Demand,回本点约 2,720 小时(~3.7 个月),对 1/3/5 年保留分别约 4,423/6,800/7,591 小时(~6/9.3/10.4 月)[28]。
$ ^! l/ z$ l) L# I: [Token 成本对比示例(LenovoPress 场景)[28]:
1 ~7 R+ N# k* u7 f9 j6 {. S' b* pLlama‑70B 推理,8×H100 本地:约 $0.11/百万 token
1 w: N( g7 ~+ @7 g% z+ a! m* c, pvs Azure H100 On‑Demand:$0.89/百万 token → 自建 ~8× 便宜。
- E- q% x. X# g$ Z* _9 ]同样 70B 模型,自建 vs GPT‑5 mini API(约 $2/百万 token):自建便宜约 18×。% ?$ K& G. o- s0 ~
Llama‑405B,8×B300 自建:$4.74/百万 token,AWS B300 On‑Demand:$29.09/百万 token → 节省 ~84%。
$ K' I' p! @# ^( v4 r" X结论:% K$ y& @3 X) c6 V e: @
高利用率、长周期推理负载下,自建 AI 数据中心的每百万 token 成本可比公有云或高端闭源 API 低 1–2 个数量级。3 Z* p0 k1 l) Y( }( Z
Token 电费占比极低,自建 vs 云租的差异几乎全部来自 硬件折旧 + 云溢价 + 运维与利用率。
8 Z* V, F" r6 `7 `二、建设期成本分布:区域对比
$ _3 [8 h/ R% ?) {6 r以下重点讨论 壳体+机电(不含 GPU) 与 全栈(含 GPU) 两层。/ z/ H7 H, V; Z3 Y7 u% ^
" r$ m" ^8 C, `5 Z/ \2.1 全球/通用结构(以 1 MW 为单位)
; u. ^& h$ v# ~' r综合 JLL、ConstructElements 等[2][41][40]:
$ x. x! }0 I( O3 v1 T7 q
" j/ L: \$ Q5 [ b( E' S壳体+机电(Shell & Core)
/ G( t& I$ e5 p& ^/ Q0 E; R6 {) ^2 q' A; R
全球传统 DC 平均(2025):$10.7M/MW,2026 约 $11.3M/MW[2][41]
! N8 m& u5 C+ ]6 Z- i其中按成本构成[40]:0 h; D, O J. S. G
电力系统(变电、配电、UPS、母线等):40–50%
; l l/ u' E: L0 c: B) V! y* b3 z机械与冷却(冷机、冷却塔、管路、CRAC/液冷):15–20%
( W2 D3 h3 m. K* X1 {7 R& Z建筑与土地、结构:约 15–20%
5 K3 y, u& ]7 {1 l; b. M. T其他(消防、安防、楼宇管理等):约 10–15%5 ^% T% [2 E0 d
IT 内装与 AI 基础设施(不含芯片)+ @/ A* U J" l( g( ?
4 i; a1 d' E! u E( H
高密 AI 集群内部装修(高密布线、机架、液冷板/浸没舱等)会在每 MW 额外增加 $25M/MW 量级[40],对 GW 级园区影响巨大。
; }- E( t0 M. c" W8 ~) s1 WGPU/加速卡硬件 CAPEX
( S+ b2 V. a6 [2 m- y+ e$ ]$ t/ i* E Z# z
多数分析认为 GPU 占 AI 数据中心总 CAPEX 的 30–40%,其中 NVIDIA 单家毛利约等于整个行业 CAPEX 的近三成[36]。
' d" I" |$ o y0 L/ c% P4 [2.2 中国 vs 美国 vs 欧洲 vs 中东:1 MW 建设 CAPEX
: b+ g' ]) k1 R# i+ L) U& M结合 ChinaTalk、JLL、UAE Stargate 等[1][2][20][13](仅壳体+机电):
. H) w; w$ {5 R1 n: Q0 }7 B
) H! O( M# z# L; I4 x区域 典型建设成本(壳体+机电,$M/MW) 备注) X" e+ v+ y/ r5 Y
中国 $5.5–6.5M/MW 以西部算力基地为主,400MW ~ $2.4B[1][13]: D1 U% i- E: L3 h' l7 s
美国 $8–12M/MW 典型超大算力园区 400MW ~ $4.0B[1]
" ^! V+ K! y, a/ `5 u2 ^欧洲 $10.7–11.3M/MW 接近全球平均,部分核心城市更高[2][41]5 ~2 P. O0 j' s
中东 ≥$6M/MW UAE 5GW Stargate >$30B → ≥$6M/MW[20]
# w" u5 W+ q7 D9 p" k! g结论:. g8 n* g7 q7 v, |% {
1 o _& {+ u* |8 ~( \2 t单位 MW 壳体+机电 CAPEX:中国 ≈ 中东 < 美国 < 欧洲。% N% V9 H0 D7 G7 d( M0 c; i+ C
若考虑土地、电网接入和许可周期,中东(特别是 UAE/沙特)在电力可得性和政府补贴方面往往优于欧洲,趋近美国甚至中国。5 S8 ~( j/ b0 g& E% E. `' _
2.3 引入 GPU 后的全栈 CAPEX(以 400MW 集群为例)3 k9 A3 |9 X X7 U6 q% V% u% D3 h
以 ChinaTalk 的 400MW NVIDIA GB200 NVL72 集群为例[1]:* D; ?3 U y* |2 o5 ] ^
, T' N/ v. A: r2 Y! D- ~
假设:PUE=1.11,电力侧 400MW,中约 360MW 投入 IT;6 e/ l b, d2 u) @4 p
GPU 配置:8 s. p/ v& Q- e
有效 312MW 用于 GB200 NVL72,约可容纳 2,154 racks(每 rack 144 GPUs,对应功耗 ~145kW/rack);5 f! a- d; d' d [" `" y$ ]5 p
每 rack 成本 ≈ $3.0–3.35M[34][69];5 l3 ?1 n V+ B, y7 p
GPU 总 CAPEX ≈ $6.5–7.2B 量级(ChinaTalk 抽样约 $5.6B 略保守[1])。7 V7 s5 p- a# _, s/ o' d* G+ k* B; E7 y
与不同区域壳体+机电组合:9 V# ^6 U8 Q: I
1 k" | `& S* R3 X" K
以中值估算:; q7 e* p! k5 R7 o
* i) O4 ~$ v4 z4 @1 R
中国 400MW:壳体+机电 $2.4B + GPU $5.6B ≈ $8.0B
% @5 [4 N; f0 D9 U- L- F/ g美国 400MW:壳体+机电 $4.0B + GPU $5.6B ≈ $9.6B, {) f: {. `# M% v- u. w
欧洲 400MW:壳体+机电 $4.5B + GPU $5.6B ≈ $10.1B. @8 \' h5 T. ]
中东 400MW:壳体+机电 $2.4–2.8B + GPU $5.6B ≈ $8.0–8.4B
( ~, a( q5 i" o5 |* T可见:/ h; }3 g5 t. ~% i) O) Y
6 E) x/ S% M, ?$ I5 [
GPU 成本在各区域大致相同,决定区域 CAPEX 差异的主要是壳体+机电与土地/电力接入。9 z. X# o" X9 t1 W/ u- o
相比美国/欧洲,中国和中东可在 400MW 级别节省约 $1.6–2.1B CAPEX,这对 IRR 有直接影响。/ ^, j8 S. K; F& \3 G! ]
三、运营期成本结构与区域对比
2 v5 }7 T0 b0 K/ L2 y! j3.1 通用 OPEX 结构(高密 AI DC)
6 l3 m4 q9 b3 V# n0 S7 |9 ~结合 ConstructElements、IEA、Microsoft/Google 披露[40][86][103][104]:! I* {5 C+ f$ |9 d! m
1 V, k9 X7 s) x
电力:约占总 OPEX 的 20–30%(传统 DC),对于 AI DC 因 GPU 负载密度提升,可达 30–40%。
, D* F# n/ h5 |# u3 P冷却与水资源:5 ~ \2 @) ]% P2 f+ l/ C
能耗:传统风冷约占总功耗 30–40%[39];液体冷却可将 IT 与制冷合并大幅降 PUE 至 1.1 左右[29][115]。, z- l, C2 U" j
水耗:典型 DC 约 1.9 L/kWh 水用量[105],每日用水可达 300,000–5,000,000 加仑 规模[100][101]。8 l+ e/ Y; b- q1 o0 a u0 b) z& ]
人工:视地区而定,在中国/印度/东南亚占比 5–10%,在美欧可达 15–20%。/ W; i4 K: m5 O$ D9 p! }
托管/物业与维护:
9 {) Q. a" D( q7 n9 l托管:高密机架约 $1,500/机架/月,标准机架约 $600/月[40][28];$ p `3 ~2 w A) _" B8 |% g
硬件维护:LenovoPress 模型中按设备价 12%/年[28]。( Y% O* X$ Z. s; B G& j5 o
3.2 区域差异(以 400MW / 3 年期为例)4 g: u3 b3 n9 u% t: N0 @' L- y
使用 ChinaTalk 的电费与人工估算[1]:
+ |% ]2 D, U$ _$ s( d1 C* ^0 _: G' U) ^+ r' \4 R
电费(3 年) – 假设 GPU 利用率 60%,IT 360MW,PUE=1.11:; x' q3 J. ?+ A a
中国:约 $0.06/kWh → 3 年电费 ≈ $350M& O9 k$ g5 R7 t1 Y
美国:约 $0.09/kWh → 3 年电费 ≈ $600M
8 j' h! \0 J, ~. H2 m& I中东:约 $0.07–0.10/kWh → $400–550M
h$ B/ \" a$ C7 L% I欧洲:约 $0.20/kWh 以上 → 电费 > $1B(显著劣势)/ k4 d4 N1 I& }9 I7 y/ J1 u9 i+ d. i
水费(3 年) – 以 MS Fairwater 站点 280 万加仑/年为参照[1][103]:
# Q7 Q0 B2 f3 x3 K- F/ V美国水价约 $5.18/千加仑,中国约 $2.57/千加仑[1]0 k& k) ~& P$ \; i$ c8 @
三年水费级别:
1 m+ z- a* |2 Z m9 f美国:$40k+% R7 O3 C; E4 U. b9 Q% D
中国:$20k+( x5 c8 o) o0 k6 r3 S0 d$ n# P
结论:水费是数量级上可忽略的小项,真正的约束是水资源总量与选址,而非成本。
0 r/ W" Z. `. x# ?/ l- {: B1 \2 P6 M6 L人员成本(3 年) – 假设 500 名全职运维:7 `- d, X6 P9 A( Z6 ?
美国:500 × $120k × 3 = $180M+# { l: [4 _ X) w
中国:500 × $22k × 3 = $33M+( Y9 @* m7 H' \/ a/ a
差异约 $150M,规模与 3 年电费差不多,是中美间第二大成本差异来源。
9 p) E. C# A) Z8 Z整体 OPEX 粗算(3 年) – 400MW 场景下:
/ w5 U; R+ o: \ Z
( Y) b/ J8 g; h/ R; D4 W$ O) O项目 中国 美国 d* C( @3 P" e3 n+ l* `* L5 c+ [. @
电费 $350M $600M) ]! T W+ f1 L8 Q- [
水费 <$0.05M <$0.05M& x% a. p. g9 A6 L+ j
人员 $33M $184M% \: E7 K$ F2 O5 p7 I
其他维护/托管 同比例估算,地区差异主要体现在人工与地价 # i* _: u, a3 K& Z; T$ _
结论:9 R/ g. v( @0 I
) K/ E. h K) {0 c0 H
就 3 年期而言,中国与中东在 电价+人工 两项合计可比美国/欧洲节省 数百百万美元级,与整体 CAPEX(数十亿美元)相比不算决定性,但对净现值和现金流有实质贡献。6 w4 i0 h/ M' ]0 K4 S* o0 D
对大模型服务商而言,更核心的是 GPU TCO 与 token 单价之间的剪刀差,而电价更多影响“边际利润率”而非“能不能赚钱”。6 l' H/ m% {+ v% X
四、基于 token 的成本与利润推演' N. d: n5 a6 z# \ y
4.1 能源维度的 token 成本(题设 0.3 美元 vs 0.3 元)
' Z3 Q# Y) @9 [& j( u$ N9 K8 E统一假设:- T$ q" N% G4 O
' h# I# J) S, O; t; ]+ F0 c
典型大模型推理能耗:约 1 J/token(考虑 FP8/BF16 优化、Batch=256–512 时的能耗甜点[26][17][18])
3 I, u( d. u* e! {6 X. l1J = 2.78×10⁻⁴ Wh → 每个 token 约 2.78×10⁻⁴ Wh: {) c3 d% f* r( O y. m
1 百万 token:278 Wh = 0.278 kWh' Q/ ^* z& C9 ?/ M) W7 }3 V
场景 A:美国电价 $0.30/kWh9 `9 E" j. c+ v" Z" D
电费/百万 token = 0.278 kWh × $0.30/kWh
5 f. T+ u7 n4 X7 S7 t& E3 c≈ $0.0834 / 百万 token
+ L; c8 h8 \; _ o场景 B:中国电价 0.3 元/kWh ≈ $0.042/kWh/ K, ^ O1 w+ g9 [) h& I
电费/百万 token = 0.278 kWh × $0.042; U5 ]5 m0 |4 v. Z( _9 q+ m" Q/ M
≈ $0.0117 / 百万 token
2 }; b. H. N7 Z# U% u3 u$ I对比当前 API 价格(OpenAI 2026Q1)[62]
" X8 l+ w( I$ i以输出侧为主(成本最敏感):
0 }: k$ y# j. t* Z4 S2 Z6 m i
( }$ `+ ], U s0 O w$ ~ i. Z模型 输出价 ($/百万 token): s& k5 b5 l* @( X" _ G
GPT‑5.2 $14
$ H5 H" u, ~- p2 j7 kGPT‑5.2 Pro $1681 z# m7 x8 M( Y2 [# }3 f
GPT‑4.1 $8
+ F0 O; _# @# \# g8 f! t9 fGPT‑4o $10! ~! z, m# x% c# @% i
GPT‑4o mini $0.60/ ?; e8 b( x1 Z1 c$ J* c
则:
& F" W- ]0 T+ U2 b# z$ B: v
9 W0 B# p: g: p) a在美国 $0.30/kWh 的极端高电价下,电费占 GPT‑4o mini 收入的 ~14%(0.083/0.60),占 GPT‑4o 仅 0.8% 左右。, ` K# h% _+ q- A& b
在中国 0.3 元/kWh 下,电费占 GPT‑4o mini 收入的 ~2%,占 GPT‑4o 的约 0.1%。
+ }2 n; @ m" Z8 B+ z% R. a) X5 ]9 ?相比之下,GPU 折旧+云溢价+开发/运维成本才是主导。. h3 ^- k1 |6 ^" r
结论:
& X5 \: p8 K1 V% Z' t/ e即便在“美国 $0.30/kWh vs 中国 0.3 元/kWh” 的极端对比下,每百万 token 电力成本差异约 $0.07,与主流 API 价格($0.6–$168/百万 token)相比仍属“小数点后两位”的影响。区域电价主要调节“利润率边际”,而不会改变“项目能否盈利”的结论。" \4 R% ]- E' s
# M+ @0 g! R0 h9 H* i1 ?0 v; G
4.2 全成本 per token:自建集群视角(基于 LenovoPress TCO)$ F1 `5 Q) U, f' ?. q+ z* y
以 LenovoPress 的 8×H100 Config A 为例[28]:; n _8 ^. @$ _7 J* O' K7 L
0 p" Z7 m p) e9 S% N2 j: }- Q5 年摊销下,8×H100 本地推理 70B 模型:5 U! t$ n0 y* g1 o: g
小时综合成本(CapEx摊销+Opex):$12.08/h
9 e, @. c, z- ]" F) Y吞吐:30,576 tokens/s → 每小时 ≈ 110M tokens$ I6 S; A. \% L; t
成本/百万 token ≈ 12.08 / 110 ≈ $0.11/M token$ H" s0 @1 c: T' y8 c
电费在其中的占比:( F8 J8 F" n+ j& y; q1 `
Opex 6.37$/h 中电力+冷却约 $0.87/h[28]
; ~: J/ I3 Z* l) P+ ]4 h; H电费/百万 token ≈ 0.87 / 110 ≈ $0.0079/M token
0 ^2 C% x9 Y* O- S! T" X% R$ N) b5 t电费占 总 token 成本 ~7% 左右。 Z3 E/ _* T+ K: w3 _* K4 i
若将美国电价从 ~$0.12/kWh 提高到 $0.30/kWh,则电费约增 2.5 倍,对总 token 成本影响约 +10–15%。! X* Y# o" H5 _( Z+ Y
若迁至中国西北 0.3 元/kWh 或中东低价长协,电费可再降 40–60%,总 token 成本再降低约 5–10%。, Z" x$ u" K/ @
0 d5 Y3 o% N7 i) n因此:0 P, v9 ]( D# a7 k, s9 p
- w0 }+ N: W9 t# b* i
在自建集群场景下,电价对 token 成本有可见但非决定性的影响(变化量级在 ±10–20%)。9 m3 A7 }5 b; r: V& P1 i0 h8 ~5 m
在云租和 API 模式下,电价影响则被进一步摊薄,绝大多数利润被云厂商的溢价和 GPU 供应链吸走。
+ E! X1 m1 {9 f% j5 k1 o五、不同芯片方案的建设与运营成本对比" ], ?, ~! I# O
5.1 NVIDIA 方案(H100/H200/B200/GB200)2 B* i- q1 L7 K' S n7 m: j k
CAPEX:
" K) d p" ~# h% x% \! j4 o9 G( M, `# [- _
H100:单卡市价 $25k–35k,8 卡服务器约 $250k+(Lenovo 配置价 $250k 左右)[9][28]。& @3 \2 w- I& k5 ^1 H/ \
H200:显存提升,单卡价更高,8 卡节点约 $280k[28]。
$ D% i3 |' M( w/ B" Q( ^6 Z0 `B200:Blackwell 代 GPU,8 卡服务器约 $338k[28]。( G: ~+ t% G6 o. D3 D& V" p
GB200 NVL72:
! r3 J5 I& Q* ]每 rack 带 72 GPU + 36 Grace CPU,售价约 $3.0–3.35M[34][69]。9 V; O) H ?. ?- H# M" W9 b5 f
冷却系统每 rack 额外 $50–56k[35]。
, `5 J7 g0 c7 {! X* I) j1 Q9 X在 400MW 场景中,GPU 总 CAPEX 约 $5.6–7B,占总体 CAPEX 近 40%。+ |, Z: }) N2 b! @/ Y
OPEX & 能效:
% @4 R* K8 r' D" C% S# F" C' l1 U6 n' F. s$ U s3 A
单 GPU 功耗:
6 Z7 A. e2 q& f) \% ]5 rH100:TDP 700W;集群实际单 GPU 含服务器/网络开销可到 ~1,500W[16]。
' l$ ]% Y, m! ^1 OH200:功耗类似或稍高,但性能/W 提升[9][10]。
7 I" p( h. M2 X9 b7 }$ u$ |3 mB200:标称 1,000W TDP,但实测约 600W 左右[68][69]。
$ a7 g' \+ L/ O4 c7 }. O. v+ lToken 性能:
) e6 l2 g1 ?% b1 ^/ u% }8 uB200:官方推理基准中,可达 60,000 tokens/s/GPU 级别(gpt‑类模型)[68]。
' ?, \4 M' M$ a. Q4 gNVIDIA 的优势:6 ~- e# l& ? N* a8 w! k
; `9 \! Y0 ?; r. \1 [2 |7 f% l$ |软件栈成熟(CUDA/TensorRT‑LLM),易于榨干硬件性能,batch 与多 GPU 并行调度成熟 → 在同等 PUE 与模型条件下可达更高 tokens per Watt。
5 A- \5 i% a2 e5 h; o% Y但硬件价格与毛利极高,从 TCO 角度,“谁买单 GPU 溢价”是关键——云厂商多半将成本转嫁给 API 用户。
$ Y; o; m. X0 e8 ^5.2 Google TPU 方案6 J8 L7 ?) b ~' a C) p
CAPEX:# ?3 A( S8 @+ [, n! a `
8 L3 J1 f7 c& z7 N' n" ^
单 TPU v4 定价约 $3.22/芯片小时,v5/v6 在云端按实例小时定价对外[52][54]。
2 n7 a* r& H4 I3 X, F8 V/ }* LGSR 估算:TPU 的出厂 ASP 约 $4,500–5,000/片(Google 内部成本)[54]。
3 ^" t" N# {- K) H- h8 TPU v5e 实例约 $11/h,而 8×H100 云价可高达该数值的 5–10 倍[52][54]。
# n0 }( v+ w6 l* j能效:
0 o4 ]' d% U, x
l! H# W) [, W( b U( @* X& mTPU v5e vs H100:' c$ J0 S, n& D [" v
同级推理场景下,8×TPU v5e ≈ 2,175 tokens/s(Llama2‑70B,INT8)[67],H100 需更高功耗才能匹配。
7 ]$ z. B2 ]1 W测试表明 v5e 功耗约为 H100 的 1/5 左右[67][52]。. d( C0 ?9 B& d l; O
新一代 Trillium/TPU v7:
@+ z/ f# {& s( p$ S* d能效比 TPU v5p 提升 ~67%,对 H200 或 B200 整体上能实现 2–3×性能/W 优势[52][65]。
6 |- r- Z' {, _: _Google 方案的特点:
* ]& n7 Z" Y. Z, I+ P9 }
; r6 b# |; v1 ]1 a( b' I5 X3 e d自用闭环——Google Cloud + TPU + Gemini,利润来自整体云栈,而非单个芯片;
: j4 B* p* z+ `$ | G对外公布的 API 价格较为激进,TPU 方案在 tokens/W 与 tokens/$ 上具有显著优势,尤其在内部工作负载。
/ R3 b# Z8 E! R" _( h8 S5.3 华为昇腾 910B / 910C 方案
! P- K5 x5 @ \* p5 ?! _CAPEX:1 Y7 D8 S7 }" |( }- z
3 l0 c: U# J q% Q# m
单 910B 芯片成本约 50,000 元人民币 ≈ $7k[60];910C 约 110,000 元[60]。
6 I' y, d1 f( P, R2 `与 A100 对比:
( |0 o; \" ^ f! G, E' UFP16 算力 320–376 TFLOPS,功耗 310W,性能接近甚至略高于 A100(400W)[80][81][82]。
9 S8 y( y$ S: Q2 y9 q# Z, w市场报道中,NVIDIA H20 在中国售价约 10 万元/片,而 910B 更便宜 30–40%[61][72]。; o: |# J! ^3 H9 c4 ~4 I
使用昇腾构建类似 400MW 级别集群,总 GPU CAPEX 相较 NVIDIA 可节省 30–60%,视集群规模与供货条件而定。
& d8 C# Y2 Q: b. F: H1 K2 H/ QOPEX & 能效:: N9 @, }; g+ A9 X# n& G
5 p: a8 z1 m! A910B 功耗 310W,FP16 320–376 TFLOPS → 性能/W 与 A100/H20 接近或更优[80][81][82]。 S# n/ `; Z. ^7 S3 x, Y
部分推理 benchmark 显示,长上下文(>4k token)推理时,910B 在 tokens-per-watt 上可超过 H200[71]。, Q0 R* q5 z+ l1 U
在中国电价(0.3–0.4 元/kWh)环境下,昇腾方案在 TCO/tokens 维度有明显优势,但生态与软件栈仍在追赶 CUDA。
. M& P4 x# w; G Q( p5.4 平头哥真武 810E(PPU)方案
/ D, {- h3 }6 l5 Y0 u( s+ r! ZCAPEX:
6 U* l+ l' ]( z) y
4 x! A9 b, K8 d7 ~% Z; m& d* V技术参数:
) h5 P9 u+ } k5 y) ]/ S/ o) [8 u96GB HBM2e,片间互联带宽 700GB/s,自研 ICN 互联,PCIe 5.0 ×16,400W 功耗级别[59][102][111]。4 d: f, }3 X) K- J# t
性能:官方宣称整体性能超过 A800 与主流国产 GPU,与 NVIDIA H20 大致相当,升级代际可逼近/超过 A100[59][110]。! J: R# h2 o- }( }$ W8 v' Y8 ~
价格:
C# ^' p1 a1 ~& R2 c未公开详细单价;多个媒体报道指出“单位算力成本可下降 ~40%”,与英伟达 H20 有 3–4 成价差[74][112]。( j' m" p; V6 ?
结合国内报道:
; H" b# L* q% @: m, m3 C/ M2025 年出货量数十万片,已在阿里云实现多个万卡集群部署,服务 400+ 客户[59][111]。
$ u) n$ {5 g' T数量规模与生态成熟度迅速提升,使得 真武+昇腾 成为中国公有云/算力租赁的主力基础。* t# B5 z6 C: Z/ w
OPEX & 能效:
+ _7 i( M- R0 t( b) w! e6 ?/ P0 |3 i# g* i3 a, t
400W TDP、96GB HBM2e,使其在 高上下文、RAG、大模型训练+推理一体化场景 中具有良好性能/能效平衡;2 f9 G" H9 s' r$ S
在中国低电价 + 低人工成本环境下,真武方案可将 AI 推理服务的综合 token 成本进一步压缩 —— 对标 NVIDIA H20,本地算力提供商可在保持 ~8–9 成性能的前提下降价 30–40% 仍保持毛利[74][112]。
' h. ^9 ~3 t9 l3 H$ ]* D7 N) J* e六、综合比较与策略建议2 F' ^$ `. |$ x) R; t* |# J/ a$ r: S
6.1 区域维度:在哪里建 AI 数据中心?
- a. d6 [" U7 b% x2 u纯经济性(TCO/tokens)排序(假设无政策/合规约束):
" P! w. e& O8 ~; d0 q0 ^+ L1 }" X+ A; u9 F
中国西部/北部(电价低、人力低、建设成本低)% ~8 B: t4 j4 [$ @: C/ o" i
中东(UAE/沙特)(电价中等偏低、土地与电力可得性好、政策支持)
1 y2 P$ U. r- D, B2 M1 x3 d美国电价低但人工高;东海岸/加州电价上涨压力大$ ^# o& g2 g. \* Z. F% m. v7 ?
欧洲电价高、审批严格,但接近高价值企业客户和数据主权要求7 ^1 y- n, s/ }! e3 ?; t
若以“美国 $0.30/kWh vs 中国 0.3 元/kWh”极端场景比较:
; N: b4 v7 p- d7 l: b& N" q) }! p+ i( Y
纯电费/百万 token 差异:约 $0.083 vs $0.012 → 差别 ~$0.07/M tokens;) S1 m, D. J! w, i7 R4 K
对比 API 价格:差异对整体利润率的影响远小于是否使用 NVIDIA vs 国产芯片、自建 vs 云租的差异;! q, |. Z; U, c
但在极高利用率的 自建超级集群 场景,电价仍然能在 5 年 TCO 上带来 10–20% 的边际优化,是选址决策的重要考虑。
! z) u0 H) a0 A/ h8 b T0 X6.2 技术栈维度:选哪家芯片/云栈?
. e7 [5 W& Z8 o# Y5 R4 B: q若目标是全球最优 tokens/$ 且不受出口管制:
6 I( w. m4 x9 T7 L
0 ~; B3 g) E0 t; j9 j, H& lGoogle TPU v7/Trillium + 自建 on-prem:性能/能效与成本的综合最优,但前提是可以直接获得 TPU 硬件与软件栈授权(现实中仅限 Google 内部和极少数大客户)。$ y4 ~! x' B* v S J/ _! V+ u- {
若在美国/欧洲,能自由采购 NVIDIA:
) g3 x4 b8 X) F; h- K! A8 N1 W4 A/ s5 H n
短中期内,NVIDIA B200/GB200 NVL72 仍是最佳实践:
' \% E6 k, L1 O9 @7 F/ Y8 ]: T. _成熟的软件栈与生态,极高的 tokens/s/GPU;
' E) S9 ~* s P' B在云厂商/超大规模自建模式下,配合液冷与 PUE~1.1,可取得较低的 token 成本; e6 |" p. @- c* z7 h% I' n
但要谨慎评估 GPU CAPEX≈总投资 40% 的集中风险。
4 S h/ I; ] Z1 r1 @5 W' {若在中国或存在出口管制约束:$ y- q- x# P: W( W
: j, ]( r5 ]+ `) V
昇腾 910B/910C + 平头哥真武 810E 是现实可行的主力组合:
1 `3 [6 |8 K: c: d" ~性能上已能覆盖大部分 GPT‑4 类推理需求;" r3 R) g0 \2 z2 k5 \& X# o+ ]
单片成本显著低于 H20/H100,集群 CAPEX 明显更友好;
" I) {- }5 E: z" f1 E软硬件全栈国产(CANN + MindSpore + 通义/Qwen 等),可避免制裁风险;" p/ E, h; ?! q8 {7 d0 D
建议配合:
$ E8 A' S4 V/ a! {" N/ _2 {" u高效液冷(PUE~1.1)、
1 d* c9 h1 S3 n; y# s大 batch、路由(浅层任务走小模型/低成本芯片)、
! k( K1 Q! }6 Z5 u2 o强量化(FP8/INT4)与分层缓存策略,进一步摊薄 token 成本。6 g/ D: @1 m+ c9 X
长远看,“tokens-per-watt / PCE” 取代单纯 PUE/FLOPS 成为核心 KPI: y) G+ P: z7 E) r
: \; h4 u5 x5 q% [* l) J数据中心运营者应从“PUE 1.5→1.1”的设施思维,转向“每瓦输出多少有价值 token”的AI 工厂思维[29][118];* H% b. J2 Q) q. c
这意味着:2 k, _+ {7 i* k/ E e. c
优先选择 更高 tokens/J 的芯片架构(例如 TPU v7、B200、后续国产芯片);
1 f1 T N; R" [精细化调优 batch size、路由策略、CoT 深度,将“energy-per-token”作为最优先指标来优化[17][26]。
9 \! s# j% d9 T& r( X6.3 针对你关心的具体问题的简要回答9 E0 s6 K9 O! q, A y q8 X
AI 数据中心建设 vs 运营成本的大体比例?
9 u7 v/ s& ?) X4 I n9 k' ]* W" z: [0 a! G
在 5 年期 TCO 视角下,CAPEX(尤其 GPU)约占总成本 50–70%,运营成本(电力+冷却+人工+维护)约 30–50%。( A0 P8 @) D1 ^" T5 p
其中 GPU 自身 CAPEX 占到总 CAPEX 的 30–40%[36]。
: B9 k! L4 @% [# L6 o# Y, K中国、美国、欧洲、中东的成本结构区别?
$ t t+ ~) `, O% A0 b8 Y/ X/ W* X, V" ?
建设期:- ]; I( C$ `3 k1 ]: a
中国/中东的壳体+机电成本明显低于美欧(约 5–7 vs 8–12 vs 10–11M $/MW)[1][2][20]。
" t' o% O$ p: w4 i: g- a$ T/ w运营期:
( d m8 C) L6 }7 }5 V! m电价:中东 ≈ 中国西部 < 美国平均 < 欧洲& I' m0 t4 v& {0 Y9 R% |% ~6 u
人工:中 国 ≪ 美 欧,中东居中。 h" O# ^* D+ w T1 B( J5 A
在美国 $0.3/kWh 与中国 0.3 元/kWh 下 token 成本与利润率?
/ F. j4 }& L+ z- N" d/ n6 N8 `% X+ f
对于典型 1 J/token 推理负载:, a8 ?3 d2 E6 @( F8 X: D+ A
美国 $0.30/kWh:电费约 $0.083/M token# X" @! N2 y) g! g. t% j9 Z
中国 0.3 元/kWh:电费约 $0.012/M token
5 W, z! I& ?+ N4 Z. q; k" {对比 OpenAI 等对外价格($0.6–168/M token),电费无论在中国还是美国都只是利润表里的“小头”,主导因素是 GPU TCO 和平台溢价。
0 m9 B: E: o: V+ I; [/ H不同技术方案(NVIDIA / Google / 昇腾 / 平头哥)的建设与运营成本谁更有利?2 p4 f, o3 t4 w: l- F
& V* Y/ d/ m" } l3 t p
在可获得 TPU 的前提下:Google TPU v7 在 tokens/W 和 tokens/$ 上最优;# W# ?9 A5 i1 X4 m; N+ c: y
全球通用方案:NVIDIA Blackwell 全家桶(B200/GB200)+ 液冷,但 CAPEX 巨大;9 z" f9 M5 R; C" U0 @% }7 }4 W
中国/被管制市场:昇腾 + 真武 是当前最有经济性与可持续性的路线,综合来看能把 token 成本压到 NVIDIA 方案的 40–70%。 |
评分
-
查看全部评分
|