TA的每日心情 | 擦汗 2026-3-17 22:01 |
|---|
签到天数: 1133 天 [LV.10]大乘
|
沙发

楼主 |
发表于 2026-2-26 21:43:21
|
只看该作者
后来想了想,我让龙虾爬了一个分析全球AI数据中心建设和运营成本的报告,内容如下:7 ?" l, \# \2 `7 O% x! ~& M* X
: U0 V$ O2 c5 _& @
一、总体分析框架与核心结论4 n" J- T) _- E- X: `
1.1 分析框架概览+ g: S, q# ^3 Q' o0 e+ ~" \
拆分维度
& r! y8 E8 B% @: L
# K8 A0 G- @3 G% G" n/ e阶段:$ |. K% n3 F2 f# c# U9 x4 G
建设期(CAPEX):土地/建筑、供电与配电、制冷、IT 硬件(GPU/TPU/加速卡)、网络与其他基础设施) s9 [% ^0 D, D8 n3 h$ \
运营期(OPEX):电力、水、运维人员、场地/托管、维护与更新、网络带宽等, W' Z! \" K }& u1 }
区域:3 k; \! @( b+ E; ]% P
中国、美国、欧洲、中东(以海湾地区/UAE 为代表)) _. N5 n0 O) I- c
技术方案:
# \. b, W+ V; INVIDIA(H100 / H200 / B200 / GB200 NVL72 等)
n# R2 W: Z# E5 jGoogle TPU(v5e/v5p/Trillium 等)7 l0 y: Q/ g4 \
中国芯片:华为昇腾 910B / 910C 系列、阿里平头哥真武 810E(PPU)/ M, O+ w0 k) M0 W
算例基准
& i9 q l' c+ x0 {/ t3 ?( F/ Y! @5 S
以400 MW 级 AI 数据中心为统一标尺(与 ChinaTalk BOTEC 分析保持一致)[1]:0 i) N! T2 K- I/ b% K! ~! M
其中 IT 有效功率约 360 MW:GPU/AI 加速约 312 MW,CPU/存储约 48 MW! P1 h- ]5 f7 o* i: A- n, i' p) b3 W
PUE 假设约 1.11(高效液冷场景)[1][29]
" ] D8 p. b$ H时间窗口:3–5 年运营期(与行业 TCO 分析和硬件折旧相匹配)[28]: }; _# h! F/ P( l+ E2 m. p2 G O' g
关键指标- ]0 u8 ^( \$ ^# V
# ]( y- w: q& W1 z$/MW 建设成本(含/不含 IT 硬件)
3 y* E3 b! ?5 M$/kWh 电力成本、L/kWh 水耗
) L9 A: g0 H) {! X8 J1 Z& V$/token 或 $/百万 token 的综合成本
0 e$ e5 T3 f# P* jToken-per-watt / Joule-per-token 作为能效基准[17][18][26]
1 R9 ~/ M: K2 G5 I) P q项目 IRR/回收期、吨位级 TCO 对比(自建 vs. 云租)
% E) b/ R5 c7 P" H/ q& b1.2 高层结论(供决策快速参考)
$ j& L/ s+ \1 L9 T4 Y6 b: z建设成本:AI 数据中心相对传统云数据中心成本翻倍' ~& I. c4 ~% D5 X1 }
! ^* S4 j9 S" h传统云数据中心壳体+机电平均约 $10.7M/MW (2025),预计 2026 升至约 $11.3M/MW[2][41]。+ p* ?, X" d R- `( b
AI 优化数据中心(高功率密度 + 液冷)壳体+机电可高达 $20M/MW 甚至更高[41]。: K: l# \5 O M9 y/ d% @" i
按 Accenture/Soben 研究,传统云 DC 为 $8–10M/MW,而 GW 级 AI 数据中心可达 $17M/MW(仅壳体+机电,不含 GPU)[3]。
! s1 L7 U5 v8 A$ ]- G7 K9 ]区域 CAPEX:中东≈中国 < 美国≈欧洲 < 高端 AI 园区
& Y7 O4 u3 k3 o& ^' u1 u1 u; O
0 r: H. H3 T' A- p中国:$5.5–6.5M/MW,400 MW 约 $2.4B[1][13]' _+ y) ?& K' S& T1 y3 ^% z' _
美国:$8–12M/MW,400 MW 约 $4.0B[1]8 N( R c% _% J. o8 T* p5 C
欧洲:接近全球平均 $10.7–11.3M/MW[2][41]; e; F2 G" J3 e2 P: Q( i( `" ]
中东(UAE Stargate 5 GW):总投资超 $30B,约 ≥$6M/MW[20]- r3 A1 L1 j8 j. Y H4 ~# Y
结论:中国与中东的壳体+机电 CAPEX 明显低于美国/欧洲,同等规模下节省约 30–40% 构筑成本。
1 t6 e ^* q7 g. QOPEX:电价与人工决定区域优势+ ?7 J( F4 ~" x' t1 t* J2 Z' P
9 u# e, P2 D9 m' a$ F' N3 g
电价(2025–2026 工商业大致区间):- ?* _5 u4 o% X \, C* }
中国:约 0.8–1.1 元/kWh ≈ $0.08–0.11/kWh,部分算力基地可通过长协拿到 ≈3 美分/kWh[12][73] w5 I* V8 k" r$ f
美国:工业用电约 $0.085–0.09/kWh[44]$ |4 ^* L* B8 d
欧洲:非居民平均 €0.19/kWh ≈ $0.20+/kWh[45]
4 y9 Q r/ r+ G, Z" P7 E; @# \' I中东/UAE:工业用户 $0.07–0.13/kWh[47]3 l! A' L3 }; \% V, r( J" @% q
人工:# R9 a9 z. W. c
中国数据中心运维:约 $22k/人/年
* }2 X+ r1 ^! m$ Z( R% k9 X美国数据中心运维:约 $120k/人/年[1] K; T- s& L% H5 {8 X2 q- s) W6 X
结论:电价上中国西部/北部与中东有显著优势,人工成本上中国远低于美欧。8 b- D4 D5 t2 J* M- Y6 _2 D7 |- o
能耗与每 token 能源成本:能效差异远大于电价差异
( v( o* t0 O' v7 Q0 S4 s" I/ a2 N, D9 @1 v7 b1 }+ h
IEA:2022 全球 DC+AI+加密耗电 460TWh,2026 可能至 620–1050TWh[86][90];AI 专用服务器约 90TWh 量级[30][90]。" z! J* g) e! c- K" j
大规模 LLM 推理能耗估算:H100 集群训练 GPT-3 175B 约 2.46–3.63 J/token(训练)[10][16];经推理优化后,Inference 端典型可做到 0.4–1.0 J/token 级别[17][26]。
& \; L( e0 D$ l4 f S将 token 能耗约化为统一口径:5 P5 U. M2 k2 o& U; _, m3 L" o
粗略取 1 J/token = 2.78×10⁻⁴ Wh/token。若电价为:
X/ @# I: i' P中国 0.3 元/kWh ≈ $0.042/kWh:电费 ≈ 1.17×10⁻⁸ $/token ≈ $0.0117/百万 token# g( Y$ S* D5 ?% F6 \# I
美国 $0.30/kWh(题设):电费 ≈ 8.34×10⁻⁸ $/token ≈ $0.0834/百万 token
! S8 |, L: P4 x- X* k6 ], d7 U对比:OpenAI GPT‑4.1 / GPT‑5.2 系列对外 API 输出侧价格 $8–168/百万 token[62],电费占比 远低于 1%,真正决定成本差异的是硬件 TCO 和利用率,而非电价本身。( A7 z) k( B9 E) F
不同芯片方案的核心差异
, p/ ]+ F U6 O4 q7 u7 V# Z- Q5 v& }6 `2 x8 ^# \/ G; j
NVIDIA Blackwell/B200 & GB200 NVL72:$ ]/ Q/ ?( r5 H$ |
单 B200 GPU 峰值 ~4.5 PFLOPS FP4/FP8,功耗 600–1000W[68][69]。0 [. f0 A5 m! |6 |
GB200 NVL72 整机架售价约 $3.0–3.35M,72 GPU[34][69],GPU 约占整个 AI 数据中心总 CAPEX 的 39% 左右[36]。$ X) P4 r7 M* ]! Y5 S# w( f
Google TPU v5e/v5p/Trillium:! m' Y- P5 @) X: l7 z
TPU v5e 8 芯推理:约 2,175 tokens/s(Llama2‑70B,INT8)[67];功耗显著低于 H100,同负载下能耗可降约 5 倍[67][52]。
2 {1 S8 n( i$ E( @3 ]7 n" JGoogle 内部披露 TPU v5 能效约为 H200 的 1.46×,Trillium/TPU v7 更高(约 2× 甚至以上)[52][65]。
6 M; l$ U& D: ^% }8 f华为昇腾 910B:) b; o i+ c. B0 V' @0 n J: u. m
FP16 算力 320–376 TFLOPS,INT8 640 TOPS,TDP ≈ 310W[80][81][82];能效接近甚至超过 A100,在长序列推理上 token-per-watt 可超 H200[71]。
1 ?) f s& F* v- t单芯片成本约 5 万元人民币 ≈ $7k[60],显著低于受限版本 H20/H100。
$ n' a, f; K2 Z5 Q2 X' z7 v5 L阿里平头哥真武 810E(Zhenwu PPU):1 c1 n* z0 w, y! S4 R% n# ?* B# a
96GB HBM2e、700 GB/s 互联带宽[59][111],功耗约 400W 级别[102],整体性能对标 NVIDIA H20/A800,并已形成万卡集群部署[59][111]。
% z5 X1 g. i; i$ [结论:* |* _9 W6 e& N; o3 P( z1 G' }% }
能效(tokens/J 或 tokens/W)排序大致为:Google TPU v7/Trillium > NVIDIA B200/GB200 > TPU v5e/H200 ≈ 华为 910B ≈ 阿里真武 > H100/A100。
' B3 ^) o5 Y/ N/ U0 \单芯片/整机价格排序:华为/平头哥 < TPU 自用成本(Google 内部) < NVIDIA 公版(H100/B200/GB200)。
# g+ j9 }' Z2 Z- [5 ]. w对中国市场,在算力性能足够的前提下,昇腾 + 真武 方案的 CapEx/每 token 成本有 30–60% 的价格优势。
* u5 k5 I: b- Y* l2 I" T9 ^8 H自建 vs 云租的 TCO 与 token 成本- G' s* [1 @: A% }! f! X& F2 t- l
0 g: V8 @6 e$ F* b; B5 }/ LLenovoPress 对 8×H100/H200/B200/B300 本地 vs AWS/Azure/GCP 的 5 年 TCO 对比[28]:
9 V8 K5 T7 S6 z8×B300(Config D)自建 5 年 TCO ≈ $1.01M;$ D( n, S) x, }: Y. P3 k# x) I
等价 AWS p6‑b300.48xlarge(24/7)5 年 ≈ $6.24M,节省 83.8%。
# J( }4 P$ G+ X/ K( C8×H100(Config A)自建对 Azure On‑Demand,回本点约 2,720 小时(~3.7 个月),对 1/3/5 年保留分别约 4,423/6,800/7,591 小时(~6/9.3/10.4 月)[28]。 G) u* W7 ^' Z6 H, g8 O5 B* ~
Token 成本对比示例(LenovoPress 场景)[28]:
+ ] g8 {" K, ^6 D }Llama‑70B 推理,8×H100 本地:约 $0.11/百万 token
$ D7 h! H/ b) e% E& [vs Azure H100 On‑Demand:$0.89/百万 token → 自建 ~8× 便宜。
+ Q1 f% B7 Y0 U, n5 X2 X同样 70B 模型,自建 vs GPT‑5 mini API(约 $2/百万 token):自建便宜约 18×。/ @( q; [3 e; [' d
Llama‑405B,8×B300 自建:$4.74/百万 token,AWS B300 On‑Demand:$29.09/百万 token → 节省 ~84%。
/ Q- {4 ]! o+ y, w, ]结论:
( E4 v1 ]+ l; r. U% a高利用率、长周期推理负载下,自建 AI 数据中心的每百万 token 成本可比公有云或高端闭源 API 低 1–2 个数量级。7 a: q; D) K9 ~3 r6 F. p
Token 电费占比极低,自建 vs 云租的差异几乎全部来自 硬件折旧 + 云溢价 + 运维与利用率。/ Q4 s' ^0 ?3 y/ p
二、建设期成本分布:区域对比* m" N7 z; e. t R0 \; M
以下重点讨论 壳体+机电(不含 GPU) 与 全栈(含 GPU) 两层。8 Y( _; D- H5 U: P5 O
) K9 r/ u9 Z9 L5 X9 q
2.1 全球/通用结构(以 1 MW 为单位)
' `/ e) ^5 l* l综合 JLL、ConstructElements 等[2][41][40]:+ f7 g& `: [! I" g; g( Z5 F; f
) ~7 T5 F4 w, m, y6 S" p% x
壳体+机电(Shell & Core)
1 [- }5 V* {7 C ]9 _" \1 E7 r' O {
全球传统 DC 平均(2025):$10.7M/MW,2026 约 $11.3M/MW[2][41]* o5 Z6 q' T2 P: y1 n0 Z: _
其中按成本构成[40]:
H8 |1 x. w" k8 ]# ~; \电力系统(变电、配电、UPS、母线等):40–50%
4 M7 p. d. y1 f机械与冷却(冷机、冷却塔、管路、CRAC/液冷):15–20%! B# v" w( y7 e$ c! u* q1 x
建筑与土地、结构:约 15–20%% E9 G0 t1 c" P% u! ^
其他(消防、安防、楼宇管理等):约 10–15%6 N' c1 |+ T' v
IT 内装与 AI 基础设施(不含芯片)
6 k4 Y0 _" M, F4 ~3 a+ b5 V
( b% Z( @3 Y( m* t: D$ _高密 AI 集群内部装修(高密布线、机架、液冷板/浸没舱等)会在每 MW 额外增加 $25M/MW 量级[40],对 GW 级园区影响巨大。) V I2 ^8 y; U3 [8 |. G4 q0 V* x8 f
GPU/加速卡硬件 CAPEX) W' o/ ]0 c. Z+ c/ d! y" p
S, z" i( _/ X( k0 e' F* [( t5 g* g多数分析认为 GPU 占 AI 数据中心总 CAPEX 的 30–40%,其中 NVIDIA 单家毛利约等于整个行业 CAPEX 的近三成[36]。 m1 l7 h7 n) E8 q( p8 Y
2.2 中国 vs 美国 vs 欧洲 vs 中东:1 MW 建设 CAPEX
/ i7 d; a, h! F" K6 y结合 ChinaTalk、JLL、UAE Stargate 等[1][2][20][13](仅壳体+机电):* W, D" D6 e( @$ e
- v, m& P ^4 @9 i9 i+ l; ?
区域 典型建设成本(壳体+机电,$M/MW) 备注0 c, X& g9 r( N; ~9 s0 V
中国 $5.5–6.5M/MW 以西部算力基地为主,400MW ~ $2.4B[1][13]+ B& j) S" Y1 j- e8 J3 v3 F
美国 $8–12M/MW 典型超大算力园区 400MW ~ $4.0B[1]0 x* v8 b. [* q/ D0 J. o! W$ i. f
欧洲 $10.7–11.3M/MW 接近全球平均,部分核心城市更高[2][41]
# ~; ~- W3 B' I) j1 X中东 ≥$6M/MW UAE 5GW Stargate >$30B → ≥$6M/MW[20]+ x* \+ f8 K) W4 o' F9 W/ | R
结论:9 r8 O# s0 C" ?3 v$ W E
3 C/ R4 H$ n; B# L6 t, H2 N" L: l' T单位 MW 壳体+机电 CAPEX:中国 ≈ 中东 < 美国 < 欧洲。
3 I7 q# l- k& X$ l若考虑土地、电网接入和许可周期,中东(特别是 UAE/沙特)在电力可得性和政府补贴方面往往优于欧洲,趋近美国甚至中国。
: H5 k' b5 X+ ?5 \# u# `: q2.3 引入 GPU 后的全栈 CAPEX(以 400MW 集群为例)7 Q3 D1 H! _+ T) [
以 ChinaTalk 的 400MW NVIDIA GB200 NVL72 集群为例[1]:
. r" B, X: X- O3 O. O9 k+ l2 }. D) ?7 r$ a+ u+ q7 E! ]
假设:PUE=1.11,电力侧 400MW,中约 360MW 投入 IT;
8 R5 O& z* ^7 K% E% o7 T( q! LGPU 配置:0 l& u; v2 g8 g7 G) H
有效 312MW 用于 GB200 NVL72,约可容纳 2,154 racks(每 rack 144 GPUs,对应功耗 ~145kW/rack);1 T. v7 P# X) l6 y2 }6 |$ U
每 rack 成本 ≈ $3.0–3.35M[34][69];
) }2 ]1 n, R2 ~( P1 f0 |GPU 总 CAPEX ≈ $6.5–7.2B 量级(ChinaTalk 抽样约 $5.6B 略保守[1])。0 w7 M9 l" d8 L: b- c9 H, N
与不同区域壳体+机电组合:2 Q; h, B; _& B8 H4 K g, X: |6 ~
" A* W" X7 K6 l
以中值估算:
& L$ ~9 ?$ I! f; [( M; S* F2 @
( ]* H7 ], {$ W& @! H a5 J中国 400MW:壳体+机电 $2.4B + GPU $5.6B ≈ $8.0B( |0 _" G. M0 i
美国 400MW:壳体+机电 $4.0B + GPU $5.6B ≈ $9.6B/ U! F3 d% o8 v9 Y$ n: j0 j* g
欧洲 400MW:壳体+机电 $4.5B + GPU $5.6B ≈ $10.1B
$ n K8 E" p2 ^# `! {) j, K( F中东 400MW:壳体+机电 $2.4–2.8B + GPU $5.6B ≈ $8.0–8.4B
# N( d# p: }' p+ D5 N( g& B可见:
) f# [* @4 O8 v& q" H
P3 z9 i1 E$ l$ \9 ~8 f9 KGPU 成本在各区域大致相同,决定区域 CAPEX 差异的主要是壳体+机电与土地/电力接入。
3 t3 D* W! I0 Y' j2 _相比美国/欧洲,中国和中东可在 400MW 级别节省约 $1.6–2.1B CAPEX,这对 IRR 有直接影响。 p) _/ [5 ?! L6 x
三、运营期成本结构与区域对比
( \! I& V: ?2 f; p7 T3.1 通用 OPEX 结构(高密 AI DC)) w1 F& l0 {" c' D# H8 p9 X# X/ G
结合 ConstructElements、IEA、Microsoft/Google 披露[40][86][103][104]:
* A7 B: H `8 w0 {# v; L& t$ }- B s$ C/ x) l
电力:约占总 OPEX 的 20–30%(传统 DC),对于 AI DC 因 GPU 负载密度提升,可达 30–40%。( c' x. a) Z& M+ \* Q( o, ]
冷却与水资源:! E6 M8 {8 ]0 @/ p# v7 v/ M
能耗:传统风冷约占总功耗 30–40%[39];液体冷却可将 IT 与制冷合并大幅降 PUE 至 1.1 左右[29][115]。* f" W/ l2 l7 `& I* `% Q
水耗:典型 DC 约 1.9 L/kWh 水用量[105],每日用水可达 300,000–5,000,000 加仑 规模[100][101]。
+ D3 t d8 o' j/ h6 N I+ B人工:视地区而定,在中国/印度/东南亚占比 5–10%,在美欧可达 15–20%。. [0 W( W8 n4 G5 d- z
托管/物业与维护:, ]) D9 r% f7 M* y, D
托管:高密机架约 $1,500/机架/月,标准机架约 $600/月[40][28];, X, \: b1 C/ l* t! S; j
硬件维护:LenovoPress 模型中按设备价 12%/年[28]。
% v2 L. X+ T1 E* A3.2 区域差异(以 400MW / 3 年期为例)
6 x/ ?! P N6 ]) X2 y" r/ o使用 ChinaTalk 的电费与人工估算[1]:
- m+ J- X( f# d6 q0 b$ l* t+ k! s% x- r |+ {# F
电费(3 年) – 假设 GPU 利用率 60%,IT 360MW,PUE=1.11:
; S! H" b2 L4 N. y. t/ |( A中国:约 $0.06/kWh → 3 年电费 ≈ $350M
! V4 a" d2 o- G美国:约 $0.09/kWh → 3 年电费 ≈ $600M
. @( |6 G4 M+ _, B/ \中东:约 $0.07–0.10/kWh → $400–550M% \8 z. R1 s$ _/ W4 n
欧洲:约 $0.20/kWh 以上 → 电费 > $1B(显著劣势)4 L* K$ n- [9 F0 q% U5 O
水费(3 年) – 以 MS Fairwater 站点 280 万加仑/年为参照[1][103]:
& O' P; r# _! F( Y/ E美国水价约 $5.18/千加仑,中国约 $2.57/千加仑[1]; S. ?7 M$ `$ w9 s0 c: V
三年水费级别:1 T, [1 Z% r+ p) |& |
美国:$40k+8 ]) Z _8 `& c1 [, [4 \- n
中国:$20k+ [9 ^! P; D" ]1 O1 D- v
结论:水费是数量级上可忽略的小项,真正的约束是水资源总量与选址,而非成本。8 W, l0 |4 w1 `/ K+ H; g
人员成本(3 年) – 假设 500 名全职运维:
4 s) b R6 x9 d" Y) d" L9 X1 T美国:500 × $120k × 3 = $180M+
1 m7 j0 \3 }% `$ V7 d& n0 r& z中国:500 × $22k × 3 = $33M+
& T+ m& e. j0 u% l& ?5 c差异约 $150M,规模与 3 年电费差不多,是中美间第二大成本差异来源。3 j6 w! |& H& P% w
整体 OPEX 粗算(3 年) – 400MW 场景下: G f. ?6 N* n/ M1 m" u2 \
2 e! [1 I* Z* E9 L" z4 h4 ]项目 中国 美国 J9 \3 H' `9 i' T. v) W" U- ` C1 W
电费 $350M $600M$ c F/ p9 c" K9 X) u
水费 <$0.05M <$0.05M( z: Q- D! G3 e6 S, x% w9 Y
人员 $33M $184M
8 o+ O- c: o/ A, ]其他维护/托管 同比例估算,地区差异主要体现在人工与地价
( E3 g$ O* F7 W H结论:
. ~/ K8 N$ ?9 B5 ]
& S: c5 p# p5 m* u* [就 3 年期而言,中国与中东在 电价+人工 两项合计可比美国/欧洲节省 数百百万美元级,与整体 CAPEX(数十亿美元)相比不算决定性,但对净现值和现金流有实质贡献。
% N$ p7 U; _) L* L, {- \对大模型服务商而言,更核心的是 GPU TCO 与 token 单价之间的剪刀差,而电价更多影响“边际利润率”而非“能不能赚钱”。/ p3 G! ~( p! K* ?) `
四、基于 token 的成本与利润推演
: R' h& ~$ @5 T# c& h. F4.1 能源维度的 token 成本(题设 0.3 美元 vs 0.3 元)
- E0 q. G3 @, g; j统一假设:
" Y ~* s* t s3 V; D
/ x( d# U [0 B7 R典型大模型推理能耗:约 1 J/token(考虑 FP8/BF16 优化、Batch=256–512 时的能耗甜点[26][17][18])
' a/ n- Q% e/ U: B& D1J = 2.78×10⁻⁴ Wh → 每个 token 约 2.78×10⁻⁴ Wh2 \' z# F4 ?3 M4 v* Q
1 百万 token:278 Wh = 0.278 kWh! b: K, b$ A: a$ | y* w- g8 \( B
场景 A:美国电价 $0.30/kWh, L7 e5 ^& l, D4 F m/ m* b+ H, t; z9 @
电费/百万 token = 0.278 kWh × $0.30/kWh
4 n( X) L/ H1 D$ ], J! D% u8 O L3 n≈ $0.0834 / 百万 token
" T; H+ c2 N5 |7 Y7 k2 d% a场景 B:中国电价 0.3 元/kWh ≈ $0.042/kWh7 T: I1 Z) S5 g: D! V# ]4 q) A1 [
电费/百万 token = 0.278 kWh × $0.042! ?3 Z* G. M9 M }5 R6 k2 t
≈ $0.0117 / 百万 token3 W ]$ |$ a, R7 ^2 h( i9 T8 |
对比当前 API 价格(OpenAI 2026Q1)[62]' v8 q2 {; K3 Z6 o
以输出侧为主(成本最敏感):$ q0 C; ^0 o4 j `0 d
$ V: j P0 r2 v! Z) h
模型 输出价 ($/百万 token). W& v( C) ^+ J5 x1 C
GPT‑5.2 $14, U4 @6 y* Z1 ~( D' ]" x* C
GPT‑5.2 Pro $168: S- {# G) Y. G
GPT‑4.1 $8! x: {' ^/ R- e& S: N2 l' y! Q
GPT‑4o $10
8 g' z+ c) z( a& M; T) SGPT‑4o mini $0.60! h( Z! c$ O. j }* p5 @2 F
则:
: u6 S( h1 Q2 z: ~% V. u3 E( H7 V7 i
' P l) T# Y' B& U9 y7 _# s1 U+ e在美国 $0.30/kWh 的极端高电价下,电费占 GPT‑4o mini 收入的 ~14%(0.083/0.60),占 GPT‑4o 仅 0.8% 左右。! M) i3 q3 J# F
在中国 0.3 元/kWh 下,电费占 GPT‑4o mini 收入的 ~2%,占 GPT‑4o 的约 0.1%。
! [6 t# g) f7 w* G相比之下,GPU 折旧+云溢价+开发/运维成本才是主导。4 [* o5 N: e: k$ o" \6 \
结论:
3 U# j5 D* k4 P g) q. q4 ^即便在“美国 $0.30/kWh vs 中国 0.3 元/kWh” 的极端对比下,每百万 token 电力成本差异约 $0.07,与主流 API 价格($0.6–$168/百万 token)相比仍属“小数点后两位”的影响。区域电价主要调节“利润率边际”,而不会改变“项目能否盈利”的结论。
2 a: y5 D% E2 j8 y6 ]! e( v( F5 t; H$ |9 ?) l
4.2 全成本 per token:自建集群视角(基于 LenovoPress TCO)
% X8 i. m) Y6 l; y以 LenovoPress 的 8×H100 Config A 为例[28]:
8 j' i/ D4 `- G7 l& d
4 T1 {+ a# y8 \5 年摊销下,8×H100 本地推理 70B 模型:9 h3 M6 I: P) S! B9 H) C
小时综合成本(CapEx摊销+Opex):$12.08/h! H/ ^- j; F+ g- H6 Y/ G# [, C
吞吐:30,576 tokens/s → 每小时 ≈ 110M tokens% i5 h5 v. L! W
成本/百万 token ≈ 12.08 / 110 ≈ $0.11/M token8 c3 X2 J) b' p5 x) O
电费在其中的占比:
! ]- v) E @+ V% e! c5 nOpex 6.37$/h 中电力+冷却约 $0.87/h[28]
, ?' }( F( R) f3 F! o8 m电费/百万 token ≈ 0.87 / 110 ≈ $0.0079/M token4 H+ o' V8 y8 f1 c+ J
电费占 总 token 成本 ~7% 左右。
0 d% u& l; b7 a/ H$ H8 D若将美国电价从 ~$0.12/kWh 提高到 $0.30/kWh,则电费约增 2.5 倍,对总 token 成本影响约 +10–15%。6 m! Z! L+ S d' B
若迁至中国西北 0.3 元/kWh 或中东低价长协,电费可再降 40–60%,总 token 成本再降低约 5–10%。3 t2 n" b5 F7 d. `4 ], T
( n: K5 R% Y1 Z% d
因此:) g0 a7 N9 f' f1 a* Q2 a2 t' z7 \
9 d- y9 Z \9 X) [% k, {) b* [在自建集群场景下,电价对 token 成本有可见但非决定性的影响(变化量级在 ±10–20%)。# @7 S6 c1 H$ i0 u6 S
在云租和 API 模式下,电价影响则被进一步摊薄,绝大多数利润被云厂商的溢价和 GPU 供应链吸走。
, S. B+ g" \" m f" I五、不同芯片方案的建设与运营成本对比
9 o# G- ^6 u! U" F$ d/ M5.1 NVIDIA 方案(H100/H200/B200/GB200)3 c/ ^' v2 f5 U5 V
CAPEX:
1 P9 b$ U, W t U. y. h0 |6 Z3 Q! h1 M/ R0 ?. c' }8 Z% A/ `: Q
H100:单卡市价 $25k–35k,8 卡服务器约 $250k+(Lenovo 配置价 $250k 左右)[9][28]。
3 m( z3 \4 |0 x) q9 F8 N; M4 ~8 n RH200:显存提升,单卡价更高,8 卡节点约 $280k[28]。5 z S6 f& \! P- b+ O3 W
B200:Blackwell 代 GPU,8 卡服务器约 $338k[28]。
j! z( X; {, wGB200 NVL72:
, C( a' I+ K5 Z% ~每 rack 带 72 GPU + 36 Grace CPU,售价约 $3.0–3.35M[34][69]。
( f2 t6 L3 q9 R3 X T6 Z) Y- a冷却系统每 rack 额外 $50–56k[35]。
" _3 C" u) q4 c5 R) J, w在 400MW 场景中,GPU 总 CAPEX 约 $5.6–7B,占总体 CAPEX 近 40%。! l) }" ~4 X' M
OPEX & 能效:
. [! J' T# Z! c( q" [' Y0 P/ ` ~4 R$ \+ R8 y- @) U6 z% q: H2 j1 _
单 GPU 功耗:
4 w" t$ p! z6 pH100:TDP 700W;集群实际单 GPU 含服务器/网络开销可到 ~1,500W[16]。
. P0 a" q( a2 D( N$ hH200:功耗类似或稍高,但性能/W 提升[9][10]。8 ]. e5 m1 F T
B200:标称 1,000W TDP,但实测约 600W 左右[68][69]。7 I0 w4 C! g6 M/ B" S
Token 性能:! D; J0 ^' `* z) Y1 h0 {* p$ R& u. {- u
B200:官方推理基准中,可达 60,000 tokens/s/GPU 级别(gpt‑类模型)[68]。$ f* c" a$ Y- G5 V" [" O( }; |
NVIDIA 的优势:2 h& b/ n( `4 B* ^, A1 f0 K
7 ^, z2 p9 ?. v2 v" q, t
软件栈成熟(CUDA/TensorRT‑LLM),易于榨干硬件性能,batch 与多 GPU 并行调度成熟 → 在同等 PUE 与模型条件下可达更高 tokens per Watt。3 L. _6 w& r: Q7 N4 P X3 _4 W4 K. f) \
但硬件价格与毛利极高,从 TCO 角度,“谁买单 GPU 溢价”是关键——云厂商多半将成本转嫁给 API 用户。' p! O8 z$ e1 p" _. c
5.2 Google TPU 方案! u" T. f4 _% S/ y
CAPEX:+ Z) n7 U- q' Z
3 a6 x- o0 m) s0 [( ^单 TPU v4 定价约 $3.22/芯片小时,v5/v6 在云端按实例小时定价对外[52][54]。
% n) n0 ~, e, M* D: dGSR 估算:TPU 的出厂 ASP 约 $4,500–5,000/片(Google 内部成本)[54]。
) |1 z/ Q% V( T7 c8 TPU v5e 实例约 $11/h,而 8×H100 云价可高达该数值的 5–10 倍[52][54]。- \2 v% p0 k M6 K8 m$ |/ E0 i
能效:
" n9 O2 d1 m z: {' L; ]& c4 o S% [8 ?# Z
TPU v5e vs H100: C3 \1 F, g( o% K4 x1 k
同级推理场景下,8×TPU v5e ≈ 2,175 tokens/s(Llama2‑70B,INT8)[67],H100 需更高功耗才能匹配。) z* d7 ~5 M% G/ w. {4 \
测试表明 v5e 功耗约为 H100 的 1/5 左右[67][52]。, z& n) e$ ?9 r7 B! R
新一代 Trillium/TPU v7:3 ?+ A# I8 |- y6 \- N4 ~1 r4 |
能效比 TPU v5p 提升 ~67%,对 H200 或 B200 整体上能实现 2–3×性能/W 优势[52][65]。 H6 r P: ^0 Z4 O" e# A% f$ m, d
Google 方案的特点:; R- D' Q, i" @# W1 u
4 G& _3 m% P6 T
自用闭环——Google Cloud + TPU + Gemini,利润来自整体云栈,而非单个芯片;$ g1 |) ^% a0 T9 A9 p9 S, l7 Y
对外公布的 API 价格较为激进,TPU 方案在 tokens/W 与 tokens/$ 上具有显著优势,尤其在内部工作负载。: L3 Q) ?1 F# M9 F+ w( i/ u4 H: Y6 R
5.3 华为昇腾 910B / 910C 方案% a; g7 o f, k* n6 t
CAPEX:
4 p& Y3 a! Z3 @; m5 j- B* u5 E
8 {6 B. z K v" u, {! {单 910B 芯片成本约 50,000 元人民币 ≈ $7k[60];910C 约 110,000 元[60]。 J' [- J( h( z0 l
与 A100 对比:
" a2 t. F: G% w) CFP16 算力 320–376 TFLOPS,功耗 310W,性能接近甚至略高于 A100(400W)[80][81][82]。
- d0 ? R7 k5 q) h3 K; @市场报道中,NVIDIA H20 在中国售价约 10 万元/片,而 910B 更便宜 30–40%[61][72]。1 X* {4 [$ c$ Z6 {& X8 V4 E- s' \
使用昇腾构建类似 400MW 级别集群,总 GPU CAPEX 相较 NVIDIA 可节省 30–60%,视集群规模与供货条件而定。
/ {, w A6 D# X1 VOPEX & 能效:
9 _: X, X- O6 P5 @! U' D3 G I- e; i# ^) Q! N
910B 功耗 310W,FP16 320–376 TFLOPS → 性能/W 与 A100/H20 接近或更优[80][81][82]。# O- t3 S5 l# `1 ~
部分推理 benchmark 显示,长上下文(>4k token)推理时,910B 在 tokens-per-watt 上可超过 H200[71]。
( s, d5 V4 w9 ~' Q在中国电价(0.3–0.4 元/kWh)环境下,昇腾方案在 TCO/tokens 维度有明显优势,但生态与软件栈仍在追赶 CUDA。* y0 P+ x" W) D, d3 R+ E( X
5.4 平头哥真武 810E(PPU)方案
; B4 Z$ y! C. kCAPEX:
[2 s$ u% |0 i) L# F3 ?( e" G$ c1 k" |! n6 \& t
技术参数:1 B) z4 r( L0 z* A, s
96GB HBM2e,片间互联带宽 700GB/s,自研 ICN 互联,PCIe 5.0 ×16,400W 功耗级别[59][102][111]。! N1 k: d) L. `- y' X" G2 t. G
性能:官方宣称整体性能超过 A800 与主流国产 GPU,与 NVIDIA H20 大致相当,升级代际可逼近/超过 A100[59][110]。/ b* Z; S$ T3 Z( ?; e! A
价格:
]' V, A- y& C3 z+ K未公开详细单价;多个媒体报道指出“单位算力成本可下降 ~40%”,与英伟达 H20 有 3–4 成价差[74][112]。
- ^) Q+ A3 V4 M" g& n/ t结合国内报道:
. c6 y$ u; I4 |; \5 K& u2025 年出货量数十万片,已在阿里云实现多个万卡集群部署,服务 400+ 客户[59][111]。
1 _5 T- D6 b+ o4 c5 I; q& i数量规模与生态成熟度迅速提升,使得 真武+昇腾 成为中国公有云/算力租赁的主力基础。; ^5 C( H4 V( Q( _
OPEX & 能效:
8 @3 |" h- L( J
9 E) o4 w: ]9 A: t! |400W TDP、96GB HBM2e,使其在 高上下文、RAG、大模型训练+推理一体化场景 中具有良好性能/能效平衡;
, \7 i! H% n; y* i' D J在中国低电价 + 低人工成本环境下,真武方案可将 AI 推理服务的综合 token 成本进一步压缩 —— 对标 NVIDIA H20,本地算力提供商可在保持 ~8–9 成性能的前提下降价 30–40% 仍保持毛利[74][112]。) l% Z2 k. e, H5 V) s8 w( ]# \
六、综合比较与策略建议# S7 E7 g; T" ]$ t! Q- Y( r
6.1 区域维度:在哪里建 AI 数据中心?
$ X- `; E8 C1 q$ T; X( z% \: h纯经济性(TCO/tokens)排序(假设无政策/合规约束):- T% `! M! ?" l
: E9 e0 I8 B2 F* Y1 ^8 P; o中国西部/北部(电价低、人力低、建设成本低)
o' n6 L9 d& m2 ^, t. d中东(UAE/沙特)(电价中等偏低、土地与电力可得性好、政策支持)
+ \! }0 Z; R* t: _美国电价低但人工高;东海岸/加州电价上涨压力大8 z& i+ Y0 G% t- y) q/ h
欧洲电价高、审批严格,但接近高价值企业客户和数据主权要求) Q6 o/ h- y1 F6 _5 K
若以“美国 $0.30/kWh vs 中国 0.3 元/kWh”极端场景比较:
. `9 e0 c8 V6 B6 |' t1 M
" Y6 F. s" {" z7 U) i纯电费/百万 token 差异:约 $0.083 vs $0.012 → 差别 ~$0.07/M tokens;
2 r! ]0 i4 o9 P7 Q对比 API 价格:差异对整体利润率的影响远小于是否使用 NVIDIA vs 国产芯片、自建 vs 云租的差异;
w* y% f' n3 X7 q6 S但在极高利用率的 自建超级集群 场景,电价仍然能在 5 年 TCO 上带来 10–20% 的边际优化,是选址决策的重要考虑。
7 l4 u- V" K8 A3 q+ B6.2 技术栈维度:选哪家芯片/云栈?6 j5 C& Q3 k0 _2 ^& e
若目标是全球最优 tokens/$ 且不受出口管制:) D3 m& \6 W x2 j R( R
% a- n& `) ~3 o& R) r" k
Google TPU v7/Trillium + 自建 on-prem:性能/能效与成本的综合最优,但前提是可以直接获得 TPU 硬件与软件栈授权(现实中仅限 Google 内部和极少数大客户)。, Y' J, w; X# i8 [; W7 E
若在美国/欧洲,能自由采购 NVIDIA:
4 s+ x- T& k$ M" d4 Q( c2 }/ U) a A: y$ B* T/ T/ A+ R; o
短中期内,NVIDIA B200/GB200 NVL72 仍是最佳实践:- |' p# v% [& F8 K/ K
成熟的软件栈与生态,极高的 tokens/s/GPU;4 O1 b: N# j0 a r& {, W2 q7 `
在云厂商/超大规模自建模式下,配合液冷与 PUE~1.1,可取得较低的 token 成本;! s9 W0 `# x) o, Z1 S( ]0 x# Q0 S
但要谨慎评估 GPU CAPEX≈总投资 40% 的集中风险。
1 n. b# n" D4 u& [若在中国或存在出口管制约束:
- \: ]' u# p/ f& @9 P* g: Z1 b1 ]1 L! _
昇腾 910B/910C + 平头哥真武 810E 是现实可行的主力组合:
* C5 H d3 i% H z性能上已能覆盖大部分 GPT‑4 类推理需求;
/ }+ u d& }9 Q/ L, D: k0 P单片成本显著低于 H20/H100,集群 CAPEX 明显更友好;
9 H) f, i( X& q9 u, `( E( L软硬件全栈国产(CANN + MindSpore + 通义/Qwen 等),可避免制裁风险;
+ y. j( ?$ z; o p# P1 D建议配合:
0 r8 K. X/ @1 H, C高效液冷(PUE~1.1)、2 w( f. I. x0 F* H+ ~0 F
大 batch、路由(浅层任务走小模型/低成本芯片)、6 x/ F! [5 s: g! t2 v5 @1 ^
强量化(FP8/INT4)与分层缓存策略,进一步摊薄 token 成本。
1 v; H, o7 g& t0 A7 d$ K' C长远看,“tokens-per-watt / PCE” 取代单纯 PUE/FLOPS 成为核心 KPI:% |$ `6 V& P; M* z' V6 T1 A
) o9 @6 z- y0 e' A8 p/ [数据中心运营者应从“PUE 1.5→1.1”的设施思维,转向“每瓦输出多少有价值 token”的AI 工厂思维[29][118];( j- Y- s; Q4 K
这意味着:
& n2 g c3 E: z, W" b$ I优先选择 更高 tokens/J 的芯片架构(例如 TPU v7、B200、后续国产芯片);
6 @1 Q6 P# `* R- E* \; O精细化调优 batch size、路由策略、CoT 深度,将“energy-per-token”作为最优先指标来优化[17][26]。5 k6 o/ C8 k& j E
6.3 针对你关心的具体问题的简要回答, t3 T2 |: D# u/ m
AI 数据中心建设 vs 运营成本的大体比例?% J6 D) b z- h. L. O
, _: A4 B* L0 J; B0 ^/ @
在 5 年期 TCO 视角下,CAPEX(尤其 GPU)约占总成本 50–70%,运营成本(电力+冷却+人工+维护)约 30–50%。
& s! q8 s- h- k( W! W& e; b9 G其中 GPU 自身 CAPEX 占到总 CAPEX 的 30–40%[36]。
8 b& ^7 I* @3 G, r! H中国、美国、欧洲、中东的成本结构区别?
2 `/ k7 T# b- | m1 C3 t% f4 g$ x- j: B
建设期:0 g3 D8 s* q, V) X0 D: Y
中国/中东的壳体+机电成本明显低于美欧(约 5–7 vs 8–12 vs 10–11M $/MW)[1][2][20]。8 b. d) x7 i9 }& t: K
运营期:
$ u' r: a' @$ I8 ?! l B1 D* d电价:中东 ≈ 中国西部 < 美国平均 < 欧洲
1 X' X8 B9 S, l/ s$ e* K人工:中 国 ≪ 美 欧,中东居中。
$ A& t2 @: w9 t2 a! N在美国 $0.3/kWh 与中国 0.3 元/kWh 下 token 成本与利润率?* j3 v Y) G4 ~( O+ {2 t: N1 d
6 G; J3 e, ?) C对于典型 1 J/token 推理负载:
: q9 g. J- K# b* I$ E, q! T f美国 $0.30/kWh:电费约 $0.083/M token- Q! w% k0 S" u4 [4 B
中国 0.3 元/kWh:电费约 $0.012/M token7 S; U/ L+ t: ^! l+ v( O- u1 Q( x
对比 OpenAI 等对外价格($0.6–168/M token),电费无论在中国还是美国都只是利润表里的“小头”,主导因素是 GPU TCO 和平台溢价。
. c# P0 q. M H7 v3 |' C不同技术方案(NVIDIA / Google / 昇腾 / 平头哥)的建设与运营成本谁更有利?$ o$ U4 ~$ B/ c$ G( S% j
u8 Z' O. N. H# M4 O/ n在可获得 TPU 的前提下:Google TPU v7 在 tokens/W 和 tokens/$ 上最优;& J2 m, U7 ^& O; {7 u( a
全球通用方案:NVIDIA Blackwell 全家桶(B200/GB200)+ 液冷,但 CAPEX 巨大;6 o/ J* }/ ^6 s/ E0 \' P# e9 W1 y
中国/被管制市场:昇腾 + 真武 是当前最有经济性与可持续性的路线,综合来看能把 token 成本压到 NVIDIA 方案的 40–70%。 |
评分
-
查看全部评分
|