谷歌最强 AI 平台:第七代 TPU 架构 Superpod 曝光
科技媒体 WccfTech 昨日发布博文,报道称在 Hot Chips 2025 大会上,援引博文介绍,谷歌于今年 4 月官宣第 7 代 TPU 架构,代号为 Ironwood,号称其性能是当前最强大超级计算机的 24 倍。
本次披露主要聚焦单个 Superpod 的硬件构成与架构设计。相比 2022 年的 TPU v4和 2023 年的 TPU v5p,Ironwood 在核心规格上大幅跃升。
单个 Ironwood Superpod 集成 9216 枚芯片,每片配备 192GB、带宽 7.4TB/s 的高带宽存储,峰值算力高达 4614 TFLOPs,意味着其单芯片性能较 TPU v4 提升超过 16 倍。
每四颗芯片组成一块 PCBA 主板,16 块主板构成一个机架,共 64 芯片节点,谷歌采用 InterChip Interconnect技术,将多达 43 个 64 芯片模块互连,构建出拥有 1.8PB/s 网络带宽的集群。
在物理布局上,Ironwood 沿用过去三代的 3D Torus拓扑,每个逻辑单元为 4×4×4 节点阵列,即 64 芯片,封装于单个机架。
一个 Superpod 包含 144 个机架,还配备光学交换机机箱以实现跨模块互连,以及用于液冷的冷却分配单元机架,互连方面为提高灵活性与可扩展性,采用 PCB 走线、铜缆和光纤的混合方式。
在机架设计上,顶部设有泄漏检测盘以监控液冷系统,下方是供电模块,具备两路电源域,将 416V 交流电经整流转换为直流电。整套系统支持液冷散热,满载运行功率可超过 100kW。
简要介绍下上述专有名词:
TPU张量处理单元:谷歌专为机器学习任务设计的专用芯片,优化矩阵运算性能。Superpod,就是一组连续的 TPU,通过专用网络组合在一起。HBM高带宽存储:一种集成在芯片附近的高速显存,显著提升数据传输速率。TFLOPs万亿次浮点运算 / 秒:衡量芯片浮点运算性能的指标。
