当前位置: 当前位置:首页 > 知识 > 谷歌挑战英伟达:TPU的崛起之路正文

谷歌挑战英伟达:TPU的崛起之路

作者:闲趣 来源:聚焦 浏览: 【 】 发布时间:2026-06-17 20:16:49 评论数:

2025年7月26日,谷歌上海,挑战谷歌参展WAIC世界人工智能大会。英伟<strong></strong>视觉中国/图

2025年7月26日,达T的崛上海,谷歌谷歌参展WAIC世界人工智能大会。挑战视觉中国/图

2026年1月初,英伟美国知名半导体与AI研究机构SemiAnalysis披露,达T的崛人工智能公司Anthropic计划直接采购近一百万颗谷歌最新一代TPU v7系列芯片。谷歌相关交易尚未获得谷歌确认,挑战但已引发广泛关注。英伟

长期以来,达T的崛在大模型训练与推理的谷歌核心算力市场,英伟达的挑战GPU(图形处理器)几乎是最优选择。凭借其强大的英伟CUDA软件生态和通用计算能力,英伟达得以制霸行业基础设施。

相比之下,谷歌自研的TPU(张量处理器)虽存在多年,却鲜少进入公众视野。

变化发生在过去一年。全球两款顶尖大模型——谷歌的Gemini 3和Anthropic的Claude 4.5 Opus,被爆出大部分训练和推理都依赖于TPU。苹果、Meta、Midjourney甚至OpenAI,也都传出在不同场景下已使用或计划使用TPU的消息。

与此同时,谷歌对TPU的供给方式,也从单纯依附云服务租赁,转向更为机动的商业化路径。TPU与GPU究竟有何不同?它是否正在成为AI算力竞争中的有力变量?

为谷歌而生

TPU的诞生,源于谷歌内部的一场算力危机。

早在2006年,谷歌就考虑过为人工智能构建专用芯片(ASIC)的可能性。但直到2013年,谷歌才真正意识到,未来对AI计算的需求,或将远超当时基础设施所能承载的上限。

那时,谷歌正计划在全球范围内推出语音识别功能。其首席科学家杰夫·迪恩(Jeffery Dean)曾在采访中介绍,团队做过粗略估算,如果数亿用户每天使用3分钟语音识别服务,所需算力将是谷歌全部数据中心算力的两倍。

谷歌团队评估了多种现有方案,结论是它们甚至难以满足其产品当下的基础机器学习需求,更无法拥护未来增长。于是,谷歌决定设计一种全新的芯片。

硬件工程师诺曼·乔皮(Norman Jouppi)于2013年加入谷歌,成为TPU项目的关键推动者之一。

他后来向媒体回忆,团队曾考虑像微软一样,采用FPGA(可编程芯片)路线。这类芯片可以按需编程以适配不同任务。但在实际测试中,它在AI计算上的性能表现并不优于GPU,成本还更高。最终,团队转向自研专用芯片TPU。

按照谷歌的划分,CPU(中央处理器)如同计算机的“通用大脑”,处理各类繁琐指令;GPU(图形处理器)配合CPU,用于图形处理、图像渲染和繁琐的数学计算。

而TPU只专注一件事,高效执行AI所需的大量矩阵运算。其核心在于一种名为“脉动阵列”的架构。

CPU和GPU的计算方式,本质上都是指令驱动型,为了通用性,数据在计算过程中往往需要被反复读取和搬运。

而在TPU里,成千上万个乘加单元被密切排列在