AI需求激增导致算力紧张!谷歌限制了Meta对Gemini模型的使用

  这一举措背后,是2025年3月至8月期间Gemini API请求量翻倍,这一点迫使谷歌重新思考应该如何分配科技领域最抢手的资源之一——原始

  据知情人士透露,谷歌在今年3月前后告诉Meta,无法足额供应其所需的Gemini模型算力额度。由于Meta对谷歌模型的需求远高于其他客户,因此受到的影响也最为明显。

  此举打乱并推迟了Meta多项内部项目的推进节奏。受该算力限制,叠加公司整体压缩人工智能成本的战略,Meta已要求员工节约调用AI令牌,提升使用效率。

  自2026年5月17日起,谷歌对Gemini应用实施了基于算力额度的使用限制。这类似于手机流量套餐:用户不再拥有无限请求,而是需在每周滚动更新的5小时刷新窗口内使用,并且每周有使用上限。

  这些限制适用于广泛范围,而不仅限于一家公司。谷歌已记录了速率限制和支出层级,旨在确保在该公司所称的快速增长阶段,所有客户都能公平使用API。

  谷歌选择实施使用量限制而非单纯扩大基础设施,这正说明了其经济考量。即使对于拥有谷歌资源的公司而言,要满足不受约束的人工智能需求所需的资本支出也令人望而生畏,因此有必要在短期内采取需求管理措施。

  这起事件再次凸显,即使全球科技巨头持续投入数千亿美元兴建数据中心并采购人工智能芯片,整体基础设施仍难以追上生成式人工智能快速扩张所带来的需求,算力供给仍是目前产业发展的重要瓶颈。

  谷歌云端事业最新财报也反映相同问题。 在截至2026年3月底的2026财年第一季,谷歌云营收达200亿美元,但Alphabet CEO皮查伊当时表示,算力限制使谷歌云无法承接更多客户需求,也让该部门积压订单较前一季接近倍增。AI需求激增导致算力紧张!谷歌限制了Meta对Gemini模型的使用

评论

发表回复