马斯克雪耻!“地表最强AI模型”Grok 3 发布,20万卡训练,多项表现超DS和OpenAI

Connor bitop交易所 2025-02-18 4 0

马斯克雪耻!“地表最强AI模型”Grok 3 发布,20万卡训练,多项表现超DS和OpenAI

出品|搜狐科技

作者|郑松毅

2月18日,马斯克旗下人工智能公司xAI正式发布最新模型Grok 3,并称其为“地球上最聪明的人工智能”。

根据xAI公布的官方测试结果,Grok 3在数学、科学、编程方面的表现均优于谷歌Gemini-2 Pro、GPT-4o、DeepSeek-V3、Claude 3.5 Sonnet模型。

马斯克雪耻!“地表最强AI模型”Grok 3 发布,20万卡训练,多项表现超DS和OpenAI

且在全球知名AI大模型排行榜Chatbot Arena中,Grok 3综合表现得分超1400,力压DeepSeek-R1、Gemini-2.0-pro等竞争对手,登顶榜首。

马斯克雪耻!“地表最强AI模型”Grok 3 发布,20万卡训练,多项表现超DS和OpenAI

展开全文

“20万卡训练,前所未有的规模”

马斯克对Grok 3寄予的厚望,来自于前所未有的训练投入。

模型发布直播中介绍,“Grok 3在第一阶段的122天训练过程中,调用了10万张英伟达H100芯片,较前代产品Grok 2使用的1万5千张实现了数倍的跨越式提升。后来扩展到20万块GPU(含新增的5万块H100与5万块H200),又训练了92天。这个训练规模是前所未有的。”

反观对手OpenAI,虽然官方未公布训练GPT-5用了多少张H100芯片,但马斯克预测的数值是3万到5万张。

xAI表示,“强大的基础设施支撑了Grok 3在推理、编程、及文本和图像分析等多模态功能方面的改进。帮助Grok 3更高效地处理大型数据集,缩短训练时间并提高了准确性。”

除了提高计算能力,xAI在训练Grok 3时调整了方法,结合合成数据集、自我校正机制和强化学习来增强其性能。

“Grok 3的训练使用了大量合成数据,并且会在数据之间来回比对,追求逻辑一致性。如果它发现某些数据是不符合事实的,会主动剔除或纠正。这让它的推理能力非常扎实,同时减轻模型‘幻觉’问题。”马斯克说。

此外,Grok 3引入了“思维链”推理能力,使其能像人类一样逐步思考和处理复杂任务。

“从早期测试来看,Grok 3在复杂推理任务中的表现优于其他竞争对手,包括OpenAI和谷歌。”xAI称。

当然,关于Grok 3到底是不是“地球最强AI”,仍存质疑。

至少从xAI自家员工De Kraker的分享来看,Grok 3的编程能力优于DeepSeek R1,但不及OpenAI。

拟融资100亿美元,“烧钱模式”仍在上演

作为2024年在全球AI领域拿钱最多的公司(120亿美元),xAI在新年伊始又开始了新一轮的融资大计。

这轮目标直接叫价100亿美元,将使xAI的估值升至750亿美元。

据报道,xAI正在为本轮融资招募投资者,包括红杉资本、Valor Equity Partners等,谈判仍在进行中。

知情人士称,xAI考虑从戴尔购买价值超过50亿美元的服务器,以支持其人工智能技术(包括Grok系列模型)的研发。相关谈判已处于后期阶段。

随着AI竞争加剧,现阶段的局势更像是一场“军备赛”。无论是大模型训练,还是AI基础设施搭建,硅谷推崇的“烧钱模式”,仍在继续。

成立于2023年7月的xAI,是OpenAI的主要竞争者之一。近两年,xAI凭借Grok系列模型的出色表现,及马斯克的个人魅力,引来市场关注,一直以惊人的速度筹集资金。

去年12月,xAI宣布完成60亿美元的C轮融资,公司市值超过400亿美元。同年5月,xAI完成60亿美元的B轮融资。据悉,有投资者还有强烈意愿希望增加投资。

融资后,马斯克立刻把钱用在了“刀刃”上,从英伟达购进多达10万颗先进GPU,搭建“Colossus”超级人工智能训练集群,以建起决定性的硬件优势。

反观对手,OpenAI也有新动作,正进行高达400亿美元的融资,将使其估值超过3000亿美元。即便在该融资完成前,OpenAI现阶段估值也达到1500亿美元,远高于xAI。

前不久,马斯克公开表示,“当初投5000万美元给OpenAI做非营利性研究,结果很失望,现在要花970亿美元收回来。”

但从OpenAI当前市值来看,老马的报价还是缺了点儿诚意。

评论