官方网站-首页官方网站-首页

“大力出奇迹”,20万卡练出马斯克口中“最聪明的AI”

18

2025-02

-18

Grok 3,马斯克口中“最聪明的AI”来了! 2月18日中午12时许,马斯克(Elon Musk)的AI公司xAI研发的新一代AI基座大模型Grok 3正式发布。耗费了20万张GPU的Grok 3显示,“卷算力”目前仍是核心。

Grok 3的三个亮点

据马斯克团队介绍,Grok 3模型和Grok 3 mini(Reasoning,精简版)在数学推理、科学逻辑推理和代码写作等能力表现方面超越了所有主流模型,包括GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3和Gemini-2 Pro等。

同时,具备推理能力的Grok-3 Reasoning Beta和Grok-3 mini Reasoning则是超越了类似的推理模型,包括DeepSeek-R1和OpenAI的o3 mini等。

模型推理能力

发布会上,马斯克提及,Grok 3的推理模型还支(zhī)持(chí)一(yī)项(xiàng)名为DeepSearch搜索引擎(qíng)新(xīn)功(gōng)能(néng)的(de)应(yīng)用(yòng)。Deep Search通(tōng)过(guò)扫(sǎo)描(miáo)互(hù)联(lián)网(wǎng)和(hé)X平(píng)台(tái)上(shàng)的(de)信(xìn)息(xi)进(jìn)行(xíng)分(fēn)析(xī),并(bìng)生(shēng)成(chéng)摘(zhāi)要(yào)以(yǐ)回(huí)答(dá)用(yòng)户(hù)提(tí)出(chū)的(de)问(wèn)题(tí),在(zài)这(zhè)一(yī)过(guò)程(chéng)中(zhōng)还(hái)可(kě)以(yǐ)“推(tuī)测用户的真正意图”,在经过交叉比对不同信息来源后,确保能向用户返回正确的信息。

融入智能体功能

快思慢想研究院院长、原商汤智能产业研究院创始院长田丰在接受澎湃科技采访时表示,从发布会上的内容看,Grok3有三个亮点:一是通过缩放定律Scaling Law显著提升模型性能,二是数学与编程等逻辑推理能力大幅增强,三是融入智能体产品化设计。

澎湃科技注意到,曾担任OpenAI创始团队、斯坦福博士,训练大型深度神经网络的工程师Andrej Karpathy,分享了其用户体验。

Andrej 称,在今天早上大约使用了两个小时的过程中,他感受到,Grok3加上深度思考(Thinking)模式的能力略好于DeepSeek-R1和Gemini2.0 Flash Thinking。这是相当令人难以相信的,不过,现在模型给出的答案是随机的,每次可能会给出略有不同的答案,现在还处于早期阶段,在接下来的时间,还需要更多的评估。

模(mó)型(xíng)将(jiāng)进(jìn)入(rù)“神(shén)仙(xian)打(dǎ)架(jià)”

“不(bù)过这(zhè)场(chǎng)大(dà)语(yǔ)言(yán)模(mó)型(xíng)(LLM)模(mó)型(xíng)领(lǐng)域的(de)竞(jìng)赛(sài)令(lìng)人(rén)非(fēi)常(cháng)兴(xìng)奋(fèn)!”Andrej 说(shuō)。

伴(bàn)随(suí)人(rén)工(gōng)智(zhì)能(néng)快(kuài)速(sù)迭(dié)代(dài),模(mó)型(xíng)的(de)领(lǐng)先(xiān)优(yōu)势(shì)的(de)“保(bǎo)质(zhì)期(qī)”越(yuè)来(lái)越(yuè)短(duǎn),此(cǐ)前(qián)有(yǒu)业(yè)内(nèi)人(rén)士(shì)向(xiàng)澎(pēng)湃(pài)科(kē)技(jì)表(biǎo)示,“不超过100天,就会有新的模型出现,并超越。”

田丰也表示,接下来将进入神仙打架阶段,“Grok3‘PK’DeepSeek V3,马上(shàng)就(jiù)会(huì)有(yǒu)人(rén)来(lái)‘PK’Grok 3,也(yě)许(xǔ)是(shì)GPT4.5”。根(gēn)据(jù)此(cǐ)前(qián)OpenAI对(duì)外(wài)公(gōng)布(bù)的(de)信(xìn)息(xi),GPT4.5的(de)发(fā)布(bù)日(rì)期(qī)已(yǐ)经列入日程。

另有观点认为,目前的大模型行业,训练还未卷完,范式已经统一。

目前Grok3并未开放给普通用户使用,实际推理效果还要使用产品后看,目前看起来基准测试是达到GPT-o1水平的模型,但还不确定实际效果,推理能力的最佳呈现是数学和代码。马斯克在这次直播中主要展现了Grok3的数学计算和代码的能力。

卷算力目前是核心

值得一提的是,在DeepSeek开启了低成本训练模型的风潮后,Grok 3却是花了重金。Groks 3短时间内反超之前的SOTA模型(state-of-the-art model指在该项研究任务中(zhōng),目(mù)前(qián)最(zuì)好/最先进的模型),说明“卷算力”目前仍是核心。

在此次发布会上,马斯克透露,Grok 3的计算能力是Grok 2的10倍以上,Grok 3训练过程累计消耗20万张英伟达GPU,计算资源的显著提升帮助Grok 3能更高效地处理大型数据集,缩短了模型训练时间也提高了准确性。有分析称,Grok 3算力消耗是Deepseek V3的263倍。

据xAI团队透露,Grok 2模型使用了2400亿参数规模,性能媲美GPT-4,为了训练Grok 3,xAI团队也将数据中心容量翻倍。

马斯克团队在发布会上表示,“早在去年4月,马斯克就决定创建我们自己的数据中心。我们大约在四个月内建立了数据中心,并花了122天时间,让10万个GPU启动并运行,这是一项艰巨的工作。我们相信这是同类中最大的全连接的H100集群。但我们并没有止步于此。”

“我们每天都在不断改进模型。”马斯克称,目前,Grok 3测试版现已面向马斯克的社交媒体平台X Premium用户推出。

田丰认为,Grok 3采用的还是“大力出奇迹”的模式,因其使用了20万块英伟达GPU卡训练而成,是典型的“又好又贵”。从数据来看,Grok 3的推理能力远远超过前一代的Grok 2模型。“xAI基础设施的建设能力全球领先,相比于10万块卡用了120多天,最新拓展至20万块GPU集群只用了92天完成施工搭建,且利用率应该很高,值得中国算力供应链借(jiè)鉴(jiàn)。”田(tián)丰(fēng)补(bǔ)充(chōng)说(shuō)。

商(shāng)业(yè)化(huà)布(bù)局(jú)更(gèng)进(jìn)一(yī)步(bù)

与(yǔ)DeepSeek相(xiāng)比(bǐ),Grok 3最(zuì)大(dà)的(de)短(duǎn)板(bǎn)在(zài)于(yú)它(tā)并(bìng)非(fēi)开(kāi)源(yuán)模(mó)型(xíng),且(qiě)需(xū)要(yào)付(fù)费(fèi)。针(zhēn)对(duì)是(shì)否(fǒu)开(kāi)源(yuán)的(de)问(wèn)题(tí),马(mǎ)斯(sī)克(kè)也(yě)在(zài)直(zhí)播(bō)中(zhōng)回(huí)应(yīng),Grok 3并(bìng)未(wèi)开(kāi)源(yuán),但(dàn)“按(àn)照(zhào)惯(guàn)例(lì),我(wǒ)们(men)会(huì)在(zài)新(xīn)模(mó)型(xíng)发(fā)布(bù)时(shí),将(jiāng)上(shàng)一(yī)代(dài)模(mó)型(xíng)进(jìn)行(xíng)开(kāi)源(yuán)。因(yīn)此(cǐ),可(kě)以(yǐ)预(yù)见(jiàn)的(de)是(shì),在(zài)几(jǐ)个(gè)月(yuè)后(hòu),Grok-3也(yě)将(jiāng)迎(yíng)来(lái)其(qí)开(kāi)源(yuán)时(shí)刻(kè)。”

此(cǐ)次(cì)推(tuī)出(chū)的(de)Grok 3测(cè)试(shì)版(bǎn)本(běn)已(yǐ)面(miàn)向(xiàng)社(shè)交(jiāo)平(píng)台(tái)X上(shàng)的(de)付(fù)费(fèi)用(yòng)户(hù)开(kāi)放(fàng),此(cǐ)外(wài),xAI还(hái)推(tuī)出(chū)了(le)更(gèng)高(gāo)阶(jiē)的(de)Super Grok订(dìng)阅(yuè)服(fú)务(wu)。

“发(fā)布(bù)会(huì)只(zhǐ)提(tí)到(dào)X用(yòng)户(hù)能(néng)选(xuǎn)择(zé)付(fù)费(fèi)版(bǎn)的(de)Grok 3与(yǔ)Super Grok服(fú)务(wu),但(dàn)没(méi)有(yǒu)提(tí)toB企(qǐ)业(yè)客(kè)户(hù)如(rú)何(hé)使(shǐ)用目前闭源的Grok 3大模型,相信今年马斯克会发布美国政企客户使用Grok的价格,因为发布会展示了游戏创意、航天科研等产业场景。”田丰预测。

单从xAI的资本投入角度,也确实存在进一步扩大商业化的需求。成立于2023年的xAI,日前正加速其资本布局,在2024年的11月,xAI告知投资者,该公司在最新一轮融资中筹集了50亿美元,估值达到500亿美元。2024年12月24日,xAI在其官网宣布已完成60亿美元(约合人民币438亿元)C轮融资,目前xAI公司的市值已超过400亿美元。据美国媒体报道,xAI正寻求新一轮约100亿美元的融资,此轮融资将使公司估值达到约750亿美元。

分享新闻