特斯拉AI前成员卡帕西给Agent泼冷水：真正成熟还需十年

20

2025-10

-20

【导语】2025年虽被视为智能体Agent爆发之年，但OpenAI创始成员安德烈·卡帕西却泼下冷水：当前AI Agent存在无法持续学习、非真正多模态、操作电脑不可靠等核心缺陷，实现实(shí)用(yòng)化(huà)仍(réng)需(xū)十(shí)年(nián)。他(tā)直(zhí)言(yán)强(qiáng)化(huà)学(xué)习(xí)效(xiào)率(lǜ)低(dī)下(xià)、模(mó)型(xíng)坍(tān)塌(tā)阻(zǔ)碍(ài)进(jìn)步(bù)，AGI更(gèng)不(bù)会(huì)突(tū)然(rán)降(jiàng)临(lín)，而(ér)是(shì)如(rú)蒸(zhēng)汽(qì)机(jī)般(bān)渐(jiàn)进(jìn)融(róng)入(rù)社(shè)会(huì)，人(rén)类(lèi)需(xū)抓(zhuā)住(zhù)窗(chuāng)口期为协同演进做好准(zhǔn)备(bèi)。

2025年(nián)被(bèi)称(chēng)为(wèi)智(zhì)能(néng)体(tǐ)Agent之(zhī)年(nián)，当(dāng)行(xíng)业(yè)的(de)热(rè)潮(cháo)席(xí)卷(juǎn)全球(qiú)之(zhī)际(jì)，OpenAI创(chuàng)始(shǐ)成(chéng)员(yuán)、特(tè)斯(sī)拉(lā)前(qián)AI总(zǒng)监(jiān)安(ān)德(dé)烈(liè)·卡(kǎ)帕(pà)西(xi)（Andrej Karpathy）近(jìn)日(rì)在(zài)接(jiē)受(shòu)播(bō)客(kè)节(jié)目(mù)“Dwarkesh Patel Show”采访(fǎng)时(shí)给(gěi)这(zhè)股(gǔ)热(rè)潮泼下一盆冷水，他直言，当前AI Agent技术尚处早期，还存在“无法持续学习、非真正的多模态、不能自如操作电脑”等核心缺陷，要实现真正的实用化还需要十年左右。

OpenAI创始成员、特斯拉前AI总监安德烈·卡帕西（Andrej Karpathy）近日在接受播客节目采访。

AGI为何还需要十年

卡帕西认为，尽管当前大语言模型展现出令人(rén)惊(jīng)叹(tàn)的(de)能(néng)力(lì)，但Agent真正能够使用的标志是它成为一个员工或实习生，人类愿意雇佣它和自己一起干活、工作。显然，Agent当前还做不到这一步。

原因在于Agent还存在三大核心缺陷：无法持续学习、非真正的多模态、不能自如操作电脑。现在的AI无法记住和用户的每一次互动，当关掉对话窗口后，它就会忘掉。它无法像人类一样，通过日常经历持续学习巩固。

AI虽然能看图写字，但无法真正理解并完成复杂任务。卡帕西举例，AI能写代码，但无法制作一张精美的PPT，因为超出了本质是文本处理器的能力范围。同时，AI操作电脑、点击软件的能力还非常初级和不可靠。

卡帕西借用其在特斯拉开发自动驾驶的经验提出，从“演示”到“产品”有着巨大的鸿沟，“这是一场向数字‘9’的进军，一个在90%的情况下能工作的演示达成(chéng)了(le)第(dì)一(yī)个(gè)9，但(dàn)要(yào)达(dá)到(dào)99.99999%的(de)可(kě)靠(kào)性(xìng)，还有更多的‘9’需要走。这就是为什么这些事情要花这么长时间。”

强化学习很糟糕

谈及强化学习（Reinforcement Learning），卡帕西直言，“强化学习很糟糕，只是碰巧之前的其他方法更糟糕。”

在强化学习中，试图找到一个问题的解决方案，AI可能会进行数百种不同的尝试。“就像做选择题，它蒙了100次，只有最后1次对了，但它会把整个蒙题过程都当成‘正确经验’，这种学习方式存在严重的效率问题。而⼈类永远不会这样做。”其中的原因是第一，现实世界⼈类不会进行数百次试运行；第二，当人类找到解决⽅案时，会有⼀个相当复杂的反思复盘过程。

另一个深层问题是模型坍塌（model collapse）。模型生成的内容多样性会悄然减少，分布范围变窄，即使单个输出看起来仍然合理。卡帕西举例，你可以让 ChatGPT讲个笑话，但它反复输出的可能只是少数几个模式化的笑话。这一特性阻碍了AI实现持续学习，而如果让AI使用自己产出的数据，就会导致模型在自有数据上产生更加同质化的内容，陷入恶性循坏。

虽然人类也会存在类似的思维定式，但可以通过交流、阅读等方式来对抗这一趋势。儿童之所以是高效的学习者，正因为他们不擅长记忆，反而被迫去发现通用模式。当前AI缺乏这种主动寻求并整合多样性的内在机制，必须依赖人类产生的真实数据，这是个很大的瓶颈。

但卡帕西同时也深刻认识到，强化学习仍是当前AI发展道路上不可或缺的一环。原因在于，传统的监督学习（Supervised Learning）存在明显的天花板。监(jiān)督(dū)学(xué)习(xí)严(yán)重(zhòng)依(yī)赖(lài)大(dà)量(liàng)、高(gāo)质(zhì)量(liàng)的(de)标(biāo)注(zhù)数(shù)据(jù)。但(dàn)对(duì)于(yú)“好(hǎo)代(dài)码(mǎ)”、“好决策”这类无法明确定义、无法通过标注数据学习的概念，只能通过设计一个奖励函数来让模型自己摸索什么是“好”。这正是强化学习的应用场景。

AGI的渐(jiàn)进(jìn)式(shì)路径

卡帕西坚持AGI的早期定义——能执行任何具有经济价值任务的人类水平系统。但目前AI的实际影响仍有限，其应用高度集中在编码等高度结构化、文本驱动的领域。“人们把物理的东西都拿走了，只是在讨论数字知识工作，这是一个相当重大的让步。原始定义是人类可以做的任何任务，包括举起一件东西。”

与很多人对AGI“奇(qí)点(diǎn)”时(shí)刻(kè)的(de)想(xiǎng)象(xiàng)不(bù)同(tóng)，卡(kǎ)帕(pà)西(xi)认(rèn)为(wèi)，AGI不(bù)会(huì)在(zài)某(mǒu)一(yī)天(tiān)突(tū)然(rán)降(jiàng)临(lín)并(bìng)引(yǐn)爆(bào)智(zhì)能(néng)爆(bào)炸(zhà)，而(ér)是(shì)会(huì)像(xiàng)蒸(zhēng)汽(qì)机(jī)、电(diàn)力(lì)和(hé)互(hù)联(lián)网(wǎng)等(děng)历(lì)史(shǐ)上(shàng)的(de)通(tōng)用(yòng)技(jì)术(shù)一(yī)样(yàng)，缓(huǎn)慢(màn)地(de)融(róng)入(rù)并(bìng)延(yán)续(xù)过(guò)去(qù)2.5个世纪来约2%的年度GDP增长趋势。

卡帕西一直试图在GDP（Gross Domestic Product，国内生产总值）的增长趋势中找到AI对其产生的明显影响，理论上GDP应该显著上升。“但后来我看了⼀些我认为⾮常具有变⾰性的其他技术，⽐如计算机或移动电话等。你在GDP中找不到它们，GDP是同样的指数。” 他进一步举例，即使人们认为2008年iPhone 推出是个重⼤的地震式变化，而实际上不是，一切都如此分散、如此缓慢地扩散，以⾄于⼀切最终都被平均到同样的指数中。

这种渐进性源于技术革命的本质：新技术从(cóng)演(yǎn)示(shì)到(dào)成(chéng)熟(shú)产(chǎn)品(pǐn)的(de)扩(kuò)散(sàn)需(xū)要(yào)时(shí)间(jiān)。就(jiù)像(xiàng)自(zì)动(dòng)驾(jià)驶(shǐ)关于(yú)一(yī)场(chǎng)向(xiàng)数(shù)字(zì)“‘9’的(de)进(jìn)军(jūn)”，每(měi)一(yī)个(gè)“9”的(de)可(kě)靠(kào)性(xìng)提(tí)升(shēng)都(dōu)需(xū)要(yào)付(fù)出(chū)巨(jù)大(dà)努(nǔ)力(lì)。AGI的(de)发(fā)展同样会遵循这条路径，先自动化一些封闭、结构化的任务，再逐步攻克更复杂的工作，其间社会需要时间来调整基础设施、法律和技能体系。

卡帕西相信未来将会是多个AI实体逐渐增强自主性，与人类社会协同演进。因此人们拥有宝贵的窗口期进行准备，可以系统地调整教育、社会保障和法律法规，以确保人类在AGI时代能够持续繁荣。



官方网站-首页

企业动态

特斯拉AI前成员卡帕西给Agent泼冷水：真正成熟还需十年

20

2025-10

-20

返回列表

分享新闻

上一页

施郁忆杨振宁：他是一名“保守的革命者”，负责任地推动进步

下一页

BDA数据分析师成长之路