李广密：对DeepSeek和智能下半场的几条判断

10

2025-02

-10

·DeepSeek很让人兴奋，但还不能称作范式级创新，更准确的表述是将之前OpenAI o1半遮半(bàn)掩的范式开源，将整个生态推向很高渗透率，推进整个行业进入了新范式。

DeepSeek 视觉(jué)中国资料图

从2024年第三季度开始我们就一直在讲AI的下半场，虽然OpenAI o1提出了强化学习（RL）叙事，但因为各种原因没有破圈，DeepSeek R1解了RL的谜题，推进整个行业进入了新范式，真正进入智能下半场。

市场上关于DeepSeek是什么、为什么的讨论已经很多了，接下来更有价值讨论是AI竞赛要怎么继续？把过去半个月的思考总结了一下，希望成为探索下半场的路径图，每隔一段时间来复盘。

拾象科技创始人兼CEO李广密。

Insight 01：DeepSeek 超越 OpenAI 了吗？

DeepSeek超越了Meta Llama毫无疑问(wèn)，但(dàn)相(xiāng)比(bǐ)OpenAI、Anthropic和(hé)Google这(zhè)些(xiē)第(dì)一(yī)梯(tī)队(duì)还(hái)有(yǒu)距(jù)离(lí)，比(bǐ)如(rú)Gemini 2.0 Flash成(chéng)本(běn)比(bǐ)DeepSeek更(gèng)低(dī)，能(néng)力(lì)也(yě)很(hěn)强，且全模态，外界低估了Gemini 2.0为代表的第一梯队的能力，只是没有开源而获得这么炸裂轰动性的效果。

DeepSeek很(hěn)让(ràng)人(rén)兴(xìng)奋(fèn)，但(dàn)还(hái)不(bù)能(néng)称(chēng)作(zuò)范(fàn)式(shì)级(jí)创(chuàng)新(xīn)，更(gèng)准(zhǔn)确(què)的(de)表(biǎo)述(shù)是(shì)将(jiāng)之(zhī)前(qián)OpenAI o1半(bàn)遮(zhē)半(bàn)掩(yǎn)的(de)范(fàn)式(shì)开(kāi)源(yuán)，将(jiāng)整个生态推向很高渗透率。

从第一性原理角度，在Transformer这一代架构下超越第一梯队模型厂商是有难度的，同样路径下很难实现弯道超车可能，今天更期待有人能探索出下一代的智能架构和范式。

Insight 02：DeepSeek 开启新范式了吗？

就像前面说的，严格意义上说，DeepSeek 没有发明新范式。但DeepSeek的重要意义在于帮助RL和test time compute这个新范式真正出圈。如果说OpenAI最初发布的o1是给行业出了一个谜语，DeepSeek就是第一个公开解谜的人。

DeepSeek发布R1和R1-zero之前，行业只有少部分人在实践RL和reasoning model，但DeepSeek给大家指明了路线图，让行业相信这样做真的能提升智能，这对提升信心，吸引更多人转向新范式的研究有巨大的帮助。

有人才进入，才有算法创新，有开源紧追才有更多计算资源投入。在DeepSeek之后，原本计划不再发新模型的OpenAI接连发出o3mini，并计划继续发布o3，还考虑开源模型。Anthropic和Google也会加快RL的研究。行业对新范式的推进因为DeepSeek加快。

另外，reasoning model的提升会进一步帮助Agent落地，AI researcher现在都因此对agent的研究和探索更有信心，因此也可以说DeepSeek开源reasoning model推进了行业向Agent的进一步探索。所以 DeepSeek虽然没有发明新范式，但推进整个行业进入了新范式。

Insight 03：Anthropic的技术路线和R1有什么不同？

从Dario（Anthropic创始人）的访谈可以看出，Anthropic对R-1/reasoning model的理解，与O系列有些分歧，Dario觉得基础模型与推理模型应该是个连续光谱，而非OpenAI这种独立的模型系列。如果只做 O系列会很快遇到天花板。

我一直想为什么Sonnet 3.5的coding、reasoning 和 agentic能力一下子提升这么强，但4o一直没追上？他们在基础模型预训练阶段就做了大量RL工作，核心还是把基础模型的能力提上去，不然只靠RL提升推理模型可能很容易把收益吃光。

Insight 04：DeepSeek的轰动有必然，也有偶然

两位OpenAI的早期研究员写的《为什么伟大不能被计划》一书用来形容DeepSeek也很合适。

技术角(jiǎo)度(dù)上(shàng)，DeepSeek有(yǒu)下(xià)面(miàn)几(jǐ)个(gè)亮(liàng)点(diǎn)：

• 开(kāi)源(yuán)：这(zhè)点(diǎn)很(hěn)重(zhòng)要(yào)，OpenAI从(cóng)GPT-3开(kāi)始(shǐ)转(zhuǎn)为(wèi)闭(bì)源(yuán)公(gōng)司(sī)后(hòu)，第(dì)一(yī)梯(tī)队(duì)三巨头就不再公开技术细节，拱手让出了一个空白的开源生态位，但Meta和Mistral并没有接稳这个位置，DeepSeek这次堪称奇袭，在开源这块大赛道一马平川。

如果把轰动性打100分，智能提升贡献30分，开源贡献70分，之前LLaMA也开源但没有这么轰动的效果，说明LLaMa智能水平不够。

• 便宜：“Your margin is my opportunity” （你的利润就是我的机会）这句话的含金量还在上升。

• 联网+公开CoT（思维链）：对于用户，这两个(gè)点(diǎn)分(fēn)别都能带来很好的用户体验，DeepSeek把两张牌同时出了，可以说是王炸，给到C端用户的体验和其他Chatbot完全不一样。尤其是CoT透明，把模型思考过程公开了，透明能让用户对AI更信任，促进了破圈。不过，按理说Perplexity也是冲击很大的，但DeepSee 服务端不稳定，Perplexity团队快速反应上线了R-1反而承接了很大DeepSeek R-1溢出的用户。

• RL泛化：虽然RL是OpenAI o1最先提出来的，但因为各种运营一直半遮半掩，渗透率并不高，DeepSeek R-1很大意义推动了reasoning model范式的进程，生态接受度大幅提升。

DeepSeek在技术上的探索投入(rù)是(shì)被(bèi)这(zhè)个智能成果值得更多人关注、讨论的确定性因素，但DeepSeek R1 推出的时间点又让这场轰动带有偶发性：

• 过去美国一直讲自己在基础技术研究上大幅领先，但DeepSeek原生于中国国内，这本身也是一个亮点，这个过程中，又有很多美国科技大佬开始(shǐ)去(qù)宣(xuān)扬(yáng)DeepSeek挑(tiāo)战(zhàn)了(le)美(měi)国(guó)科(kē)技(jì)霸(bà)主的(de)地(de)位(wèi)的(de)论(lùn)调(diào)，DeepSeek属(shǔ)于(yú)被(bèi)动(dòng)卷(juǎn)进(jìn)舆(yú)论(lùn)战；

• DeepSeek R1发布之前，美国5000亿美元的“星际之门”事件刚刚开始发酵，这种巨量投入和DeepSeek团队智能产出效率对比太鲜明了，很难不引发关注、讨论；

• DeepSeek让英伟达股价大跌又进一步让舆论发酵，他们肯定也想不到自己成为了2025开年美股第一只黑天鹅；

• 春节是产品的练兵场，移动互联网时代很多超级App都是在春节大爆发的，AI时代也不例外。DeepSeek R1恰好在春节前发布，大众惊喜的是它的文字创作能力，而不是训练时候强调的(de)编(biān)程(chéng)和(hé)数(shù)学(xué)能(néng)力(lì)，文创(chuàng)更(gèng)容(róng)易(yì)被(bèi)大(dà)众(zhòng)用(yòng)户(hù)有(yǒu)体(tǐ)感(gǎn)，也(yě)更(gèng)容(róng)易(yì)迅(xùn)速(sù)传(chuán)播(bō)。

Insight 05：谁受伤？谁受益？

可以把这个赛场上的玩家分成三类：ToC（消费者）、To Developer（开发者）以及 To 企事业单位：

1. ToC：Chatbot 肯定受冲击最大，心智和品牌关注度被DeepSeek抢走了，ChatGPT也不例外；

2. 在开发者环节的影响很有限，我们看到有用户用完之后说评论r1不好用不如sonnet，Cursor官方也说 Sonnet还是表现更好，用户高比例都选择Sonnet，并没有大幅迁移；

3. 第三个维度，To Enterprise和To Government的生意在于信任和需求理解，大型组织做决策(cè)的利益考虑很复杂，不会像C端用户那么容易迁移。

再换个角度，从闭源、开源和算力的视角想这个问题：短期大家会觉得闭源的OpenAI/Anthropic/Google 更受冲击：

• 技术神秘感被开(kāi)源(yuán)了(le)，AI营(yíng)销(xiāo)里(lǐ)面(miàn)最(zuì)重(zhòng)要(yào)的(de)神(shén)秘(mì)感(gǎn)的(de)溢(yì)价(jià)被(bèi)打(dǎ)破(pò)；

• 更(gèng)现(xiàn)实(shí)的因素，市场认为这几家闭源公司的潜在客户和市场规模被抢走了一些，GPU投入的回本周期变长；

• 作为领头羊的OpenAI在其中属于最“吃亏”的那个，之前想捂着技术不开源，半遮半掩，希望多赚技术溢价的美梦无法实现了。

但中长期看，GPU资源充裕的公司还是受益的，一方面是第二梯队的Meta可以快速跟进新方法，Capex更加高效，Meta可能是很大受益者，另一方面是智能提升还需要更多探索，DeepSeek开源把大家水平拉齐，进入全新探索又需要10倍甚至更大量级的GPU投入。

从第一性原理来想，对于AI智能产业来说，无论是发展智能还(hái)是(shì)应(yīng)用智能，从物理本质上就必然要消耗海量算力，这是基础定律决定的，不是技术优化能完全规避的。

所以，无论是探索智能，还是应用智能，即便短期有质疑，中长期的算力需求也会爆炸，这也解释了为什么马斯克从第一性原理出发，xAI坚持扩建集群，xAI和“星际之门”背后的深层逻辑也许是一样的。Amazon 等云厂商都宣布了要增加资本支出。

我们就假设全球的AI research人才水平和认知都拉齐，有更多GPU就可以做更多实验探索？最后可能还是回到算力的竞争。

DeepSeek光脚不怕穿鞋，没有商业化诉求，专注AGI智能技术探索，开源这个动作对推动AGI进程推动意义很大，加剧了竞争，推动了开放性，颇有鲶鱼效应。

Insight 06：蒸馏能超越SOTA吗？

有个细节点不确定，如果DeepSeek从预训练阶段就大量使用蒸馏的CoT数据，那做到今天效果不算惊艳，还是在第一梯队巨头的肩膀上获得的基础智能，然后再开源出来；但如果预训练阶段没有大量用蒸馏数据，DeepSeek从0做预训练做到今天的效果，那就堪称惊艳了。

另外，蒸馏能否在基础模型超越SOTA（效果最好的模型），应该是不太可能的。但DeepSeek R-1非常强，猜测是奖励模型做的非常好，如果R-1 Zero这条路径靠谱，是有机会超越SOTA。

Insight 07：No Moat !

Google之前对OpenAI的一个评价：No Moat！（没有护城河）这句话放在这里也很应景。

DeepSeek这一波Chatbot用户又出现了大量迁移现象，给了市场一个很重要的启发：智能技术进步非常陡峭，阶段性产品很难形成绝对壁垒。不管是 ChatGPT/Sonnet/Perplexity 刚形成了心智和口碑，还(hái)是(shì) Cursor、Windsurf 这类开发者工具，一旦有了更智能的产品，用户对“上一代”智能的产品毫无忠诚度，今天不管是模型层还是应用层都很难构建护城河。

DeepSeek这次也验证了一件事：模型即应用，DeepSeek在产品形式上没任何创新，核心就是智能+开源，我也不禁思考：在AI时代，任何产品和商业模式的创新都比不上智能的创新吗？

Insight 08：DeepSeek 应该承接这波 Chatbot 流量并做大吗？

从Chatbot 爆火到今天，通过DeepSeek团队的反应可以明显感觉出来，DeepSeek还没想好怎么用这波流量。而要不要接住、并积极运营这批流量这个问题的本质是，伟大的商业公司和伟大的研究机构能共存在一个组织吗？

这件事非常考验精力和资源分配、组织能力和战略选择，如果是字节、Meta这类大公司，他们的第一反应应该都要接下来，也有一定组织基础可以接下来，但DeepSeek作为一个研究团队组织，承接这波巨量流量的压力必然很大。

但同时也要想这一波Chatbot会是阶段性流量吗？Chatbot是不是在未来智能探索的主线下？似乎感觉每个智能阶段都有对应的产品形态，而 Chatbot只是解锁的其中一个早期形态。

对于DeepSeek来说，从未来3-5年视角看，如果今天不去承接Chatbot流量，会不会是一种错过？万一哪天跑出规模效应？如果AGI最终实现了，又会是什么载体来承接？

Insight 09：下一个智能突破的Aha moment从哪来？

一方面，第一梯队的下一代模型很关键，但今天我们又处在Transformer的极限边界上，第一梯队能否拿出代际提升的模型也不确定。OpenAI、Anthropic和Google作为回应发出来好30%-50%的模型可能都不够挽回局势，因为他们资源多了10-30倍。

另一方面， Agent落地比较关键，因为Agent需要做长距离多步骤推理，如果模型好5%-10%，领先的效果就会被放大很多倍，所以OpenAI、Anthropic和Google一方面要做Agent产品落地，全栈集成模型+Agent产品，就像 Windows+Office，二是也要秀出来更强大的模型，比如O3完整版、Sonnet 4/3.5 opus为代表的下一代模型。

在技术不确定性下，最宝贵的是天才AI研究员，任何想要探索AGI的组织都要投入资源到更激进的范式，尤其是在今天预训练阶段已经被拉齐的背景下，要有好的人才+充裕资源，探索下一个智能涌现的Aha moment。

Insight 10：DeepSeek 这一波让我对中国AI人才更有信心，非常鼓舞

最后，希望技术无国界。

(本文首发于微信公众号海外独角兽，海外独角兽为拾象旗下开源研究平台）

官方网站-首页

企业动态

李广密：对DeepSeek和智能下半场的几条判断

10

2025-02

-10

返回列表

分享新闻

上一页

3.5亿元，中国植入式脑机接口最大一笔融资诞生

下一页

今日科普|用户反馈数据洞察