
3月24日晚间,杭州深度(dù)求(qiú)索人工智能基础技术研究有限公司(以下简称“深度求索”)发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前已在Hugging Face上开源,并迅速登上了Trending榜单。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,该版本的最新模型也已经同步至官网、App 和小程序,关闭“深度思考”就可体验。
此次发布(bù)的(de)版(bǎn)本(běn)更(gèng)新(xīn),在(zài)性(xìng)能(néng)上(shàng),编(biān)程(chéng)能(néng)力(lì)的(de)优(yōu)化(huà)成(chéng)了(le)最(zuì)大亮点,新版本DeepSeek-V3-0324生成前端代码的能力大大提升。
不少自媒体博主在社交平台上发帖认为,DeepSeek-V3-0324 模型在前端代码的生成能力上有了质的(de)提(tí)升,审美方面也提升了不少,甚至有博主测评称可以媲美 Claude 3.7 Sonnet思维链版本。有不少用户开始尝试将新模型与此前发布的模型结合解锁新的玩法。有用户称用DeepSeek-V3-0324 模型尝试编写了800多行代码,整个过程没有出现任何故障。“这是免费的、开源的、超快的。很高兴看到这些开源模型如何向大型科技公司施压,以更低的成本构建更好的模型。”该位用户称。
澎湃科技此前曾报道,初代DeepSeek-V3发布于2024年12月26日晚间,这款模(mó)型(xíng)自(zì)上(shàng)线(xiàn)后(hòu)便(biàn)以(yǐ)高(gāo)性(xìng)价(jià)比(bǐ)火(huǒ)速(sù)“出(chū)圈(quān)”。根(gēn)据(jù)官(guān)方(fāng)技(jì)术(shù)论(lùn)文披(pī)露(lù),DeepSeek-V3模(mó)型(xíng)的(de)总(zǒng)训(xun)练(liàn)成(chéng)本(běn)为(wèi)557.6万(wàn)美(měi)元(yuán),而(ér)GPT-4o等模型的训练成本约为1亿美元。深度求索表示,“这是一个全新的开始。”其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术(shù),在(zài)仅(jǐn)有(yǒu)极(jí)少(shǎo)标(biāo)注(zhù)数(shù)据(jù)的(de)情(qíng)况(kuàng)下(xià),极(jí)大(dà)提(tí)升(shēng)了(le)模(mó)型(xíng)推(tuī)理(lǐ)能(néng)力(lì)。