官方网站-首页官方网站-首页

DeepSeek更新了

29

2025-05

-29

【导语】5月28日,DeepSeek宣布其R1模型已完成小版本升级,用户可在多平台体验。新版R1模型在Hugging Face开源,并在多项基准测试中表现优异,几乎媲美OpenAI的o3模型。此前,DeepSeek V3模型也于春节期间大火,并在3月完成升级,大幅提高推理任务表现,代码生成能力尤为突出。DeepSeek持续引领AI模型发展潮流。

5月28日,DeepSeek在官方交流群中公布,DeepSeek R1模型已完成小版本试升级。用户可在官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。DeepSeek在开源社区Hugging Face也开源了新版R1模型(R1-0528)。

有网友对新版R1模型进行了测试,并表示Deepseek-R1-0528在竞赛级编程的难度基准LiveCodeBench中的表现几乎与OpenAI的o3模型相当。

社交网络和信息网站City-data.com创始人Lech Mazur在社交媒体上表示,Deepseek-R1-0528在Extended NYT Connections基准测试中比原先的DeepSeek R1有了显著改进,分数从38.6上升到49.8。在Thematic Generation基准测试中,Deepseek-R1-0528也优于DeepSeek R1,分数从1.80变为1.74,该分数越低越好。Thematic Generation基准测试衡量各种大模型如何有效地从一小组示例和反示例中推断出一个狭义或特定的“主题”(类别/规则),然后在一组具有误导性的候选项中(zhōng)检(jiǎn)测(cè)出(chū)哪(nǎ)一(yī)项(xiàng)真(zhēn)正(zhèng)符(fú)合(hé)该(gāi)主题(tí)。

DeepSeek今(jīn)年(nián)春(chūn)节(jié)期(qī)间(jiān)大(dà)火(huǒ)。3月(yuè)份(fèn),DeepSeek V3模(mó)型(xíng)完(wán)成(chéng)小(xiǎo)版(bǎn)本(běn)升(shēng)级(jí)。新(xīn)版(bǎn)V3模(mó)型(xíng)借(jiè)鉴(jiàn)DeepSeek R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。在HTML等代(dài)码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。在中文写作任务方面,新版V3模型基于R1的写作水平进行优化,同时提升中长篇文本创作的内容质量。

分享新闻