除了编程能力大幅提升,还有更宽松的开源协议:DeepSeek 发布 V3 模型更新!

seekdeep12个月前AI资讯14774

和上周不少朋友期待的一样,新一周第一天的北京时间 3 月 24 日晚,DeepSeek 果然「突然」发布了模型更新。

但暂时还不是 DeepSeek V4 或 R2,而是 DeepSeek V3 模型的一次更新。目前,其开源版本目前已经上架开源网站。其开源版本模型体积为 6850 亿参数。

初代 V3 模型最为人所熟知的,可能还是「557.6 万美金比肩 Claude 3.5 效果」的超级性价比。而更新后的模型由其新的 32KGPU 集群上改进的后训练提供支持。

截至目前,还没有任何关于新版 DeepSeek V3 的能力基准测试榜单出现,但有了 DeepSeek V3 发布即成为 Chatbot Arena 榜单前十中唯一一个开源模型的刷榜历史,还是在发布一小时后迅速吸引来全球用户对其测试体验。

1.jpg

根据目前最新的用户上手测试,新版 V3 模型前端编码能力的提升,是目前「感知最强」的部分。根据专业用户对新版 V3 的综合体验判断,V3-0324 的提升幅度大约相当于 Sonnet 3.5 到 Sonnet 3.6 的提升。

用户按照下面的提示词,同时对新版 V3 与 R1 下达任务,实际产出的效果已经出现巨大差异。

创建一个包含 CSS 和 JavaScript 的单个 HTML 文件,以生成一个动画天气卡片。卡片应通过不同的动画直观地表示以下天气条件:风:(例如,移动的云朵、摇曳的树木或风线)雨:(例如,落下的雨滴、形成的水坑)晴:(例如,闪耀的光线、明亮的背景)雪:(例如,落下的雪花、积雪)并排显示所有天气卡片。卡片应具有深色背景。在此单个文件中提供所有 HTML、CSS 和 JavaScript 代码。JavaScript 应包含一种在不同天气条件之间切换的方法(例如,一个函数或一组按钮),以演示每种天气的动画。

左侧是 DeepSeek 新版 V3 模型的生成结果,右侧为 R1 的生成结果。

除了对比 R1 ,用户还用类似的提示词,对比了 Claude 系列。Claude 3.7 作为目前号称「编程能力最强模型」,实际编程能力使用体验也是多次被评为「已经达到专家级程序员水准」。

同一提示词给到 Claude 3.5/3.7 后,除了这个测试案例,根据更多用户对之前 prompt 测试的结果,普遍结论是当前新版 V3 在编码能力已经接近 claude3.7 ,同时也是目前第一时间上手中,大家觉得比之前的 v3 能力提升最大的部分。

针对前端网站搭建测试,新版 V3 所生成的网站(上)在与 Claude 3.7 Sonnet 生成的结果(下)中,也快速「拉齐」了网站的构建效果

除了编程能力,在其他用户的测试中,新版 V3 在多轮对话中体现出了更强的上下文理解能力。

当然,与往常一样,DeepSeek 也没有同时公开表示 R2 或者 V4 模型会在何时发布,但不少用户在体验过新版 V3 后,都觉得似乎 R2 的到来,也已经不远了。

还有一个普通用户「感知不强」,但让开源社区非常兴奋的改变。新版 V3 的开源许可与 R1 一样,也更新变成了 MIT 开源许可(MIT License),这意味着新版 V3 有着比初代 V3 更宽松的开源使用条件。

并且 MIT 开源许可一向以商业友好而著称,使用 MIT 许可的项目可以与商业和专有软件集成,这或许对于希望在商业项目中使用新版 V3 模型的开发者来讲,是本次更新最重要的改变了。

返回列表

上一篇:智启未来生活 AI赋能家电

没有最新的文章了...

相关文章

成功率从1%暴涨至88%-过去时态让GPT-4o防线崩塌

最高端的大模型,往往需要最朴实的语言破解。来自EPFL机构研究人员发现,仅将一句有害请求,改写成过去时态,包括GPT-4o、Llama 3等大模型纷纷沦陷了。将一句话从「现在时」变为「过去时」,就能让...

OpenAI员工:没什么科学突破了,接下来只需要工程.GPT-5被曝不及预期!

OpenAI下一代旗舰模型被曝提升不如预期。具体指代号“猎户座”(Orion)的模型相对GPT-4的提升幅度,小于GPT-4相对GPT-3,已进入收益递减阶段。或许这也是奥特曼曾说,可能不会把新模型命...

几百家企业接入DeepSeek,后续将有更多的企业接入!

几百家企业接入DeepSeek,后续将有更多的企业接入!

但要有人说:DeepSeek 是秦始皇。那咱没准还真要琢磨下,毕竟人家这段时间,真一统全国了。。。你看甭管是哪个行业的哪家公司、和 AI 有没有打过交道,平时有没有互相 Diss ,最近都跟说好了一样...

中国“AI教父”李一舟靠卖课年入5000万,“比肩”ChatGPT之父奥特曼!

什么样的人可以“比肩”ChatGPT之父山姆·奥特曼?他就是在国内被粉丝誉为“AI教父”的清华博士李一舟,当别人还在焦虑如用AI赚钱时,他已经在利用AI卖课年入千万了。“比肩”ChatGPT之父山姆·...

OpenAI取消GPT-4 Turbo的每日限制!

OpenAI在社交平台宣布,取消了GPT-4Turbo的所有每日限制,并将速率限制提升1倍。现在,每分钟可处理高达150万TPM的数据。OpenAI这一周的连续王炸组合拳,从ChatGPT增加 “记忆...

马斯克为何要全力炮轰:苹果系统接入ChatGPT

苹果在全球开发者大会(WWDC 24)推出Apple Intelligence(苹果智能),并表示将与OpenAI合作,ChatGPT将整合到包括新一代iOS、iPadOS以及macOS中。对隐私的高...