除了编程能力大幅提升,还有更宽松的开源协议:DeepSeek 发布 V3 模型更新!

seekdeep10个月前AI资讯5258

和上周不少朋友期待的一样,新一周第一天的北京时间 3 月 24 日晚,DeepSeek 果然「突然」发布了模型更新。

但暂时还不是 DeepSeek V4 或 R2,而是 DeepSeek V3 模型的一次更新。目前,其开源版本目前已经上架开源网站。其开源版本模型体积为 6850 亿参数。

初代 V3 模型最为人所熟知的,可能还是「557.6 万美金比肩 Claude 3.5 效果」的超级性价比。而更新后的模型由其新的 32KGPU 集群上改进的后训练提供支持。

截至目前,还没有任何关于新版 DeepSeek V3 的能力基准测试榜单出现,但有了 DeepSeek V3 发布即成为 Chatbot Arena 榜单前十中唯一一个开源模型的刷榜历史,还是在发布一小时后迅速吸引来全球用户对其测试体验。

1.jpg

根据目前最新的用户上手测试,新版 V3 模型前端编码能力的提升,是目前「感知最强」的部分。根据专业用户对新版 V3 的综合体验判断,V3-0324 的提升幅度大约相当于 Sonnet 3.5 到 Sonnet 3.6 的提升。

用户按照下面的提示词,同时对新版 V3 与 R1 下达任务,实际产出的效果已经出现巨大差异。

创建一个包含 CSS 和 JavaScript 的单个 HTML 文件,以生成一个动画天气卡片。卡片应通过不同的动画直观地表示以下天气条件:风:(例如,移动的云朵、摇曳的树木或风线)雨:(例如,落下的雨滴、形成的水坑)晴:(例如,闪耀的光线、明亮的背景)雪:(例如,落下的雪花、积雪)并排显示所有天气卡片。卡片应具有深色背景。在此单个文件中提供所有 HTML、CSS 和 JavaScript 代码。JavaScript 应包含一种在不同天气条件之间切换的方法(例如,一个函数或一组按钮),以演示每种天气的动画。

左侧是 DeepSeek 新版 V3 模型的生成结果,右侧为 R1 的生成结果。

除了对比 R1 ,用户还用类似的提示词,对比了 Claude 系列。Claude 3.7 作为目前号称「编程能力最强模型」,实际编程能力使用体验也是多次被评为「已经达到专家级程序员水准」。

同一提示词给到 Claude 3.5/3.7 后,除了这个测试案例,根据更多用户对之前 prompt 测试的结果,普遍结论是当前新版 V3 在编码能力已经接近 claude3.7 ,同时也是目前第一时间上手中,大家觉得比之前的 v3 能力提升最大的部分。

针对前端网站搭建测试,新版 V3 所生成的网站(上)在与 Claude 3.7 Sonnet 生成的结果(下)中,也快速「拉齐」了网站的构建效果

除了编程能力,在其他用户的测试中,新版 V3 在多轮对话中体现出了更强的上下文理解能力。

当然,与往常一样,DeepSeek 也没有同时公开表示 R2 或者 V4 模型会在何时发布,但不少用户在体验过新版 V3 后,都觉得似乎 R2 的到来,也已经不远了。

还有一个普通用户「感知不强」,但让开源社区非常兴奋的改变。新版 V3 的开源许可与 R1 一样,也更新变成了 MIT 开源许可(MIT License),这意味着新版 V3 有着比初代 V3 更宽松的开源使用条件。

并且 MIT 开源许可一向以商业友好而著称,使用 MIT 许可的项目可以与商业和专有软件集成,这或许对于希望在商业项目中使用新版 V3 模型的开发者来讲,是本次更新最重要的改变了。

返回列表

上一篇:智启未来生活 AI赋能家电

没有最新的文章了...

相关文章

被曝本周即将发布ChatGPT搜索引擎!OpenAI正面对决谷歌?

随着越来越多的竞争对手推出聊天机器人,人工智能霸主OpenAI开始试图推出更多功能,入局搜索市场,以提升其自身竞争力。据知情人士透露,正在计划推出一款基于其ChatGPT聊天机器人的搜索引擎产品,发布...

人工智能ETF、软件30ETF等产品布局相关产业链投资机会。GPT-5有望于今夏发布!

本周国证机器人产业指数下跌1.4%,中证云计算与大数据主题指数下跌2.1%,中证人工智能主题指数下跌2.2%,中证软件服务指数下跌3.2%。银河证券认为,预计GPT-5将在大模型的上下文输入长度实现重...

Agent不会复杂任务规划,GPT-4/Gemini大翻车做攻略成功率≈0%!

最近,复旦、俄亥俄州立大学、Meta和宾夕法尼亚州立大学的研究者发现,GPT-4 Agent规划旅行只有0.6%成功率!离在人类复杂环境中做出规划,智能体还任重道远。AI智能体,是目前学界炙手可热的前...

GPT-5有望今年夏季发布,多模态能力预期提升,中国银河给予计算机行业推荐评级!

AI快讯,中国银河03月29日发布研报称:给予计算机行业推荐(维持)评级。近日,多家媒体公开消息称 GPT-5 预计将在今年夏季正式发布,目前仍处内测阶段。当前,最新版本 GPT-4 Turbo 已能...

蚂蚁首次公布AI应用矩阵;OpenAI已启动开发“GPT-5”;百度智能云推出“千帆行业增强版”

今日AI daily早新闻主要内容有:OpenAI宣布已启动下一代前沿模型训练,传言已久的“GPT-5”已经开始了;蚂蚁首次公布AI应用矩阵;百度智能云推出“千帆行业增强版”,加速行业大模型应用落地。...

将发布针对日语进行优化的GPT-4模型,OpenAI官宣在东京开设首个亚洲办事处!

每经AI快讯,OpenAI 4月15日宣布在日本东京设立该公司在亚洲的首个办事处,将业务扩展到亚洲,并将发布针对日语进行优化的GPT-4定制模型。OpenAI称,将致力于与日本政府、当地企业和研究机构...