性能全面赶超GPT-4 Turbo,阿里云发布通义千问2.5!

seekdeep2年前AI资讯749

阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问最新开源的1100亿参数模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70B,成为开源领域最强大模型。




相比通义千问2.1版本,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。在权威基准OpenCompass上,通义千问2.5得分追平GPT-4 Turbo,是该基准首次录得国产大模型取得如此出色的成绩。




通义还发布了最新款开源模型,1100亿参数的Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型;在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首,再度证明通义开源系列业界最强的竞争力。




通义的多模态模型和专有能力模型也具备业界顶尖影响力。通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越Gemini Ultra和GPT-4V,目前已在多家企业落地应用;通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手,还是国内用户规模第一的智能编码助手通义灵码的底座。


通义大模型问世一年多来,还发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从通义APP、官网和小程序免费使用通义家族全栈服务。


相关文章

周鸿祎:中国垂直领域AI大模型超过GPT-4完全有可能(两会访谈)

从去年初ChatGPT掀起人工智能(AI)大模型热潮,到今年初Sora以文生视频技术惊艳世界,国际尖端人工智能技术迭代迅速。中国该怎么走好自己的AI之路?“我觉得中国还是有优势的。”全国政协委员、36...

华尔街将迎投资新时代?小摩AI投顾IndexGPT正式上线 !

据媒体报道,摩根大通已经推出了一款名为IndexGPT的产品,该服务将依赖颠覆性的人工智能(AI)为客户提供投资建议。一年之前,摩根大通为IndexGPT申请了产品商标。根据文件,IndexGPT将利...

高考报考GPT,百年育才发布会圆满落幕

2024年4月2日9:30,百年育才高考报考GPT正式发布。百年育才创始人金泰雄先生隆重推出了这款AI产品,以其创新性和出色的性能引起了广泛关注,通过人机对话完成高考志愿填报,体验科技的力量。发布会现...

80亿参数、前OpenAI人员经数年打造,机器人ChatGPT来了!

机器人 AI 公司 Covariant CEO Peter Chen坐在一个聊天机器人面前,界面和 ChatGPT 的很像。“给我看看你面前的运送箱,” 他输入一段文本。然后出现了一段视频,一个机械臂...

6小时收藏破5000次,利好国产GPU。DeepSeek开源第一弹!

6小时收藏破5000次,利好国产GPU。DeepSeek开源第一弹!

2月24日,在上周DeepSeek宣布本周将是开源周(OpenSourceWeek),并将连续开源五个软件库后。今日上午9:30时许,DeepSeek宣布开源了本次开源周首款代码库——针对Hopper...

是数据不够,还是能力太强?ChatGPT-5为何按下“暂停键”。

是数据不够,还是能力太强?ChatGPT-5为何按下“暂停键”。

关于ChatGPT-5的发布延迟,行业内外的猜测可谓五花八门。人们不仅期待新一代模型的问世,也在揣测它背后的迟滞原因。是数据量不足的技术困局,当前数据量的增长遇到了瓶颈?还是AGI(通用人工智能)的控...