性能全面赶超GPT-4 Turbo,阿里云发布通义千问2.5!

seekdeep2年前AI资讯647

阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问最新开源的1100亿参数模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70B,成为开源领域最强大模型。




相比通义千问2.1版本,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。在权威基准OpenCompass上,通义千问2.5得分追平GPT-4 Turbo,是该基准首次录得国产大模型取得如此出色的成绩。




通义还发布了最新款开源模型,1100亿参数的Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型;在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首,再度证明通义开源系列业界最强的竞争力。




通义的多模态模型和专有能力模型也具备业界顶尖影响力。通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越Gemini Ultra和GPT-4V,目前已在多家企业落地应用;通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手,还是国内用户规模第一的智能编码助手通义灵码的底座。


通义大模型问世一年多来,还发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从通义APP、官网和小程序免费使用通义家族全栈服务。


相关文章

GPT-4o新模型会代替Siri?联手OpenAI,苹果一夜市值大增近3600亿元。

美东时间周一,美股三大指数收盘涨跌不一,截至收盘,道指跌0.21%,纳指涨0.29%,标普500指数跌0.02%。大型科技股涨跌不一,其中,苹果涨1.76%。消息面上,今日凌晨1点,抢在谷歌年度开发者...

未来专家将有“分身术”,元宇宙医学数字人GPT在闵行亮相!

专家少,患者多,如何解决专家的稀缺性问题?4月10日,上海市闵行区医学会元宇宙医学专业委员会举行成立大会。会上,全球领先的元宇宙医学数字人GPT——BAIMGPT1.0正式亮相。据悉,BAIMGPT1...

又一次GPT式创业的Sora!

Sora让整个行业又兴奋起来。字节辟谣中国版Sora,周鸿祎火速“追星”,李一舟趁热卖课,一众上市公司夹杂着“颠覆性、里程碑、加速器”等关键词舞动资本市场。又一次创业机会,还是新一轮赶超焦虑,是看待S...

美国专利商标局驳回了OpenAI申请"GPT"商标的尝试

美国专利商标局(U.S. Patent and Trademark Office)驳回了 OpenAI 申请"GPT"商标的尝试,裁定该词"仅仅是描述性的",因...

OpenAI获66亿美元新融资 投后估值超千亿

引领此轮生成式人工智能潮流的美国科技公司OpenAI,近日宣布再获66亿美元(约合人民币463.22亿元)新融资,投后估值高达1570亿美元(约合人民币1.1万亿元)。今年年初时,OpenAI市场估值...

OpenAI 最快的新模型 GPT-4o mini,微软 Azure AI 已上线!

微软 Azure AI 发布博客文章宣布,OpenAI 最快的模型GPT-4o mini现已在 Azure AI 上线。该模型支持文本处理,并承诺未来将支持图像、音频和视频。图片来自 微软 Azure...