性能全面赶超GPT-4 Turbo,阿里云发布通义千问2.5!

seekdeep1年前AI资讯457

阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问最新开源的1100亿参数模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70B,成为开源领域最强大模型。




相比通义千问2.1版本,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。在权威基准OpenCompass上,通义千问2.5得分追平GPT-4 Turbo,是该基准首次录得国产大模型取得如此出色的成绩。




通义还发布了最新款开源模型,1100亿参数的Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型;在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首,再度证明通义开源系列业界最强的竞争力。




通义的多模态模型和专有能力模型也具备业界顶尖影响力。通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越Gemini Ultra和GPT-4V,目前已在多家企业落地应用;通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手,还是国内用户规模第一的智能编码助手通义灵码的底座。


通义大模型问世一年多来,还发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从通义APP、官网和小程序免费使用通义家族全栈服务。


相关文章

ChatGPT:官方终于给出答案,神秘名字“David Mayer”搞崩的原因!

近日,聊天机器人 ChatGPT 在面对一个名字时出现了奇怪的故障,无论用户如何尝试,都无法让 ChatGPT 说出 "David Mayer" 这个名字。不管用户怎么修改提示词,...

AI的出现,将给电影产业带来什么影响

  近日举办的第75届柏林国际电影节上,德国导演汤姆·蒂克韦尔的新作《光》作为揭幕影片亮相。一个叫“无瑕”的美国外语配音公司与蒂克韦尔合作,通过人工智能(AI)调整电影中演员的口型,制作了“口型与台词...

夸克正打算重新定义AI搜索

夸克正打算重新定义AI搜索

夸克是AI搜索的最佳形态么?2月的最后一天,我注意到,夸克宣布已经完成对夸克App和PC端的全面升级:首页改版,夸克AI搜索上线“深度思考”。这是夸克首次将大模型深度思考能力融入AI搜索功能。夸克方面...

是数据不够,还是能力太强?ChatGPT-5为何按下“暂停键”。

是数据不够,还是能力太强?ChatGPT-5为何按下“暂停键”。

关于ChatGPT-5的发布延迟,行业内外的猜测可谓五花八门。人们不仅期待新一代模型的问世,也在揣测它背后的迟滞原因。是数据量不足的技术困局,当前数据量的增长遇到了瓶颈?还是AGI(通用人工智能)的控...

传统业务疲软,AI与智能驾驶能否撑起未来?百度2024年财报解析!

2024年,百度在AI转型的关键一年交出了一份喜忧参半的财报。智能云业务逆势增长26%,文心一言调用量激增33倍,转型成果初显。然而,传统广告业务持续承压,爱奇艺业绩表现不佳,整体业绩略显疲软。更值得...

解锁大模型时代的无限可能,从GPT-3到Sora

从2020年OpenAI的GPT-3到2023年的GPT-4再到2024年的文生视频模型Sora,我们见证了大模型领域创新速度之快。从百度、阿里和360等为代表的头部科技企业率先入局到互联网公司、AI...