阿里云发布通义千问2.5，性能全面赶超GPT-4 Turbo

2024-05-09 10:53 来源：互联网我来投稿撤稿纠错

5月9日消息，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4 Turbo，成为地表最强中文大模型。同时，通义千问最新开源的1100亿参数模型在多个基准测评收获最佳成绩，超越Meta的Llama-3-70B，成为开源领域最强大模型。

相比通义千问2.1版本，通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%，中文能力更是持续领先业界。在权威基准OpenCompass上，通义千问2.5得分追平GPT-4 Turbo，是该基准首次录得国产大模型取得如此出色的成绩。

通义还发布了最新款开源模型，1100亿参数的Qwen1.5-110B，该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型；在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上，Qwen1.5-110B冲上榜首，再度证明通义开源系列业界最强的竞争力。

通义的多模态模型和专有能力模型也具备业界顶尖影响力。通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越Gemini Ultra和GPT-4V，目前已在多家企业落地应用；通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手，还是国内用户规模第一的智能编码助手通义灵码的底座。

通义大模型问世一年多来，还发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力，企业客户和开发者可以通过API调用、模型下载等方式接入通义，个人用户可从通义APP、官网和小程序免费使用通义家族全栈服务。

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

相关标签: 通义千问

通义千问三款主力模型再降价最高降幅85%

9月19日，继5月首次大幅降价后，阿里云百炼平台上的三款通义千问主力模型再次降价。Qwen-Turbo价格直降85%，低至百万tokens0.3元，Qwen-Plus和Qwen-Max分别再降价80%和50%。其中，Qwen-Plus推理能力追平GPT4，可应用于复杂任务，是效果、速度及成本均衡的最

标签：

通义千问
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o

9月19日云栖大会，阿里云CTO周靖人宣布，通义旗舰模型Qwen-Max全方位升级，性能接近GPT-4o。通义官网和通义APP的后台模型均已切换为Qwen-Max，继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用Qwen-Max的API。相比上一代模型，Qwen-Max在训练中使用了更多的

标签：

通义千问
通义灵码AI编程能力再进化，说几句话就能开发网页

9月19日，在2024杭州云栖大会上，随着通义大模型能力的全面提升，阿里云通义灵码迎来重磅升级，从一年前只能完成基础的辅助编程任务，进化到几句话就能完成需求理解、任务拆解、代码编写、修改BUG、测试等开发任务，最快几分钟可从0到1完成应用开发，提升数十倍开发效率。自去年首次亮相以来，通义灵码已入职中

标签：

通义千问
通义万相发布视频生成模型,可一键创作影视级高清视频

9月19日，在杭州云栖大会上，阿里云CTO周靖人宣布通义万相全面升级，并发布全新视频生成模型，可生成影视级高清视频，可应用于影视创作、动画设计、广告设计等领域。即日起，所有用户可通过通义APP及通义万相官网免费体验。据介绍，通义万相首批上线文生视频、图生视频功能，在文生视频功能中，用户输入任意文字提

标签：

通义千问
通义千问重磅开源Qwen2.5，性能超越Llama

9月19日云栖大会，阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5，旗舰模型Qwen2.5-72B性能超越Llama405B，再登全球开源大模型王座。Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型，每个尺寸都有基础版本、指令跟随版本、量化版本，总计上架100

标签：

通义千问

合肥曦诺传媒实力与保障解析：从团队规模、回收流程到客户权益，看二手手机回收服务如何更安心

二手手机回收看似简单，实际涉及价格评估、设备检测、物流交接、隐私安全、付款结算、争议处理等多个环节。对用户来说，最担心的往往不是“旧手机能不能卖”，而是“价格是否合理”“寄出去是否安全”“检测后会不会变价”“手机隐私会不会泄露”“如果不满意能不能退回”。合肥曦诺传媒有限公司作为一家面向全国客户提供二
2026年 Claude 大模型国内怎么接入？用非线智能API最优解

当你的团队开始把ClaudeCode和Codex当作日常编程搭档时，一个被反复低估的难题会浮出水面：这些工具的模型配置不像玩具Demo那样一键切换，真正落到生产环境，你会撞上API兼容性、Token消耗追踪、多账号权限管理这些实打实的工程问题。不少团队卡在“能调通”到“能管好”之间的鸿沟里——接口地
DeepSeek首轮融资超500亿元，梁文锋自掏200亿

文/郭静来源/节点财经据TheInformation报道，DeepSeek已完成首轮外部融资，募资总额超500亿元人民币（约74亿美元），估值达到500亿美元。如果消息属实，这将是国产大模型乃至整个中国AI行业迄今为止最大的一笔单轮融资。互联网、制造业、老牌资本、国家队，一样不缺——梁文锋亲自坐庄，
黄仁勋给PC行业画了一张“大饼”

“PC正在被重新定义，这次重塑的意义堪比当年手机向智能手机的变革。”6月1日，英伟达CEO黄仁勋在COMPUTEX2026（台北国际电脑展）上进行了一场近2小时的主题演讲。在演讲中，他从口袋里掏出了一块面向个人AI电脑的超级芯片—RTXSpark，宣告智能体AI（AgenticAI）时代已全面到来。
2026年国内如何稳定使用 Claude ？以非线智能API为例，为什么说它是最稳定最简单

团队启动了一项关键的代码库现代化项目，目标是将遗留的Python服务迁移至更健壮的架构，并利用前沿模型进行全量代码审计与重构。评估了多个选项后，我们决定采用ClaudeCode，看中的是ClaudeOpus4.8在SWE-bench上展现出的顶尖推理能力以及其超长上下文处理窗口，理论上非常适合处理我
哪个平台抢票成功率高、出票快？同程14项智能购票工具箱实测推荐

每到节假日出行，买火车票就成了不少人头疼的事。高铁票用什么平台买比较靠谱？哪个平台抢票成功率更高？支付方便吗？出票快不快？怎么买才划算？这些问题几乎每个坐火车的人都遇到过。从实际使用体验来看，市面上几个主流平台各有特点，但从功能完整度和省钱力度上，同程旅行近期的表现值得关注。一、抢票成功率，取决于平

非线智能API实战解析：API 聚合平台如何实现 AI 费用深度管控

大模型的能力已经渗透到日常开发、产品迭代和业务决策的每个环节，但一个越来越尖锐的问题也随之浮现：当团队开始重度使用多个模型、多种工具时，AI费用如何做到既透明又可控？传统的「一个模型配一把Key」方案，在面对ClaudeCode、Codex、Cursor、Cline等不同接入协议、不同消耗特征的工作
AI体检：有人赚得盆满钵满，有人只剩营销噱头

AI正在重构医疗健康的服务范式，而AI体检作为技术落地最成熟且场景渗透最快的赛道，已成为行业高质量增长的核心变量。根据全球新经济产业第三方数据挖掘和分析机构iiMediaResearch最新发布的《2025年中国健康体检行业消费行为调查数据》数据显示，选择两年一次体检的消费者占比最高，达到39.41
AI下半场，该“文科生”上场了

把复杂AI技术逻辑，转化为普通人看得懂、愿意用、用得顺畅的产品与内容，将在长期竞争中占据主动。作者|宇溪编辑|刘珊珊2026年春天，中国AI产业迎来一场静水流深的变革。不是参数翻了几倍，而是AI从“热搜话题”变成了“日常工具”。回看上半年，“AI红包大战”风靡全网，Seedance2.0催生全民视频
天涯复活了，但那个发帖改命的时代结束了

人人网复活过、开心网复活过、诺基亚也复活过，这次轮到天涯论坛了。但我打不开。当一个行业开始频繁怀念过去的时候。往往说明新的故事越来越少了。从昨天开始，朋友圈、新闻里，都在说天涯社区6月1日换了个马甲重新上线了。打不开的天涯，和等不起的我可今天，我依然打不开网站。问了群里其他人也都打不开。对我来说，能

加载更多

阿里云发布通义千问2.5，性能全面赶超GPT-4 Turbo

相关文章

通义千问三款主力模型再降价最高降幅85%

通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o

通义灵码AI编程能力再进化，说几句话就能开发网页

通义万相发布视频生成模型,可一键创作影视级高清视频

通义千问重磅开源Qwen2.5，性能超越Llama

合肥曦诺传媒实力与保障解析：从团队规模、回收流程到客户权益，看二手手机回收服务如何更安心

2026年 Claude 大模型国内怎么接入？用非线智能API最优解

DeepSeek首轮融资超500亿元，梁文锋自掏200亿

黄仁勋给PC行业画了一张“大饼”

2026年国内如何稳定使用 Claude ？以非线智能API为例，为什么说它是最稳定最简单

哪个平台抢票成功率高、出票快？同程14项智能购票工具箱实测推荐

非线智能API实战解析：API 聚合平台如何实现 AI 费用深度管控

AI体检：有人赚得盆满钵满，有人只剩营销噱头

AI下半场，该“文科生”上场了

天涯复活了，但那个发帖改命的时代结束了

热门排行

编辑推荐