阿里发布Qwen3-Max，性能超GPT5，跻身全球前三

2025-09-24 15:07 来源：互联网我来投稿撤稿纠错

9月24日，2025云栖大会开幕，阿里通义旗舰模型Qwen3-Max重磅亮相，性能超过GPT5、Claude Opus 4等，跻身全球前三。Qwen3-Max包括指令（Instruct）和推理（Thinking）两大版本，其预览版已在 Chatbot Arena 排行榜上位列第三，正式版性可望再度实现突破。

Qwen3-Max为通义千问家族中最大、最强的基础模型。该模型预训练数据量达36T tokens，总参数超过万亿，拥有极强的Coding编程能力和Agent工具调用能力。在大模型用Coding解决真实世界问题的SWE-Bench Verified测试中，Instruct版本斩获69.6分，位列全球第一梯队；在聚焦Agent工具调用能力的Tau2-Bench测试中，Qwen3-Max取得突破性的74.8分，超过Claude Opus4和DeepSeek-V3.1。

【图说】：Qwen3-Max-Instrurct测评分数

Qwen3-Max的推理增强版本Qwen3-Max-Thinking-Heavy也展现出非凡性能，结合工具调用和并行推理技术，其推理能力创下新高，尤其在聚焦数学推理的AIME 25和HMMT测试中，均达到突破性的满分100分，为国内首次。Qwen3-Max推理模型之所以能够取得优异成绩，原因在于大模型在解数学题时懂得调动工具，能够写代码做题，同时，增加测试时的计算资源，也让模型表现变得更好。

【图说】：Qwen3-Max-Thinking-Heavy 测评分数

大模型预训练原理Scaling Law（规模化法则）认为，持续地增长数据和参数规模，是通向 AGI 的可能路径之一。由于自然数据的数量有限，当前有部分学者认为预训练的Scaling Law即将逼近上限，而Qwen3-Max的性能突破显示，继续增大数据、模型参数，依然能锻造出更强的模型，给予了大家更多的信心。目前，通义千问系列模型已经实现从0.5B到超万亿的全尺寸覆盖，包含三百多个大模型，可满足不同场景的需求。

即日起，用户可在通义千问QwenChat上免费体验Qwen3-Max，也可通过阿里云百炼平台调用API服务。

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

黄仁勋与马斯克同日发声：中国将成为全球AI领导者

当地时间7月25日，两位全球科技界的标志性人物——英伟达CEO黄仁勋和特斯拉CEO埃隆·马斯克——在同一天公开谈及中国人工智能发展。两人给出了几乎相同的判断：中国将成为全球AI领导者。黄仁勋此前在接受采访时明确表示，美国企业完全应当被允许使用来自中国的开源AI模型。他说得很直白：“这些中国模型非常优

标签：

黄仁勋

马斯克

ai智能
AI应用概念股爆发：资金正在从“造AI”转向“用AI”

7月27日，A股市场AI应用概念盘中异动拉升——智度股份直线涨停，此前苏州科达涨停，米奥会展涨超15%，宣亚国际、游族网络、福石控股、中文在线等跟涨。创业板人工智能板块同样表现强势，联特科技涨超6%，致尚科技、富瀚微涨超4%。人工智能ETF华夏持仓股中，海康威视涨4.62%领涨。为什么AI应用概念突

标签：

ai智能

ai技术
硅谷撕裂：开源 vs 闭源，一场由中国AI引爆的内战

7月，硅谷爆发了一场前所未有的内战。一方是OpenAI和Anthropic。它们认为，某些AI模型过于危险，不应以开放方式开发，而必须由像它们这样的企业进行严格控制。另一方是微软、英伟达、谷歌、Meta。它们主张开源AI模型必须保持开放，以便人们进一步开发技术、创立新的业务。这场争论的导火索是什么？

标签：

硅谷

开源项目

ai智能
Kimi K3正式开放下载：2.8万亿参数，全球最大开源模型来了

7月27日，月之暗面正式开放旗下模型KimiK3供公众下载。2.8万亿参数是什么概念？这是全球参数规模最大的开源权重模型。上下文窗口支持高达100万Tokens，能够在单次提示中处理大量文件或代码库。KimiK3于7月16日正式对外发布，在Arena全球AI大模型榜单的FrontendCodeAre

标签：

开源项目

大模型
科学智能产业化爆发前夜：AI正在把“十年”变成“三天”

在上海举办的WAIC2026上，AIforScience（科学智能，简称AI4S）成为最密集出现的词汇之一。多位专家判断，科学智能未来2-3年将进入产业化爆发期。AI到底给科研带来了多大改变？中国科学院发布了磐石·科学基础大模型2.0，依托800万条高质量科学推理数据。据中国科学院自动化研究所研究员

标签：

人工智能

ai智能
英伟达豪掷2500亿美元为OpenAI“兜底”：全球最大数据中心要来了

7月27日，一则消息引爆全球科技圈——英伟达正在与OpenAI谈判，拟为其提供约2500亿美元的融资担保。如果算上数据中心内部使用的芯片，总投资规模可能达到约5000亿美元，这将是迄今为止宣布的规模最大的数据中心项目。这个项目有多大？该项目位于美国俄亥俄州南部，由日本软银集团旗下的能源子公司开发，规

标签：

英伟达

ai智能

2026年最新调用Kimi K3的路径：API接入非线智能API实现稳定高并发

在2026年的AI应用开发生态中，大语言模型已成为驱动业务创新的核心引擎。对于国内的技术团队和决策者而言，如何在生产环境中稳定、高效地调用全球顶尖的AI大模型，尤其是像KimiK3这样备受关注的模型，是一个至关重要的技术选型问题。常常面临网络延迟高、连接不稳定、甚至服务中断的风险，这直接影响了用户体

标签：

AI大模型
为什么说非线智能API是2026国内Claude开发者最便捷稳定的AI大模型API中转接入方式

在2026年的今天，大模型应用早已从“能不能用”的探索阶段，全面迈向了“如何用得稳、用得好、用得值”的生产力深耕期。对于国内广大的技术从业者、AI应用开发者以及企业级决策者而言，接入顶级大模型，尤其是以强大推理和代码能力著称的Claude系列，早已不是技术上的难题，而是横亘在面前的“稳定性、合规性、

标签：

OpenClaw
端侧AI概念股逆势涨停：7款手机AI获批备案，合规化加速落地

7月24日，A股市场整体表现平淡，但端侧AI概念板块却逆势活跃。博通集成（603068）盘中直线拉升涨停，晶晨股份、翱捷科技、瑞芯微、乐鑫科技、全志科技等个股纷纷跟涨。消息面的催化剂是什么？近日，依据《生成式人工智能服务管理暂行办法》，中国网信网公布了新增的7款提供手机端侧生成式人工智能服务的备案信

标签：

手机ai
微软发布两款自研AI模型：不抄别人作业，自己从头写

当地时间7月23日，微软宣布推出两款新的自研AI模型——MAI-Image-2.5-Pro和MAI-Voice-2-Flash，目前均已进入公开预览阶段。这两款模型分别面向高质量图像生成和高并发语音交互场景。但真正让行业关注的，不是它们的功能，而是微软做这两款模型的方式。微软说了三句话，句句都有深意

标签：

大模型

微软公司

ai智能

加载更多

阿里发布Qwen3-Max，性能超GPT5，跻身全球前三

相关文章

黄仁勋与马斯克同日发声：中国将成为全球AI领导者

AI应用概念股爆发：资金正在从“造AI”转向“用AI”

硅谷撕裂：开源 vs 闭源，一场由中国AI引爆的内战

Kimi K3正式开放下载：2.8万亿参数，全球最大开源模型来了

科学智能产业化爆发前夜：AI正在把“十年”变成“三天”

英伟达豪掷2500亿美元为OpenAI“兜底”：全球最大数据中心要来了

2026年最新调用Kimi K3的路径：API接入非线智能API实现稳定高并发

为什么说非线智能API是2026国内Claude开发者最便捷稳定的AI大模型API中转接入方式

端侧AI概念股逆势涨停：7款手机AI获批备案，合规化加速落地

微软发布两款自研AI模型：不抄别人作业，自己从头写

热门排行

编辑推荐