科大讯飞：星火大模型快进入Next-level了

2024-07-03 13:55 来源：A5专栏我来投稿撤稿纠错

OpenAI一纸禁令，挑动了大模型行业的神经。但没有什么阻碍，可以抵挡技术向上的决心。在不少大模型厂商开出优惠价格，试图从OpenAI禁令中截流用户的同时，国产大模型的代表企业科大讯飞，拿出了直面技术挑战的勇气。

6月27日，科大讯飞在北京国家会议中心举行讯飞星火4.0发布会。在“懂你的AI助手”这个主题下，讯飞星火大模型不但在8个国际主流测试集中排名第一，实现了对GPT-4 Turbo的全面对标，还对商业化落地、生产力探索做出了更全面的阐释，前瞻了行业的“Next-level”。

这一次，星火大模型掀起了新的巨浪。

自力更生，星火大模型成国产力量代言人

在国内外总共覆盖中英文的12项主流测试集，讯飞星火大模型V4.0在其中8项全面超越了GPT-4 Turbo、Claude 3 Opus、Gemini 1.5 Pro。后面这三位，正是目前英文世界大模型的战力天花板选手。

换一个指标，去年，科大讯飞参与设计了国产通用认知智能大模型测评体系，包含由481个测试项组成的7个方面。而如今，星火大模型V4.0在其中的文本生成、语言理解、知识问答、逻辑推理、数学能力五个方面超越了GPT-4 Turbo，仅在代码能力和多模态能力上仍有一定差距。

不过从数据来看，文本生成（80.2%）、语言理解（82.3%）、知识问答（85.7%）、逻辑推理（82.2%）、数学能力（86.5%）、代码能力（81.2%）、多模态能力（78.4%）这组数据放在一起，星火大模型V4.0总体已然算是国产大模型的能力代表。

具体来看，GPT-4 Turbo、Claude 3 Opus和星火大模型V4.0，重点都放在多维度信息组成的复杂指令、更考验逻辑任务能力的空间推理等高阶能力上。根据科大讯飞发布会现场的介绍，星火大模型V4.0不仅在长文本等通用能力上整体打平GPT-4 Turbo，而且更加擅长利用已有资料进行联系推理——比如解读几张有联系的图片的关系，为其补全内容情节，并减少“幻觉”的出现。

有趣的地方在于，星火大模型V4.0其实在多模态能力方面，实现了对GPT4-Turbo的部分超越，比如科研、金融、医疗、司法和办公等专业领域的图文识别能力。这代表星火大模型V4.0的侧重点明显不同于普通的通用大模型。它更侧重于某些垂直领域的应用潜力。

对此，科大讯飞董事长刘庆峰在演讲中做了一些阐述：“大模型不仅可以写诗、作画，在改变工业、改变科研范式等方面已经实实在在发挥作用，包括我们和中国科学技术大学做的合成类的科学创新，比如说化学；还有与合肥综合性国家科学中心能源研究院合作，在推进大模型赋能核聚变整个过程中更快地预测、更好地应对各种各样的异常情况。”

应用，已经成为星火大模型V4.0的重头戏。只有真正用起来，能力才会有价值。

以讯飞星火APP为例，自2023年9月全面开放以来，讯飞星火APP在安卓公开市场累计下载量达1.31亿次。现在，全新升级的讯飞星火APP，允许消费者用自己的知识库打造“更懂你的AI助手”。换句话说，专属于个体的智能体。

按照刘庆峰在演讲中透露的信息，讯飞星火APP使用的高峰期是工作日的工作时间段，意味着它真的变成了不少用户的刚需。这是对“AI只能用来玩玩”的刻板印象的有力回击，也是星火大模型价值的体现。

但更让人激动的应用，其实还在蓄力。个人能从星火大模型中找到助手，企业乃至社会，将从中汲取更大的力量。这就是整个大模型产业的“Next-level”，它的亮点就在落地的最后一公里，以及那些暂时还是畅想的形式。

真正的Next-level，藏在最后一公里

几个简单的问题，可以让我们对星火大模型V4.0的未来进化更有数。

首先，智能体为什么值得期待？九合创投在近日召开的年会上发布了《不朽的计算：比特连接世界，词元生成未来》报告。其中提到，“模型是能够沉淀智慧的计算形态”。传统算法是数学结果，一次使用不具备普及性。但模型可以持续进化，适应多维度的使用需求。而封装为智能体之后的超级模型，已经是特定领域的智慧结晶。它具有不可估量的复用价值。

以星火企业智能体平台为例，科大讯飞已经首批创建了32个企业智能体，可以深入业务流程，满足企业的需求。而这个过程其实非常轻松，企业只需要提出需求就可以开始创建智能体，经过功能验证后，就可以真实上马，并可以和企业内部办公平台打通。

从市场价值来看，讯飞星火大模型从去年发布到现在，已经和国家能源集团、中国石油、中国移动、交通银行、大众汽车、海尔集团、美的集团等行业领军企业建立合作，证明其使用价值得到一线认可。

其次，为什么是讯飞？因为企业智能的底层除了大模型技术，还有对企业业务的理解，对分门别类的场景的认知，这不是坐在办公室里就能拍脑袋想出来的。讯飞建立这些认知，花费了数十年的时间和遍布各行各业的具体尝试。所以，智能体是新物种，但在讯飞和星火大模型的共同支持下，它会很快和现有生态相融。

换句话说，讯飞的领先，是星火大模型的技术领先和自身To B和To G业务领先的复合结果。2024年6月，讯飞刚刚荣获国家科学技术进步奖一等奖，获奖项目名为“多语种智能语音关键技术及产业化”，技术和产业化的双剑合璧，成为一块勋章。上半场的技术较量，讯飞能和OpenAI掰手腕。下半场的应用较量，讯飞更懂中国市场。

最后，星火大模型V4.0背后的进化，对智能体概念的探索，远期价值恐怕会远超普通人的想象。目前，还只是这个概念的蓄力阶段。

一个很关键的问题是，从GPT-4 Turbo到星火大模型V4.0，我们越来越关注大模型的多模态能力、空间和逻辑推理能力、对复杂指令的理解和执行能力等等。这种需求引导下发展的大模型和智能体，注定用于和现实世界融合交互。

现代机器人之父罗德尼·布鲁克斯（Rodney Brooks）在1991年发表的《没有表征的智能》论文中提出，传统智能基于复杂算法和内部数据模型是错误和片面的，真正的智能行为要从自主机器与环境的物理交互中产生。这个想法更加适合今天大模型和智能体的发展，或者说“具身智能”的概念——能理解和推理物理世界，并且产生互动。

“AI教母”李飞飞选择的创业方向就是与之类似的“空间智能”。她曾在TED的演讲上举过一个例子——一张猫伸出爪子将玻璃杯推向桌子边缘的图片。她说，人类大脑可以评估“这个玻璃杯的几何形状，它在三维空间中的位置，它与桌子、猫和所有其他东西的关系”，所有推理都基于这些认知。

无疑，星火大模型V4.0也好，GPT-4 Turbo也罢，都是在朝着这种意义上的智能发展。

刘庆峰曾提出星火大模型的四条商业化路径，其中一条就是基于“超脑2030计划”推动机器人走进千家万户，重头戏在于全栈机器人能力，而这又源于大模型的多模感知和多维表达。

对科大讯飞来说，好消息是它所掌握的应用经验，很有可能让星火大模型在向空间智能、具身智能的发展过程中步步领先。比如现在，星火个人智能体和企业智能体的落地，其实已经在调动现实要素对大模型和智能体进行完善。只不过，目前的应用停留在数字空间，还没有深入现实进行交互。

但我们相信，这一天会比想象的更早到来。毕竟，从去年的星火大模型1.0版本到如今的4.0版本，科大讯飞从无到有，创造出世界一流的大模型能力和应用，已然是一个奇迹。

而在当下这个世界中，地缘层面的割裂已经影响到大模型世界的完整性。当OpenAI发出断供宣言，有星火大模型这样的一线玩家能够顶上，不得不说是中国大模型产业的幸运。在这一年，中国人工智能领域的实力，正在这些领先者身上，闪耀着新的光芒。

来源：松果财经

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

相关标签: 大模型

货运大模型的未来：轻量化、场景化

要想跑得快，轻量化是大模型最好的路

标签：

大模型
大模型产品的“命名经济学”：名字越简单，产品越火爆？

名字越简单，产品越火爆？

标签：

大模型
26岁的“天才少年”，带队面壁打通高效大模型之路

每一轮技术浪潮出现时，冲在最前面的都是朝气蓬勃的年轻人。当大模型代表的人工智能浪潮席卷全球，作为移动互联网“原住民”的年轻开发者，可以说是最活跃的群体。他们的脸庞还有些稚嫩，但在技术和方向上有着自己的想法，在火热的AI赛道里加速狂奔，努力打下一片新天地。面壁智能CTO曾国洋就是其中的佼佼者，26岁的

标签：

大模型
价格战迷雾下，大模型创业者只能被动挨打？

如果说2023年是大模型的资格赛，融资额度决定了能否晋级，2024年已然快进到了淘汰赛的阶段。字节跳动、阿里云、百度智能云、腾讯云等先后在5月中下旬加入“价格战”，轻量级模型直接免费，主力模型的API价格普遍下调了90%以上。曾经以“烧钱”著称的大模型，迅速进入到“白菜价”时代。当时就有人提出这样的

标签：

大模型
MaaS玩家：希望AI大模型价格战再狠一点

明知产能严重过剩的新能源企业却还在重金扩产，多半因为他们花的不是自己的钱；明知极度烧钱的AI大模型却开始打价格战，多半因为他们并不靠这东西挣钱。所有投资人必备的一项技能，就是中观行业景气度及商业模式对比。很明显，AI有很多的商业逻辑与其他行业非常相似。就比如：有实力的才能卷、免费的往往才是最贵的。打

标签：

大模型

大模型抢滩高考志愿填报，能否顶替「张雪峰」们？

文/二风来源/节点财经每年高考成绩放榜后，数千万考生和家长将迎来另一场硬仗——填报志愿。今年，这一领域迎来了AI的全面介入，多家互联网大厂和教育公司纷纷推出智能志愿填报产品，为考生提供院校和专业选择建议。据艾媒咨询数据，2023年中国高考志愿填报市场付费规模约9.5亿元，近九成考生愿意借助志愿填报服

标签：

大模型
苹果AI掉队？现在唱衰或许还为时过早

苹果还没从WWDC25的“群嘲”中走出，又迎来了一次新的痛击。据路透社报道，21日，苹果公司遭到股东集体起诉，被指在信息披露中低估了将先进生成式AI整合进语音助手Siri所需的时间，导致iPhone销量受影响、股价下滑，构成证券欺诈。在这份诉讼中，库克、首席财务官凯文·帕雷克及前首席财务官卢卡·马埃

标签：

苹果公司

ai智能
DeepSeek、豆包向左，盘古大模型向右

华为的盘古大模型终于推出新版本了。6月20日华为云计算CEO张平安宣布基于CloudMatrix384超节点的新一代昇腾AI云服务全面上线，盘古大模型5.5同步发布。不过，当前国内的AI大模型竞争可谓是相当激烈，华为的盘古大模型在众多大模型中并不是十分出众。华为云此次重磅推出的盘古大模型5.5能否从

标签：

deepseek

豆包ai

盘古大模型
数字人罗永浩一场直播卖了5000万，数字人能取代真人主播吗？

一场没有罗永浩的“罗永浩直播”，正在改写带货规则当数字人罗永浩在百度直播间举起青岛啤酒，以标志性幽默回应粉丝提问时，弹幕疯狂刷出“这是真的还是假的？”的疑问。这场持续近7小时的直播，创下1300万人次观看、GMV突破5500万元的惊人战绩，甚至超过了他本人一个月前真人直播5000万元的成绩。数字人主

标签：

数字人

数字人直播

罗永浩
新东方发布首款原创AI教育产品，开启一对一智能学习时代

高频互动、个性化教学、突破成本壁垒，AI老师让英语学习更普惠。6月24日，新东方正式推出面向消费者的首款原创AI教育产品——“新东方AI1对1”。这款产品标志着新东方在教育+AI战略布局中迈出关键一步，旨在以科技力量推动优质教育资源的普惠发展。在发布会现场，新东方教育科技集团CEO周成刚表示：“AI

标签：

ai智能
AI工作流是什么？coze扣子工作流怎么搭建和使用？

大家好，我是白杨SEO，专注SEO十年以上，全网SEO流量实战派，AI搜索优化研究者。为什么想分享这个AI工作流及coze扣子这个？因为我们搞流量的如果学会了用AI给我们生产提效将更有助于我们去获客。目前白杨SEO用得并不是很好，分享仅供参考，希望给你一些启发。老规矩，先说下文章大纲如下：1、AI工

标签：

ai智能

特斯拉与百度在自动驾驶的全维度较量

将在2025年见分晓

标签：

自动驾驶

特斯拉

百度
2025年10个顶级GPU云平台：Serverless+RL开启AI普惠时代

近期，“AI新云”（NeoCloud）概念在科技圈和投资圈引发热潮。今年3月，被业内称作“英伟达亲儿子”的AI基础设施企业CoreWeave上市。这家依托英伟达GPU资源冲击新云市场的初创公司，上市不到3个月市值飙升359%，达881亿美元。CoreWeave的“身价暴涨”吸引了无数视线。对此，不少

标签：

ai智能
阿里巴巴梭哈AI

2024年往前数三年，我们称之为阿里巴巴失去的三年。

标签：

阿里巴巴

ai智能
华为盘古大模型5.5发布：深度思考模型将上线

一场人工智能领域的革新风暴正从华为开发者大会现场席卷全球产业界。2025年6月20日，在东莞举行的华为开发者大会HDC2025上，华为常务董事、华为云计算CEO张平安揭开了盘古大模型5.5的神秘面纱。这一全新版本在自然语言处理、计算机视觉、多模态、预测和科学计算五大基础模型上实现全面突破，标志着中国

加载更多

科大讯飞：星火大模型快进入Next-level了

相关文章

货运大模型的未来：轻量化、场景化

大模型产品的“命名经济学”：名字越简单，产品越火爆？

26岁的“天才少年”，带队面壁打通高效大模型之路

价格战迷雾下，大模型创业者只能被动挨打？

MaaS玩家：希望AI大模型价格战再狠一点

大模型抢滩高考志愿填报，能否顶替「张雪峰」们？

苹果AI掉队？现在唱衰或许还为时过早

DeepSeek、豆包向左，盘古大模型向右

数字人罗永浩一场直播卖了5000万，数字人能取代真人主播吗？

新东方发布首款原创AI教育产品，开启一对一智能学习时代

AI工作流是什么？coze扣子工作流怎么搭建和使用？

特斯拉与百度在自动驾驶的全维度较量

2025年10个顶级GPU云平台：Serverless+RL开启AI普惠时代

阿里巴巴梭哈AI

华为盘古大模型5.5发布：深度思考模型将上线

热门排行

编辑推荐