清华学霸引爆“长文本”大战，大模型的应用前景清晰了吗？

2024-04-02 13:30 来源：A5专栏我来投稿撤稿纠错

文 | 智能相对论

作者 | 沈浪

Long-LLM（长文本大模型）时代似乎来得有些突然，而引爆这场热潮的，竟是一家由清华学霸牵头的本土AI初创企业。

前不久，月之暗面（Moonshot AI）公司宣布旗下对话式 AI 助理产品 Kimi 应用现已支持200万字无损上下文输入。

对比去年10月份Kimi上线时仅支持的20万字，这一波升级直接提升了10倍文本处理能力，同时也引起了强烈的市场反应，特别是在资本市场，Kimi概念股应运而生，诸如九安医疗、华策影视、中广天择等都受益于Kimi概念而实现了股价不同程度的涨幅。

这些刺激更让大模型领域彻底卷起了长文本大战。

01 “长文本”大战，卷的不是字数而是财力

阿里率先完成自家的大模型产品升级，强化长文本处理能力，免费面向大众开放最高1000万字的长文本处理能力。

360则紧随其后，宣布旗下360智脑正式内测500万字的长文本功能，并在360AI浏览器开放给用户使用。

而百度也宣布在下个月进行版本升级，开放长文本能力，文字范围会在200万-500万字。

目前，文心一言的文本上限大致为2.8万字。而像GPT-4Turbo-128k公布的文本范围也不过为10万汉字，Claude3200k上下文约16万汉字。

可以说，这一波热潮直接把国内的大模型厂商一下子都拉进了百万量级的长文本竞赛，而主流厂商的入局也为这场“长文本”大战增添了很多看头。

目前来看，“长文本”大战的赛点主要呈现在两个方面。

一方面，是大模型的支持文本参数。类似阿里通义千问的1000万字、360智脑的500万字、百度文心一言的200万-500万字、Kimi的200万字等等，都在极力向市场争“彩头”，告诉用户自家的长文本处理能力足够“长”。

另一方面，是长文本处理能力的开放程度。有意思的是，Kimi是免费开放给用户使用的，阿里通义千问的长文本处理功能也是免费的，360智脑、百度文心一言也没有要收费的意思。——以“长文本”大战为例，今年的大模型竞争远比去年要“卷”得多。

还记得去年大火的妙鸭相机，以及各式各样的图片生成式服务，都或多或少地通过各种形式如充值、办会员等，要求用户付费才能体验。

今年大模型领域的这把“火”烧得旺，也烧的离奇地“free”。

为什么？

Kimi自升级以来，就有大量用户不断涌入，激增的流量更是一度让月之暗面（Moonshot AI）的服务器承受了巨大的压力，一度陷入宕机，旗下的App和小程序都无法正常使用。

根据月之暗面（Moonshot AI）发布的官方消息，从3.20观测到流量异常增高后，已经进行了5次扩容工作。推理资源会持续配合流量进行扩容，以尽量承载持续增长的用户量。

简单来说，用户对长文本功能是非常有兴趣的，相关的市场需求还在保持持续性的、爆炸性的增长。同时，大量的用户涌进，不仅提高了大模型产品的知名度，更重要的是在大量用户的基础上通过类似于UGC的模式去探索大模型的应用，或许更能进一步推动Long-LLM（长文本大模型）的商业化进程。

当然，在这个过程中，不可避免地就得投入大量资金，一旦商业化加速，大模型厂商就得做好“卷”财力的准备。

阿里通义千问目前免费对所有人开放高达万页的文档处理能力，如果要计算成本，按照目前最便宜的市价0.1元/页，10000页的文档光解析费用就要1000元，这还不包括解析完成之后大模型处理文档的成本。考虑到通义千问网页、APP、钉钉等多个端口的用户基数，需要投入的资金恐怕不会是个小数目。

大模型的商业化在开始阶段并非“赚钱”，而是“烧钱”。

02 长文本，直接“接驳”商业化场景

在大模型的商业化进程上，长文本的爆火是很关键的一环。

就大模型的技术原理而言，解决长文本问题是必要的。因为文本长度的提高，对应的模型能解决问题的边界也将大幅提升，两者呈现出明显的正向关系。

传统的文本处理模型受限于训练结构，可支持的文本范围都不算长，在处理复杂任务和深度专业知识（这一类知识往往都是长篇巨著）时，只能拆解输入训练，由此就有可能导致输出的结果上下文逻辑不连贯不顺畅等问题。

区别于传统的文本处理模型，长文本模型就具备更准确的文本理解和生成能力以及更强大的跨领域迁移能力。这对于打造垂直领域的行业专家是一个非常必要的能力支持，比如面向一些长篇巨制的医疗文献、法律文件、财务报告等，长文本模型就具备更好的理解能力，对应完成跨领域学习和应用，从而打造出更专业的医疗助理、法律助理以及金融助理等应用。

话不多说，实践一下。

在这里，「智能相对论」向阿里通义千问相继“投喂”了几本长达数百页的专业书籍，涵盖以《高产母猪饲养技术有问必答》为代表的农业养殖、以《犬猫营养需要》为代表的宠物喂养等等小众领域。

结果所能实现的效果确实令人惊讶，阿里通义千问不仅能高度概括总结这些长篇巨著的主要内容，还能有针对性的给出具体篇章的知识解答。比如，在《高产母猪饲养技术有问必答》一书中，「智能相对论」向其提问“夏季高温提问应该如何饲养母猪？”很快就得到了书中的精炼解答。

这意味着什么？只要用户有足够多的专业书籍“投喂”给大模型，那么大模型就可以成长为一个专业的专家助理，帮助用户快速解答相关专业问题。

在日常生活中，或许有很多书籍是我们没办法去仔细阅读和学习的，但是只要有长文本大模型予以支持，那么基本上人人都能创造一个专业的垂直领域助理。

这或许会颠覆现在我们获取信息、知识的渠道，去百度搜索或是去知乎提问、亦或是去小红书讨论这些路径都将被替代。

在Kimi开放20万字文本处理能力的时候，其做了一个简单的对比，20万字等于什么？答案是等于先秦的全部古籍。随着长文本大模型进入百万量级的迭代，那么这些能力还能实现进一步的进化，对应所赋予场景应用的机会就是无限的。

如今，在AI领域，Agent的话题也很火，被认为是下一个主流的应用形态。那么，打造Agent的关键是什么？答案正是大模型的长文本处理能力。

比如，Kimi就在帮助元隆雅图等公司进行营销升级，基于长文本处理能力来提供爆品文案分析、文案写作、市场分析、辅助营销策划等功能。

尽管现在很多相关的应用还处在探索阶段，但是谁又能确定下一个爆款应用不是出自自家的大模型+某个C端用户的想法/某个企业客户的业务融合？正因如此，大模型厂商们才不顾一切的升级并开放长文本功能，为下一场应用上的爆火做准备。

目前，长本文的火爆还只是技术上的，接下来的爆点大概率将是应用上的爆发。

03 写在最后

2024年是大模型大规模走向商业化的关键一年。从Kimi的火爆程度来看，以长文本为代表的技术迭代走向C端引发了非常积极的反馈。同时，在「智能相对论」的实践中，也预感这一能力随着技术的成熟和完善，必然会在C端用户的手中被“玩出花来”。

只是目前很多的“玩法”还缺乏打磨，显得比较粗糙。OpenAI在发布GPT商店时，就期望要打造一个全新的生态，人人都能创造自己的专属GPTs。

现在，摆在大众面前的长文本热潮，其实就是一个全民时代到来的信号。只要用户有书，会投喂，那么同样可以在国内的大模型平台上打造出属于自己想要的专业助理，进而延伸到应用端的火爆。

当然，在这个过程中，书籍的版权问题、平台的审核问题以及巨大的流量涌入所带来的诸多挑战和问题，也是大模型走向商业化的难点。但是，其根本的方向是清晰的，Long-LLM（长文本大模型）时代已经拉开序幕，从技术到应用，接下来大模型厂商们有得卷了。

说实在，就目前各大厂商公布的参数，从500万到1000万，基本上也足够用了。大模型在长文本技术层面或许不会再有什么值得卷了，哪怕是有也只是背地里正常迭代和发展。

接下来的爆点只能是往应用层面来看。不管是To C还是To B，谁家的平台最先把大众化的应用探索并验证出来，再加以打磨推向大众市场，那么谁就有可能成为下一个市场的宠儿。

*本文图片均来源于网络

此内容为【智能相对论】原创，

仅代表个人观点，未经授权，任何人不得以任何方式使用，包括转载、摘编、复制或建立镜像。

部分图片来自网络，且未核实版权归属，不作为商业用途，如有侵犯，请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能十万个为什么》

•【重点关注领域】智能家电（含白电、黑电、智能手机、无人机等AIoT设备）、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

百度智能云PaddleOCR 3.1正式发布：关键能力支持MCP

百度AI团队今日正式推出PaddleOCR3.1版本，以突破性的多语言组合识别（MultilingualCompositionPerception,MCP）技术为核心，彻底重构复杂文档处理边界。此次升级标志着OCR领域首次实现对同一文档内任意混合语言文本的精准识别，为全球化企业、跨境业务及多元文化场

标签：

ai智能

ai技术
宇树科技加速冲刺科创板IPO，人形机器人龙头估值飙至120亿元

“宇树已形成硬件、算法、场景联动的业务飞轮，自研率超95%的技术壁垒让其成为全球机器人赛道不可忽视的中国力量。”首程资本管理合伙人朱方文在追加投资时如是评价。7月7日，据每日经济新闻从宇树科技投资方处获悉，国内人形机器人领军企业宇树科技（UnitreeRobotics）已明确计划于科创板IPO，预计

标签：

宇树科技
OpenAI推出GPT-5：AI大统一时代的到来？

推理与多模态的终极融合，将彻底终结用户在不同模型间切换的烦恼。7月7日，OpenAI正式确认将在今年夏季推出新一代人工智能模型GPT-5。这一突破性产品将整合现有的多个强大模型，特别是融合专注推理能力的“O系列”与具备多模态功能的“GPT系列”，为用户提供前所未有的统一体验。OpenAI开发者体验负

标签：

chatgpt
中小AI企业，没有“高考”资格

高考一结束，忙坏了海内外一众大模型。豆包、DeepSeek、ChatGPT、元宝、文心一言、通义千问……掀起了一波“AI赶考”大战。据悉，去年高考期间，大模型的成绩才勉强过一本线，今年集体晋升985。据悉，豆包甚至过了清北的录取线。头部大模型在高考“考场”上玩得不亦乐乎，中小AI创企的处境却日益尴尬

标签：

ai智能
大模型抢滩高考志愿填报，能否顶替「张雪峰」们？

文/二风来源/节点财经每年高考成绩放榜后，数千万考生和家长将迎来另一场硬仗——填报志愿。今年，这一领域迎来了AI的全面介入，多家互联网大厂和教育公司纷纷推出智能志愿填报产品，为考生提供院校和专业选择建议。据艾媒咨询数据，2023年中国高考志愿填报市场付费规模约9.5亿元，近九成考生愿意借助志愿填报服

标签：

大模型
苹果AI掉队？现在唱衰或许还为时过早

苹果还没从WWDC25的“群嘲”中走出，又迎来了一次新的痛击。据路透社报道，21日，苹果公司遭到股东集体起诉，被指在信息披露中低估了将先进生成式AI整合进语音助手Siri所需的时间，导致iPhone销量受影响、股价下滑，构成证券欺诈。在这份诉讼中，库克、首席财务官凯文·帕雷克及前首席财务官卢卡·马埃

标签：

苹果公司

ai智能

DeepSeek、豆包向左，盘古大模型向右

华为的盘古大模型终于推出新版本了。6月20日华为云计算CEO张平安宣布基于CloudMatrix384超节点的新一代昇腾AI云服务全面上线，盘古大模型5.5同步发布。不过，当前国内的AI大模型竞争可谓是相当激烈，华为的盘古大模型在众多大模型中并不是十分出众。华为云此次重磅推出的盘古大模型5.5能否从

标签：

deepseek

豆包ai

盘古大模型
数字人罗永浩一场直播卖了5000万，数字人能取代真人主播吗？

一场没有罗永浩的“罗永浩直播”，正在改写带货规则当数字人罗永浩在百度直播间举起青岛啤酒，以标志性幽默回应粉丝提问时，弹幕疯狂刷出“这是真的还是假的？”的疑问。这场持续近7小时的直播，创下1300万人次观看、GMV突破5500万元的惊人战绩，甚至超过了他本人一个月前真人直播5000万元的成绩。数字人主

标签：

数字人

数字人直播

罗永浩
新东方发布首款原创AI教育产品，开启一对一智能学习时代

高频互动、个性化教学、突破成本壁垒，AI老师让英语学习更普惠。6月24日，新东方正式推出面向消费者的首款原创AI教育产品——“新东方AI1对1”。这款产品标志着新东方在教育+AI战略布局中迈出关键一步，旨在以科技力量推动优质教育资源的普惠发展。在发布会现场，新东方教育科技集团CEO周成刚表示：“AI

标签：

ai智能
AI工作流是什么？coze扣子工作流怎么搭建和使用？

大家好，我是白杨SEO，专注SEO十年以上，全网SEO流量实战派，AI搜索优化研究者。为什么想分享这个AI工作流及coze扣子这个？因为我们搞流量的如果学会了用AI给我们生产提效将更有助于我们去获客。目前白杨SEO用得并不是很好，分享仅供参考，希望给你一些启发。老规矩，先说下文章大纲如下：1、AI工

标签：

ai智能

加载更多

清华学霸引爆“长文本”大战，大模型的应用前景清晰了吗？

相关文章

百度智能云PaddleOCR 3.1正式发布：关键能力支持MCP

宇树科技加速冲刺科创板IPO，人形机器人龙头估值飙至120亿元

OpenAI推出GPT-5：AI大统一时代的到来？

中小AI企业，没有“高考”资格

大模型抢滩高考志愿填报，能否顶替「张雪峰」们？

苹果AI掉队？现在唱衰或许还为时过早

DeepSeek、豆包向左，盘古大模型向右

数字人罗永浩一场直播卖了5000万，数字人能取代真人主播吗？

新东方发布首款原创AI教育产品，开启一对一智能学习时代

AI工作流是什么？coze扣子工作流怎么搭建和使用？

热门排行

编辑推荐