1. 创业头条
  2. 前沿领域
  3. 人工智能
  4. 正文

率先全面开放,文心一言为何一骑绝尘?

 2023-09-01 13:48  来源:A5专栏  我来投稿 撤稿纠错

  【推荐】海外独服/站群服务器/高防

连续两天,半夜爆出大消息。先是华为新机深夜上线,让芯片国产替代的步伐更进一步;次日晚,百度文心一言官宣向公众全面开放——两大劲爆消息直接点燃科技圈。

8月31日凌晨,百度官方公众账号即发布推文,称“文心一言向全社会开放”,用户可以在应用商店下载“文心一言APP”或登陆“文心一言官网”体验。包括百度文心一言在内,一共有8个企业/机构的大模型位列第一批名单,可以正式上线面向公众提供服务,值得注意的是,被看作文心一言竞争者的阿里通义千问、360智脑、讯飞星火等,不在首批获批名单中。

随后“文心一言APP”在各大应用商店冲上热榜,在苹果App Store上更是直接登顶免费榜榜首,成为当日热门应用,这无疑让百度再一次占得了先机。

此前,在获得备案审批之前,各家只能小范围内测,用户需要“排队”申请内测资格,由此大大限制了大模型在用户层面的推广,如今大模型备案获批和全面开放,大模型的步伐有望迈入下一阶段。

秉持着技术自主的理念,将资金大规模倾斜到自主技术研发的百度和华为,可以说是殊途同归,而软硬件领域的“双子星”联袂,共同推动技术投入走向“开花结果”。

技术坚守,换来厚积薄发

大模型在国内掀起新一代技术浪潮,迅速席卷了整个互联网,而百度在大模型赛道上的步伐一直领先。2019年第一个发布了文心大模型,2023年,大厂中最早推出大语言模型“文心一言”,如今又率先获批、得到认可,正式向全社会开放。

百度之所以快速踩在了大模型的全球性技术风口上,是建立在百度雄厚的技术基底之上。

早从2010年开始,百度就已经着手布局AI相关技术的研发,近十年来,累计研发投入超过 1400 亿元。其中2022 年研发费用高达 214.16 亿元,占百度核心收入比例达到 22.4%。与全球其他大厂相比,这些投入也是数一数二。

在高研发成本的持续投入下,这些年从最初探索深度学习等基础技术,到推动AI在互联网等场景试点落地,再到如今扎根千行百业、大力推进AI工业化大生产等,百度既完成了在芯片、框架、模型和应用四层构架对应的自研技术积累,具备了做AI基础设施供给者的前提条件,又成功引领了AI技术成果在产业层面的实践,降低了人工智能的开发和应用门槛。

这也使得百度无论在技术专利、技术产品还是技术应用上,都占据了领先地位。以专利来看,根据由国家工业信息安全发展研究中心、工信部电子知识产权中心发布的《中国人工智能专利技术分析报告(2022)》显示,百度AI专利申请量1.68万件,连续五年保持中国第一;专利授权量上,百度仍以5705件专利授权量位列第一。

文心一言大模型,正是百度多年技术积累和产业实践的水到渠成,而基于技术和实践的领先优势,文心一言问世不到半年,在国内外多家调研机构、权威媒体和高校等发布的大模型评测报告中,表现优异。

如IDC最新发布的《AI大模型技术能力评估报告,2023》,报告显示,百度文心大模型3.5拿下12项指标的7个满分,综合评分第一,算法模型第一,行业覆盖第一。其中算法模型是大模型能力最为核心的要素,百度文心大模型在这一维度获得了唯一的满分。

更令外界欣喜的是,从测评来看,百度文心一言大模型能力从5月至今不断提升,正在逐渐赶上国外大模型。

百度「AI大底座」的全栈能力,助力文心一言进化

31日凌晨全面开放后,百度文心一言APP迅速飙升至苹果商店免费榜榜首,成为首个登顶应用商店榜首的中文AI原生应用。

用户的反响,透露出他们对文心一言表现出的强劲进化能力的期待。自今年3月发布至今,文心一言快速成长,熟练掌握的创作体裁超过200个,内容丰富度是发布初期的1.6倍,思维链长度是初期的2.1倍,知识点覆盖达到初期的8.3倍。在一些公开测评中,文心大模型3.5版支持下的文心一言中文能力突出,甚至有超出GPT-4的表现。

这很大程度上得益于百度飞桨,百度拥有自研的深度学习平台飞桨,它有力支撑了大模型的高效训练和推理。通过飞桨端到端自适应混合并行训练技术以及压缩、推理、服务部署的协同优化,文心大模型训练速度达到原来的3倍,推理速度达到原来的30多倍。

飞桨和文心一言,一个是框架平台,一个是大模型,这两者之间正好处在人工智能技术体系里面很重要的两层,它们之间有很强的协同优化潜力,由此飞桨领先的训练技术,能够优化大模型的训练效率。

百度不单单在框架层和模型层拥有关键技术。进入人工智能时代,IT技术的技术栈发生了根本性变化,从过去三层转变为“芯片-框架-模型-应用”四层,百度则是全球为数不多、进行全栈布局的人工智能公司。从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,及搜索、智能云、自动驾驶、小度等应用,各层都有领先业界的关键自研技术。

如框架层上,百度从2016年就开源了飞桨深度学习框架,目前这一框架已经集成了深度学习核心训练和推理框架、基础模型库、端到端开发套件等工具组件,在中国市场份额中排行第一。

全栈布局的优势在于,可以在技术栈的四层架构中,实现端到端优化,大幅提升效率,飞桨和文心一言的优化,就是最典型的例子。另外,芯片、框架、大模型和终端应用场景,也可以形成一个高效的反馈闭环,帮助大模型不断去调优迭代,越做越好。

比如文心一言与搜索、信息流等应用层的协同。百度的搜索服务,每天响应几十亿次真实的用户使用需求,每天进行1万亿次深度语义推理与匹配,能够提供最真实、最及时的反馈,从而倒逼大模型、深度学习框架和芯片的优化。相对地,文心一言应用于搜索,也将带来搜索的变革。

除了全栈自研的「AI 大底座」,百度智能云推出的两大AI工程平台—「AI 中台」和「百度百舸· AI 异构计算平台」,也分别在开发和资源层面进行提效,加速训练过程。这给文心一言的成长提供了最坚实的技术支撑,也成为其追赶国外大模型的底气。

核心能力升级,百度加速大模型落地时代到来

5月底举行的2023万象·百度移动生态大会上,百度搜索宣布“AI伙伴”开始内测。这款全能的“Al伙伴”能够听懂用户的任何问题,并用语音进行互动,还能帮助用户标记答案中的重点,提供权威的来源。在演示中,“Al伙伴”完整地提供了一篇人工智能大会主持词。

百度旗下各类用户侧产品正在利用大模型进行重构,而基于大模型基座和云平台进行开发生态的建设也在同步推进。前不久,百度承办的2023 WAVE SUMMIT上,推出了“超级助理”和“Comate X智能编程助手”。

理解、生成、逻辑和记忆,构成了一个人工智能或者通用人工智能系统最基本的能力,从文心一言在C端及B端应用上的表现来看,这四大核心能力正在快速提升,而背后展示出的则是百度在知识增强、检索增强、对话增强方面的关键技术能力和差异化优势。

庞大的知识图谱和搜索基础上对真实数据和用户需求的理解,是百度多年来构建技术护城河和打造内容生态的基础,因而作为百度自主研制的知识增强大语言模型,文心一言在知识增强和检索增强方面天然具有优势。

据悉,百度文心大模型拥有世界上最大规模知识图谱,包含50亿实体、5500 亿级事实,每天调用量超过400亿次。

在对话增强方面,百度深耕对话技术多年,前不久,王海峰带领团队完成的「知识与深度学习融合的通用对话技术及应用」成果,荣获了「2022 年度吴文俊人工智能科技进步奖特等奖」,这是该奖项设立以来颁发的首个特等奖。对话技术所涉及的记忆机制、上下文理解和对话规划能力,能够帮助文心一言实现更好的对话连贯性、合理性和逻辑性。

百度已经构建了面向中文、服务应用、富含知识的多样化训练数据,并建立起人类反馈、奖励模型和策略优化之间的飞轮机制,随着真实用户的反馈越来越多,文心一言的效果会越来越好,能力也越来越强。

而今,文心一言率先面向用户全面开放,也就说未来能获得更海量的真实世界中的人工反馈,这将进一步改进基础模型,助力文心一言加速迭代、提升能力。而且,对用户层面的放开,会刺激大模型竞争焦点转向应用层,激起应用开发的创造活力,基于文心一言的领先,百度未来或将率先带来杀手级应用,真正引领大模型进入落地时代。

这亦是用户想从这场技术性浪潮看到的,弯道超车,占领新一代技术变革的制高点。

道总有理,曾用名歪道道,互联网与科技圈新媒体。同名微信公众号:道总有理(daotmt)。本文为原创文章,谢绝未保留作者相关信息的任何形式的转载。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
文心一言

相关文章

  • 为何海尔智家能够做到“换新不厌旧”?

    在繁忙的城市角落,张先生的小公寓里藏着一个宝贝——一台20年前的海尔老式彩电。这台电视见证了他的拼搏、快乐和岁月的流转。虽然他对新科技并不感冒,但他的儿子小张对此却充满了好奇和热情。小张在线上看到以旧换新活动的同时,说服了张先生,并在手机上下单预约上门服务。没多久,服务人员便上门拆走旧家电,安装调试

    标签:
    海尔智家
  • 也谈谈AI洗稿

    前几天腾讯发了个公告称:平台巡查发现有些MCN和作者发布大量“AI洗稿”内容。并宣称要对“AI洗稿”行为进行打击,同时鼓励合理运用AI技术。其实我是想借此机会,给大家说说“AI洗稿”这件事,隐秘在黑暗角落里的赚钱行为。“洗稿”就是把别人的文章用AI工具修改润色一下或调整段落,然后再发到自媒体平台上,

    标签:
    ai智能
  • 竞逐智能家居大模型:美的“蓄力”,海尔“疾行”

    随着ChatGPT火热出圈,AI大模型便成为了各行各业必争的高地。

    标签:
    智能家居
  • 李彦宏新目标,押注AI原生应用

    文/道哥“未来,自然语言将成为新的通用编程语言。你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”4月16日,百度创始人、董事长兼首席执行官李彦宏在Create2024百度AI开发者大会上表述了对未来AI人工智能发展的新一轮展望。自OpenAI发布ChatGPT大模型后,这股AI人工智能

    标签:
    李彦宏
  • AI算力竞赛加速散热技术变革,液冷方案获行业青睐

    进入AIGC时代,智算中心规模日渐庞大,服务器能耗与日俱增。如何降低智算中心能耗已成为国家和地方政府关注的焦点。工信部数据显示,2022年全国数据中心总耗电量约2700亿千瓦时。当前,大部分数据中心仍主要采用风冷散热技术,在单柜密度、PUE值方面已愈发难以满足行业发展及绿色节能方面的要求,而冷板式液

  • 中国AIGC最值得关注企业&产品榜单揭晓!首份应用全景图谱发布

    “你好,新应用!”站在大模型落地元年,是时候喊出这句话了。从软件APP、智能终端乃至具身智能等等,AIGC开始席卷一切。大模型玩家、互联网巨头、终端厂商、垂直场景玩家纷纷入场,办公、创作、营销、教育、医疗领域相继被渗透……一个万亿市场,正在酝酿。站在浪潮起点,当下发展究竟如何了?机遇在哪?挑战如何?

  • 标准引领促转型 提升新质生产力——2024数字教育标准创新应用研讨会召开

    4月14日,以“标准引领促转型,提升新质生产力”为主题,由全国信息技术标准化技术委员会教育技术分技术委员会主办,锐捷网络承办的2024数字教育标准创新应用研讨会暨《高等学校数字校园建设规范(试行)》(以下简称《规范》)优秀及典型应用案例的颁奖活动在福州举办。本次会议聚焦赋能新质生产力和高校教育数字化

  • 两座超大城市对“视”联手 杭深奏响智能物联产业合鸣!

    春至岭南花似锦,出门俱是看花人。4月16日,2024“中国视谷”城市(深圳)推介会暨智能物联产业合作发展论坛在深圳举行。一场广聚全球英才的产业思想盛宴就像早春的花潮,召示着智能物联产业合作发展的丰硕成果正在孕育、成长。站在时代的风口和机遇中瞭望,智能物联产业是人工智能和物联网融合与应用的战略性新兴产

  • AI提高效率:用智谱清言打造爆款视频号

    关注卢松松,会经常给你分享一些我的经验和观点。(1)想做副业、短视频的同学,看完本文一定对你有所帮助!(2)很多人说2024是视频号红利的一年,有分成收益,广告主也多,流量大。(3)松松一共做了10多个视频号,在视频号布局3年了,几乎啥都做过,有的收益千八百、有的收益1-2k,有的收益3-5k。(4

    标签:
    ai技术
  • CPU上跑AI?从推荐系统的演进看CPU的崛起

    在信息和数据极度繁荣的当下,人工智能正在通过各种方式影响着人类生活。其中,AI推荐系统作为互联网时代最关键的伴生技术之一,正在帮助人类梳理着各种纷繁杂乱的信息,让资源实现更精准的调配,让一切变得井然有序。推荐系统:数字营销的重要引擎当你到一座旅游城市,不知道当地有什么美食时,AI推荐系统在手机上的本

编辑推荐