汽车AI语音交互正在让机器交互更接近真人交互

2020-05-01 18:09 来源：A5专栏我来投稿撤稿纠错

　一键部署OpenClaw

文|胡杨胡皓

来源|智能相对论（ID：aixdlun）

- 今天天气怎么样？

- 今日是晴天，气温17到22度，东北风3到4级。

- 那周五呢？

- 周五距今天还有2天。

“重复唤醒，答非所问，这不是人工智能，是‘人工智障智障’。”这是大部分智能网联汽车用户对语音交互的抱怨。

现在，情况有了改善。当用户询问车机“明天出门需要带伞么?”，车机就会播报明天的天气情况，如果需要再查询其他时间或者城市的天气，那么用户不用重新唤醒，也不需要说出完整表达，只需要说“那大后天呢？”、“那杭州呢？”。在用户和车机在自然连续对话的过程中，语义理解服务会记住会话的历史，并结合历史处理用户的请求，通过这种方式，用户的多次连续交互就可以形成一个会话流，与用户的交互也更加自然。

自然连续对话，是车载语音交互从“人工智障”迈向“人工智能”的重要一步。不过斑马网络最近推出的斑马智行VENUS系统，打破了对用户说话规则的要求，用户可以按照自身的说话习惯来进行交流，交互过程更加人性化。这会不会是一个跨越？

从科幻到现实，语音交互一直在进化

提到智能语音交互，普罗大众对于技术刷屏的记忆停留在2018年的Google开发者大会“Google I/O”开幕式上。当Google Assistant以惊人的流利会话，打电话和店家沟通，预约理发店、餐厅，并用一句俏皮的“嗯哼”作为回应时，观众给予了热烈的掌声。这是技术愿景美好、激励人心的一面。

有趣的是，同年2月的美国第五十二届超级碗的天价广告上，亚马逊卖力黑了自家的智能音箱和智能助手——Alexa。唤醒失误、识别不准、响应困难等等用户槽点，被广告创意表现得淋漓尽致。这是技术的现实。

但不论是基于场景的未来畅想，还是对当下缺陷的大胆自嘲，两个科技巨头都将业务重心的一角，押注在了语音交互赛道上。

亚马逊首席技术官Werner Vogels断言：未来，人和数字世界对的交互，一定是以“人”为核心，而不是机器驱动；我们终将构建出更人性化的交互，让人机互动更加融合。

在“以人为核心”、“更加融合”的人机交互中，语音交互（简称VUI）是核心。VUI允许更自由、高效的人机交互，其本质上比任何其他形式的用户界面都更“人性化”。斯坦福大学教授，Wired for Speech的合著者，克利福德·纳斯写道：“语音是人类交流的基本手段…….所有文化主要通过语音来说服，告知和建立关系。”

VUI允许用户使用语音作为媒介与机器进行交互。从《2011太空漫游》中的HAL到《星球大战》中的C-3PO，人们在科幻电影里畅想着能够与机器自由沟通。事实上，早在1952年，贝尔实验室的工程师就开发出了Audrey（奥黛丽）：它可以识别数字0-9的发音。尽管奥黛丽能够以超过90%的精度识别语音输入，但其体积大，成本高昂，未曾步入大规模商业化的发展通道。

自此，人类开启了长达半个多世纪的语音交互探索。1962年，IBM推出了第一台真正意义上的是语音识别机器。工程师William Dersch开发出的Shoebox可以收听操作员说出的数字和命令。例如“5+3+8+6+4-9，总和”，机器将打印出正确答案：17。

1970年，隐马尔可夫模型（HMM）为语音识别的发展插上了算法的翅膀，让语音识别从文字匹配进化到了可预测的高度。20世纪80年代，Covox,Dragon Systems,Speechworks相继成立，推动了语音识别的商用化进程。

90年代，语音识别技术迎来了大规模商用和普及。1995年，Dragon发布了单词听写级的语音识别软件。这是人类历史上首个面向广大消费者的语音识别产品。仅一年之后，Charles Schawab（嘉信理财）和Nuance（纽昂斯）联合推出了一套“语音股票经纪人”系统，可同时响应360个客户的股票询价电话。1997年，如今隶属Nuance旗下的声龙系统（Dragon system）推出了“NaturallySpeaking”软件，这是历史上第一个可用的“连续语音”听写软件。它标志着单词级不停顿语音交互的开始。

最近的20年，Google，Apple，Amazon先后推出了大众耳熟能详的智能语音助手，并通过智能手机、智能音箱等产品，来到普罗大众身边。据Juniper Research统计，截至2019年2月，全球使用中的语音助手达32.5亿；预计到2023年，该数字将达到80亿。

语音交互技术上的高山一：自然连续对话

随着软硬件的快速迭代，如今的ASR（语音识别）技术已近成熟，未来智能语音交互的核心竞争力在于在复杂场景下准确理解用户的意图，并为其提供差异化服务。更加智能的自然连续对话能力，将让语音交互系统更具人类的亲和力特质和逻辑思维能力，能带给用户更具情景化、更有温度的用车体验和服务潜力。

“智能相对论”认为，自然连续对话是一个系统的工程，涉及到从车机端的声学前端处理、语音唤醒、语音识别、语义理解、对话管理、自然语言生成、语音合成等核心交互技术。斑马智行VENUS的AI语音得益于阿里达摩院的重磅加持以及科大讯飞、思必驰等合作伙伴的大力支持，极大提升了语音能力。斑马基于AliOS系统，可以更好地将语音核心技术能力与系统能力相结合，更大程度地发挥出语音核心技术的优势，将多种引擎的协作发挥到极致，达到“1+1>2”的效果。

语音交互技术上的高山二：个性化，即声音克隆

如果说自然连续对话为更自由的交互和差异化服务提供可能，那语音定制化则将个性化、情感化的语音交互率先落地。

2017年9月，一家名为Lyrebird的加拿大初创公司在推特上发布了一段10秒的录音。录音是内容AI模仿美国总统特朗普的话语。在此之前，Google旗下的DeepMind曾经公布了一个用AI合成人声的研究成果：WaveNet，达到以假乱真的地步。Adobe也发布过一款名为Project VoCo的原型软件，在倾听20分钟音频样本之后可以进行模仿。而Lyrebird将音频采样的输入时间缩短到了60秒。

如今，国内智能网联行业也首次迎来了语音定制——“声音克隆”产品。斑马智行VENUS系统“声音克隆”操作流程非常简单。用户只需在斑马智行APP录制20句话即可合成私人语音包，一键发送至车机便可全局使用，无论是导航引导、天气查询，还是预订餐厅，和你对话的都是你最想听的声音。

声音是车载AI语音交互功能的“灵魂”，基于“声音克隆”技术，斑马智行VENUS系统将为用户提供“千人千声”的定制化服务，用户可以“克隆”亲人和爱人的声音，让陪伴更长久，让驾驶更舒心。

据介绍，斑马智行VENUS系统“声音克隆”操作流程非常简单。用户只需在斑马智行APP录制20句话即可合成私人语音包，一键发送至车机便可全局使用，无论是导航引导、天气查询，还是预订餐厅，和你对话的都是你最想听的声音。斑马网络AI语音相关负责人表示，斑马智行VENUS系统能在录制“倾听”中“掌握”每个人说话时的字母、音位、单词和语句的发音特点，通过深度学习技术推理并模仿声音中的语音音色、语调，“说”出全新的语句。

攀登技术高山，如何让机器交互能够更接近真人交互依然在等待更好答案

语音是人类最舒适，最直观的交流方式之一。如今的智能语音交互产品，变得越来越像人一样聪明且富有感情。它可以准确理解信息输入、高效处理并提供理想的信息输出。“智能相对论”认为，在人工智能和5G迅速发展的背景下，语音平台有机会成为物联网时代下新的“操作系统”，连接全新的产业生态，包括各类服务、应用、硬件等。

在各类应用场景中，除了智能家居，汽车产品对于语音交互的需求显而易见。不论是点击、滑动等触摸交互方式，在车载环境下都存在安全隐患且并不高效，语音交互是天然适应车载环境的交互方式。不过想要设计、开发、应用一套成熟的车载语音交互系统，要翻越重重高峰：行车噪音干扰如何处理、方言口音如何适配、自然的表达如何更好支持、系统的误触发如何控制在可用范围。

而随着用户对汽车智能化要求的越来越高，更自然的交互成为语音交互的发展方向。如何让机器交互能够更接近真人交互？多模态融合理解、自然全双工对话、自然语义理解成为了新的需要攀登的高峰。

斑马智行的系统底层——AliOS，在传统触控、按键交互模式的基础上，将语音交互能力、视觉交互能力以及场景信息在系统层进行融合互通，更大程度得发挥了各个交互能力的优势，使得多模态融合理解、融合交互以及更自然的全双工对话、拥有更多信号输入的自然语义理解成为可能。同时在各种交互能力融合后对上层应用进行开放，使得最终呈现给用户的交互更自然。

语音交互带来的产业机遇方兴未艾。如果说，未来的主流交互方式存在多样的可能性，那更高率、更自然、更接近于人本能的方向一定是人机交互的未来。

此内容为【智能相对论】原创，

仅代表个人观点，未经授权，任何人不得以任何方式使用，包括转载、摘编、复制或建立镜像。

部分图片来自网络，且未核实版权归属，不作为商业用途，如有侵犯，请作者与我们联系。

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

相关标签: ai技术; ai智能

瓯江论道：AI赋能绿色发展

2025年10月25日，2025世界青年科学家峰会之人工智能（AI）融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办，中国投资协会能源投资专业委员会、温港院士科创中心承办，中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持，以“瓯江论道-AI赋能绿色发展”为主题，

标签：

ai技术
王通：未来个人创业的十个机会

个人创业需要启动成本低、无需庞大团队、可快速验证、能利用个人技能或资源。这里分享适合个人创业的十个机会一.AI内容优化与本地化服务·做什么：帮助企业或个人利用AI工具（如GPT-4,Midjourney）优化内容生产流程。例如，为跨境电商撰写多语言产品描述，为小红书博主生成爆款文案，为小公司制作营销

标签：

创业机会

ai技术
Figma股价热情仅存1天，AI焦虑成关键隐忧？

文/道哥美国设计软件公司Figma近期在纽约证券交易所挂牌上市，首日即上演“狂飙”行情——发行价定每股33美元，开盘报价85美元，较发行价翻倍。首日收报115.50美元，较发行价大涨约250%，市值飙升至近670亿美元，创下近30年来同等规模美股IPO的最大单日涨幅纪录。然而，随着短线资金获利了结，

标签：

ai智能
AI「带飞」腾讯业绩

文/一灯来源/节点财经在当前无人敢缺席的AI军备竞赛中，巨头们一面为巨额的资本支出焦虑，一面又向市场勾勒着未来的宏伟蓝图。在各家动辄千亿级投入的背景下，市场迫切需要一份关于AI回报价值的有力证明。而腾讯，率先给出了答卷。8月13日，腾讯控股发布2025年第二季度财报。尽管资本开支同比剧增119%，达

标签：

ai智能

腾讯
Meta用亿元薪酬发起「人才狙击」能否买来一个AI未来？

文/二风来源/节点财经2025年的硅谷，一场没有硝烟的战争正以前所未有的烈度上演。这场战争的核心武器不是代码或芯片，而是人——那些全球仅有数千名、能够构建未来人工智能基础模型的顶尖大脑。在这场激烈的人才争夺战中，Meta及其首席执行官马克·扎克伯格（MarkZuckerberg）正扮演着最具侵略性的

标签：

ai智能

养openclaw小龙虾，每月要花多少钱才能养好？

“养龙虾”到底要花多少钱？这个问题可能是大家最关心的。我们把成本拆成三部分：服务器租用费+大模型API调用费+杂项开销。第一部分：服务器租用费。最省钱的方案当然是本地旧电脑自托管——零新增成本，电费忽略不计。但如前所述，你需要接受“不是7×24小时在线”的局限性。如果选择云服务器，成本差异就很大了。

标签：

openclaw小龙虾

ai龙虾是什么

ai小龙虾什么意思
养小龙虾用个人电脑还是云服务器？先搞清楚OpenClaw到底是什么

不少朋友第一次接触OpenClaw时，都会有一个相同的困惑：这玩意儿到底该装在哪里？OpenClaw（社区戏称“养龙虾”，因Logo为龙虾钳）不是普通的聊天机器人，而是一款本地优先、可自主执行、支持多Agent分工协作的AI执行网关。说白了，它让大模型从“只会说话”变成“会动手做事”——帮你管理文件

标签：

ai龙虾是什么

ai小龙虾什么意思

openclaw小龙虾
AI龙虾养了这么久，这8个建议你一定要听

01别相信“一键养虾，躺平赚钱”的鬼话打开社交媒体，你可能会看到这样的标题：“养只龙虾自动炒股，零代码养出数字巴菲特！”信了，你就输了。真实情况是：一个做跨境电商的小哥花了200元租服务器、订阅API，指望龙虾帮他炒股暴富。结果龙虾开始几天还像模像样，后来直接摆烂，生成个干瘪的大纲就敷衍了事。AI是

标签：

ai龙虾是什么

ai小龙虾什么意思

openclaw小龙虾
“养龙虾”火了，可你养的“虾”要是闯了祸，责任到底算谁的？

一张证书引发的讨论4月7日，北京嫣然天使儿童医院给陈光标发了一张感谢证书，感谢他捐赠1000万元。这事说起来挺曲折的。此前陈光标高调说要赠给张雪一台价值1300万元的劳斯莱斯，张雪回应“收了，八折卖掉捐给嫣然”，一番拉扯之后，陈光标把车变现，1000万元直接打到了嫣然医院账上。医院发证书感谢，本来是

标签：

ai龙虾是什么

ai小龙虾什么意思

openclaw小龙虾
国家安全部发布Token安全警示：需高度警惕数据泄露与金融诈骗风险

2026年4月7日，国家安全部就AI核心术语“词元”（Token）发布安全警示，强调在日均调用量突破140万亿规模的市场背景下，需高度警惕由此引发的数据泄露与金融诈骗风险。据统计，截至今年3月，我国日均词元调用量已超过140万亿，较2024年初增长1000多倍。词元作为大模型处理信息的最小单元，兼具
中国AI大模型连续五周领跑全球，调用量大幅增长

如今出门，如果你还没用过AI智能助手，可能真有点跟不上节奏了。无论是写作文、查资料，还是规划出行路线，越来越多的人已经习惯随手打开AI问一句。这股热潮背后，中国AI大模型用实打实的数据交出了一份亮眼的成绩单。根据全球知名AI模型聚合平台OpenRouter的最新数据，在3月30日至4月5日这一周，中

标签：

大模型

小白养龙虾的5条保命建议，值得收藏！

01别在主电脑上养！这是最最重要的一条“保命”建议。很多小白心血来潮，直接在自己存着毕业论文、工作文件、银行卡信息的主力电脑上部署OpenClaw。然后悲剧发生了：让龙虾帮忙整理一下桌面文件，结果它把整台电脑的文件全删了。这不是段子，是真事。OpenClaw一旦被授予高权限，就能执行删除、修改等不可

标签：

ai龙虾是什么

ai小龙虾什么意思

openclaw小龙虾
养一只OpenClaw小龙虾1个月到底要花多少钱，快来算一算适不适合你？

01免费领养，但饲料要钱很多人第一次听说OpenClaw时，脑子里冒出的第一个念头是：开源软件，那不免费吗？没错，OpenClaw本身确实是开源的，下载安装一分钱不收。但你很快就会发现，真正的开销根本不在这里。养一只“龙虾”，就像领养了一只宠物——领养免费，但“虾缸”“虾粮”“虾保姆”都得自己掏钱。

标签：

ai龙虾是什么

ai小龙虾什么意思

openclaw小龙虾
“养龙虾”为什么突然火了？OpenClaw很强，但普通人真的适合吗？

一只“龙虾”，火遍全网“今天你养龙虾了吗？”这句话在2026年初，迅速取代“吃了吗”成为社交媒体上的新晋暗号。别误会，这不是什么水产养殖新风口。这里说的“龙虾”，是一款名为OpenClaw的开源AI智能体。因为它的图标是一只红色龙虾，网友们便把部署、配置和使用它的过程，戏称为“养龙虾”。一个开源软件

标签：

ai龙虾是什么

ai小龙虾什么意思

openclaw小龙虾
一秒当导演：小云雀上线短剧Agent，10万字剧本一键生成60集

凌晨两点，小王合上笔记本，揉了揉酸胀的眼睛。花了一个月写出来的10万字短剧剧本躺在硬盘里，要真正把它拍成剧，得找演员、租场地、请摄像、做后期……粗算下来少说要几十万，他只能把剧本继续锁在抽屉里。不过，现在小王的剧本可以“见光”了。2026年3月19日，字节跳动旗下的小云雀AI正式上线了短剧Agent

标签：

大模型

加载更多

汽车AI语音交互正在让机器交互更接近真人交互

相关文章

瓯江论道：AI赋能绿色发展

王通：未来个人创业的十个机会

Figma股价热情仅存1天，AI焦虑成关键隐忧？

AI「带飞」腾讯业绩

Meta用亿元薪酬发起「人才狙击」能否买来一个AI未来？

养openclaw小龙虾，每月要花多少钱才能养好？

养小龙虾用个人电脑还是云服务器？先搞清楚OpenClaw到底是什么

AI龙虾养了这么久，这8个建议你一定要听

“养龙虾”火了，可你养的“虾”要是闯了祸，责任到底算谁的？

国家安全部发布Token安全警示：需高度警惕数据泄露与金融诈骗风险

中国AI大模型连续五周领跑全球，调用量大幅增长

小白养龙虾的5条保命建议，值得收藏！

养一只OpenClaw小龙虾1个月到底要花多少钱，快来算一算适不适合你？

“养龙虾”为什么突然火了？OpenClaw很强，但普通人真的适合吗？

一秒当导演：小云雀上线短剧Agent，10万字剧本一键生成60集

热门排行

编辑推荐

汽车AI语音交互 正在让机器交互更接近真人交互

相关文章

热门排行

编辑推荐

汽车AI语音交互正在让机器交互更接近真人交互