1. 创业头条
  2. 前沿领域
  3. 人工智能
  4. 正文

Google Assistant新技术,能为人工智障般的语音助手扳回一局?

 2018-05-14 10:39  来源:A5专栏  我来投稿 撤稿纠错

  【推荐】海外独服/站群服务器/高防

在最近谷歌的Google I/O大会上,谷歌CEO“劈柴“直接祭出了这次大会的王牌AI,这个AI产品似乎像人们展现了人工智能技术的进一步提升,Assistant的“持续性对话”功能让对话更自然,而“多重行动”功能让用户在一次对话中可以提出多个问题。

这似乎是一个标志性的转变,存在对话生硬、无法多轮对话等诸种弊病的语音助手在这场GoogleI/O大会上表现的尤为智能。相比Apple Siri和Microsoft Cortana只能机械式对话的语音互动,Google Assistant似乎表现尤为优异(至少在发布会上),那么,GoogleAssistant的出现是谷歌在AI语音助手领域的一张王牌吗?

惊艳全场的“嗯哼”

想要探究AI语音助手的智能程度,其评判标准就是如何做到让AI“像人”,这是一个深度学习的能力问题,而体现在表现形式上则为“话术”,如何能够让语音助手真正突破“图灵测试”,让用户人机难辨。然而,当下Google Assistant似乎正朝着全面“类人化”的方向发展。

以Google Assistant在GoogleI/O大会上的表现为例,发布会上,用户对Google Assistant说:我想剪头发。Google Assistant接受指令后直接帮你电话预约。

Google Assistant先拨通了Jim理发店的电话,进行电话预约剪发。

Google Assistant:你觉得时间定为3号可以吗?

理发店:我需要查查Jim老师的档期,稍等。

Google Assistant:嗯哼?

这一句“嗯哼”让全场所惊艳,AI的反应似乎出乎了所有人的预料,然而,这一切并没有结束。

理发店:3号12点不行,Jim老师已经有预约了。

Google Assistant:那10点到12点这段时间呢?

理发店:您的顾客是想烫头发还是剪头?

Google Assistant:只是简单修剪一下。

理发店:那没有问题,我们10点见!

诚然,对于人类来说,此类“嗯”、“呃”之类的语气词是再正常不过,可是对于机器而言,这是一件难以做到的事情。事实上,Google Assistant说“嗯嗯”,好似在点头同意;而其所拉长的某些词的发音,又好像它正在花时间去思考一个问题的答案,当然,这一切都是是由编程算法即时实现的。

谷歌助手的背后是一种称之为“Duplex”的技术,这由纽约、特拉维夫和山景城的谷歌工程师和产品设计师联合开发,该技术可实现一小部分人可以完成预订餐厅、查看假日时间等通常通过电话进行的活动。所有这些交互都发生在后端——谷歌数字助理Assistant和餐厅之间。

搭载数字助理Assistant的智能家居

此外,Google Assistant除了一种男性发音和女性发音外,其还可以用六种声音说话。谷歌还使用户能够更轻松地提出后续问题,并在开车并使用谷歌地图时自动向某些人发送你的预计抵达时间。

GoogleAssistant真的“完美无缺”吗?

Google Assistant新技术的应用,许多人认为“这下真的分不清对面对面是人是狗了”,但是,Google Assistant显然并不是完美无瑕,皮查伊在开发者大会上展示的 demo 距离落地还有多远?所展示的GoogleAssistant落地后真的会如此惊艳吗?智能相对论分析师柯鸣认为,谷歌语音助理虽然已经突破了众多技术瓶颈,但其真正能够应用于生活场景中,并完全替代“人类助理”,依然尚需时日。

首先,google duplex似乎已经可以解决自然对话的问题。展开一段自然的对话有这么几个难点:自然语言难以理解,人类的自然行为很难建模,人类对延迟的耐受性很低所以需要高处理速度,以及生成听起来自然的语音,其中还要适当地夹杂一些语气词。

谷歌联合使用了一个级联 TTS 引擎和一个生成式 TTS 引擎(其中使用了 Tacotron 和 WaveNet),根据不同的情境控制语音的语调。

为了让语音变得更加亲切自然,这个系统能够生成一系列语气词,这也是让大家所惊叹的地方,比如“hmmm”、“uh”等语气词。

当级联 TTS 需要组合变化很大的语音单元,或者需要增加生成的停顿时,语气词就会被添加到生成的语音中,这就让这个系统可以以一种自然的方式向对方示意“是的我听着呢”或者“我还在考虑”(人类说话的时候就经常在思考的同时发出一些语气词)。谷歌的用户调查也确认了人类觉得带有语气词的对话更熟悉、更自然。

Duplex的运作模式

但是,也正是TTS的表现让人觉得其仍有可商榷之处。如从自然语言训练的方法角度看,通过充分的数据梳理,借助机器学习在某个单一领域穷举各种情况,继而达到Google 在今天所展示的效果尚有可能。

但目前没有公司可以做到全方位理解各种场景。也就是说,Google Assistant所擅长的也是针对特定场景的,例如预订餐位和理发。

这能否在所有场景中具有普适性,目前依然无法得知。从这个角度来看,小场景有限话题模拟对话并不是难题,针对 demo 优化到流畅也能够做到,这是否能够真正替代“人类助理”,依然是一个尚未确知的问题。

其次,从伦理和信息安全的的角度来看,Google Assistant依然存在着诸多争议。比如,谷歌官方曾表示:“现在的技术并没有达到只通过与开发人员对话就学会如何像人一样说话的水平,为了获得高精度,我们在匿名电话的会话数据库上对Duplex的RNN进行了训练。”

在数百个小时的训练过程中,它记录下了客户们电话中的通话记录。这让我们又一次回到了十年来一直在进行的辩论,即维护个人数据隐私和推进技术便利的界限究竟在何处,Facebook的信息泄露案更将这个问题推到了风口浪尖。

当然,倘若撇开公地悲剧的存在主义解决方案不谈,Duplex AI的出现还暴露了许多实际问题。例如,如何防止某人非法利用公众人物的录音来训练人工智能,并生成伪造的音频?

此外,我们还需要防止伪造视频的攻击,鉴于人们已经能够伪造图像和视频(甚至色情),并能够合并一层虚假音频,谷歌和Facebook的内容审核工作将面临着更大的困难。

谷歌这条路好走吗?

谷歌语音助手这条路,已经走了很久。最早的GoogleNow作为谷歌语音助手的最初形式出现在人们面前,Google Now 2012 年最早出现在安卓 4.1 和 Nexus 手机上,随后又推出面向移动设备信息快速检索服务的“Now On Tap”、以及“Now cards”。

从 2016 年开始,Google Assistant 就开始逐步取代 Google Now,相应的功能也被替换,“Now cards”被“Feed”取代,“Now on Tap”被“Screen Search”所取代。

最早于2016年与Google Home一起亮相的Google Assistant,依托着谷歌系产品的用户量级,虽然同类竞品亚马逊的Echo已经占据一定市场,但是依然有着一定发展的前景和底气。

但是,如果谷歌的目标是让Assistant成为拟人化的谷歌,那么仍有很多事情要做。若想实现与斯派克·琼斯(Spike Jonze)科幻电影《她》(Her)中的操作系统Samantha进行对话的那样,谷歌依然还有一定距离。、

当然,相较于市场上同类系的其他产品,Google Assistant的表现确实稍显优秀。Stone Temple Consulting与ROAST公司2018年发布的智能语音助理测试报告也显示,Google Assistant手机版能回答的题目最多,高达90%,准确率也有将近80%的超高表现。

来源:Stone Temple Consulting、ROAST测试报告

其实,严格来说,谷歌的竞争对手Alexa,Siri和Cortana都没有兑现他们的承诺。Alexa,Siri等都存在着或大或小的问题,每个产品在市场中的表现似乎都没有人们想象中的优异。

当然,谷歌并非第一个进入语音助理领域的公司。作为后来者,CIRP公司的数据显示,2016年发布的GoogleHome占有31%的市场份额,较之亚马逊的69%的市场份额稍显不足。

总的来说, “AI很好,但不够惊人”,始终是近年来笼罩在AI语音市场上的浓重阴影。当然,随着日后GoogleAssistant新技术的逐渐应用,这是否能够成为谷歌新的“杀手锏”仍需时间检验,而谷歌语音助理的这条路,也将坚定的走下去。

智能相对论:深挖人工智能这口井,评出咸淡,讲出黑白,道出深浅。重点关注领域:AI+医疗、机器人、智能驾驶、AI+硬件、物联网、AI+金融、AI+安全、AR/VR、开发者以及背后的芯片、算法、人机交互等。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关文章

  • 竞逐智能家居大模型:美的“蓄力”,海尔“疾行”

    随着ChatGPT火热出圈,AI大模型便成为了各行各业必争的高地。

    标签:
    智能家居
  • 李彦宏新目标,押注AI原生应用

    文/道哥“未来,自然语言将成为新的通用编程语言。你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”4月16日,百度创始人、董事长兼首席执行官李彦宏在Create2024百度AI开发者大会上表述了对未来AI人工智能发展的新一轮展望。自OpenAI发布ChatGPT大模型后,这股AI人工智能

    标签:
    李彦宏
  • AI算力竞赛加速散热技术变革,液冷方案获行业青睐

    进入AIGC时代,智算中心规模日渐庞大,服务器能耗与日俱增。如何降低智算中心能耗已成为国家和地方政府关注的焦点。工信部数据显示,2022年全国数据中心总耗电量约2700亿千瓦时。当前,大部分数据中心仍主要采用风冷散热技术,在单柜密度、PUE值方面已愈发难以满足行业发展及绿色节能方面的要求,而冷板式液

  • 中国AIGC最值得关注企业&产品榜单揭晓!首份应用全景图谱发布

    “你好,新应用!”站在大模型落地元年,是时候喊出这句话了。从软件APP、智能终端乃至具身智能等等,AIGC开始席卷一切。大模型玩家、互联网巨头、终端厂商、垂直场景玩家纷纷入场,办公、创作、营销、教育、医疗领域相继被渗透……一个万亿市场,正在酝酿。站在浪潮起点,当下发展究竟如何了?机遇在哪?挑战如何?

  • 标准引领促转型 提升新质生产力——2024数字教育标准创新应用研讨会召开

    4月14日,以“标准引领促转型,提升新质生产力”为主题,由全国信息技术标准化技术委员会教育技术分技术委员会主办,锐捷网络承办的2024数字教育标准创新应用研讨会暨《高等学校数字校园建设规范(试行)》(以下简称《规范》)优秀及典型应用案例的颁奖活动在福州举办。本次会议聚焦赋能新质生产力和高校教育数字化

  • 两座超大城市对“视”联手 杭深奏响智能物联产业合鸣!

    春至岭南花似锦,出门俱是看花人。4月16日,2024“中国视谷”城市(深圳)推介会暨智能物联产业合作发展论坛在深圳举行。一场广聚全球英才的产业思想盛宴就像早春的花潮,召示着智能物联产业合作发展的丰硕成果正在孕育、成长。站在时代的风口和机遇中瞭望,智能物联产业是人工智能和物联网融合与应用的战略性新兴产

  • AI提高效率:用智谱清言打造爆款视频号

    关注卢松松,会经常给你分享一些我的经验和观点。(1)想做副业、短视频的同学,看完本文一定对你有所帮助!(2)很多人说2024是视频号红利的一年,有分成收益,广告主也多,流量大。(3)松松一共做了10多个视频号,在视频号布局3年了,几乎啥都做过,有的收益千八百、有的收益1-2k,有的收益3-5k。(4

    标签:
    ai技术
  • CPU上跑AI?从推荐系统的演进看CPU的崛起

    在信息和数据极度繁荣的当下,人工智能正在通过各种方式影响着人类生活。其中,AI推荐系统作为互联网时代最关键的伴生技术之一,正在帮助人类梳理着各种纷繁杂乱的信息,让资源实现更精准的调配,让一切变得井然有序。推荐系统:数字营销的重要引擎当你到一座旅游城市,不知道当地有什么美食时,AI推荐系统在手机上的本

  • 李彦宏放话:百度AI大模型绝不抢开发者饭碗

    关注卢松松,会经常给你分享一些我的经验和观点。昨晚,李彦宏内部讲话称:AI大模型开源意义不大,百度绝不抢开发者饭碗。但你一定要说话算话哦,可千万别说:“我永远不做手机,谁再敢提做手机就给我走人”,结果5年后自己的手机销量排名第一。如果百度也这么干的话估计AI也没人用了。李彦宏认为:从商业模式的角度来

    标签:
    大模型
  • 具身智能潮起、巨头环伺之下,优必选如何撑起资本期待?

    AI大模型风口之下,作为“具身智能”最佳载体,人形机器人似乎即将迎来“觉醒元年”。前有马斯克巨大影响力加持之下的人形机器人Optimus亮相,后有OpenAI联合人形机器人初创公司Figure推出令人惊艳的Figure01。可以看出,AI软件和机器人硬件的结合,已经是当下科技界一大风口。乘着这样的东

编辑推荐