1. 创业头条
  2. 前沿领域
  3. 人工智能
  4. 正文

从人工"智障"到人工智能,AI交互还缺什么?

 2019-06-29 17:20  来源:A5专栏  我来投稿 撤稿纠错

  【推荐】海外独服/站群服务器/高防

引爆AI技术的Alphago与李世石的“人工智能”世纪大战已经过去三年,与三年前Alphago大胜李九段时人们惊呼“人工智能将要替代人类”相比,2019年的人们在面对AI时则更为淡然,与之对应的现实是,近三年来人工智能技术虽已取得惊人成就,但仍未真正脱离“人工”的现实。

AI的“人工不智能”之困

2018年5月,谷歌在其I/O开发者大会上,展示了令人印象深刻的Duplex人工智能语音技术,当时谷歌现场演示了Duplex语音AI预约理发服务,在与理发店沟通过程中Duplex的那一声“嗯哼”更是技惊四座、惊艳全球,随后谷歌董事长骄傲的向世界宣布:在电话预约领域,Duplex已经通过了图灵测试。

然而,事情当然没有那么简单,在《*》记者的测试中发现,在成功预约的4次中,有三次是由人工伪装成Duplex完成的,随后谷歌官方声明,目前通过Duplex拨打的电话中,约有25%由人类完全操作,在其他非人工操作的情况下,有15%的呼叫受到了人为干预。

即使人工智能技术强如谷歌,也仍然迈不过AI语音交互的“智能之坑”。而实际上,著名的图灵测试,也有其特定历史环境下的局限性。

在图灵测试中,仅仅通过AI是否表现的像个人类的判断无法有效得出AI是否真的具有智能,而要想AI脱离“人工”烙印真正实现智能,就必须真正跨过那条人与AI之间的边界。

在电影《机械姬》中,人工智能Ava在利用Caleb的感情达到帮助自己成功逃生则是“真正成功的图灵测试”的刻画,影片中,人工智能Ava的缔造者Nathen真正目的正是希望Ava通过“性魅力、对人性的操纵、同理心”等人类情感特征的综合利用而实现逃生,因而,Ava的逃生也是“图灵测试的终极版”。

虽然相比机械姬Ava,谷歌人工智能Duplex的完成度显得“相形见绌”,但作为人工智能最为重要的底层技术之一,AI语音交互技术近年来的发展取得了一系列进步,并随着智能手机、智能音箱等硬件设备进入千家万户。

实际上,AI语音交互的基础是基于深度学习算法对语言系统的深度集成,因而决定其具有明显的“双边效应”,一方面,AI语音交互的完成度越高,其用户数量增长越快;另一方面,用户数量与使用频次的增长反作用于AI语音交互的深度学习训练,从而实现更高的完成度。

AI语音交互的“动态规划”法则

在互联网江湖(ITVIPTI)看来,语言交互的过程的本质,是数据在“动态规划”逻辑下对数据特征的精确匹配。

在数学领域,动态规划(dynamic programming)是运筹学的一个分支,是求解决策过程(decision process)最优化的数学方法。在AI语音交互上,实现交互的过程可以看做是一个对语音输入数据反馈“最优解”的数据匹配过程。

从技术构成上来看,AI语音交互技术大致可分为三个层面:“交互层、算法层、数据层”。在一个完整的AI语音交互过程中,由语音识别反馈技术为核心,实现交互层AI与人的交互触达,然后由算法层进行“动态规划”解析,将完整语义下的文字数据拆解为特定的“数据包”,并由算法将“数据包”与已有“语言系统数据”进行精确匹配,从而实现AI对语义的理解并给出反馈。

简单来说,这就像你拿着一只印着小猫图案的黄色铅笔并且想要一只同样的铅笔,你需要去一个有着各种各样笔的文具店,因而你需要用“动态规划”思维将这只独特的铅笔“拆分开来”,明确它的种类以及特征:首先,它是铅笔、其次它是黄色的,最后它印着小猫图案。然后根据这些特征通过筛选(算法)去找到文具店中同样的铅笔。(与已有“语言系统数据”进行精确匹配)

但就目前的技术条件下,想要实现语言数据的100%精确匹配需要一些“先决条件”。

交互层实现100%准确率的语音识别准确率是保证整个语音交互不会出现语义“理解”偏差的重要前提,而要实现语音识的精准必须构建完整的“语句数据库”,然后通过大量的识别训练提升其准确度。

其次,在实现精确语音识别后,需要算法对其进行“数据打包”并且实现对“语言系统数据库”进行快速检索,从而匹配到相应的“反馈方案”,而由于不同的语义决定了不同的语音交互场景,因此需要涵盖几乎所有语音交互场景的“算法仓”,同时每个算法必须满足对于精度和效率的双重需求。

在数据层,“语言系统”数据库的完善程度重某种意义上决定了整个语言交互系统的完成度。

无论是“交互层”还是“算法层”都需要“语言系统大数据”的全面参与,因而,构建完善的“语言系统”数据是整个AI语音交互系统的核心,也是技术上难度最高的一环。

然而,现实中在语音识别领域,目前只有科大讯飞的语音识别技术达到了98%的准确率,在整个语音交换互领域,也仅仅只有谷歌的Duplex通过了图灵测试,而要想真正实现语音交互的人工智能,仍然需要AI底层技术革新的推动。

进阶AI语音交互与“数据纳什均衡博弈”

目前,无论是苹果的Siri 还是微软的小娜,在语音交互中均未实现基于时间线对语境的理解。而就2018年5月谷歌开发者大会上Duplex的表现来看,谷歌人工智能语音识别技术在语境的“理解”上已经取得了一些进展。

互联网江湖团队(ITVIP1)认为,在进阶的语音交互过程中,除了遵循“动态规划”原则实现对语言数据的检索外,基于“语言系统”对输入数据的反馈则是一场算法驱动下数据与数据的“纳什均衡博弈。”

所谓“纳什均衡”,实际上是一种策略组合,在该策略组合上,即在博弈的双方中,一方的策略会随着另一方的策略变动进行策略组合的调整,以达到一种战略上的“均衡态势”,而这种“均衡态势”被称为“纳什均衡”。

在进阶AI语音交互中,AI算法基于时间线对语义的“理解”过程,可以看做是对于语言输入数据端的变化,完成AI算法端相应的策略变换的过程,从而形成“数据纳什均衡”。纳什均衡的形成需要以既定的“目标收益”为前提,而在AI语音交互中,这种“目标收益”实质上就是“在时间线的上对于语境的理解”。

“数据纳什均衡”下的进阶AI语音交互虽然从理论上可以实现AI对特定语境下的理解,但这样的AI仍不能够算的上真正的人工智能,真正意义上的人工智能不仅仅是“具有人类语言特征”的AI,而是真正具备人类思维能力以及行为能力的AI系统。

因此,从这个意义上来讲,真正的人工智能不仅具有“人类思维”的软件范式,也需要在物理上的“拟人化”,使之具备作为“人”行动能力。而想要实现真正的人工智能,不仅需要AI技术的“人化”也需要工程上的“人类化”。

因而,电影《机械姬》以及《机械公敌》中的人工智能形态才是完美的人工智能,从某意义上来讲,这样的人工智以及成为了一种由“人工”创造的硅基生命,而不仅仅是简单的“人工智能”了。

尾声:

AI天花板尽显,人工智能还有多远?

当下AI技术的兴起,源于深度学习算法领域取得的突破性进展,因而从这个意义上来讲,如今AI技术实质上是计算形式的革新。

也就是说,剥去人工智能的外衣,如今的AI并未真正意义上实现“人工智能”,更多的还是一种用于大数据分析与检索的工具,实际上,当下AI的价值也在于对数据的高效匹配和应用。另一方面,虽然AI技术在产业应用上仍有巨大的空间,但深度学习算法的“工具式”人工智能的天花板已经触及,算法驱动下的AI技术已经到达瓶颈。

也许,《机械姬》中对于人工智能的幻想在本世纪末也未必能够实现,而对于“人工智能颠覆人类”的恐惧也颇为“杞人忧天”,相对于人工智能时代的到来,或许我们更应该关注如今AI技术对于当下的改变,而AI语音交互作为AI技术应用的前沿阵地,任何的技术以及应用层面的进展都更值得我们去关注。

科技自媒体刘志刚,订阅号:互联网江湖,微信号:13124791216,转载保留作者版权信息,违者必究。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
人工智能

相关文章

  • IoT开发者为王,涂鸦智能硬核“靠边站”

    IoT盛宴:涂鸦向下,产品向上

    标签:
    人工智能
  • IPO观察丨黑芝麻智能递表港交所,车芯行业已迈向量产决战期?

    虽然我国汽车芯片行业还处在发展初期,但已经迸发出无限潜力。一方面,智能汽车的发展不断带动需求增长;另一方面,政策引导下,汽车芯片企业持续抢占高地。对此,在7月5日-7日举办的2023年中国汽车论坛上,中国汽车工业协会副秘书长李邵华就做出表示,“中国将成为未来汽车芯片发展的集聚地”。车规芯片行业近日的

    标签:
    人工智能
  • 倒计时2天丨云天励飞将亮相世界人工智能大会

    2023世界人工智能大会将于7月6日至8日在上海举办。云天励飞将在大会上展示自主设计开发的新一代边缘计算芯片DeepEdge10系列SoC芯片,并公布“天书”大模型的最新动态。欢迎莅临上海世博展览馆H1-C801展台参观交流!同时,云天励飞也将与中国电子、中国信通院、华为等合作伙伴,在WAIC的舞台

    标签:
    人工智能
  • 酷学院智能产品发布会:引领中大型企业学习新潮流

    近日,酷学院智能产品发布会在深圳闪亮登场。近200位现场观众和近万人次在线观看,共同见证了这一激动人心的时刻。发布会上,酷学院引领大家探索企业培训学习和人才发展领域的新高度,并揭幕其全新的产品智能升级和突破。酷学院产品负责人徐晨通过形象生动、逻辑严谨的讲述,揭晓了全新的智能企业培训和人才发展平台,以

    标签:
    人工智能
  • 青少年在科创新活动中受益:人工智能教育开启未来的可能性

    随着人工智能技术的快速发展,各行各业都受到了深刻影响,特别是中小学人工智能教育的普及,已经成为当今不可忽视的重要课程。ChatGPT等人工智能技术的出现,让我们看到了人工智能将成为未来推动科技跨越发展、生产力整体跃升的重要驱动力量之一。在这个背景下,中小学教育已经将人工智能作为重要学习内容,并将科技

    标签:
    人工智能
  • 为何海尔智家能够做到“换新不厌旧”?

    在繁忙的城市角落,张先生的小公寓里藏着一个宝贝——一台20年前的海尔老式彩电。这台电视见证了他的拼搏、快乐和岁月的流转。虽然他对新科技并不感冒,但他的儿子小张对此却充满了好奇和热情。小张在线上看到以旧换新活动的同时,说服了张先生,并在手机上下单预约上门服务。没多久,服务人员便上门拆走旧家电,安装调试

    标签:
    海尔智家
  • 也谈谈AI洗稿

    前几天腾讯发了个公告称:平台巡查发现有些MCN和作者发布大量“AI洗稿”内容。并宣称要对“AI洗稿”行为进行打击,同时鼓励合理运用AI技术。其实我是想借此机会,给大家说说“AI洗稿”这件事,隐秘在黑暗角落里的赚钱行为。“洗稿”就是把别人的文章用AI工具修改润色一下或调整段落,然后再发到自媒体平台上,

    标签:
    ai智能
  • 竞逐智能家居大模型:美的“蓄力”,海尔“疾行”

    随着ChatGPT火热出圈,AI大模型便成为了各行各业必争的高地。

    标签:
    智能家居
  • 李彦宏新目标,押注AI原生应用

    文/道哥“未来,自然语言将成为新的通用编程语言。你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”4月16日,百度创始人、董事长兼首席执行官李彦宏在Create2024百度AI开发者大会上表述了对未来AI人工智能发展的新一轮展望。自OpenAI发布ChatGPT大模型后,这股AI人工智能

    标签:
    李彦宏
  • AI算力竞赛加速散热技术变革,液冷方案获行业青睐

    进入AIGC时代,智算中心规模日渐庞大,服务器能耗与日俱增。如何降低智算中心能耗已成为国家和地方政府关注的焦点。工信部数据显示,2022年全国数据中心总耗电量约2700亿千瓦时。当前,大部分数据中心仍主要采用风冷散热技术,在单柜密度、PUE值方面已愈发难以满足行业发展及绿色节能方面的要求,而冷板式液

  • 中国AIGC最值得关注企业&产品榜单揭晓!首份应用全景图谱发布

    “你好,新应用!”站在大模型落地元年,是时候喊出这句话了。从软件APP、智能终端乃至具身智能等等,AIGC开始席卷一切。大模型玩家、互联网巨头、终端厂商、垂直场景玩家纷纷入场,办公、创作、营销、教育、医疗领域相继被渗透……一个万亿市场,正在酝酿。站在浪潮起点,当下发展究竟如何了?机遇在哪?挑战如何?

  • 标准引领促转型 提升新质生产力——2024数字教育标准创新应用研讨会召开

    4月14日,以“标准引领促转型,提升新质生产力”为主题,由全国信息技术标准化技术委员会教育技术分技术委员会主办,锐捷网络承办的2024数字教育标准创新应用研讨会暨《高等学校数字校园建设规范(试行)》(以下简称《规范》)优秀及典型应用案例的颁奖活动在福州举办。本次会议聚焦赋能新质生产力和高校教育数字化

  • 两座超大城市对“视”联手 杭深奏响智能物联产业合鸣!

    春至岭南花似锦,出门俱是看花人。4月16日,2024“中国视谷”城市(深圳)推介会暨智能物联产业合作发展论坛在深圳举行。一场广聚全球英才的产业思想盛宴就像早春的花潮,召示着智能物联产业合作发展的丰硕成果正在孕育、成长。站在时代的风口和机遇中瞭望,智能物联产业是人工智能和物联网融合与应用的战略性新兴产

  • AI提高效率:用智谱清言打造爆款视频号

    关注卢松松,会经常给你分享一些我的经验和观点。(1)想做副业、短视频的同学,看完本文一定对你有所帮助!(2)很多人说2024是视频号红利的一年,有分成收益,广告主也多,流量大。(3)松松一共做了10多个视频号,在视频号布局3年了,几乎啥都做过,有的收益千八百、有的收益1-2k,有的收益3-5k。(4

    标签:
    ai技术
  • CPU上跑AI?从推荐系统的演进看CPU的崛起

    在信息和数据极度繁荣的当下,人工智能正在通过各种方式影响着人类生活。其中,AI推荐系统作为互联网时代最关键的伴生技术之一,正在帮助人类梳理着各种纷繁杂乱的信息,让资源实现更精准的调配,让一切变得井然有序。推荐系统:数字营销的重要引擎当你到一座旅游城市,不知道当地有什么美食时,AI推荐系统在手机上的本

编辑推荐