1. 创业头条
  2. 前沿领域
  3. 人工智能
  4. 正文

人工智能时代来袭 输入法如何决胜下一个10年

 2020-05-29 10:05  来源:A5专栏  我来投稿 撤稿纠错

  【推荐】海外独服/站群服务器/高防

近日,讯飞输入法新版本正式上线,在随声译和快捷翻译功能里增加了日译中、韩译中、泰、越、西、法、德、俄与中文互译,合计18种翻译,这也使得讯飞输入法成为中文与外语互译最多的输入法产品。

不得不说,语音输入已经越来越受欢迎。艾媒《2019-2020中国第三方手机输入法市场监测报告》显示,29%的受访者表示2019年使用语音输入的频率明显增加,是增长最快的输入方式。

面对输入方式的变迁,讯飞输入法、百度输入法、搜狗输入法三大输入法,也一直在围绕AI技术不断加码语音输入服务,使其不断实现准确率的突破,比如讯飞输入法的语音识别准确率已经高达98%。

输入法越来越智能的背后,各家的AI技术加持至为关键。而面对每天数亿次甚至数十亿次的使用需求,今天的输入法产品已经嵌满了令人意想不到的五彩黑科技。

输入法的重担

输入法越来越智能的代价,就是要背负越来越重的使命。追溯市面上几款主流输入法产品的发展历史,可以发现这些产品已经不年轻,至少都有十年或以上的产品迭代时间。以此推算,输入法产品与移动互联网的发展同步,可以说是跟着移动互联网一路走来的。

最早的输入法,不论是设备自带输入法,还是第三方输入法,功能普遍比较简单,比如只支持9键和26键键盘输入、手写输入等非智能机时代沿袭的输入方式,主要是为了满足最普遍的用户需求。

但移动社交、移动趋势的明晰,以及智能手机的普及,彻底改变了输入法产品们的发展路径。个人用户在多元场景下不断衍生出更多的输入需求,开始特别注意到输入体验的进步,希望更快和更好,比如能否根据拼音首字母快速预测想打的字。特别是在移动社交场景下,个人用户使用输入法的频率越来越高,用户对输入法体验的感知非常明显,输入法好不好用,效率高不高,用户其实心知肚明。

这让输入法的担子越来越重,原本定位于轻服务工具的输入法,不得不开始思考如何满足不同用户不同场景下的个性化需求。于是,为巨大体量的用户大规模同步提供优质的输入服务,成为输入法产品们发展的核心目标。

愈发全能的输入法

场景和需求之变,不断倒逼着输入法产品的进化,结果就是,输入法变得越来越全能,越来越精致,越来越个性。以目前的三大输入法产品为例,十年前的它们与十年后的它们,已经“判若两人”。

一方面,不断的功能增加使得产品能够适应许多输入场景。除了传统的手写和键盘输入外,三大输入法还加入了OCR扫描、智能预测/纠错等功能。其中,OCR扫描指的是用户可以通过扫描将图片或手写稿转换成文字,而智能预测功能则可以提前根据输入拼音预测用户想打的字,智能纠错则可以根据词库、语境快速纠正用户的错误。

各种功能的丰富,使得输入法可以服务于用户的全输入过程,在输入前、中、后每个环节提供对应的服务。

另一方面,产品能力的极限突破为用户带来了全面的体验。以从语音起家的讯飞输入法为例,目前讯飞输入法已经做到了一分钟400字的输入速度,以及语音识别准确率达98%的水平,也就是说整段输入的出错率非常小,为用户带来的是极速和流畅的综合输入体验。

可以说,这些功能所达到的极限颠覆了以往低效低质的输入体验,从感官上弥补了用户对输入法的体验缺乏。

黑科技成就输入法

无论是功能上的全能,还是体验上的全能,输入法产品能够实现质变,甚至能够适应一些极限和极端的输入场景,除了产品本身的创新外,不断的技术迭代是最核心的原因。用户之所以能够只花一半的时间完成整个输入过程,都依赖于输入法们背后的黑科技。

讯飞输入法可以说是“科技成就输入法”的最佳代言人。 一方面,其背靠有20多年智能语音技术沉淀的科大讯飞,已有20万小时训练数据积累;另一方面,科大讯飞有太多的国际赛事顶尖荣誉,比如在2018年由国际计算语言学协会(ACL)下属组织主办的第十二届国际语义评测比赛(SemEval2018)中,科大讯飞斩获了基于常识的机器阅读理解全球第一;2018年的国际权威英文语音识别大赛“CHiME-6”中,科大讯飞包揽了两项第一名;2019年在ICDAR2019举办的场景文本视觉问答挑战赛ST-VQA中,科大讯飞包揽了三项冠军;2020年初在德国The 20BN-Jester Dataset手势识别评测中,科大讯飞以97.26%的准确率斩获冠军,且刷新了世界纪录……讯飞输入法背后的黑科技可以从四方面来看。

一、语音输入

语音输入讲究快速和准确,讯飞输入法之所以能达到一分钟400字、识别准确率98%的水平,主要在于其自研的“记忆增强的多通道全端到端语音识别框架”,这项技术简单来说就是能够完全将前端语音处理过程深度学习化,并使用深度卷积神经网络和后端识别模型进行混合训练,从而大大提高了语音识别的效率。

至于能够使用23种方言进行精准语音输入,一方面要靠通过多方言共享方式训练的Multi-lingual多语言建模技术,另一方面要靠GlobalPhone全球音素集,这项技术从声学层面的相似性来统一各方言的音素定义,使方言“语图谱”模型进一步精进,从而使得方言识别效果有效提升。多语种互译功能则对技术提出了更大的挑战性,以中英互译为例,讯飞输入法基于对抗样本训练方法提出了融合副语言特征的“高鲁棒性语音翻译技术”,并在模型中结合特定技术,有效提高了最终翻译结果。

二、拼音输入

在拼音输入上,讯飞输入法创新性引入了Encoder-Decoder框架,构建了新一代拼音识别引擎,极大简化了传统拼音识别模型,同时在Attention机制和长短期记忆网络的门控机制,以及Transformer等模块的共同作用下,长句输入识别效果有效提升,能够提前预测用户想输入的内容,还能有效实现智能纠错。

此外,这一模型由于采用的是序列建模,建模不再依赖词典,更易实现中英文混合建模,因而让讯飞输入法在中英混输上实现了非常出色混输表现。值得注意的是,不论是智能预测,还是智能纠错,背后都有可实时更新的百万词库。

三、手写输入

同样是手写,体验却完全不一样,这是因为讯飞输入法的手写识别可支持两万多类中文字符、52类英文字符、10类阿拉伯数字以及100多种特殊符号,这种超级识别能力的背后,是讯飞输入法的“HWR手写识别技术”,这项技术采用的是CNN卷积神经网络技术,可支持实时手写轨迹,边写边出字,而且单个字符识别仅需15ms,响应迅速无延迟。

四、扫描输入

扫描输入的技术支撑是计算机视觉,面对复杂的手写文字、中英混合文字,“OCR文字检测技术”可检测任意方向和形状的文字,“OCR文字识别技术”则可以有效缓解因环境问题造成的识别效果低下问题。

综上,基于AI和大数据的组合技术,如今的输入法不再死板坚硬,即使面对输入场景的复杂需求,也能够在不同语种、不同语境、不同语调下满足不同用户的需求。过去的输入法只能辅助,而现在,科技加持下的输入法,更像是一个“一站式”的输入管家。

输入法的智能普惠

黑科技成就了输入法,也成就了输入法的地位。根据相关报告提供的数据,以三大输入法为代表的第三方输入法,已经覆盖了超过90%的中国网民。

要是放大到整个输入法行业,可以说人人都是输入法的受益者,移动设备也好,个人电脑也好,日常交流必然离不开输入法的帮助。可以说,输入法已经成为一个互联网沟通的基础设施。而且值得庆幸的是,讯飞输入法等头部产品在技术上的进化,让这个基础设施不断产生质变,越来越智能。

应该说,像讯飞输入法这样始终痴迷于“科技驱动”的输入法产品,是输入法作为工具产品在价值上得到跃进式提升的关键,因为它们用技术无限拔高了输入法产品的价值上限。换言之,讯飞输入法们的“科技大法”一定程度上改善了整个互联网世界的沟通协作效率。

技术无上限,输入法产品也无上限。对9.04亿中国互联网网民而言,黑科技持续加持下的输入法工具,会继续为每个用户提供独一无二的使用体验,真正实现全方位的智能普惠。

文/刘旷公众号,ID:liukuang110

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关文章

  • IoT开发者为王,涂鸦智能硬核“靠边站”

    IoT盛宴:涂鸦向下,产品向上

    标签:
    人工智能
  • IPO观察丨黑芝麻智能递表港交所,车芯行业已迈向量产决战期?

    虽然我国汽车芯片行业还处在发展初期,但已经迸发出无限潜力。一方面,智能汽车的发展不断带动需求增长;另一方面,政策引导下,汽车芯片企业持续抢占高地。对此,在7月5日-7日举办的2023年中国汽车论坛上,中国汽车工业协会副秘书长李邵华就做出表示,“中国将成为未来汽车芯片发展的集聚地”。车规芯片行业近日的

    标签:
    人工智能
  • 倒计时2天丨云天励飞将亮相世界人工智能大会

    2023世界人工智能大会将于7月6日至8日在上海举办。云天励飞将在大会上展示自主设计开发的新一代边缘计算芯片DeepEdge10系列SoC芯片,并公布“天书”大模型的最新动态。欢迎莅临上海世博展览馆H1-C801展台参观交流!同时,云天励飞也将与中国电子、中国信通院、华为等合作伙伴,在WAIC的舞台

    标签:
    人工智能
  • 酷学院智能产品发布会:引领中大型企业学习新潮流

    近日,酷学院智能产品发布会在深圳闪亮登场。近200位现场观众和近万人次在线观看,共同见证了这一激动人心的时刻。发布会上,酷学院引领大家探索企业培训学习和人才发展领域的新高度,并揭幕其全新的产品智能升级和突破。酷学院产品负责人徐晨通过形象生动、逻辑严谨的讲述,揭晓了全新的智能企业培训和人才发展平台,以

    标签:
    人工智能
  • 青少年在科创新活动中受益:人工智能教育开启未来的可能性

    随着人工智能技术的快速发展,各行各业都受到了深刻影响,特别是中小学人工智能教育的普及,已经成为当今不可忽视的重要课程。ChatGPT等人工智能技术的出现,让我们看到了人工智能将成为未来推动科技跨越发展、生产力整体跃升的重要驱动力量之一。在这个背景下,中小学教育已经将人工智能作为重要学习内容,并将科技

    标签:
    人工智能
  • Sora是什么?怎么读?Sora怎么就成了热点流量风向标?

    Sora是个什么东东?Sora,读音叫索拉,你也可以叫它索拉。这个Sora是目前可以说世界第一的美国的人工智能AI大模型公司Openai四天前(2024年2月16日)发布的文本生成视频的大模型,目前未对外开放,还在内测阶段。对了,它还有一个同样非常出名的,2022年11月30日发布的ChatGPT人

    标签:
    ai技术
  • 大模型时代,现代BI的底层已经被颠覆了?

    文|智能相对论作者|沈浪“Whatgetsmeasured,getsmanaged.”——这是著名管理学大师彼得·德鲁克的观点,意为「只有被量化的,才能被管理。」尽管备受争议,但是从某种程度来说,这一观点基本贯穿了当今企业的数字化转型进程。企业业务的数字化,本质上就是一个持续量化的过程。以BI(商业

    标签:
    大模型
  • 如何为您的业务开发和训练一个AI-BOT

    生成式AI(GenerativeAI)是当今科技领域的前沿技术之一。随着数据量的不断增加和计算能力的不断提升,AI技术在企业和个人生活中的应用越来越广泛。AI-BOT(以下简称BOT)是生成式AI技术的其中一种重要的应用形式,它可以通过学习各类业务数据信息,帮助人们执行一系列任务,从而提高工作效率,

    标签:
    ai技术
  • OpenAI发布文生视频大模型Sora

    照这个速度发展下去,通用人工智能应该就是这几年的事了,人类的未来到底是怎么样的,谁都无法预测了。

    标签:
    ai技术
  • 通义千问上线春节新应用,AI帮你免费拍全家福

    2月5日,春节将至年味渐浓,阿里云通义千问APP上线多项免费新应用,涵盖全家福、拜新年、万物成龙等图像生成的新玩法,

  • 2024,AI落地起风云,厂商如何抢先机?

    作者|曾响铃文|响铃说在ChatGPT引爆大模型热潮的2023年,很多人其实都还处于只听说没用过的阶段。到了国内最早获批的百度文心一言、中科院紫东太初、商汤日日新等正式对公众开放服务后,最先进的AI科技,才丝滑地飞入寻常百姓家了。人工智能带来的颠覆性让大家伙短暂地担忧过生成式应用“会不会把我的饭碗抢

    标签:
    ai技术
    ai智能
  • 空间计算时代加速到来,需要的不只是苹果

    创新和用户拓展,哪个都不能太快

  • 用友的YonGPT大模型,落到了企业服务的点子上

    文|智能相对论作者|沈浪“面向AI时代,所有的产品都值得用大模型重新升级。”大模型甚嚣尘上,各行各业都在尝试用大模型来重做业务。此前,用友率先发布了业内首个企业服务大模型YonGPT。作为大模型与企业运营管理的深度结合,YonGPT是否能把大模型的行业应用路径给走通?从目前透露出来的信息来看,用友Y

    标签:
    大模型
  • 巨人踏步,港口自动驾驶提速向前打开行业新空间

    按照吞吐量排名,全世界最大的50个港口,中国占了29个。在中国的港口和码头上,一场进化正在发生:人在这个生态中占的比重越来越少,技术接管的要素正在越来越多。像是最具代表性的全球综合自动化程度最高的码头——上海洋山港四期自动化码头上,甚至到了“人迹罕见”的地步。之所以称之为进化,是因为任何事物在规模达

    标签:
    自动驾驶
  • 高通:人工智能只是一个红利

    高通作为人工智能领域的重要参与者可能被低估。

编辑推荐