1. 创业头条
  2. 前沿领域
  3. AI智能
  4. 正文

搜狗推“个性化语音识别”,将颠覆与改变未来人机交互模式

 2019-08-15 18:08  来源:A5专栏  我来投稿 撤稿纠错

  阿里云优惠券 先领券再下单

专业机构发布《2019年语音技术》报告称,语音将成为未来十年决定性主题之一,与人工智能一起从根本上改变人与机器的关系。近日,搜狗输入法在语音输入领域率先推出“个性化语音识别”功能,突破语音识别技术瓶颈,大幅优化个人词汇录入的直接准确性,在语音输入领域实现“更懂用户”。

搜狗“个性化语音识别”打造用户专属输入法

在日常交流中,个人口头禅、惯用语经常会干扰双方的信息传达,这一问题在人机语音交互中尤为凸显。在语音输入时,往往用户只是想录入一个名称,输入结果却显示的是音同意不同的另一项结果。比如,当用户希望输入法显示人名“凭远”时,通用的语音识别往往将大众常用的“平原、品源”列在前列的候选词汇,用户的个性化内容并不在其中。除此之外,用户习惯使用的个人词汇,以及一些多音字、读音差错也会对语音识别结果造成影响。

基于以上原因,搜狗语音率先对语音识别技术进行了革新优化,推出“个性化语音识别”服务。经过本轮更新,用户只需在搜狗输入法App选择一键登录个人账户,即可体验此项服务。成功开启后,“个性化语音识别”会通过强化学习用户习惯使用的个人词汇,为每个用户建立定制化语音输入法。此后,在用户需要进行语音输入时,输入法会根据语言环境,结合上下段落语句进行分析,快速输出符合用户心意的文本内容,有效减少用户手动进行二次更改的频率。

搜狗语音又诞生“黑科技”语音识别更精准

搜狗“个性化语音识别”不仅可有效提升用户个性化词句的识别准确率,同时全自动词库学习这一特色极大保证了系统的处理及反馈速度,实现整个学习个性化特征的过程在“毫秒级别”就可以全部自动完成。

通过DTSS(Deep Transformer-based Sequence to Sequence model)的端到端声学模型、神经网络语言模型和智能标点预测等技术,搜狗输入法引入前沿深度学习技术,对语音识别进行仿真模拟和训练,有效提高语音录入在通用场景下的识别准确性,精准度已达到领先业内。“个性化语音识别”可基于用户数据分析,对用户习惯使用的个性化词组进行扫描记录,在语音输入时,优先选择用户习惯用语进行文本输出。通过此项技术革新,在保障通用识别准确性的前提下,使用户常用语的字词错误率下降40%,攻克语音识别精准化的技术难关。

掌控AI从个性化语音识别开始

手和舌头是人类最灵活的两个部分,从移动智能设备发展以来,各种触控交互无不依赖于手的操作。而当语音技术和人工智能同时走向成熟时,或许就像《2019语音技术报告》中所描述的那样:语音交互扭转了以往人机交互的存在形态,用户与设备间基于语音交互的全新关系开始搭建,与之前互联网向移动互联网过渡一样,其对底层平台的全新需求也在酝酿当中。

新时代即将来临,为应对人工智能、虚拟现实等技术的革新以及不同维度、多场景使用的需要,用户输入法的使用习惯逐渐向语音输入转移。同时,与文本输入相比,语音输入注定成为最主要的人机互动接口。优化语音识别技术,为用户提供更自然、更便利、更高效的语音录入服务,是智慧输入法的发展趋势。

随着语音识别技术的不断成熟,以及用户个性化词库的不断丰富,搜狗将聚合用户级语音个性化资源,实现“定制化语音输入法”。使每个用户基于“定制版”、“更懂自己”的搜狗语音识别的支持,在日常生活以及医疗、法律等专业领域,有效提高线上交流和人机沟通的效率及准确度,或将成为人工智能时代输入端的全局掌控者。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关文章

  • 瓯江论道:AI赋能绿色发展

    2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,

    标签:
    ai技术
  • 王通:未来个人创业的十个机会

    个人创业需要启动成本低、无需庞大团队、可快速验证、能利用个人技能或资源。这里分享适合个人创业的十个机会一.AI内容优化与本地化服务·做什么:帮助企业或个人利用AI工具(如GPT-4,Midjourney)优化内容生产流程。例如,为跨境电商撰写多语言产品描述,为小红书博主生成爆款文案,为小公司制作营销

  • 百度智能云PaddleOCR 3.1正式发布:关键能力支持MCP

    百度AI团队今日正式推出PaddleOCR3.1版本,以突破性的多语言组合识别(MultilingualCompositionPerception,MCP)技术为核心,彻底重构复杂文档处理边界。此次升级标志着OCR领域首次实现对同一文档内任意混合语言文本的精准识别,为全球化企业、跨境业务及多元文化场

    标签:
    ai智能
    ai技术
  • AI工具导航网站,未来的发展前景怎么样?

    导航网站的崛起:从信息过载到精准触达随着全球AI工具数量爆发式增长(2025年已超数万款),用户面临前所未有的选择困境。传统搜索引擎的“关键词-链接”模式难以应对工具筛选的场景需求,垂直化、场景化的AI导航网站应运而生。这类平台通过聚合、评测、分类与推荐四重机制,将分散的工具资源整合为结构化入口。例

  • 微信AI搜索被指“强行开盒”:名字成了数据入口,腾讯回应“仅用公开信息”

    当微信公众号文章中出现一个人的名字,它会自动变成蓝色链接,点击即可查看AI生成的“个人简历”——这一微信新功能让不少用户感到被“扒光”在互联网上。近日,微信新上线的“AI搜索”功能陷入隐私泄露争议漩涡。多位网友在社交平台反映,当微信公众号推文中出现本人姓名时,名字会自动变为蓝色超链接,点击即可浏览由

    标签:
    ai技术
    ai搜索
  • GDPS2025赛场直击!开普勒大黄蜂助力华理斩获搬运赛项桂冠

    12月12日-14日,2025全球开发者先锋大会暨国际具身智能技能大赛(GDPS2025)于上海张江科学会堂举行,大会以具身智能竞技为核心,融合了技术比拼、产业展示与科普体验,为全球观众呈现出具身智能的现在与未来。上海开普勒机器人有限公司(以下简称"开普勒机器人")携明星产品K2"大黄蜂"亮相,并参

    标签:
    GDPS
    2025
  • 弈动 Dynamic·数智跃迁 博弈无界|2025TechWorld智慧安全大会在京召开

    在数字化与智能化深度交织的时代浪潮中,安全的边界不断延展,技术的演进正引领产业迈向新一轮变革。10月24日,以“弈动Dynamic·数智跃迁博弈无界”为主题的2025TechWorld智慧安全大会在北京盛大召开。来自国家部委、院士学者、高校科研机构和企业的权威专家与业界精英齐聚北京,共议AI安全、数

    标签:
    弈动
  • 瓯江论道:AI赋能绿色发展

    2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,

    标签:
    ai技术
  • AI云“分野”:阿里云们“卖铲”,火山引擎奇袭“MaaS”

    AI云“分野”:阿里云们“卖铲”,火山引擎奇袭“MaaS”

    标签:
    阿里巴巴
  • 未来5年,中国AI的“大洗牌”和“内循环”

    我觉得我们AI的目标是:从芯片设计到软件生态,全链路自主开发,建立可控的世界级AI体系。所以这是俺对未来5年中国AI圈的展望和判断。(1)2026年,英伟达造车、国产开车26年国产芯片会在推理和垂直场景上发力。以DeepSeek为代表,大多数AI大模型会以软件弥补硬件不足,所以训练和推理分开,训练就

  • H20芯片开卖即叫停,英伟达如何解围?

    文/道哥在深陷“后门”风波、接受网信办问询之后,英伟达的“特供版”H20芯片,又有了新消息。近日,美国科技媒体《TheInformation》援引知情人士消息称,英伟达已悄然向其关键供应商——包括负责封装的安靠科技、供应高带宽内存的三星电子、以及承担后端处理的富士康发出指令,要求暂停所有与H20AI

    标签:
    英伟达