1. 创业头条
  2. 前沿领域
  3. AI智能
  4. 正文

真假难辨?猎户星空10段话克隆你的声音!

 2018-11-06 12:02  来源:互联网  我来投稿 撤稿纠错

  阿里云优惠券 先领券再下单

今日,猎豹移动董事长兼CEO傅盛在自己的抖音号上发布了一条视频。作为一名“科技乐观主义者”,傅盛和世界上的另一个“自己”进行了一场隔空对话。短短几十秒里,机器人“傅盛”的对答、绕口令样样精通。即使是仔细辨别,你也很难确认哪一个才是真正的傅盛。

能够达到如此惊艳的效果,其实要归功于猎豹移动旗下人工智能公司猎户星空研发的语音合成技术。只要听十段你的话,就可以克隆你的声音,听起来是不是很炫酷?

在人机交互的过程中,与用户体验感直接相关的,就是语音合成技术。这项技术是将文字转化为声音,可以简单地理解为人类的嘴巴。大家在各种智能语音助手中听到的声音,都是由TTS来生成的。所以,让TTS合成的语音能够“以假乱真”,正是TTS领域长期以来不断探索的主题。

传统的TTS都是怎么做的?

在看猎户星空如何实现“以小取大”的效果时,我们可以先看看以往的TTS是如何实现的。

传统的TTS系统通常包括前端、后端两个模块。前端模块主要负责对输入文本进行分析,提取语言学信息,如果是中文还涉及文本正则化、分词、词性预测、多音字消歧、韵律预测等,后端模块根据前端的分析结果,通过一定的方法生成语音波形。

后端系统的主流技术有两种,一种是基于统计参数建模的语音合成,或者叫做参数合成、参数法,优点是所需语料库少,几千句即可,训练与合成过程也都可以由程序自动完成,但缺点是语音质量不高,情感韵律平淡。

现在大家地图导航软件中的听到的明星音,针对导航场景录制了几千句的语料,不仅声音生涩感强,而且需要的成本和周期较长,在其他领域的声音效果不是很好。如果用户预期不苛刻,这样一种方式也未尝不可。

另一种是基于单元挑选和波形拼接的语音合成,或者叫做拼接合成、拼接法,与参数法相反,优点是合成语音自然度很好,缺点就是数据要求太大,至少万句语料才能满足商用需求,一些厂商会请声优为其智能产品录制语料库,前后时间长达数月,花费动辄几百万。

猎户星空:十段话合成人声

鱼和熊掌不可兼得,传统的TTS存在着或多或少的问题。所以这个领域的核心,在于如何降低训练成本,用更少的语料合成高质量的声音。

随着人工智能、深度学习的应用,TTS也迎来了新的变革。2017年3月,Google 提出了一种新的端到端的语音合成系统:Tacotron。它可将接收的输入字符,输出成相应的原始频谱图,然后提供给Griffin-Lim重建算法生成语音。2017年底,Tacotron 2结合了WaveNet和Tacotron的优势,不需要任何语法知识即可直接输出文本对应的语音。

在已有的技术创新铺垫下,猎户星空TTS团队在Tactron的基础上,训练了大语料库的语音库作为基础模型,目标发音人只需要录制10段话,通过Adapt自适应模型,提取出目标发音人的特征,再通过World声码器,即可合成出目标发音人音色相同的语音。

所以,这项技术真正落地商用后,将为明星语音、个性化语音的合成带来重大突破,尤其是很大程度上减少明星音合成的成本、缩短应用研发的周期。

想象一下,以后你的语音助手中住着你喜欢的明星或心爱的人,每天都可以和TA互动聊天,仿佛TA就是你的私人小秘书,是不是有点小激动呢?

除此之外,猎户星空已掌握麦克风阵列、语音唤醒、语音识别、语义理解和语音合成等全套远场语音技术,语音交互更快更准,垂直领域深度语义理解正确率96%,还首创了唤醒后人声回应。

猎户语音OS成为行业标配

在上文提到技术能力支撑之下,猎户星空打造了猎户tts——这个星球最温暖的AI声音。目前猎户语音OS技术已经应用到了小米小爱同学、美的小美AI音箱、喜马拉雅小雅音箱、猎豹移动小豹AI音箱、华为智能AI音箱等多家合作伙伴产品中,已经成为行业标配。

截至目前,搭载猎户语音合成技术的智能音箱产品在国内份额已超30%,每天都超过2000万次语音服务请求,比如小米AI助理小爱同学月活跃设备超过3000万台,累计唤醒超50亿次。

10月15日,中国人工智能产业发展联盟(AIIA)在人工智能开发者大会公布了国内智能音箱智能化评级结果,包括猎豹移动、小米、喜马拉雅、百度、京东在内的五家主流厂商携其智能音箱产品参与了首批测试评估。猎户语音OS占据了获评产品前五强中的三席,支撑起了智能音箱市场的大半壁江山。

结合自身人机交互的产品基因和猎户星空拥有的行业唯一的全链条AI技术,猎豹移动也在不同行业推动人工智能产品的场景化落地。未来,猎豹移动与旗下猎户星空还会将自主研发的视觉、导航、语音、机械臂技术等核心能力逐步对外开放,与合作伙伴一起,让机器人产品走进大众生活。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关文章

  • 瓯江论道:AI赋能绿色发展

    2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,

    标签:
    ai技术
  • 王通:未来个人创业的十个机会

    个人创业需要启动成本低、无需庞大团队、可快速验证、能利用个人技能或资源。这里分享适合个人创业的十个机会一.AI内容优化与本地化服务·做什么:帮助企业或个人利用AI工具(如GPT-4,Midjourney)优化内容生产流程。例如,为跨境电商撰写多语言产品描述,为小红书博主生成爆款文案,为小公司制作营销

  • 百度智能云PaddleOCR 3.1正式发布:关键能力支持MCP

    百度AI团队今日正式推出PaddleOCR3.1版本,以突破性的多语言组合识别(MultilingualCompositionPerception,MCP)技术为核心,彻底重构复杂文档处理边界。此次升级标志着OCR领域首次实现对同一文档内任意混合语言文本的精准识别,为全球化企业、跨境业务及多元文化场

    标签:
    ai智能
    ai技术
  • AI工具导航网站,未来的发展前景怎么样?

    导航网站的崛起:从信息过载到精准触达随着全球AI工具数量爆发式增长(2025年已超数万款),用户面临前所未有的选择困境。传统搜索引擎的“关键词-链接”模式难以应对工具筛选的场景需求,垂直化、场景化的AI导航网站应运而生。这类平台通过聚合、评测、分类与推荐四重机制,将分散的工具资源整合为结构化入口。例

  • 微信AI搜索被指“强行开盒”:名字成了数据入口,腾讯回应“仅用公开信息”

    当微信公众号文章中出现一个人的名字,它会自动变成蓝色链接,点击即可查看AI生成的“个人简历”——这一微信新功能让不少用户感到被“扒光”在互联网上。近日,微信新上线的“AI搜索”功能陷入隐私泄露争议漩涡。多位网友在社交平台反映,当微信公众号推文中出现本人姓名时,名字会自动变为蓝色超链接,点击即可浏览由

    标签:
    ai技术
    ai搜索
  • 弈动 Dynamic·数智跃迁 博弈无界|2025TechWorld智慧安全大会在京召开

    在数字化与智能化深度交织的时代浪潮中,安全的边界不断延展,技术的演进正引领产业迈向新一轮变革。10月24日,以“弈动Dynamic·数智跃迁博弈无界”为主题的2025TechWorld智慧安全大会在北京盛大召开。来自国家部委、院士学者、高校科研机构和企业的权威专家与业界精英齐聚北京,共议AI安全、数

    标签:
    弈动
  • 瓯江论道:AI赋能绿色发展

    2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,

    标签:
    ai技术
  • AI云“分野”:阿里云们“卖铲”,火山引擎奇袭“MaaS”

    AI云“分野”:阿里云们“卖铲”,火山引擎奇袭“MaaS”

    标签:
    阿里巴巴
  • 未来5年,中国AI的“大洗牌”和“内循环”

    我觉得我们AI的目标是:从芯片设计到软件生态,全链路自主开发,建立可控的世界级AI体系。所以这是俺对未来5年中国AI圈的展望和判断。(1)2026年,英伟达造车、国产开车26年国产芯片会在推理和垂直场景上发力。以DeepSeek为代表,大多数AI大模型会以软件弥补硬件不足,所以训练和推理分开,训练就

  • H20芯片开卖即叫停,英伟达如何解围?

    文/道哥在深陷“后门”风波、接受网信办问询之后,英伟达的“特供版”H20芯片,又有了新消息。近日,美国科技媒体《TheInformation》援引知情人士消息称,英伟达已悄然向其关键供应商——包括负责封装的安靠科技、供应高带宽内存的三星电子、以及承担后端处理的富士康发出指令,要求暂停所有与H20AI

    标签:
    英伟达
  • 真正的「国产英伟达」来了

    文/二风来源/节点财经一场关于“中国芯”的IPO审议,正把投资者们的目光锁定在上交所。根据上交所发布的公告,上市审核委员会已定于9月26日审议摩尔线程的科创板首发申请。作为中国半导体自主化浪潮中最受瞩目的“考生”之一,包括其创始人显赫的英伟达背景、高达80亿元人民币的募资雄心,以及在国产GPU领域取

    标签:
    英伟达