真假难辨？猎户星空10段话克隆你的声音！

2018-11-06 12:02 来源：互联网我来投稿撤稿纠错

今日，猎豹移动董事长兼CEO傅盛在自己的抖音号上发布了一条视频。作为一名“科技乐观主义者”，傅盛和世界上的另一个“自己”进行了一场隔空对话。短短几十秒里，机器人“傅盛”的对答、绕口令样样精通。即使是仔细辨别，你也很难确认哪一个才是真正的傅盛。

能够达到如此惊艳的效果，其实要归功于猎豹移动旗下人工智能公司猎户星空研发的语音合成技术。只要听十段你的话，就可以克隆你的声音，听起来是不是很炫酷?

在人机交互的过程中，与用户体验感直接相关的，就是语音合成技术。这项技术是将文字转化为声音，可以简单地理解为人类的嘴巴。大家在各种智能语音助手中听到的声音，都是由TTS来生成的。所以，让TTS合成的语音能够“以假乱真”，正是TTS领域长期以来不断探索的主题。

传统的TTS都是怎么做的?

在看猎户星空如何实现“以小取大”的效果时，我们可以先看看以往的TTS是如何实现的。

传统的TTS系统通常包括前端、后端两个模块。前端模块主要负责对输入文本进行分析，提取语言学信息，如果是中文还涉及文本正则化、分词、词性预测、多音字消歧、韵律预测等，后端模块根据前端的分析结果，通过一定的方法生成语音波形。

后端系统的主流技术有两种，一种是基于统计参数建模的语音合成，或者叫做参数合成、参数法，优点是所需语料库少，几千句即可，训练与合成过程也都可以由程序自动完成，但缺点是语音质量不高，情感韵律平淡。

现在大家地图导航软件中的听到的明星音，针对导航场景录制了几千句的语料，不仅声音生涩感强，而且需要的成本和周期较长，在其他领域的声音效果不是很好。如果用户预期不苛刻，这样一种方式也未尝不可。

另一种是基于单元挑选和波形拼接的语音合成，或者叫做拼接合成、拼接法，与参数法相反，优点是合成语音自然度很好，缺点就是数据要求太大，至少万句语料才能满足商用需求，一些厂商会请声优为其智能产品录制语料库，前后时间长达数月，花费动辄几百万。

猎户星空：十段话合成人声

鱼和熊掌不可兼得，传统的TTS存在着或多或少的问题。所以这个领域的核心，在于如何降低训练成本，用更少的语料合成高质量的声音。

随着人工智能、深度学习的应用，TTS也迎来了新的变革。2017年3月，Google 提出了一种新的端到端的语音合成系统：Tacotron。它可将接收的输入字符，输出成相应的原始频谱图，然后提供给Griffin-Lim重建算法生成语音。2017年底，Tacotron 2结合了WaveNet和Tacotron的优势，不需要任何语法知识即可直接输出文本对应的语音。

在已有的技术创新铺垫下，猎户星空TTS团队在Tactron的基础上，训练了大语料库的语音库作为基础模型，目标发音人只需要录制10段话，通过Adapt自适应模型，提取出目标发音人的特征，再通过World声码器，即可合成出目标发音人音色相同的语音。

所以，这项技术真正落地商用后，将为明星语音、个性化语音的合成带来重大突破，尤其是很大程度上减少明星音合成的成本、缩短应用研发的周期。

想象一下，以后你的语音助手中住着你喜欢的明星或心爱的人，每天都可以和TA互动聊天，仿佛TA就是你的私人小秘书，是不是有点小激动呢?

除此之外，猎户星空已掌握麦克风阵列、语音唤醒、语音识别、语义理解和语音合成等全套远场语音技术，语音交互更快更准，垂直领域深度语义理解正确率96%，还首创了唤醒后人声回应。

猎户语音OS成为行业标配

在上文提到技术能力支撑之下，猎户星空打造了猎户tts——这个星球最温暖的AI声音。目前猎户语音OS技术已经应用到了小米小爱同学、美的小美AI音箱、喜马拉雅小雅音箱、猎豹移动小豹AI音箱、华为智能AI音箱等多家合作伙伴产品中，已经成为行业标配。

截至目前，搭载猎户语音合成技术的智能音箱产品在国内份额已超30%，每天都超过2000万次语音服务请求，比如小米AI助理小爱同学月活跃设备超过3000万台，累计唤醒超50亿次。

10月15日，中国人工智能产业发展联盟(AIIA)在人工智能开发者大会公布了国内智能音箱智能化评级结果，包括猎豹移动、小米、喜马拉雅、百度、京东在内的五家主流厂商携其智能音箱产品参与了首批测试评估。猎户语音OS占据了获评产品前五强中的三席，支撑起了智能音箱市场的大半壁江山。

结合自身人机交互的产品基因和猎户星空拥有的行业唯一的全链条AI技术，猎豹移动也在不同行业推动人工智能产品的场景化落地。未来,猎豹移动与旗下猎户星空还会将自主研发的视觉、导航、语音、机械臂技术等核心能力逐步对外开放,与合作伙伴一起,让机器人产品走进大众生活。

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

相关标签: ai技术; 智能音箱; 手机克隆

瓯江论道：AI赋能绿色发展

2025年10月25日，2025世界青年科学家峰会之人工智能（AI）融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办，中国投资协会能源投资专业委员会、温港院士科创中心承办，中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持，以“瓯江论道-AI赋能绿色发展”为主题，

标签：

ai技术
王通：未来个人创业的十个机会

个人创业需要启动成本低、无需庞大团队、可快速验证、能利用个人技能或资源。这里分享适合个人创业的十个机会一.AI内容优化与本地化服务·做什么：帮助企业或个人利用AI工具（如GPT-4,Midjourney）优化内容生产流程。例如，为跨境电商撰写多语言产品描述，为小红书博主生成爆款文案，为小公司制作营销

标签：

创业机会

ai技术
百度智能云PaddleOCR 3.1正式发布：关键能力支持MCP

百度AI团队今日正式推出PaddleOCR3.1版本，以突破性的多语言组合识别（MultilingualCompositionPerception,MCP）技术为核心，彻底重构复杂文档处理边界。此次升级标志着OCR领域首次实现对同一文档内任意混合语言文本的精准识别，为全球化企业、跨境业务及多元文化场

标签：

ai智能

ai技术
AI工具导航网站，未来的发展前景怎么样？

导航网站的崛起：从信息过载到精准触达随着全球AI工具数量爆发式增长（2025年已超数万款），用户面临前所未有的选择困境。传统搜索引擎的“关键词-链接”模式难以应对工具筛选的场景需求，垂直化、场景化的AI导航网站应运而生。这类平台通过聚合、评测、分类与推荐四重机制，将分散的工具资源整合为结构化入口。例

标签：

ai技术

导航网站
微信AI搜索被指“强行开盒”：名字成了数据入口，腾讯回应“仅用公开信息”

当微信公众号文章中出现一个人的名字，它会自动变成蓝色链接，点击即可查看AI生成的“个人简历”——这一微信新功能让不少用户感到被“扒光”在互联网上。近日，微信新上线的“AI搜索”功能陷入隐私泄露争议漩涡。多位网友在社交平台反映，当微信公众号推文中出现本人姓名时，名字会自动变为蓝色超链接，点击即可浏览由

标签：

ai技术

ai搜索

看懂黄仁勋CES演讲，就看懂 AI 接下来十年的走向

2026年刚开年，全世界最狂的那个男人，穿着他的经典黑皮衣，在CES舞台上发出了未来十年的信号。他搞了个“能吃饱套餐”：6个包子+一碟小菜+一碗粥=肉包子套餐，这样以后你只要买一个套餐就能吃饱了。(Rubin平台)同时他们店里还免费提供的筷子、勺子、蘸料、酱油、醋、水果、零食等等。(开放10万亿语言
GDPS2025赛场直击！开普勒大黄蜂助力华理斩获搬运赛项桂冠

12月12日-14日，2025全球开发者先锋大会暨国际具身智能技能大赛（GDPS2025）于上海张江科学会堂举行，大会以具身智能竞技为核心，融合了技术比拼、产业展示与科普体验，为全球观众呈现出具身智能的现在与未来。上海开普勒机器人有限公司（以下简称"开普勒机器人"）携明星产品K2"大黄蜂"亮相，并参

标签：

GDPS

2025
弈动 Dynamic·数智跃迁博弈无界｜2025TechWorld智慧安全大会在京召开

在数字化与智能化深度交织的时代浪潮中，安全的边界不断延展，技术的演进正引领产业迈向新一轮变革。10月24日，以“弈动Dynamic·数智跃迁博弈无界”为主题的2025TechWorld智慧安全大会在北京盛大召开。来自国家部委、院士学者、高校科研机构和企业的权威专家与业界精英齐聚北京，共议AI安全、数

标签：

弈动
瓯江论道：AI赋能绿色发展

2025年10月25日，2025世界青年科学家峰会之人工智能（AI）融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办，中国投资协会能源投资专业委员会、温港院士科创中心承办，中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持，以“瓯江论道-AI赋能绿色发展”为主题，

标签：

ai技术
AI云“分野”：阿里云们“卖铲”，火山引擎奇袭“MaaS”

AI云“分野”：阿里云们“卖铲”，火山引擎奇袭“MaaS”

标签：

阿里巴巴
未来5年，中国AI的“大洗牌”和“内循环”

我觉得我们AI的目标是：从芯片设计到软件生态，全链路自主开发，建立可控的世界级AI体系。所以这是俺对未来5年中国AI圈的展望和判断。(1)2026年，英伟达造车、国产开车26年国产芯片会在推理和垂直场景上发力。以DeepSeek为代表，大多数AI大模型会以软件弥补硬件不足，所以训练和推理分开，训练就

H20芯片开卖即叫停，英伟达如何解围？

文/道哥在深陷“后门”风波、接受网信办问询之后，英伟达的“特供版”H20芯片，又有了新消息。近日，美国科技媒体《TheInformation》援引知情人士消息称，英伟达已悄然向其关键供应商——包括负责封装的安靠科技、供应高带宽内存的三星电子、以及承担后端处理的富士康发出指令，要求暂停所有与H20AI

标签：

英伟达
真正的「国产英伟达」来了

文/二风来源/节点财经一场关于“中国芯”的IPO审议，正把投资者们的目光锁定在上交所。根据上交所发布的公告，上市审核委员会已定于9月26日审议摩尔线程的科创板首发申请。作为中国半导体自主化浪潮中最受瞩目的“考生”之一，包括其创始人显赫的英伟达背景、高达80亿元人民币的募资雄心，以及在国产GPU领域取

标签：

英伟达
AI视频生成赛道“分野”：小厂重产品，大厂重生态

AI视频生成赛道“分野”：小厂重产品，大厂重生态

标签：

腾讯

阿里巴巴

快手
数据库进入“内存自由”时代！阿里云PolarDB发布全球首个CXL数据库服务器

技术的进步永无止境，继创下TPC-C性能&性价比双冠之后，阿里云PolarDB云原生数据库再度实现关键突破。9月24日杭州云栖大会上，阿里云宣布推出全球首款基于CXL（ComputeExpressLink）2.0Switch技术的PolarDB数据库专用服务器。在原有RDMA网络的基础上，Polar

加载更多

真假难辨？猎户星空10段话克隆你的声音！

相关文章

瓯江论道：AI赋能绿色发展

王通：未来个人创业的十个机会

百度智能云PaddleOCR 3.1正式发布：关键能力支持MCP

AI工具导航网站，未来的发展前景怎么样？

微信AI搜索被指“强行开盒”：名字成了数据入口，腾讯回应“仅用公开信息”

看懂黄仁勋CES演讲，就看懂 AI 接下来十年的走向

GDPS2025赛场直击！开普勒大黄蜂助力华理斩获搬运赛项桂冠

弈动 Dynamic·数智跃迁博弈无界｜2025TechWorld智慧安全大会在京召开

瓯江论道：AI赋能绿色发展

AI云“分野”：阿里云们“卖铲”，火山引擎奇袭“MaaS”

未来5年，中国AI的“大洗牌”和“内循环”

H20芯片开卖即叫停，英伟达如何解围？

真正的「国产英伟达」来了

AI视频生成赛道“分野”：小厂重产品，大厂重生态

数据库进入“内存自由”时代！阿里云PolarDB发布全球首个CXL数据库服务器

热门排行

编辑推荐