11月20日,爱数智慧发布中文普通话真·萌童声语音合成(TTS)开源数据集。该数据集由真童声录制,为中文童声语音合成数据集子集,时长为15分钟,文本主要为日常用语。据了解,数据集全集包含2235句话,时长超2小时。这也是该童声第一次用于TTS录制。
随着智能终端市场的扩张,人机交互逐渐成为与智能世界对话的入口。在人机互动过程中,语音合成(TTS)的自然度和表现力是用户最能直观感受到的部分。用户使用智能设备的频率增加,对合成语音的期望值也不断提高。
TTS数据是影响语音合成效果的重要因素。由于TTS数据的采集和标注要求严格,因而成品数据集较少。从采集环节来看,录音需要在专业的录音棚中进行,并严格控制噪声水平,才能最大限度还原发音人声音。录音过程中还需要有专业的录音师和监听人在场,便于及时矫正录音过程中的错误。从标注环节来看,TTS数据标注分为4个层级,包括发音校对、韵律层级、音素边界切分和分词词性。为了充分保留发音人的语义表达和发音习惯,标注准确率要求一般在99%左右。
智能设备使用者“低龄化”趋势明显,从而带动了童声数据的需求。受制于儿童识字水平和配合情况,市面上童声TTS数据库数量较少,且多为成年人模仿。童声TTS语料库呈现出明显的供需不平衡。
本次爱数智慧发布的TTS童声开源数据集采集环境为符合NC-20标准的录音间并根据儿童发音习惯对数据进行转写和全链条标注。考虑到句内停顿和句间停顿对听感的影响,在音素边界切分环节,标注人员除了对声韵母边界进行切分外,还对句中静音段和句首尾进行精准切分。
发音人是影响TTS数据质量的重要因素。该数据集的发音人为4岁小朋友妞妞。2019年初,发音韵律好的妞妞在上百位4-6岁小朋友中脱颖而出。因为发音韵律好能为用户带来更好的听感。
在与爱数智慧工作人员接触中,我们了解到妞妞性格活泼开朗,喜欢看冰雪奇缘和小马宝莉。在录制休息期间,想要看动画片时,就会黏着工作人员撒娇。录制工作已经结束很久,工作人员在提起妞妞时,言语间还是充满着浓浓的不舍与赞赏。这份由衷的赞赏,也让我们对这个真·萌童声充满期待!
为智能世界提供充足的数据生产力是这家公司创立的初衷。我们也期待爱数智慧用更多高质量的数据解锁更多应用场景,服务更广域的客户。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
在信息技术持续革新与市场竞争日趋激烈的行业环境下,本地生活服务领域正经历着深刻的智能化转型。这一转型过程不仅涉及技术层面的升级迭代,更关乎服务模式与行业生态的系统性重构。阅北科技通过持续推进算法技术的优化与应用,在提升服务精准度和用户满意度方面进行了积极探索。阅北的算法系统建立在持续优化的技术架构之
2025年10月17日,上海在人工智能技术加速演进、产业生态持续升级的关键时期,由上海市漕河泾新兴技术开发区发展总公司联合天罡智算交易平台共同发起成立的“漕河泾天罡人工智能研究院”(以下简称“研究院”)正式揭牌。研究院将依托漕河泾的产业资源与平台优势,联合上海交通大学、上海社会科学院等权威机构,聚焦
“AI大模型六小虎”百川智能危机重重。这是前搜狗CEO王小川创办的AI公司。昨天就爆出新闻,百川智能的联合创始人离职,这是王小川入局AI的第一道大坎。接下的成败非常关键:(1)拿下河北(2)学习科大讯飞百川智能离职高端概览:(1)2025年7月10日,百川智能技术联合创始人谢剑将离职。他是百川只能的
性能、商业、生态诠释开源模型的最佳姿态
2026年刚开年,全世界最狂的那个男人,穿着他的经典黑皮衣,在CES舞台上发出了未来十年的信号。他搞了个“能吃饱套餐”:6个包子+一碟小菜+一碗粥=肉包子套餐,这样以后你只要买一个套餐就能吃饱了。(Rubin平台)同时他们店里还免费提供的筷子、勺子、蘸料、酱油、醋、水果、零食等等。(开放10万亿语言
12月12日-14日,2025全球开发者先锋大会暨国际具身智能技能大赛(GDPS2025)于上海张江科学会堂举行,大会以具身智能竞技为核心,融合了技术比拼、产业展示与科普体验,为全球观众呈现出具身智能的现在与未来。上海开普勒机器人有限公司(以下简称"开普勒机器人")携明星产品K2"大黄蜂"亮相,并参
在数字化与智能化深度交织的时代浪潮中,安全的边界不断延展,技术的演进正引领产业迈向新一轮变革。10月24日,以“弈动Dynamic·数智跃迁博弈无界”为主题的2025TechWorld智慧安全大会在北京盛大召开。来自国家部委、院士学者、高校科研机构和企业的权威专家与业界精英齐聚北京,共议AI安全、数
2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,
我觉得我们AI的目标是:从芯片设计到软件生态,全链路自主开发,建立可控的世界级AI体系。所以这是俺对未来5年中国AI圈的展望和判断。(1)2026年,英伟达造车、国产开车26年国产芯片会在推理和垂直场景上发力。以DeepSeek为代表,大多数AI大模型会以软件弥补硬件不足,所以训练和推理分开,训练就
文/道哥在深陷“后门”风波、接受网信办问询之后,英伟达的“特供版”H20芯片,又有了新消息。近日,美国科技媒体《TheInformation》援引知情人士消息称,英伟达已悄然向其关键供应商——包括负责封装的安靠科技、供应高带宽内存的三星电子、以及承担后端处理的富士康发出指令,要求暂停所有与H20AI
文/二风来源/节点财经一场关于“中国芯”的IPO审议,正把投资者们的目光锁定在上交所。根据上交所发布的公告,上市审核委员会已定于9月26日审议摩尔线程的科创板首发申请。作为中国半导体自主化浪潮中最受瞩目的“考生”之一,包括其创始人显赫的英伟达背景、高达80亿元人民币的募资雄心,以及在国产GPU领域取