近日,小米推出了全面支持情感化语音交互的小米小爱音箱Art,小米也成为业内首家情感化TTS大规模落地的企业。
基于开心、关心、害羞等有限但类型不同的情感音频数据,通过不同技术训练并迭代声学模型,这款音箱支持情感TTS合成,并实现了“小爱同学”的音感化、拟人化。

随着人工智能技术的发展,在实现人机对话的基础上,各大AI企业都在情感化语音交互的领域积极展开探索。
例如在智能客服领域,当用户的问题无法解决或者问题表述不清时,智能客服很有可能无法识别用户的情绪、进行进一步操作,从而引发用户的不满和投诉。
针对这一情况,日本NTT研究所研发出一款客服电话情感识别系统,对用户的电话语音进行收集处理,如果未检测到用户愤怒的情感,则继续当前的语音服务;如果检测到愤怒的情感,则转为人工服务进行业务处理。
语音情感识别通常指机器从语音中自动识别人类情感和情感相关状态的过程。通过分析说话人情绪使机器进行拟人化的互动,识别说话人的情感成为语音技术发力的一个新热点。
语音情感识别包括两种,NTT推出的客服电话情感识别系统属于只通过声音来分析情感。这一情感语音识别模型的落地应用离不开训练数据的支撑。
数据堂深耕于AI数据领域近十年,一直致力于为全球人工智能企业提供专业的数据服务,行业内高标准的语音情感识别训练数据《20人英文情感语音麦克风采集数据》和《30部电影语音视频标注数据》广受重视和好评。
语音情感识别的另外一种模型就是结合声音和图像的多模态情感分析。
机器人Pepper就是应用多模态情感分析的典型案例。
Pepper是由日本软银集团和法国Aldebaran Robotics研发的一款人形机器人,可综合考虑周围环境,积极主动地作出反应。
Pepper配备了语音识别技术以及分析表情和声调的情绪识别技术,经过定制化开发,可通过表情、动作、语音与人类交流、反馈,甚至能够跳舞、开玩笑。
如今在商业领域,全球超过2000家企业应用了Pepper,服务于零售、金融、健康护理等众多行业。

麻省理工学院媒体实验室分拆公司Affectiva通过语音和面部数据打造了情感档案,其神经网络SoundNet可以在短短1.2秒内识别出音频数据中的愤怒情绪。
除了愤怒,人的情感从大类上可分为高兴、悲伤、失望、惊讶等面部情感,从内心情感上还可细分为:尴尬、犹豫、赞同、羡慕等。这些情感可以用VAD方法进行量化打分。
所谓VAD,是指Valence、Arousal、Dominance三个衡量维度。
· Valence(效价),指达到目标对于满足个人需要的价值,同一个目标对每一个人可能有三种效价:正、零、负。
· Arousal(积极程度),即精神+身体共同体现出的积极程度,如充满活力或死气沉沉。
· Dominance(优势度),表示个体对情景和他人的控制状态,如愤怒就属于优势度高的情感,而恐惧属于优势度低的情感。
数据堂一直致力于开发个性化的机器训练数据,并将数据和服务落地到AI产品和业务,为人们带去更好的产品体验,让每个人都能享受人工智能带来的美好生活。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,
个人创业需要启动成本低、无需庞大团队、可快速验证、能利用个人技能或资源。这里分享适合个人创业的十个机会一.AI内容优化与本地化服务·做什么:帮助企业或个人利用AI工具(如GPT-4,Midjourney)优化内容生产流程。例如,为跨境电商撰写多语言产品描述,为小红书博主生成爆款文案,为小公司制作营销
百度AI团队今日正式推出PaddleOCR3.1版本,以突破性的多语言组合识别(MultilingualCompositionPerception,MCP)技术为核心,彻底重构复杂文档处理边界。此次升级标志着OCR领域首次实现对同一文档内任意混合语言文本的精准识别,为全球化企业、跨境业务及多元文化场
导航网站的崛起:从信息过载到精准触达随着全球AI工具数量爆发式增长(2025年已超数万款),用户面临前所未有的选择困境。传统搜索引擎的“关键词-链接”模式难以应对工具筛选的场景需求,垂直化、场景化的AI导航网站应运而生。这类平台通过聚合、评测、分类与推荐四重机制,将分散的工具资源整合为结构化入口。例
当微信公众号文章中出现一个人的名字,它会自动变成蓝色链接,点击即可查看AI生成的“个人简历”——这一微信新功能让不少用户感到被“扒光”在互联网上。近日,微信新上线的“AI搜索”功能陷入隐私泄露争议漩涡。多位网友在社交平台反映,当微信公众号推文中出现本人姓名时,名字会自动变为蓝色超链接,点击即可浏览由
12月12日-14日,2025全球开发者先锋大会暨国际具身智能技能大赛(GDPS2025)于上海张江科学会堂举行,大会以具身智能竞技为核心,融合了技术比拼、产业展示与科普体验,为全球观众呈现出具身智能的现在与未来。上海开普勒机器人有限公司(以下简称"开普勒机器人")携明星产品K2"大黄蜂"亮相,并参
在数字化与智能化深度交织的时代浪潮中,安全的边界不断延展,技术的演进正引领产业迈向新一轮变革。10月24日,以“弈动Dynamic·数智跃迁博弈无界”为主题的2025TechWorld智慧安全大会在北京盛大召开。来自国家部委、院士学者、高校科研机构和企业的权威专家与业界精英齐聚北京,共议AI安全、数
2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,
我觉得我们AI的目标是:从芯片设计到软件生态,全链路自主开发,建立可控的世界级AI体系。所以这是俺对未来5年中国AI圈的展望和判断。(1)2026年,英伟达造车、国产开车26年国产芯片会在推理和垂直场景上发力。以DeepSeek为代表,大多数AI大模型会以软件弥补硬件不足,所以训练和推理分开,训练就
文/道哥在深陷“后门”风波、接受网信办问询之后,英伟达的“特供版”H20芯片,又有了新消息。近日,美国科技媒体《TheInformation》援引知情人士消息称,英伟达已悄然向其关键供应商——包括负责封装的安靠科技、供应高带宽内存的三星电子、以及承担后端处理的富士康发出指令,要求暂停所有与H20AI
文/二风来源/节点财经一场关于“中国芯”的IPO审议,正把投资者们的目光锁定在上交所。根据上交所发布的公告,上市审核委员会已定于9月26日审议摩尔线程的科创板首发申请。作为中国半导体自主化浪潮中最受瞩目的“考生”之一,包括其创始人显赫的英伟达背景、高达80亿元人民币的募资雄心,以及在国产GPU领域取
技术的进步永无止境,继创下TPC-C性能&性价比双冠之后,阿里云PolarDB云原生数据库再度实现关键突破。9月24日杭州云栖大会上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技术的PolarDB数据库专用服务器。在原有RDMA网络的基础上,Polar
2025年9月24日,在杭州举办的云栖大会上,阿里云正式发布全新一代服务器操作系统AlibabaCloudLinux4(简称Alinux4)。Alinux4基于Linux6.6内核打造,是首个全面遵循龙蜥社区“开源生态合作倡议”规范的商业发行版。它不仅兼容主流开源社区生态,更针对阿里云最新9代ECS