近日,小米推出了全面支持情感化语音交互的小米小爱音箱Art,小米也成为业内首家情感化TTS大规模落地的企业。
基于开心、关心、害羞等有限但类型不同的情感音频数据,通过不同技术训练并迭代声学模型,这款音箱支持情感TTS合成,并实现了“小爱同学”的音感化、拟人化。

随着人工智能技术的发展,在实现人机对话的基础上,各大AI企业都在情感化语音交互的领域积极展开探索。
例如在智能客服领域,当用户的问题无法解决或者问题表述不清时,智能客服很有可能无法识别用户的情绪、进行进一步操作,从而引发用户的不满和投诉。
针对这一情况,日本NTT研究所研发出一款客服电话情感识别系统,对用户的电话语音进行收集处理,如果未检测到用户愤怒的情感,则继续当前的语音服务;如果检测到愤怒的情感,则转为人工服务进行业务处理。
语音情感识别通常指机器从语音中自动识别人类情感和情感相关状态的过程。通过分析说话人情绪使机器进行拟人化的互动,识别说话人的情感成为语音技术发力的一个新热点。
语音情感识别包括两种,NTT推出的客服电话情感识别系统属于只通过声音来分析情感。这一情感语音识别模型的落地应用离不开训练数据的支撑。
数据堂深耕于AI数据领域近十年,一直致力于为全球人工智能企业提供专业的数据服务,行业内高标准的语音情感识别训练数据《20人英文情感语音麦克风采集数据》和《30部电影语音视频标注数据》广受重视和好评。
语音情感识别的另外一种模型就是结合声音和图像的多模态情感分析。
机器人Pepper就是应用多模态情感分析的典型案例。
Pepper是由日本软银集团和法国Aldebaran Robotics研发的一款人形机器人,可综合考虑周围环境,积极主动地作出反应。
Pepper配备了语音识别技术以及分析表情和声调的情绪识别技术,经过定制化开发,可通过表情、动作、语音与人类交流、反馈,甚至能够跳舞、开玩笑。
如今在商业领域,全球超过2000家企业应用了Pepper,服务于零售、金融、健康护理等众多行业。

麻省理工学院媒体实验室分拆公司Affectiva通过语音和面部数据打造了情感档案,其神经网络SoundNet可以在短短1.2秒内识别出音频数据中的愤怒情绪。
除了愤怒,人的情感从大类上可分为高兴、悲伤、失望、惊讶等面部情感,从内心情感上还可细分为:尴尬、犹豫、赞同、羡慕等。这些情感可以用VAD方法进行量化打分。
所谓VAD,是指Valence、Arousal、Dominance三个衡量维度。
· Valence(效价),指达到目标对于满足个人需要的价值,同一个目标对每一个人可能有三种效价:正、零、负。
· Arousal(积极程度),即精神+身体共同体现出的积极程度,如充满活力或死气沉沉。
· Dominance(优势度),表示个体对情景和他人的控制状态,如愤怒就属于优势度高的情感,而恐惧属于优势度低的情感。
数据堂一直致力于开发个性化的机器训练数据,并将数据和服务落地到AI产品和业务,为人们带去更好的产品体验,让每个人都能享受人工智能带来的美好生活。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,
个人创业需要启动成本低、无需庞大团队、可快速验证、能利用个人技能或资源。这里分享适合个人创业的十个机会一.AI内容优化与本地化服务·做什么:帮助企业或个人利用AI工具(如GPT-4,Midjourney)优化内容生产流程。例如,为跨境电商撰写多语言产品描述,为小红书博主生成爆款文案,为小公司制作营销
百度AI团队今日正式推出PaddleOCR3.1版本,以突破性的多语言组合识别(MultilingualCompositionPerception,MCP)技术为核心,彻底重构复杂文档处理边界。此次升级标志着OCR领域首次实现对同一文档内任意混合语言文本的精准识别,为全球化企业、跨境业务及多元文化场
导航网站的崛起:从信息过载到精准触达随着全球AI工具数量爆发式增长(2025年已超数万款),用户面临前所未有的选择困境。传统搜索引擎的“关键词-链接”模式难以应对工具筛选的场景需求,垂直化、场景化的AI导航网站应运而生。这类平台通过聚合、评测、分类与推荐四重机制,将分散的工具资源整合为结构化入口。例
当微信公众号文章中出现一个人的名字,它会自动变成蓝色链接,点击即可查看AI生成的“个人简历”——这一微信新功能让不少用户感到被“扒光”在互联网上。近日,微信新上线的“AI搜索”功能陷入隐私泄露争议漩涡。多位网友在社交平台反映,当微信公众号推文中出现本人姓名时,名字会自动变为蓝色超链接,点击即可浏览由
4月2日,字节跳动旗下火山引擎在武汉举行的AI创新巡展上宣布,Seedance2.0API正式面向企业用户开启公测。同时,火山引擎总裁谭待在会上披露,截至今年3月,豆包大模型日均Token使用量已突破120万亿,在过去三个月内增长一倍,比2024年5月发布时增长1000倍。Seedance2.0:从
养AI小龙虾的路上,坑不少。有人被代装服务骗了钱,有人电脑中了毒,有人收到天价账单,还有人发现AI“失控”了,开始乱删文件。如果你也遇到这些糟心事,别慌。下面这份“养虾应急包”,告诉你第一时间该做什么。场景一:代装被骗,钱打水漂了花了300块找人远程装OpenClaw,结果对方收了钱就拉黑,或者装了
把AI智能体请进电脑,就像把家里所有的钥匙交给了一个陌生人。它能帮你打扫房间、整理文件,但万一它“起了坏心”,或者被坏人利用了,你的家就不再安全了。这不是危言耸听。国家互联网应急中心已经发布风险提示,指出OpenClaw的默认配置“极为脆弱”,攻击者一旦得手,能轻易获取系统控制权。微软安全团队也警告
OpenClaw火了,火到似乎人人都在讨论“养虾”。打开社交媒体,满屏都是“有了AI小龙虾,我再也不用加班了”“我让AI帮我订了机票、写周报、点外卖”之类的分享。于是,很多人开始焦虑:别人都养了,我要不要也养一只?不养是不是就落伍了?先别急。在决定养“虾”之前,我们先冷静下来,想清楚一个问题:你到底
3月31日,科技圈上演了一场现实版的“代码大逃杀”。一向以“闭源”为傲的AI巨头Anthropic,因一个低级打包失误,将旗下明星产品ClaudeCode的完整源代码拱手送给了全世界。一次59.8MB的“裸奔”事情始于一个普通的周二早晨。Web3安全公司FuzzLab的实习研究员ChaofanSho
当地时间3月31日,人工智能明星公司OpenAI宣布完成一轮规模达1220亿美元的私募融资,投后估值攀升至8520亿美元,创下全球AI企业估值新纪录,同时也刷新了科技行业私募融资的历史最高规模。本轮融资筹备历时数月,核心资金来自三家头部科技企业:亚马逊承诺投资500亿美元,英伟达与软银集团分别出资3
“我也想养一只AI小龙虾,但听说安装特别难,我连代码都不会写,怎么办?”这是最近后台收到最多的私信。面对OpenClaw这个技术门槛不低的AI智能体,很多普通人跃跃欲试,却又望而却步。于是,一个“代装”产业应运而生——远程50到300元,上门500到1500元,帮你搞定一切。但问题是:这些代装服务靠
最近,身边不少人都在讨论“养AI小龙虾”。这只叫OpenClaw的智能体,能替你自动订机票、写代码、整理文件,听起来像请了一个24小时不休息的数字员工。但问题来了——月薪五千的普通人,养得起吗?我们先算一笔账。养这只“虾”,主要有三个花钱的地方。第一笔:硬件投入。OpenClaw创始人推荐用MacM
最近,“养AI小龙虾”成了互联网上的一股热潮。这里的“小龙虾”指的是OpenClaw——一个能替你自动做事的人工智能体。订机票、写代码、整理文件,它就像一个24小时不休息的数字员工。听起来很酷,但很多人忽略了一个关键问题:这只“虾”需要你电脑的完整访问权限。也就是说,一旦你把它“请”进家门,它就能看
最近,互联网上刮起了一股“养虾热”。这个“虾”不是餐桌上的小龙虾,而是一个叫OpenClaw的AI智能体。标志是一只红色小龙虾,寓意不断蜕壳成长。OpenClaw到底是个什么东西?简单说,它是一个开源的AI智能体框架,能装进你的电脑,替你自动做事——订机票、写代码、整理文件,就像一个24小时不休息的