曾经靠语音助手红极一时的智能音箱,近年来的市场表现却欠佳。据洛图科技发布的最新《中国智能音箱零售市场月度追踪》报告显示,2022年中国智能音箱总销量为2631万台,同比下降28%;市场销售额为75.3亿元,同比下降25%。而IDC发布的2023年中国智能家居市场的十大洞察也透露,智能音箱的市场需求正在逐渐消退,整个市场呈现下滑趋势。
但随着ChatGPT这种生成式AI技术的快速发展,搭载ChatGPT的智能音箱将有望获得新的增长空间。据中泰证券分析,目前全球存量智能音箱超7亿台,如考虑产品本身3-5年左右的替换周期,本轮ChatGPT带来的替换需求或在1.4亿-2亿台每年,有望再次成为市场热点。在此基础上,智能音箱的交互水平也将有望再上新台阶。
ChatGPT或成新变量
一直以来,市场上的智能音箱产品多多少少都存在着交互体验差、应用场景单一、产品缺乏创新,以及互联互通差等问题,而当下以ChatGPT为代表的生成式AI技术,则在上下文理解、多轮对话、内容生成等方面,展现出了极高的交互水准,ChatGPT或将为智能音箱带来新的变量。
一来,依托于ChatGPT在内容生成和理解能力上的优势,智能音箱的应用场景将进一步被扩展。ChatGPT具有在对话系统、文本生成、语音识别和文本分类等多种场景中的应用优势。具体来说,在对话系统中,ChatGPT可以生成自然流畅的对话内容,支持多轮对话;在文本生成中,ChatGPT可以生成高质量的文本内容,支持多种文本生成任务;在语音识别中,ChatGPT支持多语种语音识别,提供全面的语音交互体验;在文本分类中,ChatGPT可以应用于多种文本分类任务,自动学习特征,提高分类效果和效率。ChatGPT的多领域应用优势,使得它成为自然语言处理领域的重要工具之一。
也就是说,搭载了ChatGPT的智能音箱可以进一步理解用户的意图,让回答内容的质量能够更趋向于真人的表现。未来,智能音箱的功能可能并不止于家庭,或许会走进办公场所成为人们工作的助手等。
二来,ChatGPT也正在带动智能音箱产业成为资本的焦点。随着ChatGPT在全球的走红,作为人工智能交互载体的智能音箱再次成为市场热点,包括奋达科技、漫步者、惠威科技、国光电器等在内的智能音箱概念股,近期都出现了大涨行情,资金涌入迹象十分明显。可以说,在智能音箱产业进入瓶颈期的当下,ChatGPT的出现又将智能音箱重新拉回了大众视野,并为其带来了全新的可能。
当然,ChatGPT能为智能音箱产业带来多少新变量,还需等到搭载着ChatGPT的智能音箱真正走进万千家庭才能知晓。
小度更聪明
目前为止,智能音箱与生成式AI技术的结合已经在巨头玩家中初现雏形。据悉,今年2月9日,小度宣布将融合文心一言,打造针对智能设备场景的AI模型“小度灵机”,并将其应用到小度全系产品中。借助小度灵机大模型,小度智能音箱中的语音助手可以变成“超级助理”。
其一,借助小度灵机大模型,小度智能音箱拥有了提取和整合复杂信息的能力。在官方发布的测试视频中,测试员告诉超级助理,他要在周末做各种各样的事情,而在叙述这些事的时候,测试员会故意提出“修改时间”的要求,比如原定于周日要做的A事件被B事件替换。即使面对测试员的一系列复杂要求,这位超级助理也可以从中提炼出真正有效的信息,并据此给测试员生成一份正确的时间安排表。
而此前的小度智能音箱并没有理解和提取整合这样复杂信息的能力,可见小度灵机模型的作用体现得比较明显。
其二,在智能家居场景中的设备控制环节,小度灵机大模型能更准确地识别出用户的真实需求。在智能家居场景中,小度灵机大模型可以化身为“智能管家”,例如在官方的测试中,测试员告诉智能管家他每天早上七点半一定要起床,周末可以晚一些,大概九点,干脆就九点半,冬天室内温度不能低于23度,夏天温度可以定在26度。此时,超级助理就可以根据这些描述,确定要在什么时候开启家中的空调、调整到什么样的温度比较合适。
相比传统智能助手只会理解“打开空调”这样简单、单一的指令,灵机模型则可以认识到用户到家时,家里温度与用户所期望的不一样,所以需要打开空调,并且根据现在的季节调节到合适的温度。显然,大模型的加入,可以让智能音箱实现认知能力上的提升。
天猫精灵更有温度
另一智能音箱领域的巨头玩家天猫精灵,也亮出了其在生成式AI技术领域的成果积累。4月11日,天猫精灵宣布将正式接入阿里巴巴通义千问。根据官网显示的信息,通义千问是一个专门响应人类指令的大模型,目前已经开启了企业邀请测试,并放出了测试官网。
据阿里巴巴集团董事会主席兼首席执行官、阿里云智能集团首席执行官张勇透露,未来,天猫精灵除了能回答用户的提问外,还会成为更人性化的智能助手,天猫精灵的策略是针对智能音箱训练出一个个性更为鲜明的大模型。
一方面,接入通义千问的天猫精灵能够产生一些特定的人格化特征,满足用户的个性化需求。不同于知识面更为广泛的通识性大模型,天猫精灵在通义千问这种更加垂直的个性化大模型的加持下,能够变得更拟人、更聪明,其知识、情感、个性、记忆力等都会得到大幅跃升。比如“鸟鸟分鸟”这一模型,其语气、语调与脱口秀演员鸟鸟就如出一辙,这样也增加了天猫精灵的可玩性,使其成为有温度的智能化助手。
另一方面,新一代的天猫精灵将具备更为灵活的对话能力。接入通义千问的天猫精灵支持自由对话,用户可以随时打断或者切换话题,天猫精灵能根据用户需求和场景随时生成内容。例如,用户在跑步过程中,可以要求天猫精灵根据180步频合成适合跑步的歌单,同时还可以与天猫精灵展开关于文化、人生等领域的深入交流。
得益于通义千问强大的技术支持,天猫精灵的用户体验将更具智能化和个性化。而在正式接入通义千问之后,天猫精灵在未来一段时间或许会出现比较大幅度的使用体验提升,这或许也可以帮助阿里巴巴进一步巩固其在智能音箱市场的领先地位。
现实壁垒
事实上,不只是小度和天猫精灵在ChatGPT领域有所布局,华为、小米等也在生成式AI技术以及智能音箱领域均有布局。不过,要想让搭载着生成式AI技术的智能音箱真正在每一个用户家中实现普及,其背后还存着一些天然壁垒。
一是,算力成本高昂。从算力层面来看,面对参数规模的大幅增长,“暴力堆叠”(利用大量高性能GPU)已经成为企业提升大模型训练效果的主要手段,这背后高昂的成本可能将会成为ChatGPT版智能音箱落地普及的门槛。
不过,随着开源大模型的出现,一些企业不需要自己从0到1去训练大模型,被训练好的大模型可以直接调用,再在这一基础上进行优化,这相比于从头开始训练的大模型,其成本将少得多。并且,未来随着算法进化,大模型训练过程中对算力的依赖度也会大大降低。
二是,搭载ChatGPT的智能音箱的使用场景受限。ChatGPT爆火的很大一部分原因是它可以颠覆式提升生产效率,而这种输出方式主要是以文字、图片、视频为主,但智能音箱则更注重语音交互。而且在人们的日常生活和工作中,需要音频反馈的内容可能只占一小部分,因此ChatGPT版智能音箱的普及落地需要寻找更多的适配于语音交互的场景,而使用场景受限则意味着使用ChatGPT版智能音箱可能很快也会褪去热度。
三是,搭载ChatGPT的智能音箱可能面临数据安全挑战。若想要搭载生成式AI技术的智能音箱能够更好地理解用户需求,并给出个性化的解决方案,那么生成式AI势必会涉及对用户个人信息的收集,而用户对于个人隐私的收集问题一直都比较敏感。另外,相关的法律法规并不健全,这都将是ChatGPT版智能音箱在普及过程中面临的挑战。
此外,ChatGPT对智能音箱整个产业的影响必然是一个长期的过程,而生成式AI技术仍处于发展早期,其对于智能音箱这一产业所产生的切实影响可能还未明确展现出来,但可以预见的是,ChatGPT引爆的热潮正在加速这一进程。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
推理与多模态的终极融合,将彻底终结用户在不同模型间切换的烦恼。7月7日,OpenAI正式确认将在今年夏季推出新一代人工智能模型GPT-5。这一突破性产品将整合现有的多个强大模型,特别是融合专注推理能力的“O系列”与具备多模态功能的“GPT系列”,为用户提供前所未有的统一体验。OpenAI开发者体验负
近日,OpenAI宣布推出其最新旗舰生成式AI模型GPT-4o。相较于GPT-4Trubo,GPT-4o速度更快、价格也更便宜据悉,ChatGPT可以读取人类的情绪,但读取过程有一点困难。OpenAI,是一家位于美国旧金山的人工智能研究公司,现由营利性公司OpenAILP及非营利性母公司OpenAI
关注卢松松,会经常给你分享一些我的经验和观点。OpenAI宣布:从今天起,ChatGPT打开即用,无需再注册帐号和登录了!不过,免登录无法享受一些高级功能,比如分享聊天记录、自定义指令等等。松松刚测试了一下:使用ChatGPT还是需要注册登录的,但是免去了手机号验证码的环节。而且OpenAI实际开放
近日,人工智能领域的领军人物,ChatGPT之父萨姆·阿尔特曼(SamAltman)发表了令人振奋的言论。他表示,人类水平的人工智能(AI)即将出现,这一变革性技术的发展将为世界带来前所未有的影响。作为OpenAI的首席执行官,阿尔特曼的这番言论引发了业界和学术界的广泛关注。一直以来,实现具有人类智
当你看到这类是不是就明白一二了?只不过很多人是借了AI的手来回答了一些热点问题,ChatGPT成了背锅侠,而这个背锅侠却无法反抗。
凌晨两点,小王合上笔记本,揉了揉酸胀的眼睛。花了一个月写出来的10万字短剧剧本躺在硬盘里,要真正把它拍成剧,得找演员、租场地、请摄像、做后期……粗算下来少说要几十万,他只能把剧本继续锁在抽屉里。不过,现在小王的剧本可以“见光”了。2026年3月19日,字节跳动旗下的小云雀AI正式上线了短剧Agent
你一定遇到过这样的场景:明明刚和AI助手聊了半个小时的项目细节,退出会话后重新打开,它却像个失忆患者一样,连你上一轮说过什么背景信息都忘得一干二净,你又得从头把需求讲一遍。这种“聊完就忘”的体验,让无数使用AI智能体的用户深感头疼。为了解决这一普遍困扰,腾讯云在4月3日正式推出了名为“龙虾”的记忆服
4月3日凌晨,谷歌DeepMind悄然甩出一枚重磅炸弹——全新一代开源大模型Gemma4正式发布,以极其宽松的Apache2.0协议向全球开发者免费开放。这是自2025年3月发布Gemma3以来,谷歌时隔整整一年的重大迭代。本次发布的Gemma4包含四个不同规格的版本:E2B(有效20亿参数)、E4
AI龙虾也会生病。别怕,大部分病不是什么绝症,自己在家就能治。我养OpenClaw一年多,总结出五种最常见的毛病,附上我的“土方子”,希望对你有用。病一:不吃食(完全不执行任何任务)症状:你给了指令,它没反应,日志里一片空白。就像龙虾趴在塘底不动弹,碰它也不理。病因:通常是进程卡死了,或者依赖服务没
养过真龙虾的人都知道,投喂是个技术活。喂少了,龙虾饿得互相残杀;喂多了,剩饵坏水,整塘发病。OpenClaw这个AI龙虾也一样——你给它安排的任务太少,它会“闲得发慌”,反应迟钝;你一次塞给它太多复杂任务,它会“消化不良”,要么报错要么干一半就卡住。每天该喂几次?我的经验是:每天喂两次,早上一次简单
养过真龙虾的人都知道,苗种的好坏直接决定收成。养AI龙虾也一样——OpenClaw有不同版本,有的稳定但功能少,有的功能多但爱“闹脾气”。新手该怎么选?我用自己的踩坑经历告诉你。版本怎么选?OpenClaw目前主要有三个分支:稳定版(Stable)、测试版(Beta)和社区魔改版(Community
我第一次听说OpenClaw,是在一个技术群里。有人发了一串代码,说“这个AI龙虾特别好养,会自己找食吃”。我好奇点进去,结果对着终端发了一小时呆——连环境都没搭起来。后来我才明白,养AI龙虾跟养真龙虾一样,新手入门得先做足功课。第一问:我的电脑跑得动吗?很多人以为AI龙虾就是个聊天机器人,打开网页
4月2日,字节跳动旗下火山引擎在武汉举行的AI创新巡展上宣布,Seedance2.0API正式面向企业用户开启公测。同时,火山引擎总裁谭待在会上披露,截至今年3月,豆包大模型日均Token使用量已突破120万亿,在过去三个月内增长一倍,比2024年5月发布时增长1000倍。Seedance2.0:从
养AI小龙虾的路上,坑不少。有人被代装服务骗了钱,有人电脑中了毒,有人收到天价账单,还有人发现AI“失控”了,开始乱删文件。如果你也遇到这些糟心事,别慌。下面这份“养虾应急包”,告诉你第一时间该做什么。场景一:代装被骗,钱打水漂了花了300块找人远程装OpenClaw,结果对方收了钱就拉黑,或者装了
把AI智能体请进电脑,就像把家里所有的钥匙交给了一个陌生人。它能帮你打扫房间、整理文件,但万一它“起了坏心”,或者被坏人利用了,你的家就不再安全了。这不是危言耸听。国家互联网应急中心已经发布风险提示,指出OpenClaw的默认配置“极为脆弱”,攻击者一旦得手,能轻易获取系统控制权。微软安全团队也警告