也许你也有过这样的经历,向智能客服咨询问题,却陷入毫无进展的对话里:
-你们家的面膜都是纯天然的?
-亲亲,我们家的面膜都是芦荟精华提取,纯天然的哦~
-我皮肤有点干,推荐一款呗~
-冬天皮肤干燥推荐给亲亲我们的保湿精华乳~
-我是要买面膜,你是机器人吧,让人来说话。
作为顾客,此时你大概要叹一句“人工智能真不智能”。这些所谓“智能”客服们往往只能做到一问一答,一旦对话涉及稍微复杂的情境,它们就开始答非所问。
让人工智能学会根据上下文去处理信息,是自然语言处理技术一个关键的门槛,也是多年来整个学术界和工业界都在努力攻克的难题。尽管在通用NLP领域,gpt-2,BERT等算法模型的出现,让语义理解取得了重大进展,但是由于专业性强、垂直语料库不足等原因,某些亟待落地的应用场景,例如高强度的客服对话,还深陷在开头出现的“人工智障”泥潭中。
最近,这个难题迎来了新进展。晓多科技(下称“晓多”)开发的基于上下文的语义识别项目,以深度学习的方式,让智能问答机器人能够像人类一样,结合语境去理解复杂场景下的对话,并且进行持续的自我学习,无需人工设置规则,也能不断扩展和覆盖更多的场景。
从一问一答到读懂语境
为什么人工智能会有这些“不智能”的表现?这是因为目前市面上主流的智能问答机器人,大部分都是根据单个句子来识别顾客的意图,从而进行一问一答的任务型对话。但在日常聊天对话中,我们习惯口语化表达,尤其在打字时,一般不会大段大段地发送,而会使用很多断句,这种零碎的表达使得机器人无法从单个句子中准确识别出你的真实意图,造成答非所问的情况。
这对于服务业来说是一个致命伤。
和普通的闲聊机器人不同,智能客服必须做到对各种场景的精准识别。因为智能客服面对的工作,是要及时地、明确地解决顾客的问题。
当你和闲聊机器人逗趣的时候,它答非所问的话并不会让你烦躁,反而觉得很有趣味;但当你只想赶紧退货或者得到赔偿时,智能客服的胡言乱语足够让烦躁的顾客给这家店铺打上0星,并在评论区洋洋洒洒好几百字,控诉店铺服务不到位。
在商品售前阶段也是这样,智能客服错误的回复或答非所问,都会影响顾客的体验度,平台商家竞争激烈的情况下,得不到满意答复的顾客可能会很快放弃,选择另外一家店铺,从而造成顾客的大量流失。

单句识别与上下文识别的差别
解决这一问题的关键,在于要让机器人像人一样,学会联系上下文,结合语境来对话,而不仅仅对单个句子作出反应。
目前市面上其他机器人都不支持上下文语义,他们是在靠规则和流程设置关键词。也就是说,这个情景中需要什么信息,就要设计出对应的问题,让机器人按照固定的顺序提问,顾客按照要求回答完所有问题,机器人才能根据所有信息来进行回应。
例如,顾客要购买飞机票,就要设定机器人首先询问顾客起点、终点、时间,再问顾客想要什么等级的座位等等,通过这些固定问题的答案,把需要的信息补充完整,最终给出推荐。
在这种情况下,每一个场景都需要人工去设定对应的规则,效率十分低下。尤其在电商领域,从售前到售中,再到售后,涉及到的问题是方方面面的,更别说还有购物品类的区别,场景的扩展是指数级的,靠人工设定规则去做到全覆盖,说是天方夜谭也不为过。
如果能够将目前人工智能领域大热的深度学习应用到这一问题的解决上,让机器人能够通过自己学习,掌握基于上下文的语义理解,并持续学习扩展到各个场景中,就可以大大地提高智能机器人面对复杂场景的精准应对能力,同时提高它覆盖各种场景的效率。怀着这样的想法,晓多开始了上下文语义项目。
让机器人自己“划重点”:记住重要信息,忘记不重要的
机器人自己学会理解上下文,困难在哪里?晓多算法工程师、本次上下文语义项目的负责人张翀向大数据文摘介绍,最关键的问题在于要让机器人像人一样记得上文的重要信息,并且知道这些信息和当前问句的关联。
在这个问题上,目前学术界和业界并没有现成的解决方案。对此,张翀介绍,晓多为新一代问答机器人创新设计了一个深度学习模型,包含四个模块:记忆与遗忘、提炼、融合、输出。
记忆与遗忘模块赋予机器人记住上文关键信息的能力。没有记忆能力的机器人,只会对最近的一句话作出反应,而晓多的模型可以帮助机器人把前后的诉求关联起来,及时作出准确的推荐。

点击图片查看详细内容
在技术上,晓多做出了一个此前业界还没有实现过的创新应用,参照一个名叫长短期记忆网络(LSTM)的结构,设计实现会话级别的记忆和遗忘。
晓多的又一创新,是应用于提炼模块的注意力机制。它会自动对上文的每一条信息进行计算,算出这些信息与当前句子对应的重要程度,重要程度高的,就会被保留下来。
假如顾客得到了满意的产品推荐之后,又提出“什么时候发货”的问题,注意力机制通过计算,就会发现上文的重要程度并不高,这样,无用的信息就会被过滤,与当前对话有关联的上文信息被选取出来,进入下一个模块中。
在融合模块中,机器人会对提炼出的上文关键信息和当前聊天消息结合,来识别顾客的意图。晓多采用的方式是在向量空间做梳理,简单来说,可以理解为提取上文关键信息是在机器人大脑内部的一个操作,这之后,再在一个抽象的空间里,把提取出来的关键信息与当前的单句进行综合,最终输出一个结合上文信息和当前单句所做出的判断。
这个模型在实验中得到的数据令人惊喜。晓多从真实电商聊天⽇志中抽取了若⼲涉及上下⽂的问答样本,构造两份意图识别测试集,分别对应两个电商领域,对⽐发现结合上下⽂预测的模型效果远超只根据单句预测的模型:

recall(召回率)=机器人正确识别的问题数/问题总数;
Precision(精确率)=机器人正确识别的问题数/机器人已识别的问题数;f1core=2*precision*recall/(precision + recall) ,表示综合考虑召回率和精确率的评分;
这些工作并不是想到就可以做到的,对机器人的训练需要大量的数据,迁移学习能力是晓多能够实现这些创新的关键。
“人工智能的深度学习,突出的特点就是对数据的依赖非常大,”张翀说,“因为深度学习模型的参数非常多,你可以理解为它是一个更复杂的智能体,数据是它学习的依据,它要学习的东西越多,需要的数据就更多,而你给它的数据越多,它也越聪明。”
目前,晓多的标注团队从上百亿的数据中进行分析提取的价值样本,提供给机器学习进行数据训练。
如果每一步都需要人工设计,从发现场景、总结规律,到最后开发、测试、上线,可能需要至少两周的时间才能扩展一个场景,张翀介绍说,而使用这样的数据标注让机器进行深度学习,只需要几天的时间,就可以同时扩展几十个场景、几百个产品。
各个行业的电商客服需要应对的场景虽然有很多差异,但有一些数据却是通用的,包括关于快递物流的问答等。晓多对标注好的数据进行了模块拆分,区分出通用数据,当机器人需要对新行业进行学习时,可以直接使用这些标注好的通用数据,实现迅速的扩展学习。
谈到数据、算法和计算能力的关系,张翀认为,数据是基础,大数据为机器学习装上引擎;算法是核心,将人工智能带到全新高度;而计算能力是保障,为算法的实现提供坚实的后盾。
不止于此,顾客体验迎来后智能化时代
从售前的商品导购,到售中咨询运费、活动赠品等,目前,晓多的上下文语义项目已经投入使用,覆盖了多种电商服务场景。这仅仅只是这项技术投入应用的第一步,晓多的业务计划中,还涉及到更多的业务铺开。在售前,顾客可能会要求客服进行商品推荐,他们的需求点信息包含在整个对话过程中。传统的客服机器人只能根据顾客最后的需求进行推荐,而晓多机器人会对顾客的会话信息进行分析,更加准确地识别到顾客的真实需求,推荐给顾客符合心意的产品。

另外,对于电商行业中热门的服装领域来说,售前的服装尺码推荐是客服经常会遇到的问题,店铺内大量商品的尺码各不相同,尺码问题会耗费客服大量的人力。通过上下文识别的手段,客服机器人可以获取顾客的尺码信息,准确地进行尺码推荐。


在销售过程中,顾客常常要询问运费问题,这就涉及到了首次购买和退换货两种场景。没有上文语境,机器人就只能解读出“运费”,而不能准确地判断顾客询问的是首次购物运费还是退换货运费,可能导致错误的回复。而在加入了上下文理解后,机器人能够准确判断顾客的实际问题,准确地回复此类问题。

另一个常见的售中场景是关于活动赠品的问题。当店铺进行活动优惠提供赠品时,顾客的提问可能不是针对商品,而是针对赠品,需要机器人通过语境来识别,防止混淆这两个方面的提问,给出张冠李戴的答案。
这项技术不但可以应用在智能对话上,智能营销、智能质检、情绪识别……客服行业中还存在着更多未被开发的可能性。
对于晓多来说,这意味着他们为顾客提供的服务,向超专家级更进了一步。“我们现在可能只是把它应用在语义识别上,但后续我们在其它业务线上还可以继续铺开。我们把它当成一个基础的能力,一个支撑我们整个公司的算法产品。”张翀说。
晓多也期待着,上下文语义识别可以作为技术基石应用到行业各个方面,通过推开这项技术的应用,机器人可以自动生成尺码表,自动获取个性化对话内容进行系统自动萃取对接等等,机器人行业一直以来由人工配置的时代可能走向终结,而迎来一个从数据中学习后智能化自动生成的时代。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
8月16日,卢松松非常荣幸的成为了一名《2025世界人形机器人运动会》的观众。这是一场超酷的机器人运动会,也是人类给机器人办的第一届奥运会,来自16个国家的280支队伍会参加500多个比赛项目。看了一天的比赛,晚上就回来写文章,编辑短视频。先说感悟:(1)这是人类首次给机器人办的第一届运动会,史无前
文/八真来源/节点财经具身智能赛道,谁最有可能拔得A股资本市场的头筹?答案大概率是诞生刚刚两年,由华为"天才少年"、B站百万粉丝科技UP主稚晖君(彭志辉)创立的智元机器人。近期,从事新材料研发与生产的上纬新材(688585.SH)丢出重磅炸弹,宣布智元机器人及相关主体将通过收购其至少63.62%的股
©自象限原创编辑丨程心20世纪50年代开始,世界所有的汽车公司都竞相开发操作简单,功能齐全的理想家庭用车。1950年,全球汽车总产量首次超过一千万辆。价格低廉、驾驶方便、油耗低的百姓汽车广受大众青睐。但从1888年,奔驰生产出世界上第一辆可供售的汽车至1950年,整整经历了60年,家用汽车才开始走向
近年来,协作机器人产品发展势头十分强劲,尤其在工业生产方面,由于更为灵活便捷,能够实现人机安全协作,已形成较为广泛的应用。值得一提的是,协作机器人在消费场景的应用潜力也在逐步释放,比如,1月初,库迪咖啡宣布人机协作战略,计划通过门店员工和机器人的协作,进一步优化客户体验和成本结构。据悉,该战略的实施
“养龙虾”到底要花多少钱?这个问题可能是大家最关心的。我们把成本拆成三部分:服务器租用费+大模型API调用费+杂项开销。第一部分:服务器租用费。最省钱的方案当然是本地旧电脑自托管——零新增成本,电费忽略不计。但如前所述,你需要接受“不是7×24小时在线”的局限性。如果选择云服务器,成本差异就很大了。
不少朋友第一次接触OpenClaw时,都会有一个相同的困惑:这玩意儿到底该装在哪里?OpenClaw(社区戏称“养龙虾”,因Logo为龙虾钳)不是普通的聊天机器人,而是一款本地优先、可自主执行、支持多Agent分工协作的AI执行网关。说白了,它让大模型从“只会说话”变成“会动手做事”——帮你管理文件
01别相信“一键养虾,躺平赚钱”的鬼话打开社交媒体,你可能会看到这样的标题:“养只龙虾自动炒股,零代码养出数字巴菲特!”信了,你就输了。真实情况是:一个做跨境电商的小哥花了200元租服务器、订阅API,指望龙虾帮他炒股暴富。结果龙虾开始几天还像模像样,后来直接摆烂,生成个干瘪的大纲就敷衍了事。AI是
一张证书引发的讨论4月7日,北京嫣然天使儿童医院给陈光标发了一张感谢证书,感谢他捐赠1000万元。这事说起来挺曲折的。此前陈光标高调说要赠给张雪一台价值1300万元的劳斯莱斯,张雪回应“收了,八折卖掉捐给嫣然”,一番拉扯之后,陈光标把车变现,1000万元直接打到了嫣然医院账上。医院发证书感谢,本来是
2026年4月7日,国家安全部就AI核心术语“词元”(Token)发布安全警示,强调在日均调用量突破140万亿规模的市场背景下,需高度警惕由此引发的数据泄露与金融诈骗风险。据统计,截至今年3月,我国日均词元调用量已超过140万亿,较2024年初增长1000多倍。词元作为大模型处理信息的最小单元,兼具
如今出门,如果你还没用过AI智能助手,可能真有点跟不上节奏了。无论是写作文、查资料,还是规划出行路线,越来越多的人已经习惯随手打开AI问一句。这股热潮背后,中国AI大模型用实打实的数据交出了一份亮眼的成绩单。根据全球知名AI模型聚合平台OpenRouter的最新数据,在3月30日至4月5日这一周,中
01别在主电脑上养!这是最最重要的一条“保命”建议。很多小白心血来潮,直接在自己存着毕业论文、工作文件、银行卡信息的主力电脑上部署OpenClaw。然后悲剧发生了:让龙虾帮忙整理一下桌面文件,结果它把整台电脑的文件全删了。这不是段子,是真事。OpenClaw一旦被授予高权限,就能执行删除、修改等不可
01免费领养,但饲料要钱很多人第一次听说OpenClaw时,脑子里冒出的第一个念头是:开源软件,那不免费吗?没错,OpenClaw本身确实是开源的,下载安装一分钱不收。但你很快就会发现,真正的开销根本不在这里。养一只“龙虾”,就像领养了一只宠物——领养免费,但“虾缸”“虾粮”“虾保姆”都得自己掏钱。
一只“龙虾”,火遍全网“今天你养龙虾了吗?”这句话在2026年初,迅速取代“吃了吗”成为社交媒体上的新晋暗号。别误会,这不是什么水产养殖新风口。这里说的“龙虾”,是一款名为OpenClaw的开源AI智能体。因为它的图标是一只红色龙虾,网友们便把部署、配置和使用它的过程,戏称为“养龙虾”。一个开源软件
凌晨两点,小王合上笔记本,揉了揉酸胀的眼睛。花了一个月写出来的10万字短剧剧本躺在硬盘里,要真正把它拍成剧,得找演员、租场地、请摄像、做后期……粗算下来少说要几十万,他只能把剧本继续锁在抽屉里。不过,现在小王的剧本可以“见光”了。2026年3月19日,字节跳动旗下的小云雀AI正式上线了短剧Agent