近日,智言科技AI团队刷新CommonsenseQA数据集世界排名,以超出第二名3个百分点的成绩位列榜单第一。该榜单参与团队包括微软亚洲研究院、阿里达摩院、FacebookAI、CMU等。以常识性问答为应用是 NLP 最重要的前进方向之一,其目的是帮助计算机通过已有的知识来推理判断未见过的输入信息,从而使计算机更理解人的意思。
CommonsenseQA任务由以色列特拉维夫大学建立,是一个新的多项选择题答案数据集,它需要不同类型的常识知识来预测正确的答案,是极具有挑战性的数据集。数据集中的12102个问题,包含一个正确答案和四个干扰因素答案,测试结果每两周评估一次。目前排名第一的智言科技团队获得76.5%的准确性,在排名中超越第二名3个百分点,在NLP领域中已是很大的进步和超越,但是仍低于人类88.9%的水平,可见NLP在常识性推理方向仍有很大挑战和进步空间。

CommonsenseQA LeaderBoard,智言科技目前排名第一
当人类回答问题时,他们会依据常识、背景知识、空间关系、原因、结果、科学事实和社会惯例等,来判断问题答案。例如,提出了一个问题:“当李蒙听到割草机的声音时,他在哪里?”可以推断割草机靠近李蒙时,同时可能在户外并位于街道上。这种知识对人类而言似乎微不足道,但是仍然超出了当前的自然语言理解(NLU)系统。
当前阅读理解模型主要所关注的问题类型是事实类问题(factoid questions),这类型的问题答案往往能直接在原文中找到,然而如何基于常识和背景知识进行推理以获得答案仍旧是一个巨大的挑战。数据集 CommonsenseQA、CosmosQA 等相继被提出便是为了促进该方向的发展。在这些数据集中,机器需要结合常识知识来回答诸如“我可以站在河上的什么地方看水流而不会弄湿自己?”这样的问题,因此更具挑战性。
如果想人工智能要更好地服务于人类、更多地介入人类的日常生活,人工智能机器人就需要理解人类自然语言的意义,提前学习、掌握常识并据此进行推理。大家已经充分地认识到:人工智能的下一步发展和实用化,必须突破语义理解和常识推理这一瓶颈。我们认为语义理解和常识推理研究的进展,依赖于全新的自然语言处理技术和理念。
在商业化应用当中,人工智能带来的首先应该是商业模式上的转变,然后是运用的效率转变。智言科技的AI团队始终专注于自然语言处理领域的技术突破,同时将知识图谱融入其中,帮助传统企业进行数字化转型。基于多个垂直行业的大量对话应用场景,智言科技在自然语言理解、意图识别及逻辑推理等技术上取得了较好的效果。
对于企业员工来说,客户所提出的问题相似度很高,使得工作重复繁琐,这部分工作已经实现人工智能技术的部分替代性,有效提高工作效率,降低企业运营成本。除此之外,在常规问答中,为了提高机器人的问答能力边界,以知识图谱形式应用的非结构化数据、对话的数据不断累积,从而优化语料库、提高准确率。这些数据也是企业未来数字化转型的新燃料。
目前市面上大部分的商业落地项目主要采用深度学习的技术提高模型的识别率以及对话准确度,这样的方式需要大量的数据。到了一个阶段之后,即使加大数据量也无法提高模型的准确率,且过程无法解释,开放领域的多轮对话目前还处在弱人工智能的阶段。智言科技的知识图谱+深度学习的优势是数据量小、过程可以解释、准确度高,将两项结合为强人工智能奠定基础。例如,智言科技在金融领域,已经构建了数十万份非结构化文档的知识图谱,成为支撑落地应用中的数据源动力。同时,为了更好的完成企业智能化应用的闭环,智言科技AI团队在图像识别、语音识别、语音合成等领域都在不断探索,从而为用户带来更好的智能化体验。

智言科技构建非结构化文档形成为知识图谱
人工智能势必将对人们的工作产生深刻影响,因此建立新的内部业务模式流程变得前所未有的紧迫。一些领先的企业认识到,人工智能将对业务模式、员工结果及客户和员工期望获得的体验产生重大影响。智言科技AI团队对于自然语言处理技术以及知识图谱技术在不断地探索和研发。智言科技也希望通过搜索、推荐、语音及语义识别等人工智能算法,能够满足业务量快速增长的目标,助力企业完成在新的业务模式和传统系统之间的平稳过渡。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,
个人创业需要启动成本低、无需庞大团队、可快速验证、能利用个人技能或资源。这里分享适合个人创业的十个机会一.AI内容优化与本地化服务·做什么:帮助企业或个人利用AI工具(如GPT-4,Midjourney)优化内容生产流程。例如,为跨境电商撰写多语言产品描述,为小红书博主生成爆款文案,为小公司制作营销
文/道哥美国设计软件公司Figma近期在纽约证券交易所挂牌上市,首日即上演“狂飙”行情——发行价定每股33美元,开盘报价85美元,较发行价翻倍。首日收报115.50美元,较发行价大涨约250%,市值飙升至近670亿美元,创下近30年来同等规模美股IPO的最大单日涨幅纪录。然而,随着短线资金获利了结,
文/一灯来源/节点财经在当前无人敢缺席的AI军备竞赛中,巨头们一面为巨额的资本支出焦虑,一面又向市场勾勒着未来的宏伟蓝图。在各家动辄千亿级投入的背景下,市场迫切需要一份关于AI回报价值的有力证明。而腾讯,率先给出了答卷。8月13日,腾讯控股发布2025年第二季度财报。尽管资本开支同比剧增119%,达
文/二风来源/节点财经2025年的硅谷,一场没有硝烟的战争正以前所未有的烈度上演。这场战争的核心武器不是代码或芯片,而是人——那些全球仅有数千名、能够构建未来人工智能基础模型的顶尖大脑。在这场激烈的人才争夺战中,Meta及其首席执行官马克·扎克伯格(MarkZuckerberg)正扮演着最具侵略性的
“养龙虾”到底要花多少钱?这个问题可能是大家最关心的。我们把成本拆成三部分:服务器租用费+大模型API调用费+杂项开销。第一部分:服务器租用费。最省钱的方案当然是本地旧电脑自托管——零新增成本,电费忽略不计。但如前所述,你需要接受“不是7×24小时在线”的局限性。如果选择云服务器,成本差异就很大了。
不少朋友第一次接触OpenClaw时,都会有一个相同的困惑:这玩意儿到底该装在哪里?OpenClaw(社区戏称“养龙虾”,因Logo为龙虾钳)不是普通的聊天机器人,而是一款本地优先、可自主执行、支持多Agent分工协作的AI执行网关。说白了,它让大模型从“只会说话”变成“会动手做事”——帮你管理文件
01别相信“一键养虾,躺平赚钱”的鬼话打开社交媒体,你可能会看到这样的标题:“养只龙虾自动炒股,零代码养出数字巴菲特!”信了,你就输了。真实情况是:一个做跨境电商的小哥花了200元租服务器、订阅API,指望龙虾帮他炒股暴富。结果龙虾开始几天还像模像样,后来直接摆烂,生成个干瘪的大纲就敷衍了事。AI是
一张证书引发的讨论4月7日,北京嫣然天使儿童医院给陈光标发了一张感谢证书,感谢他捐赠1000万元。这事说起来挺曲折的。此前陈光标高调说要赠给张雪一台价值1300万元的劳斯莱斯,张雪回应“收了,八折卖掉捐给嫣然”,一番拉扯之后,陈光标把车变现,1000万元直接打到了嫣然医院账上。医院发证书感谢,本来是
2026年4月7日,国家安全部就AI核心术语“词元”(Token)发布安全警示,强调在日均调用量突破140万亿规模的市场背景下,需高度警惕由此引发的数据泄露与金融诈骗风险。据统计,截至今年3月,我国日均词元调用量已超过140万亿,较2024年初增长1000多倍。词元作为大模型处理信息的最小单元,兼具
如今出门,如果你还没用过AI智能助手,可能真有点跟不上节奏了。无论是写作文、查资料,还是规划出行路线,越来越多的人已经习惯随手打开AI问一句。这股热潮背后,中国AI大模型用实打实的数据交出了一份亮眼的成绩单。根据全球知名AI模型聚合平台OpenRouter的最新数据,在3月30日至4月5日这一周,中
01别在主电脑上养!这是最最重要的一条“保命”建议。很多小白心血来潮,直接在自己存着毕业论文、工作文件、银行卡信息的主力电脑上部署OpenClaw。然后悲剧发生了:让龙虾帮忙整理一下桌面文件,结果它把整台电脑的文件全删了。这不是段子,是真事。OpenClaw一旦被授予高权限,就能执行删除、修改等不可
01免费领养,但饲料要钱很多人第一次听说OpenClaw时,脑子里冒出的第一个念头是:开源软件,那不免费吗?没错,OpenClaw本身确实是开源的,下载安装一分钱不收。但你很快就会发现,真正的开销根本不在这里。养一只“龙虾”,就像领养了一只宠物——领养免费,但“虾缸”“虾粮”“虾保姆”都得自己掏钱。
一只“龙虾”,火遍全网“今天你养龙虾了吗?”这句话在2026年初,迅速取代“吃了吗”成为社交媒体上的新晋暗号。别误会,这不是什么水产养殖新风口。这里说的“龙虾”,是一款名为OpenClaw的开源AI智能体。因为它的图标是一只红色龙虾,网友们便把部署、配置和使用它的过程,戏称为“养龙虾”。一个开源软件
凌晨两点,小王合上笔记本,揉了揉酸胀的眼睛。花了一个月写出来的10万字短剧剧本躺在硬盘里,要真正把它拍成剧,得找演员、租场地、请摄像、做后期……粗算下来少说要几十万,他只能把剧本继续锁在抽屉里。不过,现在小王的剧本可以“见光”了。2026年3月19日,字节跳动旗下的小云雀AI正式上线了短剧Agent