近日,智言科技AI团队刷新CommonsenseQA数据集世界排名,以超出第二名3个百分点的成绩位列榜单第一。该榜单参与团队包括微软亚洲研究院、阿里达摩院、FacebookAI、CMU等。以常识性问答为应用是 NLP 最重要的前进方向之一,其目的是帮助计算机通过已有的知识来推理判断未见过的输入信息,从而使计算机更理解人的意思。
CommonsenseQA任务由以色列特拉维夫大学建立,是一个新的多项选择题答案数据集,它需要不同类型的常识知识来预测正确的答案,是极具有挑战性的数据集。数据集中的12102个问题,包含一个正确答案和四个干扰因素答案,测试结果每两周评估一次。目前排名第一的智言科技团队获得76.5%的准确性,在排名中超越第二名3个百分点,在NLP领域中已是很大的进步和超越,但是仍低于人类88.9%的水平,可见NLP在常识性推理方向仍有很大挑战和进步空间。

CommonsenseQA LeaderBoard,智言科技目前排名第一
当人类回答问题时,他们会依据常识、背景知识、空间关系、原因、结果、科学事实和社会惯例等,来判断问题答案。例如,提出了一个问题:“当李蒙听到割草机的声音时,他在哪里?”可以推断割草机靠近李蒙时,同时可能在户外并位于街道上。这种知识对人类而言似乎微不足道,但是仍然超出了当前的自然语言理解(NLU)系统。
当前阅读理解模型主要所关注的问题类型是事实类问题(factoid questions),这类型的问题答案往往能直接在原文中找到,然而如何基于常识和背景知识进行推理以获得答案仍旧是一个巨大的挑战。数据集 CommonsenseQA、CosmosQA 等相继被提出便是为了促进该方向的发展。在这些数据集中,机器需要结合常识知识来回答诸如“我可以站在河上的什么地方看水流而不会弄湿自己?”这样的问题,因此更具挑战性。
如果想人工智能要更好地服务于人类、更多地介入人类的日常生活,人工智能机器人就需要理解人类自然语言的意义,提前学习、掌握常识并据此进行推理。大家已经充分地认识到:人工智能的下一步发展和实用化,必须突破语义理解和常识推理这一瓶颈。我们认为语义理解和常识推理研究的进展,依赖于全新的自然语言处理技术和理念。
在商业化应用当中,人工智能带来的首先应该是商业模式上的转变,然后是运用的效率转变。智言科技的AI团队始终专注于自然语言处理领域的技术突破,同时将知识图谱融入其中,帮助传统企业进行数字化转型。基于多个垂直行业的大量对话应用场景,智言科技在自然语言理解、意图识别及逻辑推理等技术上取得了较好的效果。
对于企业员工来说,客户所提出的问题相似度很高,使得工作重复繁琐,这部分工作已经实现人工智能技术的部分替代性,有效提高工作效率,降低企业运营成本。除此之外,在常规问答中,为了提高机器人的问答能力边界,以知识图谱形式应用的非结构化数据、对话的数据不断累积,从而优化语料库、提高准确率。这些数据也是企业未来数字化转型的新燃料。
目前市面上大部分的商业落地项目主要采用深度学习的技术提高模型的识别率以及对话准确度,这样的方式需要大量的数据。到了一个阶段之后,即使加大数据量也无法提高模型的准确率,且过程无法解释,开放领域的多轮对话目前还处在弱人工智能的阶段。智言科技的知识图谱+深度学习的优势是数据量小、过程可以解释、准确度高,将两项结合为强人工智能奠定基础。例如,智言科技在金融领域,已经构建了数十万份非结构化文档的知识图谱,成为支撑落地应用中的数据源动力。同时,为了更好的完成企业智能化应用的闭环,智言科技AI团队在图像识别、语音识别、语音合成等领域都在不断探索,从而为用户带来更好的智能化体验。

智言科技构建非结构化文档形成为知识图谱
人工智能势必将对人们的工作产生深刻影响,因此建立新的内部业务模式流程变得前所未有的紧迫。一些领先的企业认识到,人工智能将对业务模式、员工结果及客户和员工期望获得的体验产生重大影响。智言科技AI团队对于自然语言处理技术以及知识图谱技术在不断地探索和研发。智言科技也希望通过搜索、推荐、语音及语义识别等人工智能算法,能够满足业务量快速增长的目标,助力企业完成在新的业务模式和传统系统之间的平稳过渡。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,
个人创业需要启动成本低、无需庞大团队、可快速验证、能利用个人技能或资源。这里分享适合个人创业的十个机会一.AI内容优化与本地化服务·做什么:帮助企业或个人利用AI工具(如GPT-4,Midjourney)优化内容生产流程。例如,为跨境电商撰写多语言产品描述,为小红书博主生成爆款文案,为小公司制作营销
文/道哥美国设计软件公司Figma近期在纽约证券交易所挂牌上市,首日即上演“狂飙”行情——发行价定每股33美元,开盘报价85美元,较发行价翻倍。首日收报115.50美元,较发行价大涨约250%,市值飙升至近670亿美元,创下近30年来同等规模美股IPO的最大单日涨幅纪录。然而,随着短线资金获利了结,
文/一灯来源/节点财经在当前无人敢缺席的AI军备竞赛中,巨头们一面为巨额的资本支出焦虑,一面又向市场勾勒着未来的宏伟蓝图。在各家动辄千亿级投入的背景下,市场迫切需要一份关于AI回报价值的有力证明。而腾讯,率先给出了答卷。8月13日,腾讯控股发布2025年第二季度财报。尽管资本开支同比剧增119%,达
文/二风来源/节点财经2025年的硅谷,一场没有硝烟的战争正以前所未有的烈度上演。这场战争的核心武器不是代码或芯片,而是人——那些全球仅有数千名、能够构建未来人工智能基础模型的顶尖大脑。在这场激烈的人才争夺战中,Meta及其首席执行官马克·扎克伯格(MarkZuckerberg)正扮演着最具侵略性的
12月12日-14日,2025全球开发者先锋大会暨国际具身智能技能大赛(GDPS2025)于上海张江科学会堂举行,大会以具身智能竞技为核心,融合了技术比拼、产业展示与科普体验,为全球观众呈现出具身智能的现在与未来。上海开普勒机器人有限公司(以下简称"开普勒机器人")携明星产品K2"大黄蜂"亮相,并参
在数字化与智能化深度交织的时代浪潮中,安全的边界不断延展,技术的演进正引领产业迈向新一轮变革。10月24日,以“弈动Dynamic·数智跃迁博弈无界”为主题的2025TechWorld智慧安全大会在北京盛大召开。来自国家部委、院士学者、高校科研机构和企业的权威专家与业界精英齐聚北京,共议AI安全、数
2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,
我觉得我们AI的目标是:从芯片设计到软件生态,全链路自主开发,建立可控的世界级AI体系。所以这是俺对未来5年中国AI圈的展望和判断。(1)2026年,英伟达造车、国产开车26年国产芯片会在推理和垂直场景上发力。以DeepSeek为代表,大多数AI大模型会以软件弥补硬件不足,所以训练和推理分开,训练就
文/道哥在深陷“后门”风波、接受网信办问询之后,英伟达的“特供版”H20芯片,又有了新消息。近日,美国科技媒体《TheInformation》援引知情人士消息称,英伟达已悄然向其关键供应商——包括负责封装的安靠科技、供应高带宽内存的三星电子、以及承担后端处理的富士康发出指令,要求暂停所有与H20AI
文/二风来源/节点财经一场关于“中国芯”的IPO审议,正把投资者们的目光锁定在上交所。根据上交所发布的公告,上市审核委员会已定于9月26日审议摩尔线程的科创板首发申请。作为中国半导体自主化浪潮中最受瞩目的“考生”之一,包括其创始人显赫的英伟达背景、高达80亿元人民币的募资雄心,以及在国产GPU领域取
技术的进步永无止境,继创下TPC-C性能&性价比双冠之后,阿里云PolarDB云原生数据库再度实现关键突破。9月24日杭州云栖大会上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技术的PolarDB数据库专用服务器。在原有RDMA网络的基础上,Polar
2025年9月24日,在杭州举办的云栖大会上,阿里云正式发布全新一代服务器操作系统AlibabaCloudLinux4(简称Alinux4)。Alinux4基于Linux6.6内核打造,是首个全面遵循龙蜥社区“开源生态合作倡议”规范的商业发行版。它不仅兼容主流开源社区生态,更针对阿里云最新9代ECS