1. 创业头条
  2. 前沿领域
  3. AI智能
  4. 正文

搜狗击败讯飞阿里,获IWSLT国际口语机器翻译评测大赛冠军

 2018-10-31 10:40  来源:互联网  我来投稿 撤稿纠错

  阿里云优惠券 先领券再下单

近日,在刚刚落幕的IWSLT(International Workshop on Spoken Language Translation)国际顶级口语机器翻译评测大赛上,搜狗击败讯飞、阿里巴巴, APPTEK(美国应用科技公司)、AFRL(美国空军研究实验室)以及KIT(德国卡尔斯鲁厄理工学院)等国际国内多个强劲对手,一举夺得了2018年IWSLT大赛Baseline Model(基线模型)赛道冠军,代表中国向世界彰显了AI领域的技术硬实力!

表1 IWSLT大赛Baseline Model赛道最终结果

--取自IWSLT官方公布结:https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf

这是搜狗继WMT 2017机器翻译顶级评测大赛夺冠之后,所摘得的又一翻译领域的技术桂冠。短期内连续登顶世界第一的位置,充分证明了搜狗在翻译行业特别是口语翻译领域已位居领先地位。

IWSLT是什么比赛?

IWSLT是国际最具影响力的口语机器翻译评测比赛,从2004年开始已经举办了15届。每届比赛都吸引了世界各地机器翻译领域的知名企业和研究机构参与,本届比赛吸引了讯飞、阿里巴巴等国内公司,爱尔兰ADAPT中心,美国约翰霍普金斯大学,德国卡尔斯鲁厄理工学院,芬兰赫尔辛基大学,英国爱丁堡大学,美国AppTek公司等多家国际知名大学、研究机构和公司参加。

表2 IWSLT2018大赛参赛情况

--取自IWSLT官方公布结果:

:https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf

本届IWSLT 2018的口语机器翻译任务主要评测基于指定数据集从英语到德语的语音翻译能力,共分为Baseline Model(基线模型赛道)和End-to-End(端到端赛道)两个赛道,其中Baseline Model赛道主要评测语音翻译的流水线方案,输入语音先通过语音识别系统得到语音识别结果,之后将结果送入机器翻译系统获得译文,这也是业内最主流、效果最好的语音翻译解决方案,市场上商用机器同传、翻译机等语音翻译类产品几乎都采用了类似的方法;End-to-End则是本次评测新增设的赛道,主要鼓励参赛方探索基于神经网络的端到端语音翻译解决方案,希望能够输入语音,基于深度神经网络模型直接输出译文,这种方法目前仍处于早期研究阶段,受制于语音-文本平行语料难以大规模采集、算法研究不成熟等因素的限制,距离商用仍存在较大距离。本次评测中,在训练集、测试集相同的情况下,Baseline Model赛道最好的系统取得了28.09的BLEU(机器翻译质量评价指标,值越大代表翻译质量越好),而End-to-End赛道最好的系统仅取得了19.4的BLEU,较Baseline Model赛道相差8.69个BLEU,差距非常明显,也证明了Baseline Model赛道评测的算法仍是目前最可行和实用的解决方案。

搜狗本次参加的是Baseline Model赛道的评测,并取得了第一名的好成绩。评测任务面向TED演讲和大会学术报告场景,测试集包括来自英国、欧洲、印度等各个国家的英语演讲者,存在噪声、口音、自由表达等复杂语音现象,同时语言中存在大量领域专有名词和口语化的表达(如:大量语气词、错误语法表达等),具有极强的实战意义和挑战性。最终,搜狗提交的系统BLEU值达到28.09,领先排名第二的科大讯飞1.6个BLEU,证明了搜狗在口语机器翻译领域强大的实力。

AI赛道中持续发力,搜狗领跑语音翻译行业

搜狗的AI战略蓝图之中,语言是最核心的重头戏。一直以来,搜狗都坚持着“自然交互+知识计算”的人工智能核心方向,并持续深耕技术,推动技术向产品的快速转化,2016年,搜狗发布了自有人机交互解决方案-知音引擎。拥有充足真实语料数据优势的搜狗,将语音识别与机器翻译技术相结合,并在2016年推出了全球首款商用AI同传系统-搜狗同传,引领了语音翻译技术的普及与应用。通过数百场的国际会议“实战”,搜狗同传获得了无数媒体和观众的好评,成为当下炙手可热的“AI字幕君”。

与此同时,搜狗也推出了一系列的智能硬件,将语音翻译技术应用到了更广阔的场景之中,帮助用户打破了跨国交流时的语言困境。2018年3月,搜狗推出了搜狗旅行翻译宝,具备离线翻译功能与拍照翻译功能,让马化腾都为之心动,在朋友圈里大打广告。作为首款智能翻译硬件,它支持42种语言对话翻译,解决了旅游场景中用户听不懂、看不懂、不会说等真实痛点。该项产品在京东平台首发当日即告售罄,首日销售额破千万。与此同时,搜狗还推出了录音翻译笔,提供录音转写、对话翻译、同声传译等功能,把AI同传落地到了消费级产品之中,开拓了语音翻译的新航道。

众所周知,人工智能是未来科技的风向标。通过这次在IWSLT比赛中的优秀成绩,可以看到以搜狗为代表的国产科技巨头企业,已表现出了引领行业的技术硬实力。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
搜狗翻译
ai技术

相关文章

  • 瓯江论道:AI赋能绿色发展

    2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,

    标签:
    ai技术
  • 王通:未来个人创业的十个机会

    个人创业需要启动成本低、无需庞大团队、可快速验证、能利用个人技能或资源。这里分享适合个人创业的十个机会一.AI内容优化与本地化服务·做什么:帮助企业或个人利用AI工具(如GPT-4,Midjourney)优化内容生产流程。例如,为跨境电商撰写多语言产品描述,为小红书博主生成爆款文案,为小公司制作营销

  • 百度智能云PaddleOCR 3.1正式发布:关键能力支持MCP

    百度AI团队今日正式推出PaddleOCR3.1版本,以突破性的多语言组合识别(MultilingualCompositionPerception,MCP)技术为核心,彻底重构复杂文档处理边界。此次升级标志着OCR领域首次实现对同一文档内任意混合语言文本的精准识别,为全球化企业、跨境业务及多元文化场

    标签:
    ai智能
    ai技术
  • AI工具导航网站,未来的发展前景怎么样?

    导航网站的崛起:从信息过载到精准触达随着全球AI工具数量爆发式增长(2025年已超数万款),用户面临前所未有的选择困境。传统搜索引擎的“关键词-链接”模式难以应对工具筛选的场景需求,垂直化、场景化的AI导航网站应运而生。这类平台通过聚合、评测、分类与推荐四重机制,将分散的工具资源整合为结构化入口。例

  • 微信AI搜索被指“强行开盒”:名字成了数据入口,腾讯回应“仅用公开信息”

    当微信公众号文章中出现一个人的名字,它会自动变成蓝色链接,点击即可查看AI生成的“个人简历”——这一微信新功能让不少用户感到被“扒光”在互联网上。近日,微信新上线的“AI搜索”功能陷入隐私泄露争议漩涡。多位网友在社交平台反映,当微信公众号推文中出现本人姓名时,名字会自动变为蓝色超链接,点击即可浏览由

    标签:
    ai技术
    ai搜索
  • GDPS2025赛场直击!开普勒大黄蜂助力华理斩获搬运赛项桂冠

    12月12日-14日,2025全球开发者先锋大会暨国际具身智能技能大赛(GDPS2025)于上海张江科学会堂举行,大会以具身智能竞技为核心,融合了技术比拼、产业展示与科普体验,为全球观众呈现出具身智能的现在与未来。上海开普勒机器人有限公司(以下简称"开普勒机器人")携明星产品K2"大黄蜂"亮相,并参

    标签:
    GDPS
    2025
  • 弈动 Dynamic·数智跃迁 博弈无界|2025TechWorld智慧安全大会在京召开

    在数字化与智能化深度交织的时代浪潮中,安全的边界不断延展,技术的演进正引领产业迈向新一轮变革。10月24日,以“弈动Dynamic·数智跃迁博弈无界”为主题的2025TechWorld智慧安全大会在北京盛大召开。来自国家部委、院士学者、高校科研机构和企业的权威专家与业界精英齐聚北京,共议AI安全、数

    标签:
    弈动
  • 瓯江论道:AI赋能绿色发展

    2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,

    标签:
    ai技术
  • AI云“分野”:阿里云们“卖铲”,火山引擎奇袭“MaaS”

    AI云“分野”:阿里云们“卖铲”,火山引擎奇袭“MaaS”

    标签:
    阿里巴巴
  • 未来5年,中国AI的“大洗牌”和“内循环”

    我觉得我们AI的目标是:从芯片设计到软件生态,全链路自主开发,建立可控的世界级AI体系。所以这是俺对未来5年中国AI圈的展望和判断。(1)2026年,英伟达造车、国产开车26年国产芯片会在推理和垂直场景上发力。以DeepSeek为代表,大多数AI大模型会以软件弥补硬件不足,所以训练和推理分开,训练就

  • H20芯片开卖即叫停,英伟达如何解围?

    文/道哥在深陷“后门”风波、接受网信办问询之后,英伟达的“特供版”H20芯片,又有了新消息。近日,美国科技媒体《TheInformation》援引知情人士消息称,英伟达已悄然向其关键供应商——包括负责封装的安靠科技、供应高带宽内存的三星电子、以及承担后端处理的富士康发出指令,要求暂停所有与H20AI

    标签:
    英伟达