1. 创业头条
  2. 前沿领域
  3. 人工智能
  4. 正文

从CVPR到ICDAR,科大讯飞一路过关斩将连夺多项冠军

 2019-08-13 14:11  来源:互联网  我来投稿 撤稿纠错

  阿里云优惠券 先领券再下单

一直致力于提升智能语音水平,在文字识别技术上有着得天独厚的优势,科大讯飞为人工智能行业发展贡献了自己的力量。在今年举办的计算机视觉顶级会议CVPR的物体检测挑战赛DIW 2019、文档分析与识别顶级会议ICDAR的手写数学公式识别挑战赛CROHME、场景文本视觉问答挑战赛ST-VQA中获得多项冠军,也再次彰显了科大讯飞在这一领域的实力。

据悉,6月期间,由科大讯飞A.I.研究院与中科大语音及语言信息处理国家工程实验室(NELSLIP)(以下统称为讯飞-中科大联合团队)组成的联合团队,先是在物体检测挑战赛DIW 2019上取得Objects365 Tiny Track第一,Objects365 Full Track第三双重佳绩。随后又在手写数学公式识别挑战赛CROHME全部两项任务以及场景文本视觉问答挑战赛ST-VQA挑战赛上全部三项任务摘取冠军之席,此外还取得了街景招牌中文文本识别挑战赛ReCTS单字识别任务冠军。上述成绩可谓展现了科大讯飞在计算机视觉领域的技术水平与优势。

对于计算机视觉领域不是很熟悉的人,可能对DIW 2019挑战赛略感陌生。实际上该项活动作为一项行业内的专业级赛事,不仅吸引了腾讯、百度、字节跳动等300多支团队参赛,在赛题内容上来看,其所采用的Objects365数据集包含63万张图像,高达1000万人工标注框,覆盖365个日常物体类别,堪称最大通用物体检测数据集,科大讯飞能够在300多支强队中拔得头筹,足可见其在图像识别领域的不俗实力。

而在由美国罗切斯特理工学院(Rochester Institute of Technology)承办的手写数学公式识别挑战赛CROHME中,科大讯飞与MyScript、三星、WIRIS(MathType)、中科院自动化所、中山大学等多家在手写数学公式识别领域著名的国内外研究机构同台比拼,凭借着自身在数学公式的字符和位置关系的端到端识别,以及多尺度空间注意力机制解决字符尺寸差异较大带来的识别字符丢失等问题上的技术突破,连夺在线手写数学公式识别和离线手写数学公式识别两项主要任务冠军。

最后,在CVC(Computer Vision Center)举办的视觉问答挑战赛ST-VQA上,面对算法图像检测、分割等前端技术,以及算法具备多模态数据融合、理解和推理能力的考验,科大讯飞出色地完成了对图像定候选词表、对数据集定候选词表,没有额外词表直接*三项任务,直接拿下了Task1-Strongly Contextualized、Task2-Weakly Contextualized和Task3-Open Dictionary三项冠军。

由此可见,科大讯飞在文字识别技术上已经达到了世界顶级水平。未来,科大讯飞将依托核心技术优势,为教育、医疗、政法等领域提供可进一步释放效能的人工智能解决方案,助推人工智能全面落地。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
科大讯飞
智能语音

相关文章

  • 未来5年,中国AI的“大洗牌”和“内循环”

    我觉得我们AI的目标是:从芯片设计到软件生态,全链路自主开发,建立可控的世界级AI体系。所以这是俺对未来5年中国AI圈的展望和判断。(1)2026年,英伟达造车、国产开车26年国产芯片会在推理和垂直场景上发力。以DeepSeek为代表,大多数AI大模型会以软件弥补硬件不足,所以训练和推理分开,训练就

  • H20芯片开卖即叫停,英伟达如何解围?

    文/道哥在深陷“后门”风波、接受网信办问询之后,英伟达的“特供版”H20芯片,又有了新消息。近日,美国科技媒体《TheInformation》援引知情人士消息称,英伟达已悄然向其关键供应商——包括负责封装的安靠科技、供应高带宽内存的三星电子、以及承担后端处理的富士康发出指令,要求暂停所有与H20AI

    标签:
    英伟达
  • 真正的「国产英伟达」来了

    文/二风来源/节点财经一场关于“中国芯”的IPO审议,正把投资者们的目光锁定在上交所。根据上交所发布的公告,上市审核委员会已定于9月26日审议摩尔线程的科创板首发申请。作为中国半导体自主化浪潮中最受瞩目的“考生”之一,包括其创始人显赫的英伟达背景、高达80亿元人民币的募资雄心,以及在国产GPU领域取

    标签:
    英伟达
  • AI视频生成赛道“分野”:小厂重产品,大厂重生态

    AI视频生成赛道“分野”:小厂重产品,大厂重生态

  • 数据库进入“内存自由”时代!阿里云PolarDB发布全球首个CXL数据库服务器

    技术的进步永无止境,继创下TPC-C性能&性价比双冠之后,阿里云PolarDB云原生数据库再度实现关键突破。9月24日杭州云栖大会上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技术的PolarDB数据库专用服务器。在原有RDMA网络的基础上,Polar

  • 为AI时代云服务器量身定制 阿里云操作系统Alinux 4重磅发布

    2025年9月24日,在杭州举办的云栖大会上,阿里云正式发布全新一代服务器操作系统AlibabaCloudLinux4(简称Alinux4)。Alinux4基于Linux6.6内核打造,是首个全面遵循龙蜥社区“开源生态合作倡议”规范的商业发行版。它不仅兼容主流开源社区生态,更针对阿里云最新9代ECS

  • 阿里云重磅发布AI安全护栏 五项安全能力护航AI安全

    9月24日,杭州云栖大会技术主论坛上,阿里云重磅发布AI安全护栏,提供五项核心安全能力,护航AI安全。一方面为客户提供融入AIAgent开发全链路的原生安全防护,另一方面持续用AI赋能安全产品智能化升级,打造Agentic-SOC安全运营,提升安全威胁检测和响应效率。在过去的一年,AIAgent正在

  • 魔搭社区国际版上线,并发布科学智能专区与AIGC创作引擎

    9月24日,魔搭社区举办了“全球协作•科学突破•创意无限”的专题论坛,并发布魔搭社区国际版、科学智能专区与AIGC创作引擎FlowBench,旨在连接全球开发者、加速科研范式创新、赋能创意表达。自2022年11月初成立至今,魔搭社区已成长为中国最大AI开源社区,其模型数量已突破10万,服务了全球20

  • 七连发!阿里多款重磅发布亮相云栖大会

    9月24日,2025云栖大会现场,阿里云CTO周靖人接连发布了七款大模型技术产品。七款技术产品覆盖语言、语音、视觉、多模态、代码等模型领域,在模型智能水平、Agent工具调用以及Coding能力、深度推理、多模态等方面均实现突破。在大语言模型中,阿里通义旗舰模型Qwen3-Max全新亮相,性能超过G

  • 阿里云扩建全球基础设施,将新增巴西、法国和荷兰数据中心

    9月24日,阿里云在云栖大会上宣布新一轮全球基础设施扩建计划:将在巴西、法国和荷兰首次设立云计算地域节点(region),并将扩建墨西哥、日本、韩国、马来西亚和迪拜的数据中心,以便更好服务全球客户日益增长的AI和云计算需求。目前,阿里云在全球29个地区运营91个可用区,是中国最大、亚太第一的云服务商

编辑推荐