一直致力于提升智能语音水平,在文字识别技术上有着得天独厚的优势,科大讯飞为人工智能行业发展贡献了自己的力量。在今年举办的计算机视觉顶级会议CVPR的物体检测挑战赛DIW 2019、文档分析与识别顶级会议ICDAR的手写数学公式识别挑战赛CROHME、场景文本视觉问答挑战赛ST-VQA中获得多项冠军,也再次彰显了科大讯飞在这一领域的实力。
据悉,6月期间,由科大讯飞A.I.研究院与中科大语音及语言信息处理国家工程实验室(NELSLIP)(以下统称为讯飞-中科大联合团队)组成的联合团队,先是在物体检测挑战赛DIW 2019上取得Objects365 Tiny Track第一,Objects365 Full Track第三双重佳绩。随后又在手写数学公式识别挑战赛CROHME全部两项任务以及场景文本视觉问答挑战赛ST-VQA挑战赛上全部三项任务摘取冠军之席,此外还取得了街景招牌中文文本识别挑战赛ReCTS单字识别任务冠军。上述成绩可谓展现了科大讯飞在计算机视觉领域的技术水平与优势。
对于计算机视觉领域不是很熟悉的人,可能对DIW 2019挑战赛略感陌生。实际上该项活动作为一项行业内的专业级赛事,不仅吸引了腾讯、百度、字节跳动等300多支团队参赛,在赛题内容上来看,其所采用的Objects365数据集包含63万张图像,高达1000万人工标注框,覆盖365个日常物体类别,堪称最大通用物体检测数据集,科大讯飞能够在300多支强队中拔得头筹,足可见其在图像识别领域的不俗实力。
而在由美国罗切斯特理工学院(Rochester Institute of Technology)承办的手写数学公式识别挑战赛CROHME中,科大讯飞与MyScript、三星、WIRIS(MathType)、中科院自动化所、中山大学等多家在手写数学公式识别领域著名的国内外研究机构同台比拼,凭借着自身在数学公式的字符和位置关系的端到端识别,以及多尺度空间注意力机制解决字符尺寸差异较大带来的识别字符丢失等问题上的技术突破,连夺在线手写数学公式识别和离线手写数学公式识别两项主要任务冠军。
最后,在CVC(Computer Vision Center)举办的视觉问答挑战赛ST-VQA上,面对算法图像检测、分割等前端技术,以及算法具备多模态数据融合、理解和推理能力的考验,科大讯飞出色地完成了对图像定候选词表、对数据集定候选词表,没有额外词表直接*三项任务,直接拿下了Task1-Strongly Contextualized、Task2-Weakly Contextualized和Task3-Open Dictionary三项冠军。
由此可见,科大讯飞在文字识别技术上已经达到了世界顶级水平。未来,科大讯飞将依托核心技术优势,为教育、医疗、政法等领域提供可进一步释放效能的人工智能解决方案,助推人工智能全面落地。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
2023年7月6日,科大讯飞AI学习机暑期新品发布会上,LUMIE10系列学习机以其强大功能、卓越性能和创新设计震撼亮相。这是科大讯飞推出的首款立式大屏AI学习机,它继承了科大讯飞AI学习机3~18岁个性化精准学的传统强项功能,同时又针对幼小关键成长期深度优化,是孩子成长路上的第1台功能齐备的AI学
作者|曾响铃文|响铃说几秒钟写出了一篇欢迎词;小说人物乱入现实,快速创作不重样的故事;鼠标一点,一封英文工作沟通邮件撰写完成;准确解出数学应用题,还给出解题步骤;甚至还能理解人类情感,认识同一个词语在不同场合下的含义……在一片掌声中,不久前的科大讯飞“星火”认知大模型发布会,以现场实机的方式,第一次
近日,讯飞星火认知大模型成果发布会在安徽合肥举行。科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型,现场实测大模型七大核心能力,并发布教育、办公、汽车、数字员工四大行业应用成果。特别是星火大模型在办公领域的落地和应用,深受不少职场、商务人士的关注。作为职场商务人士,最头痛的是什么?开会!会
文/道哥大举裁员、清空账号、国内IP无法访问——曾被誉为“中国AIAgent希望之星”的Manus,在估值飙至5亿美元的高光时刻“闪离”中国市场。近日,Manus“裁员、出走”的消息在媒体端大量发酵。消息称,Manus公司总部将由中国迁至新加坡,其国内团队也将大幅裁撤——原有120人规模团队除40余
四个月前邀请码炒至10万元,如今官网变灰、社交账号清空,这家AI新贵的闪电迁移折射中国科技企业出海潮涌。7月11日,打开Manus官网的用户发现一则突兀提示:“Manus在你所在的地区不可用”。而就在不久前,这个位置还显示着“Manus中文版本正在开发中”的乐观声明。同时,Manus官方微博和小红书
文/十界来源/节点财经一场围绕算力自主的竞赛,正在科创板上演。近日,国产全功能GPU厂商摩尔线程递交科创板招股书,拟募资约80亿人民币,成为今年上半年科创板拟募资规模最大的冲刺者,也打响了“国产英伟达”上市的第一枪。据招股书显示,摩尔线程自2020年成立以来,主营全功能GPU芯片的研发与销售,以自主
“AI大模型六小虎”百川智能危机重重。这是前搜狗CEO王小川创办的AI公司。昨天就爆出新闻,百川智能的联合创始人离职,这是王小川入局AI的第一道大坎。接下的成败非常关键:(1)拿下河北(2)学习科大讯飞百川智能离职高端概览:(1)2025年7月10日,百川智能技术联合创始人谢剑将离职。他是百川只能的
百度AI团队今日正式推出PaddleOCR3.1版本,以突破性的多语言组合识别(MultilingualCompositionPerception,MCP)技术为核心,彻底重构复杂文档处理边界。此次升级标志着OCR领域首次实现对同一文档内任意混合语言文本的精准识别,为全球化企业、跨境业务及多元文化场
“宇树已形成硬件、算法、场景联动的业务飞轮,自研率超95%的技术壁垒让其成为全球机器人赛道不可忽视的中国力量。”首程资本管理合伙人朱方文在追加投资时如是评价。7月7日,据每日经济新闻从宇树科技投资方处获悉,国内人形机器人领军企业宇树科技(UnitreeRobotics)已明确计划于科创板IPO,预计
推理与多模态的终极融合,将彻底终结用户在不同模型间切换的烦恼。7月7日,OpenAI正式确认将在今年夏季推出新一代人工智能模型GPT-5。这一突破性产品将整合现有的多个强大模型,特别是融合专注推理能力的“O系列”与具备多模态功能的“GPT系列”,为用户提供前所未有的统一体验。OpenAI开发者体验负
高考一结束,忙坏了海内外一众大模型。豆包、DeepSeek、ChatGPT、元宝、文心一言、通义千问……掀起了一波“AI赶考”大战。据悉,去年高考期间,大模型的成绩才勉强过一本线,今年集体晋升985。据悉,豆包甚至过了清北的录取线。头部大模型在高考“考场”上玩得不亦乐乎,中小AI创企的处境却日益尴尬
文/二风来源/节点财经每年高考成绩放榜后,数千万考生和家长将迎来另一场硬仗——填报志愿。今年,这一领域迎来了AI的全面介入,多家互联网大厂和教育公司纷纷推出智能志愿填报产品,为考生提供院校和专业选择建议。据艾媒咨询数据,2023年中国高考志愿填报市场付费规模约9.5亿元,近九成考生愿意借助志愿填报服