一直致力于提升智能语音水平,在文字识别技术上有着得天独厚的优势,科大讯飞为人工智能行业发展贡献了自己的力量。在今年举办的计算机视觉顶级会议CVPR的物体检测挑战赛DIW 2019、文档分析与识别顶级会议ICDAR的手写数学公式识别挑战赛CROHME、场景文本视觉问答挑战赛ST-VQA中获得多项冠军,也再次彰显了科大讯飞在这一领域的实力。

据悉,6月期间,由科大讯飞A.I.研究院与中科大语音及语言信息处理国家工程实验室(NELSLIP)(以下统称为讯飞-中科大联合团队)组成的联合团队,先是在物体检测挑战赛DIW 2019上取得Objects365 Tiny Track第一,Objects365 Full Track第三双重佳绩。随后又在手写数学公式识别挑战赛CROHME全部两项任务以及场景文本视觉问答挑战赛ST-VQA挑战赛上全部三项任务摘取冠军之席,此外还取得了街景招牌中文文本识别挑战赛ReCTS单字识别任务冠军。上述成绩可谓展现了科大讯飞在计算机视觉领域的技术水平与优势。
对于计算机视觉领域不是很熟悉的人,可能对DIW 2019挑战赛略感陌生。实际上该项活动作为一项行业内的专业级赛事,不仅吸引了腾讯、百度、字节跳动等300多支团队参赛,在赛题内容上来看,其所采用的Objects365数据集包含63万张图像,高达1000万人工标注框,覆盖365个日常物体类别,堪称最大通用物体检测数据集,科大讯飞能够在300多支强队中拔得头筹,足可见其在图像识别领域的不俗实力。

而在由美国罗切斯特理工学院(Rochester Institute of Technology)承办的手写数学公式识别挑战赛CROHME中,科大讯飞与MyScript、三星、WIRIS(MathType)、中科院自动化所、中山大学等多家在手写数学公式识别领域著名的国内外研究机构同台比拼,凭借着自身在数学公式的字符和位置关系的端到端识别,以及多尺度空间注意力机制解决字符尺寸差异较大带来的识别字符丢失等问题上的技术突破,连夺在线手写数学公式识别和离线手写数学公式识别两项主要任务冠军。

最后,在CVC(Computer Vision Center)举办的视觉问答挑战赛ST-VQA上,面对算法图像检测、分割等前端技术,以及算法具备多模态数据融合、理解和推理能力的考验,科大讯飞出色地完成了对图像定候选词表、对数据集定候选词表,没有额外词表直接*三项任务,直接拿下了Task1-Strongly Contextualized、Task2-Weakly Contextualized和Task3-Open Dictionary三项冠军。

由此可见,科大讯飞在文字识别技术上已经达到了世界顶级水平。未来,科大讯飞将依托核心技术优势,为教育、医疗、政法等领域提供可进一步释放效能的人工智能解决方案,助推人工智能全面落地。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
当AI不再需要你每次对话都从头介绍自己,而记得你的职业、上次项目痛点在哪,人工智能的发展正悄然迎来一场从“工具”到“伙伴”的质变。11月6日,在第八届世界声博会暨2025科大讯飞全球1024开发者节上,数字人“小飞”不仅能与参观者自然对话,还能根据历史偏好推荐餐厅并主动完成订票。这一幕让许多观众联想
9月26日,工业和信息化部发布2025年第19号公告,正式批准发布电子行业标准SJ/T12018-2025《智能录音设备通用技术规范》。该标准由全国音频、视频及多媒体系统与设备标准化技术委员会提出并归口,并由科大讯飞股份有限公司联合中国电子技术标准化研究院等十余家单位共同起草完成。这一标准的发布实施
“你自己还搞技术啊?”这句话,我最近用AI做网站的时候,被好几个人说过。言下之意:你是老板,不该干这个。这半年,我一直在用AI做网站,很多人在我评论里、群里、视频都说过,大意是你不开公司,天天琢磨用AI做网站干嘛?网站都是夕阳行业了。本来还没当回事,结果评论区说的人多了,我自己都恍惚了?我做网站20
昇腾,打响了一场Agent前夜的“硬软合围战”
5月13日,阿里巴巴集团发布2026财年Q4及全年财报。财报表示,阿里全栈AI技术投入已正式跨越初期培育阶段,进入正向的规模商业化回报周期。在财年第四季度,阿里AI在模型、云基础设施和应用各层实现加速突破。在AItoB方向,阿里旗下企业级Agent平台“悟空”已于近期逐步规模化放量。悟空是阿里巴巴旗
近日,负债28万元的张先生被短视频广告吸引,支付39.9元咨询费后,对方承诺减免5万元利息,却在收取14350元服务费后失联。新浪黑猫投诉平台显示,涉及“律所”与“债务协商”的投诉已超1500件。面对债务压力,许多持卡人急需知晓平安信用卡逾期怎么处理,却不慎跌入黑灰产陷阱。虚假承诺借律所外壳行骗,黑
“养龙虾”到底要花多少钱?这个问题可能是大家最关心的。我们把成本拆成三部分:服务器租用费+大模型API调用费+杂项开销。第一部分:服务器租用费。最省钱的方案当然是本地旧电脑自托管——零新增成本,电费忽略不计。但如前所述,你需要接受“不是7×24小时在线”的局限性。如果选择云服务器,成本差异就很大了。
不少朋友第一次接触OpenClaw时,都会有一个相同的困惑:这玩意儿到底该装在哪里?OpenClaw(社区戏称“养龙虾”,因Logo为龙虾钳)不是普通的聊天机器人,而是一款本地优先、可自主执行、支持多Agent分工协作的AI执行网关。说白了,它让大模型从“只会说话”变成“会动手做事”——帮你管理文件
01别相信“一键养虾,躺平赚钱”的鬼话打开社交媒体,你可能会看到这样的标题:“养只龙虾自动炒股,零代码养出数字巴菲特!”信了,你就输了。真实情况是:一个做跨境电商的小哥花了200元租服务器、订阅API,指望龙虾帮他炒股暴富。结果龙虾开始几天还像模像样,后来直接摆烂,生成个干瘪的大纲就敷衍了事。AI是
一张证书引发的讨论4月7日,北京嫣然天使儿童医院给陈光标发了一张感谢证书,感谢他捐赠1000万元。这事说起来挺曲折的。此前陈光标高调说要赠给张雪一台价值1300万元的劳斯莱斯,张雪回应“收了,八折卖掉捐给嫣然”,一番拉扯之后,陈光标把车变现,1000万元直接打到了嫣然医院账上。医院发证书感谢,本来是
2026年4月7日,国家安全部就AI核心术语“词元”(Token)发布安全警示,强调在日均调用量突破140万亿规模的市场背景下,需高度警惕由此引发的数据泄露与金融诈骗风险。据统计,截至今年3月,我国日均词元调用量已超过140万亿,较2024年初增长1000多倍。词元作为大模型处理信息的最小单元,兼具
如今出门,如果你还没用过AI智能助手,可能真有点跟不上节奏了。无论是写作文、查资料,还是规划出行路线,越来越多的人已经习惯随手打开AI问一句。这股热潮背后,中国AI大模型用实打实的数据交出了一份亮眼的成绩单。根据全球知名AI模型聚合平台OpenRouter的最新数据,在3月30日至4月5日这一周,中