1. 创业头条
  2. 前沿领域
  3. AI智能
  4. 正文

打破世界纪录!Yi+目标检测准确率位列PASCAL VOC第一

 2018-07-26 09:57  来源:互联网  我来投稿 撤稿纠错

  一键部署OpenClaw

2018年7月,在国际权威计算机视觉竞赛PASCAL VOC comp4目标检测竞赛中,Yi+ AI团队获得了目标检测单模型第一名,超越了现有排行榜中的微软研究院、谷歌 、阿里达摩院、Face++等国内外众多知名公司,以精度90.7%的成绩打破了世界记录,成为世界第一家总成绩突破90%计算机视觉企业。同时在Pascal VOC “comp3”中,首次突破80%,刷新世界纪录。

Pascal VOC comp4是众多国内外企业物体检测团队证明自己实力的地方,此次Yi+力压群雄,取得了90.7%的成绩,比第二名的阿里达摩院高了1.5个百分点,在物体检测领域,1.5个百分点意味着需要比对方“多”检测正确6000多个框,同时值得注意的是,此次Yi+AI团队使用的是难度更高的单模型,而第二名的方法是多模型融合。

PASCAL VOC可谓视觉识别类竞赛的鼻祖,包含了物体分类、目标检测、图像分割等任务。PASCAL VOC对计算机视觉的发展具有深远而巨大的影响,后续的ImageNet竞赛的任务设置就基本沿用了它的设定。此前,微软、英特尔、CMU、Facebook、UC Berkeley等国际顶尖研发团队先后在这个排行榜上刷新纪录。

Yi+AI的负责人表示,在此次Pascal VOC comp4竞赛中,Yi+AI团队使用的方法叫做FXRCNN,其中“X”,代表“多元”的意思,意味着Yi+AI使用的结构不仅仅是高准确率的模型,同时也适用多元场景,包括移植到移动端(通过更改Backbone和Head),实现图像分割(增加Mask分支),实现人体关键点(增加Key point分支),实现人脸检测(增加Face分支)。

Yi+提交的深度学习模型,虽然采用了Faster RCNN的基本结构,但有很多不同之处:1)采用ResNeXt作为基础网络,结合FPN实现多尺度特征融合,2)在后处理阶段,采用SoftNMS和多框投票融合;3)通过Yi+海量数据进行预训练;4)多尺度训练,进一步加强数据增强。

近年来Yi+不断加大对人工智能、大数据等新技术的研发和应用,本次提交的模型,是Yi+多年来技术积累的结果,是通过不断的攻克实际问题的结果,是Yi+内部模型不断优化的结果,Yi+ AI的FXRCNN在速度,内存,精度,应用范围等多维度进行了全面的优化。

在人工智能领域,目标检测技术应用广泛,是Yi+AI场景落地的关键性技术之一。Yi+将目标检测技术应用在图像搜索引擎和图片视频结构化引擎中,Yi+图像搜索引擎可检测类目超100类,覆盖服饰、3C商超、家居、日用品、交通工具等;Yi+图片视频结构化引擎则采用目前业界最领先的基于深度学习的通用目标检测算法,支持超过300类常用物体的目标检测、识别,可实现对视频和图像中的场景、人、车辆、物体(轮廓)检测、识别、分割、跟踪;可识别近10,000种物品,400种场景。

目前Yi+AI已将目标检测技术应用在多个使用场景中,包括“智能硬件”、“营销”、“新零售”、“智慧城市”等解决方案,具体则应用在场景广告平台、新零售平台、大屏AI助手、智慧安防、智慧交通、智慧社区等多项领域之中。

下一步,Yi+将结合现有技术优势继续深耕智慧城市、新零售、智能营销、智能硬件等多个领域,让计算机看懂世界,用科技提供人工智能服务,帮助人们看见非凡,see different。

Yi+获得阿里巴巴等B轮融资。服务了众多500强客户。团队成员大多来自顶尖企业与高校,如哥伦比亚大学、帝国理工、耶鲁、普林斯顿、普渡大学、新加坡国大、南洋理工、清华、北大等及微软、IBM、英特尔、阿里巴巴、腾讯、百度、华为等企业。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
人工智能
大数据

相关文章

  • 阿里发布全球首个企业级Agent平台“悟空”

    3月17日,阿里发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的”龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。拥有8亿用户的钉钉重写底层代码,进行全面CLI(命令行界面)化改造,让悟空Agent能够原生操

  • 90%的AI中间商会消失:Google封号只是第一枪

    AI的“免费红利期”结束了,未来18个月,靠“API倒卖”的公司,会成片消失。这个导火索就是最近Google的一轮封号导致的,随着封号风波的结束,这也标志着AI行业【收租时代】来了。2月封号潮:高付费用户被一锅端一周前,Google开始大规模封号,付着250美金月费的人,账号说没就没,Gmail、Y

  • DeepSeek V4意外泄露,原生多模态

    来自路透社等媒体报道的最新消息:DeepSeek未发布的V4Lite模型遭泄露上网,华为获得早期访问权限,英伟达被排除在外。近期,谷歌发表了2篇Multi-Agent协作学习新论文有网友提供了更加详细的信息,DeepSeekV4Lite:100万token上下文窗口(V3为128K)内置原生多模态推

  • 中国开启AI全民化元年,BAT同入“亿级俱乐部”

    春节红包会结束,但AI已融入数亿人生活里

  • 开源模型再突破,全球AI行业的拐点要来了?

    性能、商业、生态诠释开源模型的最佳姿态

  • 看懂黄仁勋CES演讲,就看懂 AI 接下来十年的走向

    2026年刚开年,全世界最狂的那个男人,穿着他的经典黑皮衣,在CES舞台上发出了未来十年的信号。他搞了个“能吃饱套餐”:6个包子+一碟小菜+一碗粥=肉包子套餐,这样以后你只要买一个套餐就能吃饱了。(Rubin平台)同时他们店里还免费提供的筷子、勺子、蘸料、酱油、醋、水果、零食等等。(开放10万亿语言

  • GDPS2025赛场直击!开普勒大黄蜂助力华理斩获搬运赛项桂冠

    12月12日-14日,2025全球开发者先锋大会暨国际具身智能技能大赛(GDPS2025)于上海张江科学会堂举行,大会以具身智能竞技为核心,融合了技术比拼、产业展示与科普体验,为全球观众呈现出具身智能的现在与未来。上海开普勒机器人有限公司(以下简称"开普勒机器人")携明星产品K2"大黄蜂"亮相,并参

    标签:
    GDPS
    2025
  • 弈动 Dynamic·数智跃迁 博弈无界|2025TechWorld智慧安全大会在京召开

    在数字化与智能化深度交织的时代浪潮中,安全的边界不断延展,技术的演进正引领产业迈向新一轮变革。10月24日,以“弈动Dynamic·数智跃迁博弈无界”为主题的2025TechWorld智慧安全大会在北京盛大召开。来自国家部委、院士学者、高校科研机构和企业的权威专家与业界精英齐聚北京,共议AI安全、数

    标签:
    弈动
  • 瓯江论道:AI赋能绿色发展

    2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,

    标签:
    ai技术
  • AI云“分野”:阿里云们“卖铲”,火山引擎奇袭“MaaS”

    AI云“分野”:阿里云们“卖铲”,火山引擎奇袭“MaaS”

    标签:
    阿里巴巴