1. 创业头条
  2. 前沿领域
  3. AI智能
  4. 正文

百度大脑首场开放日:AI已经渗透到了产业的毛细血管

 2019-03-22 11:13  来源:A5专栏  我来投稿 撤稿纠错

  阿里云优惠券 先领券再下单

中关村创业大街,这个曾见证互联网创业热潮的著名地标,也曾陷入冷寂。

而今,”智能+“已经成为时代新命题,这条大街又因AI有了新的活力。

去年12月底,百度大脑在中关村创业大街开设第一家“线下体验店“,引来人头攒动。3月20日,首期百度大脑开放日在中关村创业大街举办,更多了一份热闹。

过去,在创业大街上生长起来的很多互联网产品与技术已经与我们的生活难以分割,如今AI到来,又会是一种什么景象?

在百度大脑开放日上,百度大脑带来了24种全新开放的AI技术,20个鲜活的落地案例,用满满的诚意与开发者一起展开对未来的想象。

用AI的热度 去温暖每个角落

整场开放日,最令人印象深刻的案例是“智能猫窝”,看到冬天里无家可归的流浪猫,百度大脑工程师晚兮利用百度大脑的动物识别技术和百度EasyDL,打造出了配备“猫脸门禁”、“病猫识别”、“绝育识别”三大黑科技的猫窝,不仅可以识别174种不同品种的猫咪,还可以识别猫口炎、猫鼻支、猫皮肤病、猫外伤4种常见猫病,发现未绝育的猫,帮助志愿者及时救助。

和流浪猫一样,垃圾分类也是一大社会难题。分形科技借助百度EasyDL的图像分类技术,打造了首款智能垃圾桶,可以对7种常见垃圾自动分类;

德邦物流为了让用户免去自行填写信息的麻烦,使用百度大脑的定制词法分析快递申请,一秒拆分姓名、电话、住址等信息;

看到审批窗口总是排满长队,科鸿智信利用OCR 、iOCR及EasyDL平台开发了智能化审批管理系统,建立起“一次都不跑、随时随地办”的便民服务新模式。

嫌弃鼠标的功能太鸡肋,有开发者集成百度的语音识别和合成技术、翻译技术 ,打造了智能语音鼠标,语音输入速度可以达到每分钟400字,比传统键盘输入提升了两倍,并且支持28种语言的翻译;

还有开发者为了方便控制跑步机,使用百度大脑的语音识别和UNIT技术,开发了可语音控制的跑步机,动动嘴就可以切歌、速度控制、模式变换等,据说月销量已经高达一万台以上。

以上这些在开放日展出的案例,只是百度大脑落地案例冰山一角。2018年百度大脑在6个城市举办了7场行业创新论坛,针对企业服务、信息服务、地产物业、智能零售、智能工厂、智能校园、智能政务推出了7大行业解决方案,AI能力已然渗透进产业的毛细血管,从而影响我们生活的方方面面。

正如百度AI技术生态部总经理喻友平在现场所说,“人工智能应用的领域可以说无处不在,只要企业、开发者、合作伙伴们能有发现问题的眼睛,就有创新创业的机会。百度大脑把平台和AI能力开放出来,希望帮助大家快速地实现各自领域的业务解决方案,创造全新商业模式,带来更多机遇。”

研发不是炫技 是对技术赋能的践行

作为百度在人工智能领域多年研究的集大成,百度大脑在2016年正式开放后,已经开放了语音技术、视觉技术、自然语言处理、知识图谱、机器学习等近160项通用AI能力,有着超过100万的开发者,已然成为服务规模最大的AI开放平台。

对于百度大脑而言,技术的创新并没有尽头,就像是一场“打怪升级”的游戏,一直追求的是怎么让技术更好用,怎么将效率再提高一些,最终实现“用AI让复杂的世界更简单”。

在百度大脑开放日当天,百度AI技术生态部总经理喻友平一口气介绍了新开放的24项AI技术能力,囊括视觉、自然语言和语音。以往开发者要苦苦研发上月的技术,在百度大脑都可以一键获取。开放一个全新的AI技术,开发者就可能创造出一个全新的AI应用,实实在在改变生活。

在视觉方向上,OCR、车辆分析、人脸识别、图像识别都有数项更新。百度的OCR全系列产品多达34种,覆盖了卡证、票据、文档、汽车等场景。

如果你是一名户籍系统相关的开发者,只需要对着户口本拍一张照片,系统就能字段进行结构化识别,然后反馈出信息页的出生地、出生日期、姓名、民族、与户主关系、性别、身份证号码,将会帮助相关工作人员减轻大半的工作量。目前,百度在OCR上的能力最为全面,对于开发者来说,在同一家平台上就能找到应用场景的对应技术,十分便捷。

如果你是一位交警或者停车场管理员,一定会对百度大脑的车辆分析技术点赞。百度大脑推出了车辆检测、车流统计、车辆属性分析、外观损伤识别等服务。其中车辆检测功能,可以通过识别图像中的所有机动车辆(包含小汽车、卡车、巴士、摩托车、三轮车),反馈每辆车的类型和坐标位置,并对每类车辆分别计数。

如果你是一名自拍爱好者,百度大脑显然知道你想要的是什么。百度大脑新增了人脸情绪识别,并升级了人脸关键点检测和手势识别,人脸检测关键点由72个增至150个,常见手势能识别也达到了24种。这些技术落地之后,人脸识别不再局限在解锁和美颜,将带来更多有趣的应用:录制短视频时有更丰富的手势特效,识别你的情绪自动匹配背景音乐等等。

语音和语义识别也是百度大脑升级的重点,包括语言处理应用平台、语言处理应用技术、语言处理基础技术、知识理解以及知识图谱。

在百度大脑开放日上,令人印象深刻的演示是三个有趣的应用:

一是新闻摘要,对新闻内容进行全面的语义理解与分析,然后自动抽取新闻文本中的关键信息并按指定长度生成摘要,可以应用于热点新闻聚合、新闻推荐、语音播报、弹窗推送等场景,几乎是所有新闻工作者的福音。

二是智能写诗,用户只需要输入任意主题词(如公司名、节气名),百度大脑便可自动生成融合了该主题词的诗词。实际测试显示,百度大脑的智能写诗在语义和语境上并没有明显的违和感,不失为娱乐化营销的又一重要工具。

三是智能春联,今年的央视春晚上,主持人高博就演示了智能春联“看脸”的绝活儿,通过“刷脸”生成专属春联。如今这项技能也被百度开放出来,何尝不是人工智能融入美好生活的一个典型案例呢。

在语音方面,百度首次对外开放了搭载国际领先的注意力(attention)模型的语音能力,拥有更快的响应速度,相对识别准确度提升15%。同时中英文混杂和纯英文自由说,既能识别方言又能识别普通话,那些曾经让用户和开发者头疼的问题,在这里被一次性解决。

不止如此,百度还即将上线很多新产品:零代码自助训练语音识别模型,可以帮助开发者提升业务场景下的识别准确率;而远场语音开发套件,则可以应用于机器人、儿童故事机、家电、车载设备等硬件,语音识别将无处不在。

在喻友平看来,百度大脑的开放生态有着以下优势:一个是技术领先,百度很早就成立了深度学习研究院,并且早在16年开源了国内第一个深度学习框架paddlepaddle,在各类国际比赛上也取得过非常多的奖项,并且联合举办了像上面介绍的国际权威竞赛,在这样的技术号召力下,聚集了非常多的人才,这是技术得以持续保持领先的基础;

一个是技术布局非常全面,从感知到认知,从语音到视觉到语义到AR等等,非常全面,可以帮助大家一站式的获得服务,提高集成效率;最后,我们以可落地为目标,在降低人工智能应用门槛的这个方向上持续不断的努力,所以虽然只开放了两年多的时间,但进化速度也非常快。

“我们可以看到整个平台的架构,从模型到软硬一体,从深度学习框架到解决方案,从云服务到多种输出方式的支持,各个层面都快速丰富起来。我们也非常重视各个企业和开发者提出的需求,并且特别感谢在这个进化过程中大家的包容与支持。”

艺术家们喜欢让人们从作品中了解自己,如同在蒙娜丽莎中思考达芬奇,在第九交响曲中听懂贝多芬。

百度大脑似乎有着同样的情愫:用开放生态,为开发者提供发挥想象力的“黑土地”,让AI走向社会的每一个角落。

喻友平谈到,人工智能应用的领域可以说无处不在,只要企业、开发者、合作伙伴们能有发现问题的眼睛,就有创新创业的机会。百度大脑把平台和AI能力开放出来,希望帮助大家快速地实现各自领域的业务解决方案,创造全新商业模式,带来更多机遇。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关文章

  • 瓯江论道:AI赋能绿色发展

    2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,

    标签:
    ai技术
  • 王通:未来个人创业的十个机会

    个人创业需要启动成本低、无需庞大团队、可快速验证、能利用个人技能或资源。这里分享适合个人创业的十个机会一.AI内容优化与本地化服务·做什么:帮助企业或个人利用AI工具(如GPT-4,Midjourney)优化内容生产流程。例如,为跨境电商撰写多语言产品描述,为小红书博主生成爆款文案,为小公司制作营销

  • 百度智能云PaddleOCR 3.1正式发布:关键能力支持MCP

    百度AI团队今日正式推出PaddleOCR3.1版本,以突破性的多语言组合识别(MultilingualCompositionPerception,MCP)技术为核心,彻底重构复杂文档处理边界。此次升级标志着OCR领域首次实现对同一文档内任意混合语言文本的精准识别,为全球化企业、跨境业务及多元文化场

    标签:
    ai智能
    ai技术
  • AI工具导航网站,未来的发展前景怎么样?

    导航网站的崛起:从信息过载到精准触达随着全球AI工具数量爆发式增长(2025年已超数万款),用户面临前所未有的选择困境。传统搜索引擎的“关键词-链接”模式难以应对工具筛选的场景需求,垂直化、场景化的AI导航网站应运而生。这类平台通过聚合、评测、分类与推荐四重机制,将分散的工具资源整合为结构化入口。例

  • 微信AI搜索被指“强行开盒”:名字成了数据入口,腾讯回应“仅用公开信息”

    当微信公众号文章中出现一个人的名字,它会自动变成蓝色链接,点击即可查看AI生成的“个人简历”——这一微信新功能让不少用户感到被“扒光”在互联网上。近日,微信新上线的“AI搜索”功能陷入隐私泄露争议漩涡。多位网友在社交平台反映,当微信公众号推文中出现本人姓名时,名字会自动变为蓝色超链接,点击即可浏览由

    标签:
    ai技术
    ai搜索
  • 弈动 Dynamic·数智跃迁 博弈无界|2025TechWorld智慧安全大会在京召开

    在数字化与智能化深度交织的时代浪潮中,安全的边界不断延展,技术的演进正引领产业迈向新一轮变革。10月24日,以“弈动Dynamic·数智跃迁博弈无界”为主题的2025TechWorld智慧安全大会在北京盛大召开。来自国家部委、院士学者、高校科研机构和企业的权威专家与业界精英齐聚北京,共议AI安全、数

    标签:
    弈动
  • 瓯江论道:AI赋能绿色发展

    2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,

    标签:
    ai技术
  • AI云“分野”:阿里云们“卖铲”,火山引擎奇袭“MaaS”

    AI云“分野”:阿里云们“卖铲”,火山引擎奇袭“MaaS”

    标签:
    阿里巴巴
  • 未来5年,中国AI的“大洗牌”和“内循环”

    我觉得我们AI的目标是:从芯片设计到软件生态,全链路自主开发,建立可控的世界级AI体系。所以这是俺对未来5年中国AI圈的展望和判断。(1)2026年,英伟达造车、国产开车26年国产芯片会在推理和垂直场景上发力。以DeepSeek为代表,大多数AI大模型会以软件弥补硬件不足,所以训练和推理分开,训练就

  • H20芯片开卖即叫停,英伟达如何解围?

    文/道哥在深陷“后门”风波、接受网信办问询之后,英伟达的“特供版”H20芯片,又有了新消息。近日,美国科技媒体《TheInformation》援引知情人士消息称,英伟达已悄然向其关键供应商——包括负责封装的安靠科技、供应高带宽内存的三星电子、以及承担后端处理的富士康发出指令,要求暂停所有与H20AI

    标签:
    英伟达
  • 真正的「国产英伟达」来了

    文/二风来源/节点财经一场关于“中国芯”的IPO审议,正把投资者们的目光锁定在上交所。根据上交所发布的公告,上市审核委员会已定于9月26日审议摩尔线程的科创板首发申请。作为中国半导体自主化浪潮中最受瞩目的“考生”之一,包括其创始人显赫的英伟达背景、高达80亿元人民币的募资雄心,以及在国产GPU领域取

    标签:
    英伟达