1. 创业头条
  2. 前沿领域
  3. 人工智能
  4. 正文

人工智能赛事里,藏着人才成长的另一种可能

 2020-12-21 14:59  来源:A5专栏  我来投稿 撤稿纠错

  【推荐】海外独服/站群服务器/高防

每每提到“AI开发者”,大多数人想到的可能是来自互联网大厂的“程序猿”们,他们身居算法工程师、数据工程师等高光岗位,有着名校博士乃至博士后的傲人学历,并且拿着动辄百万的年薪。

正如大家所看到的,人工智能的第三次浪潮已经持续了一段时间,逐渐从象牙塔走进了社会的角角落落。可在大多数人的认知里,AI仍然有着相当远的距离,仍然是部分高知分子研究的产物,仍然是一本普通人触碰不到的“天书”。

但现实中正在发生的一些事情,俨然超出了我们的预想。

埃隆·马斯克为特斯拉招聘AI人才时曾直言:“博士学位绝对不是必需的,我不在乎你是否高中毕业。”不同于许多人对学历和经历的痴迷,马斯克正在寻找那些对人工智能有“深刻理解”的人。

不只是特斯拉的不拘一格,在游离于大多数人视线外的赛场上,一群20岁上下的少年刚刚经历了一场在AI世界的“奇幻漂流”,诠释着他们对人工智能的理解。

01 像看地图一样看新闻

正在读大四的罗运是武汉大学地理信息科学专业的本科生,他与AI的机缘开始于年初的新冠疫情。

寒假回到家乡的罗运,刚刚过了几天可以赖床的生活,就被班级群里的讨论绷紧了神经。原来在他们离校几天后,武汉就因为新冠疫情封了城。罗运想要了解那座熟悉的城市到底发生了什么,努力在社交媒体和资讯平台上搜索一切和武汉相关的新闻,却发现网上充斥着太多的谣言和假消息,想要进一步查找学校周边的情况,只能在社交媒体上找到寥寥几条无法确证的内容。

由于地理信息科学属于计算机和地理的交叉学科,除了和地理有关的课程,罗运还自学了计算机编程,并且经常在国外的慕课平台上看一些人工智能的课程和案例。苦于查找武汉当地新闻的罗运萌生了一个大胆的想法:能不能将地图和新闻资讯进行结合,像看地图一样查看当地的新闻?

罗运将自己的想法和参加大学生创新创业比赛时的两个小伙伴进行了沟通,三人一拍即合,决定打造一款以地图为导向的时空新闻交互网页应用。

团队首先确认了他们想要抓取的比较权威且有公信度的新闻源网站,然后使用Scrapy异步爬虫框架对新闻进行智能提取,在百度飞桨提供的深度学习框架的支持下,基于文心ERNIE进行命名实体识别,再联合百度地图等的地理编码服务,利用PostGIS计算空间数据的尺度、跨度,进行分词和词性提取后,运用TF-IDF、LDA等算法进行文本的向量化、词频分析、主题分析、相似度分析,最后采用飞桨的GRU4Rec模型根据用户行为序列与兴趣区域推荐新闻。

经过四个多月的开发测试后,将地图和新闻结合的网页应用正式上线。当罗运将鼠标点向武昌火车站的时候,网页上弹出了长江网的最新消息,内容是武汉市解除离汉离鄂通道管控,涉及武昌站、武汉站、汉口站等火车站。看着自己的成果,罗运比任何一刻都更想念这熟悉的城市、熟悉的学校。

不善言谈的他,很快和小伙伴定好了下一步的目标:目前他们正在为这款应用添加新的功能,逐步增加情感趋势面分析、舆论导向分析等功能,方便普通用户在地图上找到不同时段新闻的同时,帮助有关部门从新闻和民众的情绪中挖掘社会的热点和痛点。

02 告别垃圾分类的烦恼

距离武汉700多公里的杭州市,杭州电子科技大学信息工程学院计算机专业的揭金民也在进行一场人工智能之旅 。

家在杭州的揭金民看到妈妈每天都要花不少的时间对厨余垃圾、可回收垃圾、有害垃圾等进行分类,可由于垃圾的种类繁多,常常出现分类错误的情况。社区只好派驻志愿者在各个小区监督,基本就是居民刚刚扔完垃圾后,志愿者需要重新在垃圾桶里扒一遍。

有志愿者守在垃圾桶旁边检查,大家反而有了“侥幸心理”——毕竟就算分错了类也会有志愿者重新分类。看着志愿者每天在臭气熏天的垃圾桶中满头大汗地分拣,揭金民心里有些不是滋味。有没有什么办法能让妈妈不再为垃圾分类头疼,又能帮助这些志愿者?

作为一名计算机专业的本科生,揭金民想要用人工智能来改变现状:倘若可以用计算机视觉技术对垃圾进行分类识别,居民们就能更轻松地完成垃圾分类,准确性也会提升,志愿者也不用再忍受恶臭翻垃圾桶。

揭金民拉上了两位软件工程专业的同学,以三人小分队的形式践行自己心中的想法。揭金民负责硬件设计,他要做一个三层结构的智能垃圾桶,第一层进行垃圾的识别,第二层对垃圾进行处理,第三层存储不同类别的垃圾。另外两个小伙伴分别负责系统后台和前端的开发工作。

敲定了分工后,必须解决的一个核心问题是打造垃圾分类的算法模型。如果自己写一套图像识别算法,目前的水平和积累跟不上,会拖延产品成型的时间、错过了最佳的市场。好在团队找到了百度的EasyDL平台,作为一个零门槛的AI开发平台,EasyDL上有着丰富的算法模型,包括图像分类、人脸识别等等,算法模型终于有了“谱”。揭金民和小伙伴如释重负,立刻把精力放在了硬件和系统开发上。

在长达一年的时间里,揭金民团队收集整理了近2万张垃圾照片,其中包含大量袋装垃圾,在EasyDL训练后的识别准确率高达96%。硬件设计组装完成后,揭金民将智能垃圾桶放在自己家小区进行试点,目前已经协助用户完成了近1000kg垃圾的分类,异常识别率控制在5%以内。

“这只是第一步。我们想推出家庭版的智能分类垃圾桶,还想尝试推出一种‘代扔垃圾’的服务……”细心的揭金民已经想好了未来的种种可能。

03 解放高空中的补漆工

在国内风能资源最为丰富的西北地区,一座座风车如森林般矗立,源源不断地将风能转化为电能。

然而风机的维护却成了一项让人头疼的难题,西安电子科技大学的黄耀辉了解到风机的维护需要工人们绑着绳索爬到高空中,提着漆桶进行补漆维护作业。

小时候她觉得那是一件有冒险精神的事情,长大后才知道冒险的背后是可怕的风险:高空补漆通常处于二级、三级乃至特级高处作业,二级高处作业坠落死亡率就高达40% ;同时《工业卫生与职业病》中指出,油漆工人中7.2%出现了白细胞数减少, 18.3%患有沙眼,22.8%心电图异常,17.8%视力下降……

作为西安电子科技大学创新创业实验班的学生,黄耀辉在心中一直藏着“解放”高空补漆工的想法,并在课余时间自学了人工智能相关的课程。一次偶然的机会,黄耀辉在学校的微信群中看到同学们在讨论飞桨,在好奇心的驱动下走进了深度学习的世界。

与深度学习结缘之时,黄耀辉也认识了一个同校的好伙伴:左谊。那时左谊正在团队中做一个无人机的项目,他和黄耀辉沟通后,大家迅速萌生了一个新的主意:既然飞桨上有那么多成熟的算法模型,或许可以将人工智能和无人机做一个结合,让无人机替代工人完成高空中的补漆工作。

团队讨论明确了目标后,左谊作为队长将无人机的工作拆解为四个过程。第一步是检查出锈斑并喷涂除锈剂,第二步是让无人机打磨锈迹,第三步和第四步分别是涂刷底漆和面漆。由于团队在无人机巡检和机械控制方面已经有一定的积累,问题主要集中在图像识别和喷绘控制系统两个方面。

团队调用了飞桨里的计算机视觉模型,采用了空地联动的形式进行作业,即无人机将第一时间的图像传送到地面站,地面站搭建高效识别设备并将数据再次发送给无人机。由于采用了视觉SLAM技术,靠无人机上的摄像头就能完成环境的感知工作,不仅降低了硬件上的成本,也提升了实地作业的可行性。

目前这一项目已经在校园内完成了测试:无人机缓缓飞到路灯杆上的电箱附近,准确识别出了电箱上的锈斑,然后打磨、涂刷一气呵成,距离他们解放高空补漆工人的想法已经越来越近。

作为团队的一员,黄耀辉这位大西北土生土长的女孩看到无人机飞起时眼眶竟然有些湿润:“虽然现在还只是一个比赛,但我相信通过我们的努力,那些工人们终归有一天不用再冒着生命危险爬到高空进行作业。”

04 让濒危语言不再消失

遥远的英国南约克郡,正在谢菲尔德大学Lincedo组读博的Xutan Peng(彭煦潭),同样有一个“科技向善”的公益构想。

2020年初的“国际母语日”期间,Xutan Peng在谢菲尔德大学人文学院听了一场演讲,了解到全球现存7000余种有记录的语言中,已经有超过400种濒临灭绝,超过200种处于接近濒危的状态。“语言是文明的DNA”,当一些语言不再被传递给下一代的时候,意味着一个文明正在被人们所忘却。

科班出身的Xutan Peng,发现当下濒危语言的保护手段还是一项“劳动密集性”工作,需要大量专家进行田野调查采集语料。由于还在说濒危语言的人群以老人为主,他们中极少有人能同时使用汉语和本民族语言,导致对语料进行人工转写时存在很大难度。巧合的是,将自然语言处理作为研究方向的Xutan Peng正在关注低资源语言的词典生成,就萌生了以自身一技之长来减轻濒危语言保护工作量的念头。

Xutan Peng戏称自己是个话痨,所以对语言相关的工作有着天生的兴趣。然而现实问题的复杂度远超Xutan Peng的料想,尽管国内已经在少数民族语言保护上做了很多卓有成效的工作 ,可很多濒危语言的文字已经失传,只有语音留存,研究者甚至无法获知其背后所传达的语义。

不过Xutan Peng发现,少数民族的语料主要围绕神话传说、民间故事、民歌和日常会话,或许可以构建现代汉语同领域的语料库,当各自的语料领域相对近似时,可以通过对齐算法建立濒危语言和现代汉语之间的联系。

Xutan Peng先是拿到了相关数据的授权,借助PaddleOCR将相关纸质语料转化成文本,建立了业界首个大规模汉语故事数据集。然后从国际开源语料数据库找到了尔苏、嘉绒、独龙、撒拉四种语言,并将母语者的录音进行国际音标转写。

最终Xutan Peng将少数民族语言词汇嵌入到一个高维语义空间,汉语词汇被嵌入到另一个空间,基于双语词向量结构近似性,利用正交映射对齐两个空间,生成了高质量大规模的双语词典。

目前Xutan Peng已经将导出的词典提供给中国社科院的研究者进行内测,在多数词和名词方面的翻译准确率非常理想,有效提升了对少数民族语言进行转录和濒危语言典藏工作的速度。这位特别能说的大男生不忘强调:“你们看吧,语言就是这么有趣。”

05 AI人才培养需要闭环

看完这些故事,你是否发现这些年轻人们并非都是科班出身,有些甚至在开始这些项目前对编程都知之甚少。但他们也有共性:心思缜密,擅长发现生活中遇到的痛点,并且希望通过人工智能技术去解决。

好在百度飞桨、EasyDL降低了这群少年走进AI世界的门槛,让他们略显稚嫩却充满朝气的想法有了新的可能。

从好创意变成好应用,AI人才培养机制在其中起着关键的作用。虽然越来越多的高校开设了人工智能专业或课程,越来越多的政府和企业为AI人才开出了优渥的条件,动辄百万的年薪也切实激励着当下的年轻人,只是选出“千里马”所需要的不仅仅是伯乐,还要给他们一片可以自由驰骋的宽阔草原。

做一个归纳的话:“闻鼙鼓而思良将,谋大业而召英才”固然有道理,但AI人才培养还需要有人才培养的闭环思维,需要政府、高校和企业一道打通激励、培养、实训、竞赛、就业的产业链条。

至少在刚刚结束的中国高校计算机大赛-人工智能创意赛赛场上,免费的算力资源已经帮他们把想法变成了现实,半年的实操经历也让他们对想要解决的问题有了更深刻的理解。

所幸百度代表的AI头雁们已经开始行动。

前面讲述的四个故事,不过是百度承办的第三届“中国高校计算机大赛-人工智能创意赛”的一隅,同样怀揣梦想的还有2200多支学生团队,他们正在各自关注的领域续写属于自己的故事。就像上一届比赛中获奖的中南大学“AI 知肤宝”团队已经拿到数千万的孵化基金,他们的项目已经联网国内618家医院,帮助10000多名医生进行初步的病情诊断。

其实“以赛促学”是高校AI人才培养中的重要一环,百度打造的一整套AI人才培养体系已经成型:

面向高校,百度为AI人才培养提供了全套教学和数据资源,学习与实训社区AI Studio以及算力等全面支持,联合共建专业课程体系,举办师资培训班,已累计培训了1600多名来自近500所高校的教师;

面向企业,百度打造了黄埔学院、AI快车道、AI私享会等面向不同技术层级的培训方案,构建深度学习专业加实践应用的课程体系。此外,百度还通过开展能力评估认证、举办竞赛等为人才培养保驾护航。

百度已经培养了超过100万AI人才,未来5年,还将培养500万AI人才,为中国智能经济和智能社会的发展提供人才保障。

有理由相信,在百度等企业身体力行的推动下,将有越来越多的“少年”在AI世界里进行一场场“奇幻漂流”,用一个个可以触摸的项目演绎他们心中世界的样子。

彼时我们再讨论百度对于中国AI人才的贡献时,恐怕不只是培养了高端人才的“黄埔军校”,也将是无数优秀AI人才的“启蒙工厂”。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
人工智能
ai技术

相关文章

  • IoT开发者为王,涂鸦智能硬核“靠边站”

    IoT盛宴:涂鸦向下,产品向上

    标签:
    人工智能
  • IPO观察丨黑芝麻智能递表港交所,车芯行业已迈向量产决战期?

    虽然我国汽车芯片行业还处在发展初期,但已经迸发出无限潜力。一方面,智能汽车的发展不断带动需求增长;另一方面,政策引导下,汽车芯片企业持续抢占高地。对此,在7月5日-7日举办的2023年中国汽车论坛上,中国汽车工业协会副秘书长李邵华就做出表示,“中国将成为未来汽车芯片发展的集聚地”。车规芯片行业近日的

    标签:
    人工智能
  • 汇聚中国AI顶尖力量 云天励飞参与华为AI大模型联合创新

    2023年7月6日,第六届世界人工智能大会(WAIC2023)在上海开幕,“人工智能大模型”是本届大会的备受瞩目的话题,据悉,在昇腾AI大模型的创新研发中,华为联手26家行业领军企业,组建了一支协同创新的“AI明星队”,云天励飞作为中国人工智能企业的杰出代表,和互联网大厂、运营商、科研院所等优秀团队

    标签:
    ai技术
  • 用友大易:迈入AI招聘2.0时代,让人力资源回归本质

    这几个月来,以ChatGPT为代表的生成式AI展现出的能力令世界惊叹。自从2016年AlphaGo战胜李世石掀起了一波AI浪潮后,AI仿佛已经沉寂了很久,ChatGPT的横空出世就如同一束耀眼的光芒,让AI这个名词重回C位。过去在AI1.0时代,主要通过训练模型来实现图像识别、声音识别、语言处理等特

    标签:
    ai技术
  • 新发布的PaaS2.0,能否助力涂鸦智能再起飞?

    文:互联网江湖作者:志刚2023年的IoT需要一个新故事。6月29日,涂鸦智能在开发者大会上,发布了企业级战略PaaS2.0,希望通过一个平台+四大开发服务,建立起IoT生态。对于这场发布会,市场的态度是积极的。美东时间6月29日收盘,涂鸦智能美股股价上涨5.6%,来到1.87美元/股。近日股价稳定

    标签:
    ai技术
  • 为何海尔智家能够做到“换新不厌旧”?

    在繁忙的城市角落,张先生的小公寓里藏着一个宝贝——一台20年前的海尔老式彩电。这台电视见证了他的拼搏、快乐和岁月的流转。虽然他对新科技并不感冒,但他的儿子小张对此却充满了好奇和热情。小张在线上看到以旧换新活动的同时,说服了张先生,并在手机上下单预约上门服务。没多久,服务人员便上门拆走旧家电,安装调试

    标签:
    海尔智家
  • 也谈谈AI洗稿

    前几天腾讯发了个公告称:平台巡查发现有些MCN和作者发布大量“AI洗稿”内容。并宣称要对“AI洗稿”行为进行打击,同时鼓励合理运用AI技术。其实我是想借此机会,给大家说说“AI洗稿”这件事,隐秘在黑暗角落里的赚钱行为。“洗稿”就是把别人的文章用AI工具修改润色一下或调整段落,然后再发到自媒体平台上,

    标签:
    ai智能
  • 竞逐智能家居大模型:美的“蓄力”,海尔“疾行”

    随着ChatGPT火热出圈,AI大模型便成为了各行各业必争的高地。

    标签:
    智能家居
  • 李彦宏新目标,押注AI原生应用

    文/道哥“未来,自然语言将成为新的通用编程语言。你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”4月16日,百度创始人、董事长兼首席执行官李彦宏在Create2024百度AI开发者大会上表述了对未来AI人工智能发展的新一轮展望。自OpenAI发布ChatGPT大模型后,这股AI人工智能

    标签:
    李彦宏
  • AI算力竞赛加速散热技术变革,液冷方案获行业青睐

    进入AIGC时代,智算中心规模日渐庞大,服务器能耗与日俱增。如何降低智算中心能耗已成为国家和地方政府关注的焦点。工信部数据显示,2022年全国数据中心总耗电量约2700亿千瓦时。当前,大部分数据中心仍主要采用风冷散热技术,在单柜密度、PUE值方面已愈发难以满足行业发展及绿色节能方面的要求,而冷板式液

  • 中国AIGC最值得关注企业&产品榜单揭晓!首份应用全景图谱发布

    “你好,新应用!”站在大模型落地元年,是时候喊出这句话了。从软件APP、智能终端乃至具身智能等等,AIGC开始席卷一切。大模型玩家、互联网巨头、终端厂商、垂直场景玩家纷纷入场,办公、创作、营销、教育、医疗领域相继被渗透……一个万亿市场,正在酝酿。站在浪潮起点,当下发展究竟如何了?机遇在哪?挑战如何?

  • 标准引领促转型 提升新质生产力——2024数字教育标准创新应用研讨会召开

    4月14日,以“标准引领促转型,提升新质生产力”为主题,由全国信息技术标准化技术委员会教育技术分技术委员会主办,锐捷网络承办的2024数字教育标准创新应用研讨会暨《高等学校数字校园建设规范(试行)》(以下简称《规范》)优秀及典型应用案例的颁奖活动在福州举办。本次会议聚焦赋能新质生产力和高校教育数字化

  • 两座超大城市对“视”联手 杭深奏响智能物联产业合鸣!

    春至岭南花似锦,出门俱是看花人。4月16日,2024“中国视谷”城市(深圳)推介会暨智能物联产业合作发展论坛在深圳举行。一场广聚全球英才的产业思想盛宴就像早春的花潮,召示着智能物联产业合作发展的丰硕成果正在孕育、成长。站在时代的风口和机遇中瞭望,智能物联产业是人工智能和物联网融合与应用的战略性新兴产

  • AI提高效率:用智谱清言打造爆款视频号

    关注卢松松,会经常给你分享一些我的经验和观点。(1)想做副业、短视频的同学,看完本文一定对你有所帮助!(2)很多人说2024是视频号红利的一年,有分成收益,广告主也多,流量大。(3)松松一共做了10多个视频号,在视频号布局3年了,几乎啥都做过,有的收益千八百、有的收益1-2k,有的收益3-5k。(4

    标签:
    ai技术
  • CPU上跑AI?从推荐系统的演进看CPU的崛起

    在信息和数据极度繁荣的当下,人工智能正在通过各种方式影响着人类生活。其中,AI推荐系统作为互联网时代最关键的伴生技术之一,正在帮助人类梳理着各种纷繁杂乱的信息,让资源实现更精准的调配,让一切变得井然有序。推荐系统:数字营销的重要引擎当你到一座旅游城市,不知道当地有什么美食时,AI推荐系统在手机上的本

编辑推荐