2019年数字生态大会于5月21日—23日在昆明举行,在AI分论坛上,腾讯优图实验室联合负责人、杰出科学家贾佳亚分享了优图近期在AI手语识别上取得的突破——推出基于自研算法的“优图AI手语翻译机”。
据贾佳亚介绍,AI手语翻译机以普通摄像头作为手语采集装置,依托高性能计算机进行后台运算,用户只要正对摄像头完成手语表达,翻译机就能快速运算出结果并把手语翻译成为文字。未来有望在机场、民政窗口等公共场所部署和落地,助力信息无障碍城市建设。
(腾讯优图实验室联合负责人、腾讯杰出科学家 贾佳亚)
AI手语翻译机:自研算法,实现手语识别“黑科技”
手语识别(SLR),就是指通过计算机算法,自动区分手语表达中的各类手势、动作以及这些手势和动作之间的切换,最后将表达的手语翻译成文字。不过相比于其他AI视觉识别技术的研究,手语识别的研发却存在更大的困难和挑战。手语表达所特有的地域性、复杂性和多样性极大地增加了数据采集与清洗的难度和成本,而受限于数据量的大小和人工设计特征的缺陷,很多传统研究的研究方法在适应性、泛化性及鲁棒性上都十分有限。
(优图AI手语翻译机界面)
据贾佳亚介绍,此次腾讯优图推出的AI手语翻译机,结合听障人士手语表达的习惯采集手语数据,参考先进的手势识别、动作识别和序列翻译等技术,通过自研算法实现了对复杂手语表达的识别技术突破。相较于其他方法,优图AI手语翻译机的数据集覆盖了近千句日常表达,900个常用词汇,同时对数据进行进一步的分析和归纳,拥有目前最大的中文手语识别数据集,并支持整句手语表达的识别,可直接判断用户是否结束并完成实时翻译。
应用探索:视觉AI,助力信息无障碍建设
据北京听力协会2017年公开数据,估计中国残疾性听力障碍人士已达7200万,相当于北京市常住人口(约2200万,2015年数据)的3倍多。尽管我国在信息无障碍领域的投入逐渐增加,但目前国内的听障人群需求依然得不到满足。优图AI手语翻译机的推出将一定程度地缓解听障人士的交流障碍。
在演讲中,贾佳亚表示,“未来,我们希望通过与聋哑人士或手语使用者的深入接触,尝试在公共事物场所为听障者提供更好的服务,更好地助力信息无障碍的建设。”下一步,优图实验室将对AI手语翻译机展开优化和升级,尝试在日常服务窗口、手语教育等场景中落地,为听障人士带来实实在在的便利。
目前,优图实验室已经和深圳市信息无障碍研究会成立AI手语识别联合项目组,就手语数据采集、产品算法优化等方面展开长期深度合作,并通过与听障者或手语使用者进一步接触,扩充数据容量,完善数据规范,致力于推动后续的产品和服务部署,推动信息无障碍建设。
(优图和深圳信息无障碍研究会AI听障无障碍联合项目组)
此次的数字生态大会展示的优图AI手语翻译机,并不是腾讯在信息无障碍建设上的首次尝试。早在2009年腾讯便开始了信息无障碍方面的探索,截至目前,旗下QQ、QQ空间、微信、腾讯网、腾讯新闻、应用宝、企鹅FM等大部分产品已针对障碍用户实现专门优化,致力于为障碍人士构建信息友好社会。2013年,腾讯优图团队和手机QQ一起打磨了OCR引擎技术,基于计算机视觉算法及自然语言处理能力,可将图片上的文字直接转换为可编辑的结构化文本,帮助视障群体实现信息沟通无障碍化。
与本次亮相数字生态大会AI分论坛的跨年龄人脸识别技术一样,优图AI手语翻译机同样是腾讯践行“科技向善”的重要体现。而优图实验室也将继续秉承“科技向善”这一理念,推动前沿技术在社会场景中的应用,切实让更多的实际问题得以解决。做有温度的AI,让科技产生更大的社会价值。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
2023年7月6日,第六届世界人工智能大会(WAIC2023)在上海开幕,“人工智能大模型”是本届大会的备受瞩目的话题,据悉,在昇腾AI大模型的创新研发中,华为联手26家行业领军企业,组建了一支协同创新的“AI明星队”,云天励飞作为中国人工智能企业的杰出代表,和互联网大厂、运营商、科研院所等优秀团队
这几个月来,以ChatGPT为代表的生成式AI展现出的能力令世界惊叹。自从2016年AlphaGo战胜李世石掀起了一波AI浪潮后,AI仿佛已经沉寂了很久,ChatGPT的横空出世就如同一束耀眼的光芒,让AI这个名词重回C位。过去在AI1.0时代,主要通过训练模型来实现图像识别、声音识别、语言处理等特
文:互联网江湖作者:志刚2023年的IoT需要一个新故事。6月29日,涂鸦智能在开发者大会上,发布了企业级战略PaaS2.0,希望通过一个平台+四大开发服务,建立起IoT生态。对于这场发布会,市场的态度是积极的。美东时间6月29日收盘,涂鸦智能美股股价上涨5.6%,来到1.87美元/股。近日股价稳定
2020年底,王慧文在朋友圈写下这句话时,外界本以为这位伴随中国互联网发展而持续创业20年的人物即将告别创业舞台。但是,一个曾经多次创业,正值壮年的互联网老将心中的创业热情是难以熄灭的。
高考一结束,忙坏了海内外一众大模型。豆包、DeepSeek、ChatGPT、元宝、文心一言、通义千问……掀起了一波“AI赶考”大战。据悉,去年高考期间,大模型的成绩才勉强过一本线,今年集体晋升985。据悉,豆包甚至过了清北的录取线。头部大模型在高考“考场”上玩得不亦乐乎,中小AI创企的处境却日益尴尬
文/二风来源/节点财经每年高考成绩放榜后,数千万考生和家长将迎来另一场硬仗——填报志愿。今年,这一领域迎来了AI的全面介入,多家互联网大厂和教育公司纷纷推出智能志愿填报产品,为考生提供院校和专业选择建议。据艾媒咨询数据,2023年中国高考志愿填报市场付费规模约9.5亿元,近九成考生愿意借助志愿填报服
苹果还没从WWDC25的“群嘲”中走出,又迎来了一次新的痛击。据路透社报道,21日,苹果公司遭到股东集体起诉,被指在信息披露中低估了将先进生成式AI整合进语音助手Siri所需的时间,导致iPhone销量受影响、股价下滑,构成证券欺诈。在这份诉讼中,库克、首席财务官凯文·帕雷克及前首席财务官卢卡·马埃
华为的盘古大模型终于推出新版本了。6月20日华为云计算CEO张平安宣布基于CloudMatrix384超节点的新一代昇腾AI云服务全面上线,盘古大模型5.5同步发布。不过,当前国内的AI大模型竞争可谓是相当激烈,华为的盘古大模型在众多大模型中并不是十分出众。华为云此次重磅推出的盘古大模型5.5能否从
一场没有罗永浩的“罗永浩直播”,正在改写带货规则当数字人罗永浩在百度直播间举起青岛啤酒,以标志性幽默回应粉丝提问时,弹幕疯狂刷出“这是真的还是假的?”的疑问。这场持续近7小时的直播,创下1300万人次观看、GMV突破5500万元的惊人战绩,甚至超过了他本人一个月前真人直播5000万元的成绩。数字人主
高频互动、个性化教学、突破成本壁垒,AI老师让英语学习更普惠。6月24日,新东方正式推出面向消费者的首款原创AI教育产品——“新东方AI1对1”。这款产品标志着新东方在教育+AI战略布局中迈出关键一步,旨在以科技力量推动优质教育资源的普惠发展。在发布会现场,新东方教育科技集团CEO周成刚表示:“AI
大家好,我是白杨SEO,专注SEO十年以上,全网SEO流量实战派,AI搜索优化研究者。为什么想分享这个AI工作流及coze扣子这个?因为我们搞流量的如果学会了用AI给我们生产提效将更有助于我们去获客。目前白杨SEO用得并不是很好,分享仅供参考,希望给你一些启发。老规矩,先说下文章大纲如下:1、AI工
近期,“AI新云”(NeoCloud)概念在科技圈和投资圈引发热潮。今年3月,被业内称作“英伟达亲儿子”的AI基础设施企业CoreWeave上市。这家依托英伟达GPU资源冲击新云市场的初创公司,上市不到3个月市值飙升359%,达881亿美元。CoreWeave的“身价暴涨”吸引了无数视线。对此,不少