还在玩只限于人脸的AR玩法吗?一键美体塑形、视频体感游戏、用手机就能玩虚拟形象全身驱动……随着5G即将全面普及以及智能图形技术的不断创新,原本受限于高端硬件的全身AR技术,现在用智能手机就能玩,视频AR玩法也将全面进入了全身时代。
相芯科技此次对人体AI技术进行全面升级,在视频AR特效的功能基础上进行玩法升级,同时新增开放7大功能的算法接口,分别是2D人体关键点、3D人体骨骼、人像分割、头部分割、头发分割、动作识别、手势识别。每项技术革新背后都能带来新的应用层的火花,相芯更新的技术效果到底如何,一起来看下吧。

打开APP 阅读最新报道一、2D人体关键点
通过2D人体关键点算法接口,实现人体全身2D关键点的跟踪效果,点位准确性高,即使做大幅度动作、遮挡以及转身的情况下,也能准确稳定跟踪。同时针对用户在短视频、直播拍摄时的自拍场景,2D人体关键点还提供半身模式的点位跟踪,这样用户在单手持手机自拍的情况下,也能准确定位人体数据。

在高精度的人体关键点模型的基础上,对视频中的人物实现全身美体功能,是这项技术比较热门的应用场景。相芯的技术,可以从瘦身、长腿、细腰、美肩、美臀、小头、瘦腿等七个美化维度,对人物的身体进行精细化调整,从而达到一件瘦身塑形的作用。

二、3D人体骨骼
相芯科技开放的3D人体骨骼的算法接口,主要应用于基于3D关键点和3D骨骼,实现3D虚拟形象的全身驱动。这项技术不依赖于深度摄像头,只需要手机的普通摄像头就能获得视频中的人体3D骨骼数据,即使人物做大幅度的动作、有动作遮挡、转身等情况都能稳定跟踪。除了身体躯干动作,在手指细节上,也能识别和跟踪常见的14种手势。让3D虚拟形象能够更细腻地复原人物的动作。同样针对他人拍摄和自拍两种拍摄场景,相芯提供全身和半身两种模式,支持3D人体骨骼数据的输出。

三、人像分割
通过人像分割的算法接口,可对输入的视频进行内容理解,将人物进行高精分割解析,将人像区域分离出来,并实时追踪。例如视频直播过程中,识别用户的人体轮廓,为人物实时替换各种背景特效。也可以与各具创意的人体AR贴纸相结合,让贴纸实时跟随人体移动,贴纸素材与人体的前后位置关系可灵活定义,可以充分发挥运营者的互动创意,为用户带来更加丰富的娱乐体验。

四、头部分割
通过头部分割接口,企业和开发者可以对人物头部区域做更多的特效创意。例如搞笑大头玩法特效,可以实现视频中的人物头部放大的萌态效果。这项技术还能和其他技术进行组合实现更加新颖的玩法效果。比如将头部分割和表情系数结合,即可用特点的表情,触发大头效果,并用表情的夸张程度来实时控制头部的放大程度。用头部分割+哈哈镜+AR贴纸这样的技术组合,就可以实效恶搞版的效果,充分发挥脑洞创意。

五、头发分割
通过头发分割接口,可以在视频和照片中人物的头发区域高精度地分离出来,可以给头发切换各种各样的颜色,可以是纯色,也可以是渐变色,实现一键换发色的特效。同时头发的色值支持自定义,并可以进行上色程度的调整,实现想要的发色,想换就换。

六、动作识别
相芯科技的动作识别接口,能够支持15种全身动作的识别。将动作识别和匹配算法相结合,可以开发出各种体感小游戏,比如“尬舞机”游戏,跟着屏幕的动作提示即可开始跳舞了。同时动作识别也可以与AR贴纸相结合,用特定动作来触发贴纸特效,充分发挥体感互动的娱乐性。

七、手势识别
通过手势识别接口,可精准识别常见的14种手势动作。在短视频直播领域,用户在拍视频和拍照过程中,可以通过手势动作来触发各种贴纸特效,从而衍生出创意视频的各种玩法。同时,在智能设备领域,比如智能家电、智能机器人、可穿戴设备、智能互动大屏等智能硬件,可以实现用手势控制对应的功能。用户在不接触设备的情况下,通过简单的手势,就能实现对设备的交互和控制,让人机交互方式更加智能化、自然化。

相芯科技专注于人工智能和计算机图形学的融合与创新,致力于为消费级应用提供内容创作工具、平台和解决方案。相芯科技的人脸人体AI解决方案目前已累计服务700多家B端客户,产品被广泛应用于短视频、直播、社交、游戏、智能家居、在线教育、广告营销、新零售等领域,月均调用量达40亿。
此次的人体AI SDK大更新,相芯针对不同体验需求推出了两个版本的体验demo,分别是特效版和算法版demo。
【特效版demo】模拟真实的用户应用场景,提供技术的功能演示和体验,可以在这个demo里面直观体验美颜、美妆、道具贴纸、Animoji、美发、轻美妆、AR面具、搞笑大头、海报换脸、表情识别、音乐滤镜、哈哈镜、美体、全身Avatar、动作识别、人像分割、手势识别等功能。
同时针对开发者用户,为了能更好地体验各个功能接口在算法层的效果,相芯全新推出【算法版demo】,使用这个demo就能直观地看到各种人体关键点、人体骨骼、mask类功能的算法效果,便于进一步开发使用。目前开放的接口为2D人体关键点、3D人体骨骼、人像分割、头部分割、头发分割、动作识别、手势识别。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,
个人创业需要启动成本低、无需庞大团队、可快速验证、能利用个人技能或资源。这里分享适合个人创业的十个机会一.AI内容优化与本地化服务·做什么:帮助企业或个人利用AI工具(如GPT-4,Midjourney)优化内容生产流程。例如,为跨境电商撰写多语言产品描述,为小红书博主生成爆款文案,为小公司制作营销
百度AI团队今日正式推出PaddleOCR3.1版本,以突破性的多语言组合识别(MultilingualCompositionPerception,MCP)技术为核心,彻底重构复杂文档处理边界。此次升级标志着OCR领域首次实现对同一文档内任意混合语言文本的精准识别,为全球化企业、跨境业务及多元文化场
导航网站的崛起:从信息过载到精准触达随着全球AI工具数量爆发式增长(2025年已超数万款),用户面临前所未有的选择困境。传统搜索引擎的“关键词-链接”模式难以应对工具筛选的场景需求,垂直化、场景化的AI导航网站应运而生。这类平台通过聚合、评测、分类与推荐四重机制,将分散的工具资源整合为结构化入口。例
当微信公众号文章中出现一个人的名字,它会自动变成蓝色链接,点击即可查看AI生成的“个人简历”——这一微信新功能让不少用户感到被“扒光”在互联网上。近日,微信新上线的“AI搜索”功能陷入隐私泄露争议漩涡。多位网友在社交平台反映,当微信公众号推文中出现本人姓名时,名字会自动变为蓝色超链接,点击即可浏览由
2025年,被业界公认为具身智能(EmbodiedAI)真正觉醒的元年。当人工智能跨越数字世界的边界,轰然撞开物理世界的大门,是谁在荒野中劈开荆棘?又是谁在定义行业的未来?由魔搭社区(ModelScope)、CCF智能机器人专委会、工信部装备数字孪生技术重点实验室、Lumina具身智能社区、开放原子
拒绝“智元”走私语义,七维拆解Token物理本质,定义AI时代唯一真名:「符元」。
3月22日,智汇金陵·AI开源人才峰会暨魔搭开发者大会在南京举办。从去年6月30日至今,魔搭社区用户数从1600万增长至2500万,9个月内用户增量近千万;魔搭社区上的开源模型数量从7万增长至17万,9个月内新增10万个开源模型,包括DeepSeek、智谱、MiniMax、阶跃星辰、Mistral等
文/杨雪健来源/节点财经Meta或迎来史上最大规模裁员潮。2026年3月14日,路透社曝出Meta正计划启动新一轮大规模裁员,此次裁员比例或达公司总员工数的20%,按其近7.9万的员工规模计算,约1.58万名员工或将被裁。若该计划执行,将成为Meta自2022年底实行“效率之年”重组后规模最大的一次
3月17日,阿里发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的”龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。拥有8亿用户的钉钉重写底层代码,进行全面CLI(命令行界面)化改造,让悟空Agent能够原生操
AI的“免费红利期”结束了,未来18个月,靠“API倒卖”的公司,会成片消失。这个导火索就是最近Google的一轮封号导致的,随着封号风波的结束,这也标志着AI行业【收租时代】来了。2月封号潮:高付费用户被一锅端一周前,Google开始大规模封号,付着250美金月费的人,账号说没就没,Gmail、Y
来自路透社等媒体报道的最新消息:DeepSeek未发布的V4Lite模型遭泄露上网,华为获得早期访问权限,英伟达被排除在外。近期,谷歌发表了2篇Multi-Agent协作学习新论文有网友提供了更加详细的信息,DeepSeekV4Lite:100万token上下文窗口(V3为128K)内置原生多模态推
春节红包会结束,但AI已融入数亿人生活里
性能、商业、生态诠释开源模型的最佳姿态
2026年刚开年,全世界最狂的那个男人,穿着他的经典黑皮衣,在CES舞台上发出了未来十年的信号。他搞了个“能吃饱套餐”:6个包子+一碟小菜+一碗粥=肉包子套餐,这样以后你只要买一个套餐就能吃饱了。(Rubin平台)同时他们店里还免费提供的筷子、勺子、蘸料、酱油、醋、水果、零食等等。(开放10万亿语言