视频AR玩法进入全身时代，相芯人体AI技术全面升级

2020-07-13 15:20 来源：互联网我来投稿撤稿纠错

还在玩只限于人脸的AR玩法吗?一键美体塑形、视频体感游戏、用手机就能玩虚拟形象全身驱动……随着5G即将全面普及以及智能图形技术的不断创新,原本受限于高端硬件的全身AR技术,现在用智能手机就能玩,视频AR玩法也将全面进入了全身时代。

相芯科技此次对人体AI技术进行全面升级,在视频AR特效的功能基础上进行玩法升级,同时新增开放7大功能的算法接口,分别是2D人体关键点、3D人体骨骼、人像分割、头部分割、头发分割、动作识别、手势识别。每项技术革新背后都能带来新的应用层的火花,相芯更新的技术效果到底如何,一起来看下吧。

打开APP 阅读最新报道一、2D人体关键点

通过2D人体关键点算法接口,实现人体全身2D关键点的跟踪效果,点位准确性高,即使做大幅度动作、遮挡以及转身的情况下,也能准确稳定跟踪。同时针对用户在短视频、直播拍摄时的自拍场景,2D人体关键点还提供半身模式的点位跟踪,这样用户在单手持手机自拍的情况下,也能准确定位人体数据。

在高精度的人体关键点模型的基础上,对视频中的人物实现全身美体功能,是这项技术比较热门的应用场景。相芯的技术,可以从瘦身、长腿、细腰、美肩、美臀、小头、瘦腿等七个美化维度,对人物的身体进行精细化调整,从而达到一件瘦身塑形的作用。

二、3D人体骨骼

相芯科技开放的3D人体骨骼的算法接口,主要应用于基于3D关键点和3D骨骼,实现3D虚拟形象的全身驱动。这项技术不依赖于深度摄像头,只需要手机的普通摄像头就能获得视频中的人体3D骨骼数据,即使人物做大幅度的动作、有动作遮挡、转身等情况都能稳定跟踪。除了身体躯干动作,在手指细节上,也能识别和跟踪常见的14种手势。让3D虚拟形象能够更细腻地复原人物的动作。同样针对他人拍摄和自拍两种拍摄场景,相芯提供全身和半身两种模式,支持3D人体骨骼数据的输出。

三、人像分割

通过人像分割的算法接口,可对输入的视频进行内容理解,将人物进行高精分割解析,将人像区域分离出来,并实时追踪。例如视频直播过程中,识别用户的人体轮廓,为人物实时替换各种背景特效。也可以与各具创意的人体AR贴纸相结合,让贴纸实时跟随人体移动,贴纸素材与人体的前后位置关系可灵活定义,可以充分发挥运营者的互动创意,为用户带来更加丰富的娱乐体验。

四、头部分割

通过头部分割接口,企业和开发者可以对人物头部区域做更多的特效创意。例如搞笑大头玩法特效,可以实现视频中的人物头部放大的萌态效果。这项技术还能和其他技术进行组合实现更加新颖的玩法效果。比如将头部分割和表情系数结合,即可用特点的表情,触发大头效果,并用表情的夸张程度来实时控制头部的放大程度。用头部分割+哈哈镜+AR贴纸这样的技术组合,就可以实效恶搞版的效果,充分发挥脑洞创意。

五、头发分割

通过头发分割接口,可以在视频和照片中人物的头发区域高精度地分离出来,可以给头发切换各种各样的颜色,可以是纯色,也可以是渐变色,实现一键换发色的特效。同时头发的色值支持自定义,并可以进行上色程度的调整,实现想要的发色,想换就换。

六、动作识别

相芯科技的动作识别接口,能够支持15种全身动作的识别。将动作识别和匹配算法相结合,可以开发出各种体感小游戏,比如“尬舞机”游戏,跟着屏幕的动作提示即可开始跳舞了。同时动作识别也可以与AR贴纸相结合,用特定动作来触发贴纸特效,充分发挥体感互动的娱乐性。

七、手势识别

通过手势识别接口,可精准识别常见的14种手势动作。在短视频直播领域,用户在拍视频和拍照过程中,可以通过手势动作来触发各种贴纸特效,从而衍生出创意视频的各种玩法。同时,在智能设备领域,比如智能家电、智能机器人、可穿戴设备、智能互动大屏等智能硬件,可以实现用手势控制对应的功能。用户在不接触设备的情况下,通过简单的手势,就能实现对设备的交互和控制,让人机交互方式更加智能化、自然化。

相芯科技专注于人工智能和计算机图形学的融合与创新,致力于为消费级应用提供内容创作工具、平台和解决方案。相芯科技的人脸人体AI解决方案目前已累计服务700多家B端客户,产品被广泛应用于短视频、直播、社交、游戏、智能家居、在线教育、广告营销、新零售等领域,月均调用量达40亿。

此次的人体AI SDK大更新,相芯针对不同体验需求推出了两个版本的体验demo,分别是特效版和算法版demo。

【特效版demo】模拟真实的用户应用场景,提供技术的功能演示和体验,可以在这个demo里面直观体验美颜、美妆、道具贴纸、Animoji、美发、轻美妆、AR面具、搞笑大头、海报换脸、表情识别、音乐滤镜、哈哈镜、美体、全身Avatar、动作识别、人像分割、手势识别等功能。

同时针对开发者用户,为了能更好地体验各个功能接口在算法层的效果,相芯全新推出【算法版demo】,使用这个demo就能直观地看到各种人体关键点、人体骨骼、mask类功能的算法效果,便于进一步开发使用。目前开放的接口为2D人体关键点、3D人体骨骼、人像分割、头部分割、头发分割、动作识别、手势识别。

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

相关标签: ar技术; ai技术

瓯江论道：AI赋能绿色发展

2025年10月25日，2025世界青年科学家峰会之人工智能（AI）融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办，中国投资协会能源投资专业委员会、温港院士科创中心承办，中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持，以“瓯江论道-AI赋能绿色发展”为主题，

标签：

ai技术
王通：未来个人创业的十个机会

个人创业需要启动成本低、无需庞大团队、可快速验证、能利用个人技能或资源。这里分享适合个人创业的十个机会一.AI内容优化与本地化服务·做什么：帮助企业或个人利用AI工具（如GPT-4,Midjourney）优化内容生产流程。例如，为跨境电商撰写多语言产品描述，为小红书博主生成爆款文案，为小公司制作营销

标签：

创业机会

ai技术
百度智能云PaddleOCR 3.1正式发布：关键能力支持MCP

百度AI团队今日正式推出PaddleOCR3.1版本，以突破性的多语言组合识别（MultilingualCompositionPerception,MCP）技术为核心，彻底重构复杂文档处理边界。此次升级标志着OCR领域首次实现对同一文档内任意混合语言文本的精准识别，为全球化企业、跨境业务及多元文化场

标签：

ai智能

ai技术
AI工具导航网站，未来的发展前景怎么样？

导航网站的崛起：从信息过载到精准触达随着全球AI工具数量爆发式增长（2025年已超数万款），用户面临前所未有的选择困境。传统搜索引擎的“关键词-链接”模式难以应对工具筛选的场景需求，垂直化、场景化的AI导航网站应运而生。这类平台通过聚合、评测、分类与推荐四重机制，将分散的工具资源整合为结构化入口。例

标签：

ai技术

导航网站
微信AI搜索被指“强行开盒”：名字成了数据入口，腾讯回应“仅用公开信息”

当微信公众号文章中出现一个人的名字，它会自动变成蓝色链接，点击即可查看AI生成的“个人简历”——这一微信新功能让不少用户感到被“扒光”在互联网上。近日，微信新上线的“AI搜索”功能陷入隐私泄露争议漩涡。多位网友在社交平台反映，当微信公众号推文中出现本人姓名时，名字会自动变为蓝色超链接，点击即可浏览由

标签：

ai技术

ai搜索

最新API聚合平台与API中转站对比推荐：表现各具特色，一文教你怎么挑

随着大型语言模型在研发、产品与业务中渗透得越来越深，技术团队面对的现实不再是“要不要用”，而是“怎么高效、稳定、合规地调用几十上百种模型”。直接逐一申请各家官方的APIKey，管理成本高、切换成本更高，而模型供应不稳定、账单零散又缺乏企业级管控的痛点，让API聚合平台和API中转站成为技术栈中不可或
合肥曦诺传媒实力与保障解析：从团队规模、回收流程到客户权益，看二手手机回收服务如何更安心

二手手机回收看似简单，实际涉及价格评估、设备检测、物流交接、隐私安全、付款结算、争议处理等多个环节。对用户来说，最担心的往往不是“旧手机能不能卖”，而是“价格是否合理”“寄出去是否安全”“检测后会不会变价”“手机隐私会不会泄露”“如果不满意能不能退回”。合肥曦诺传媒有限公司作为一家面向全国客户提供二
2026年 Claude 大模型国内怎么接入？用非线智能API最优解

当你的团队开始把ClaudeCode和Codex当作日常编程搭档时，一个被反复低估的难题会浮出水面：这些工具的模型配置不像玩具Demo那样一键切换，真正落到生产环境，你会撞上API兼容性、Token消耗追踪、多账号权限管理这些实打实的工程问题。不少团队卡在“能调通”到“能管好”之间的鸿沟里——接口地
DeepSeek首轮融资超500亿元，梁文锋自掏200亿

文/郭静来源/节点财经据TheInformation报道，DeepSeek已完成首轮外部融资，募资总额超500亿元人民币（约74亿美元），估值达到500亿美元。如果消息属实，这将是国产大模型乃至整个中国AI行业迄今为止最大的一笔单轮融资。互联网、制造业、老牌资本、国家队，一样不缺——梁文锋亲自坐庄，
黄仁勋给PC行业画了一张“大饼”

“PC正在被重新定义，这次重塑的意义堪比当年手机向智能手机的变革。”6月1日，英伟达CEO黄仁勋在COMPUTEX2026（台北国际电脑展）上进行了一场近2小时的主题演讲。在演讲中，他从口袋里掏出了一块面向个人AI电脑的超级芯片—RTXSpark，宣告智能体AI（AgenticAI）时代已全面到来。
2026年国内如何稳定使用 Claude ？以非线智能API为例，为什么说它是最稳定最简单

团队启动了一项关键的代码库现代化项目，目标是将遗留的Python服务迁移至更健壮的架构，并利用前沿模型进行全量代码审计与重构。评估了多个选项后，我们决定采用ClaudeCode，看中的是ClaudeOpus4.8在SWE-bench上展现出的顶尖推理能力以及其超长上下文处理窗口，理论上非常适合处理我

哪个平台抢票成功率高、出票快？同程14项智能购票工具箱实测推荐

每到节假日出行，买火车票就成了不少人头疼的事。高铁票用什么平台买比较靠谱？哪个平台抢票成功率更高？支付方便吗？出票快不快？怎么买才划算？这些问题几乎每个坐火车的人都遇到过。从实际使用体验来看，市面上几个主流平台各有特点，但从功能完整度和省钱力度上，同程旅行近期的表现值得关注。一、抢票成功率，取决于平
非线智能API实战解析：API 聚合平台如何实现 AI 费用深度管控

大模型的能力已经渗透到日常开发、产品迭代和业务决策的每个环节，但一个越来越尖锐的问题也随之浮现：当团队开始重度使用多个模型、多种工具时，AI费用如何做到既透明又可控？传统的「一个模型配一把Key」方案，在面对ClaudeCode、Codex、Cursor、Cline等不同接入协议、不同消耗特征的工作
AI体检：有人赚得盆满钵满，有人只剩营销噱头

AI正在重构医疗健康的服务范式，而AI体检作为技术落地最成熟且场景渗透最快的赛道，已成为行业高质量增长的核心变量。根据全球新经济产业第三方数据挖掘和分析机构iiMediaResearch最新发布的《2025年中国健康体检行业消费行为调查数据》数据显示，选择两年一次体检的消费者占比最高，达到39.41
AI下半场，该“文科生”上场了

把复杂AI技术逻辑，转化为普通人看得懂、愿意用、用得顺畅的产品与内容，将在长期竞争中占据主动。作者|宇溪编辑|刘珊珊2026年春天，中国AI产业迎来一场静水流深的变革。不是参数翻了几倍，而是AI从“热搜话题”变成了“日常工具”。回看上半年，“AI红包大战”风靡全网，Seedance2.0催生全民视频

加载更多

视频AR玩法进入全身时代，相芯人体AI技术全面升级

相关文章

瓯江论道：AI赋能绿色发展

王通：未来个人创业的十个机会

百度智能云PaddleOCR 3.1正式发布：关键能力支持MCP

AI工具导航网站，未来的发展前景怎么样？

微信AI搜索被指“强行开盒”：名字成了数据入口，腾讯回应“仅用公开信息”

最新API聚合平台与API中转站对比推荐：表现各具特色，一文教你怎么挑

合肥曦诺传媒实力与保障解析：从团队规模、回收流程到客户权益，看二手手机回收服务如何更安心

2026年 Claude 大模型国内怎么接入？用非线智能API最优解

DeepSeek首轮融资超500亿元，梁文锋自掏200亿

黄仁勋给PC行业画了一张“大饼”

2026年国内如何稳定使用 Claude ？以非线智能API为例，为什么说它是最稳定最简单

哪个平台抢票成功率高、出票快？同程14项智能购票工具箱实测推荐

非线智能API实战解析：API 聚合平台如何实现 AI 费用深度管控

AI体检：有人赚得盆满钵满，有人只剩营销噱头

AI下半场，该“文科生”上场了

热门排行

编辑推荐