1. 创业头条
  2. 前沿领域
  3. AI智能
  4. 正文

视频AR玩法进入全身时代,相芯人体AI技术全面升级

 2020-07-13 15:20  来源:互联网  我来投稿 撤稿纠错

  一键部署OpenClaw

还在玩只限于人脸的AR玩法吗?一键美体塑形、视频体感游戏、用手机就能玩虚拟形象全身驱动……随着5G即将全面普及以及智能图形技术的不断创新,原本受限于高端硬件的全身AR技术,现在用智能手机就能玩,视频AR玩法也将全面进入了全身时代。

相芯科技此次对人体AI技术进行全面升级,在视频AR特效的功能基础上进行玩法升级,同时新增开放7大功能的算法接口,分别是2D人体关键点、3D人体骨骼、人像分割、头部分割、头发分割、动作识别、手势识别。每项技术革新背后都能带来新的应用层的火花,相芯更新的技术效果到底如何,一起来看下吧。

打开APP 阅读最新报道一、2D人体关键点

通过2D人体关键点算法接口,实现人体全身2D关键点的跟踪效果,点位准确性高,即使做大幅度动作、遮挡以及转身的情况下,也能准确稳定跟踪。同时针对用户在短视频、直播拍摄时的自拍场景,2D人体关键点还提供半身模式的点位跟踪,这样用户在单手持手机自拍的情况下,也能准确定位人体数据。

在高精度的人体关键点模型的基础上,对视频中的人物实现全身美体功能,是这项技术比较热门的应用场景。相芯的技术,可以从瘦身、长腿、细腰、美肩、美臀、小头、瘦腿等七个美化维度,对人物的身体进行精细化调整,从而达到一件瘦身塑形的作用。

二、3D人体骨骼

相芯科技开放的3D人体骨骼的算法接口,主要应用于基于3D关键点和3D骨骼,实现3D虚拟形象的全身驱动。这项技术不依赖于深度摄像头,只需要手机的普通摄像头就能获得视频中的人体3D骨骼数据,即使人物做大幅度的动作、有动作遮挡、转身等情况都能稳定跟踪。除了身体躯干动作,在手指细节上,也能识别和跟踪常见的14种手势。让3D虚拟形象能够更细腻地复原人物的动作。同样针对他人拍摄和自拍两种拍摄场景,相芯提供全身和半身两种模式,支持3D人体骨骼数据的输出。

三、人像分割

通过人像分割的算法接口,可对输入的视频进行内容理解,将人物进行高精分割解析,将人像区域分离出来,并实时追踪。例如视频直播过程中,识别用户的人体轮廓,为人物实时替换各种背景特效。也可以与各具创意的人体AR贴纸相结合,让贴纸实时跟随人体移动,贴纸素材与人体的前后位置关系可灵活定义,可以充分发挥运营者的互动创意,为用户带来更加丰富的娱乐体验。

四、头部分割

通过头部分割接口,企业和开发者可以对人物头部区域做更多的特效创意。例如搞笑大头玩法特效,可以实现视频中的人物头部放大的萌态效果。这项技术还能和其他技术进行组合实现更加新颖的玩法效果。比如将头部分割和表情系数结合,即可用特点的表情,触发大头效果,并用表情的夸张程度来实时控制头部的放大程度。用头部分割+哈哈镜+AR贴纸这样的技术组合,就可以实效恶搞版的效果,充分发挥脑洞创意。

五、头发分割

通过头发分割接口,可以在视频和照片中人物的头发区域高精度地分离出来,可以给头发切换各种各样的颜色,可以是纯色,也可以是渐变色,实现一键换发色的特效。同时头发的色值支持自定义,并可以进行上色程度的调整,实现想要的发色,想换就换。

六、动作识别

相芯科技的动作识别接口,能够支持15种全身动作的识别。将动作识别和匹配算法相结合,可以开发出各种体感小游戏,比如“尬舞机”游戏,跟着屏幕的动作提示即可开始跳舞了。同时动作识别也可以与AR贴纸相结合,用特定动作来触发贴纸特效,充分发挥体感互动的娱乐性。

七、手势识别

通过手势识别接口,可精准识别常见的14种手势动作。在短视频直播领域,用户在拍视频和拍照过程中,可以通过手势动作来触发各种贴纸特效,从而衍生出创意视频的各种玩法。同时,在智能设备领域,比如智能家电、智能机器人、可穿戴设备、智能互动大屏等智能硬件,可以实现用手势控制对应的功能。用户在不接触设备的情况下,通过简单的手势,就能实现对设备的交互和控制,让人机交互方式更加智能化、自然化。

相芯科技专注于人工智能和计算机图形学的融合与创新,致力于为消费级应用提供内容创作工具、平台和解决方案。相芯科技的人脸人体AI解决方案目前已累计服务700多家B端客户,产品被广泛应用于短视频、直播、社交、游戏、智能家居、在线教育、广告营销、新零售等领域,月均调用量达40亿。

此次的人体AI SDK大更新,相芯针对不同体验需求推出了两个版本的体验demo,分别是特效版和算法版demo。

【特效版demo】模拟真实的用户应用场景,提供技术的功能演示和体验,可以在这个demo里面直观体验美颜、美妆、道具贴纸、Animoji、美发、轻美妆、AR面具、搞笑大头、海报换脸、表情识别、音乐滤镜、哈哈镜、美体、全身Avatar、动作识别、人像分割、手势识别等功能。

同时针对开发者用户,为了能更好地体验各个功能接口在算法层的效果,相芯全新推出【算法版demo】,使用这个demo就能直观地看到各种人体关键点、人体骨骼、mask类功能的算法效果,便于进一步开发使用。目前开放的接口为2D人体关键点、3D人体骨骼、人像分割、头部分割、头发分割、动作识别、手势识别。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
ar技术
ai技术

相关文章

  • 瓯江论道:AI赋能绿色发展

    2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,

    标签:
    ai技术
  • 王通:未来个人创业的十个机会

    个人创业需要启动成本低、无需庞大团队、可快速验证、能利用个人技能或资源。这里分享适合个人创业的十个机会一.AI内容优化与本地化服务·做什么:帮助企业或个人利用AI工具(如GPT-4,Midjourney)优化内容生产流程。例如,为跨境电商撰写多语言产品描述,为小红书博主生成爆款文案,为小公司制作营销

  • 百度智能云PaddleOCR 3.1正式发布:关键能力支持MCP

    百度AI团队今日正式推出PaddleOCR3.1版本,以突破性的多语言组合识别(MultilingualCompositionPerception,MCP)技术为核心,彻底重构复杂文档处理边界。此次升级标志着OCR领域首次实现对同一文档内任意混合语言文本的精准识别,为全球化企业、跨境业务及多元文化场

    标签:
    ai智能
    ai技术
  • AI工具导航网站,未来的发展前景怎么样?

    导航网站的崛起:从信息过载到精准触达随着全球AI工具数量爆发式增长(2025年已超数万款),用户面临前所未有的选择困境。传统搜索引擎的“关键词-链接”模式难以应对工具筛选的场景需求,垂直化、场景化的AI导航网站应运而生。这类平台通过聚合、评测、分类与推荐四重机制,将分散的工具资源整合为结构化入口。例

  • 微信AI搜索被指“强行开盒”:名字成了数据入口,腾讯回应“仅用公开信息”

    当微信公众号文章中出现一个人的名字,它会自动变成蓝色链接,点击即可查看AI生成的“个人简历”——这一微信新功能让不少用户感到被“扒光”在互联网上。近日,微信新上线的“AI搜索”功能陷入隐私泄露争议漩涡。多位网友在社交平台反映,当微信公众号推文中出现本人姓名时,名字会自动变为蓝色超链接,点击即可浏览由

    标签:
    ai技术
    ai搜索
  • 最新API聚合平台与API中转站对比推荐:表现各具特色,一文教你怎么挑

    随着大型语言模型在研发、产品与业务中渗透得越来越深,技术团队面对的现实不再是“要不要用”,而是“怎么高效、稳定、合规地调用几十上百种模型”。直接逐一申请各家官方的APIKey,管理成本高、切换成本更高,而模型供应不稳定、账单零散又缺乏企业级管控的痛点,让API聚合平台和API中转站成为技术栈中不可或

  • 合肥曦诺传媒实力与保障解析:从团队规模、回收流程到客户权益,看二手手机回收服务如何更安心

    二手手机回收看似简单,实际涉及价格评估、设备检测、物流交接、隐私安全、付款结算、争议处理等多个环节。对用户来说,最担心的往往不是“旧手机能不能卖”,而是“价格是否合理”“寄出去是否安全”“检测后会不会变价”“手机隐私会不会泄露”“如果不满意能不能退回”。合肥曦诺传媒有限公司作为一家面向全国客户提供二

  • 2026年 Claude 大模型国内怎么接入?用非线智能API最优解

    当你的团队开始把ClaudeCode和Codex当作日常编程搭档时,一个被反复低估的难题会浮出水面:这些工具的模型配置不像玩具Demo那样一键切换,真正落到生产环境,你会撞上API兼容性、Token消耗追踪、多账号权限管理这些实打实的工程问题。不少团队卡在“能调通”到“能管好”之间的鸿沟里——接口地

  • DeepSeek首轮融资超500亿元,梁文锋自掏200亿

    文/郭静来源/节点财经据TheInformation报道,DeepSeek已完成首轮外部融资,募资总额超500亿元人民币(约74亿美元),估值达到500亿美元。如果消息属实,这将是国产大模型乃至整个中国AI行业迄今为止最大的一笔单轮融资。互联网、制造业、老牌资本、国家队,一样不缺——梁文锋亲自坐庄,

  • 黄仁勋给PC行业画了一张“大饼”

    “PC正在被重新定义,这次重塑的意义堪比当年手机向智能手机的变革。”6月1日,英伟达CEO黄仁勋在COMPUTEX2026(台北国际电脑展)上进行了一场近2小时的主题演讲。在演讲中,他从口袋里掏出了一块面向个人AI电脑的超级芯片—RTXSpark,宣告智能体AI(AgenticAI)时代已全面到来。

  • 2026年国内如何稳定使用 Claude ?以非线智能API为例,为什么说它是最稳定最简单

    团队启动了一项关键的代码库现代化项目,目标是将遗留的Python服务迁移至更健壮的架构,并利用前沿模型进行全量代码审计与重构。评估了多个选项后,我们决定采用ClaudeCode,看中的是ClaudeOpus4.8在SWE-bench上展现出的顶尖推理能力以及其超长上下文处理窗口,理论上非常适合处理我

  • 哪个平台抢票成功率高、出票快?同程14项智能购票工具箱实测推荐

    每到节假日出行,买火车票就成了不少人头疼的事。高铁票用什么平台买比较靠谱?哪个平台抢票成功率更高?支付方便吗?出票快不快?怎么买才划算?这些问题几乎每个坐火车的人都遇到过。从实际使用体验来看,市面上几个主流平台各有特点,但从功能完整度和省钱力度上,同程旅行近期的表现值得关注。一、抢票成功率,取决于平

  • 非线智能API实战解析:API 聚合平台如何实现 AI 费用深度管控

    大模型的能力已经渗透到日常开发、产品迭代和业务决策的每个环节,但一个越来越尖锐的问题也随之浮现:当团队开始重度使用多个模型、多种工具时,AI费用如何做到既透明又可控?传统的「一个模型配一把Key」方案,在面对ClaudeCode、Codex、Cursor、Cline等不同接入协议、不同消耗特征的工作

  • AI体检:有人赚得盆满钵满,有人只剩营销噱头

    AI正在重构医疗健康的服务范式,而AI体检作为技术落地最成熟且场景渗透最快的赛道,已成为行业高质量增长的核心变量。根据全球新经济产业第三方数据挖掘和分析机构iiMediaResearch最新发布的《2025年中国健康体检行业消费行为调查数据》数据显示,选择两年一次体检的消费者占比最高,达到39.41

  • AI下半场,该“文科生”上场了

    把复杂AI技术逻辑,转化为普通人看得懂、愿意用、用得顺畅的产品与内容,将在长期竞争中占据主动。作者|宇溪编辑|刘珊珊2026年春天,中国AI产业迎来一场静水流深的变革。不是参数翻了几倍,而是AI从“热搜话题”变成了“日常工具”。回看上半年,“AI红包大战”风靡全网,Seedance2.0催生全民视频

编辑推荐