1. 创业头条
  2. 前沿领域
  3. 人工智能
  4. 正文

远传科技“数字主持人”诞生记:不是复制,而是创造一个新模态

 2021-05-31 14:27  来源:互联网  我来投稿 撤稿纠错

  阿里云优惠券 先领券再下单

远传科技从未停止“造人”的脚步。

除了有“AI虚拟主播”之外,现在连“数字主持人”也来了,“数字主持人”到底是什么呢?

远传科技的“数字主持人”是通过语音合成、唇形合成、表情合成以及深度学习等技术,克隆出具备和真人主播一样播报能力的数字人。通过语音合成技术和视频驱动技术,只需要输入一段文本,它就能在屏幕展现虚拟数字人形象并进行新闻播报,且唇形动作能与播报声音实时同步。

或许在不久的未来,你再也分不清视频中的主持人,究竟是真人还是虚拟人,而这一天正在到来。

一、根源探究:「高逼真」的背后

远传科技“数字主持人”以真人为原型,通过将真人形象数字化扫描技术,建立超写实 3D 数字人建模,多模态识别及生成、实时面部动作生成及驱动、迁移学习等技术「熔炉」,炼就而成。

从效果上来说,3D AI 合成主播给人的最大印象便是高逼真,它较好的还原了真人的发肤、表情;同时,灵活性、可塑性更强,拥有的丰富的面部表情动作,嘴部唇动,以及身体的轻微摆动,具备在更广阔空间使用的潜力。

透过 3D AI 合成主播技术实现过程,我们探究它为何拥有如此逼真的效果。

1.数字化扫描技术还原真人形象

建立人物模型必须要有海量数据,远传科技数字化扫描技术通过摄像头对真人原型的身体各个部位进行全方位「打点」扫描,采集每一处细节,并对其多种形态的面部表情动作,嘴部唇动,以及身体的轻微摆动进行细致入微地捕捉记录,还原真人形象。

2.深度学习算法生成3D数字人模型

远传科技算法工程师熟练应用深度学习算法,对算法里的大量参数进行调优,确保生成的3D数字人模型能够精确的还原真人在正常说话时候的唇部动作,脸部表情及微动作,对3D数字人模型进行实时驱动、渲染,使其面部肌肉驱动、表情肢体和语言表达能力达到一个较高的度契合。确保非专业人士无法分辨出是真人拍摄的视频还是通过数字技术合成出来的视频。

二、核心亮点: AI 驱动、多模态交互

1.AI 驱动的 3D 数字人

远传科技“数字主持人”是一种由AI所驱动的虚拟存在,拥有和真人一致的音容、笑貌和言谈举止,拥有表达情感和智慧的能力。仔细观察你会发现, 3D AI 合成主播是基于 AI 算法实现驱动。

具体来说,3D “数字主持人”靠 AI 算法实时驱动,输入一个文本就能输出一个视频,往往生成一个 1 分钟的视频,仅只需要 1 分钟,几乎可以看作实时生成。

2.关键技术赋能多模态交互创新

唇动算法、3D建模技术、深度学习算法、5G通信等关键技术探索文本、语音和视觉多模态交互创新的无限可能。

远传科技利用唇动算法分析出数字人应显示的口型标记,突破语言交流过程的表情和唇动的无缝链接;根据给定人物形象要求,建立数字人3D模型,绑定骨骼,创立动作动画和口型动画;基于深度学习算法、肢体捕捉技术,将文本、音频和图片实时生成数字人视频;5G通信技术则让用户跟数字人进行语音视频互动成为可能,麦克风和摄像头捕捉用户的语音和动作,数字人的后端人工智能算法根据场景生成对应的数字人交互动作、表情和语音。

三、未来已来,你准备好了吗?

远传科技“数字主持人”虽然基于真实的人进行建模,但呈现在人们面前的行为都是完全逼真的,能像真实主播一样,去笑,去哭,去表达,是被创造出来的一个“数字人”。

数字人的未来将会作为主体人的一个副本形式存在于数字世界中,在未来的数字世界中我们将无法分辨出真人和数字人,大量在数字世界的服务将都会由数字人来代替,在电话客户服务、线上产品讲解、电商直播甚至线上演唱会等众多场景都将会有数字人的角色参与,数字化终极未来也许就是数字人的世界。

你准备好接受一个数字世界了吗?

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关文章

  • 全球AI巨头正在赌:谁搞定MCP,谁就是未来老大

    我不是危言耸听,现在全球的AI巨头都在做MCP,毫不夸张的说:谁能把MCP做起来,谁就拥有AI生态控制权,谁就是AI圈的老大。你们有没有发现,MCP在2025年初开始特别火爆,互联网技术大厂都在强推MCP。(1)阿里云百炼搞了个MCP平台,提供50+预置MCP服务。不过大都只面向阿里系产品。(2)腾

    标签:
    ai智能
  • 对话李军:人工智能是“第五范式革命”

    2025国际人工智能程序设计精英挑战赛(IAEPC)在香港中文大学成功举办。作为主办方之一,欧美同学基金会理事长李军接受了大赛主持人艾诚采访。在采访中,李军认为IAEPC不仅是一场“冠军中的冠军”对决,更是一次全球AI人才的线下交流盛会。大赛“史无前例”的吸引了全球青年科技精英汇聚香港,更加推动和普

  • 对话施韩原与杜瑜皓:与参赛选手一起改变世界

    2025国际人工智能程序设计精英挑战赛(IAEPC)在香港中文大学成功举办。作为大赛发起人方之一及裁判委员会负责人,施韩原与杜瑜皓接受了大赛主持人艾诚采访。裁判委员会主席施韩原分享了此次大赛的亮点,IAEPC首次引入创新赛道,探索选手如何与AI合作进行答题。裁判委员会副主席杜瑜皓认为,选手最终目标并

  • 吴林林专访IAEPC冠军:与全球参赛者交流是最重要的一课

    2025国际人工智能程序设计精英挑战赛(IAEPC)在香港中文大学成功举办。来自深圳的学生吴林林作为主办方记者团成员,采访了大赛冠军选手之一。在吴林林的采访中,选手认为与来自全球的参赛者交流是自己学到的最重要的一课。在科技与AI之前,选手们可以平等、开放、友好的交流。以下是采访实录(有删节):吴林林

  • 吴林林专访黄锦辉:年轻人要像懂中文一样懂A

    2025国际人工智能程序设计精英挑战赛(IAEPC)在香港中文大学成功举办。来自深圳的学生吴林林作为主办方记者团成员,采访了大会嘉宾:全国政协委员、香港特别行政区立法会议员、香港中文大学工程学院副院长、IAEPC联合发起人黄锦辉先生。在吴林林的采访中,黄锦辉教授勉励年轻人要像懂中文和英语一样懂AI,

  • 本以为DeepSeek天下无敌了,没想到Manus更猛

    昨天新出了一个AI,据说比DeepSeek还牛,而截止到今早,已经有10万人在排队申请Manus邀请码了,而且它邀请码已经炒到10万了。这是北京的一家人工智能公司蝴蝶科技,创始人是一名来自华中科技大学的90后毕业生肖弘,突然向全球宣布:世界上第一款真正的人工智能、通用智能体产品出现了,名叫Manus

    标签:
    ai智能