1、 行业报告 | 行业深度研究 请务必阅读正文之后的信息披露和免责申明 1 互联网传媒 证券研究报告 2022年 01月 20日 投资评级 行业评级 强于大市(维持评级) 上次评级 强于大市 作者 文浩 分析师 SAC执业证书编号:S1110516050002 资料来源:聚源数据 相关报告 1 互联网传媒-行业点评:快手与美团互联互通,生态开放协同互利 2021-12-28 2 互联网传媒-行业点评:传奇IP之争落下帷幕,着力打造传奇元宇宙社区 2021-12-28 3 互联网传媒-行业投资策略:行业2022年度策略:否极泰来,悲观中期待边际改善 2021-12-04 行业走势图 虚拟数字人:元
2、宇宙的主角破圈而来 虚拟数字人形态多变分类多元,五大模块组成通用框架。虚拟数字人指存在于非物理世界中,由计算机手段创造及使用,并具有多重人类特征(外貌特征、人类表演能力、交互能力等)的综合产物。虚拟数字人可按人格象征和图形维度划分,亦可根据人物图形维度划分。人物形象、语音生成模块、动画生成模块、音视频合成显示模块、交互模块构成虚拟数字人通用系统框架。 虚拟数字人市场逐步进入成熟期,商业化进程加速。1982 年世界第一位虚拟歌姬林明美诞生,虚拟数字人行业经历了萌芽、探索、初级和成长四个阶段。随技术逐年突破,制作过程亦得到有效简化,从最早的手工绘制到现在的 CG、人工智能合成。在虚拟数字人产业链中
3、,基础层提供软硬件的支撑;平台层为制作及开发提供技术;应用层为应用领域提供解决方案,赋能各领域发展。虚拟数字人产业进入门槛高,差异化显著,受众群体不断拓展,因而虚拟数字人价值凸显,应用领域不断拓展,未来有望加速商业化进程。 建模、驱动、渲染三大核心技术为底层架构,多项技术已具有实际应用沉淀。人物建模的主流技术仍为静态扫描,相比静态重建技术,具有高视觉保真度的动态光场三维重建技术成为未来重点发展方向。驱动技术方面,嘴型动作的智能合成已经成功应用于 2D 和 3D虚拟数字人。动作捕捉方案是目前3D数字人动作生成的核心技术,最高可实现毫米级误差。人物渲染方面,PBR 渲染技术的进步以及重光照等新型渲
4、染技术的出现使虚拟数字人皮肤纹理变得真实,突破恐怖谷效应。 虚拟数字人应用场景丰富,主力文娱及服务行业。随人工智能应用和发展,虚拟数字人从早期的泛娱乐拓展到金融、文旅、医疗、零售等领域,朝着智能化、便携化、精细化、多样化发展。并实现真实人类虚拟化身的身份职能,逐渐于 AI 虚拟数字人领域实现商业变现。推荐关注游戏、社交、营销、虚拟偶像等协同效应强板块:1)RPG游戏为游戏市场重点,其对于开放世界设定及对玩家角色的设定要求甚高,龙头厂商多把握成熟虚拟捏人技术;引擎厂商为虚拟数字人市场“卖水人”,提供高精度虚拟人制作平台。2)次时代社交专注沉浸感打造,用户虚拟化身需求提升。3)虚拟数字人KOL已广
5、泛出现在头部平台,其带货效益(市场,形象,口碑)有所彰显。4)2020年中国虚拟偶像核心产业规模为 34.6 亿元,yoy+70.3%,预计 21 年达 62.2亿元,随虚拟数字人普及度及接受度提升,虚拟偶像市场将进一步扩张。 海内外厂商多角度布局虚拟数字人赛道。国内厂商注重产业链下游的应用及开发,海外厂商聚焦基础层的建设以及 AI 技术的开发。国内:腾讯、阿里巴巴、网易等综合型厂商支持旗下相关事业部向该赛道发力。娱乐内容关注哔哩哔哩(VUP)以及芒果超媒(虚拟主持人);营销运营关注蓝色光标、乐华娱乐、三人行、浙文互联、平治信息、新华网、捷成股份、引力传媒、华扬联众等;基础层建设关注科大讯飞、
6、追一科技、捷成股份、新华网、三人行等。海外:AI技术关注Soul-Machine、Oben以及Loom.ai;动态捕捉关注 VICON、Opti Track、Xsens 等;渲染建模关注 Epic Games、Unity以及NVIDIA等。因虚拟数字人产业关注度的上升,海内外相关产业的厂商短期内获得多轮融资,大力推动行业高速发展。 投资建议:随元宇宙热潮,虚拟数字人作为先发场景产业备受关注。“五横两纵”形成虚拟数字人基础技术架构,其中建模动态光场技术、光学式和惯性式动捕方案、PBR和重光照渲染为核心技术,Unreal和Unity为主打渲染引擎。应用场景方面,考虑对数字化身的需求提升以及大众对于
7、虚拟数字人接受度改善,游戏、社交、营销、虚拟偶像为重点关注行业。海外关注产业链上游技术厂商,国内推荐关注在产业链中游运营厂商以及下游应用厂商。 风险提示:虚拟数字人技术创新及发展不及预期;用户接受度低于预期;行业政策监管风险;版权管理及保护风险;用户隐私风险 -17%-11%-5%1%7%13%19%2015-10 2016-02 2016-06 2016-10电子制造 沪深300 行业报告 | 行业深度研究 请务必阅读正文之后的信息披露和免责申明 2 内容目录 1. 名词概览:计算机技术打造虚拟数字人 . 5 1.1. 定义:数字人、虚拟人、虚拟数字人被赋予特定人物身份 . 5 1.2. 划
8、分:人格象征和图形维度是虚拟数字人常见的分类依据 . 6 1.3. 框架:五大模块构成虚拟数字人通用系统框架 . 7 2. 行业情况分析:虚拟数字人市场广阔,应用领域不断拓展 . 9 2.1. 行业沿革:虚拟数字人已处高速成长阶段 . 9 2.2. 产业链:随理论技术日益成熟,商业模式持续演进丰富产业链 . 9 2.2.1. 基础层:厂商深耕软硬件行业,具有深厚技术壁垒 . 10 2.2.2. 平台层:提供多元技术支持,赋予虚拟数字人真实及灵动感 . 10 2.2.3. 应用层:带领虚拟数字人切入商业化赛道 . 11 2.3. 政策:近期多项政策推动虚拟数字人新兴科技产业发展 . 11 2.4
9、. 行业趋势:优质技术仍待普及,受众群体仍待拓展 . 12 3. 技术架构:建模、驱动、渲染三大关键技术构成底层架构 . 13 3.1. 建模:主流技术仍为静态扫描,动态光场成为未来重点发展方向 . 14 3.2. 驱动:智能合成,动作捕捉迁移成为主流动作生产方式 . 15 3.2.1. 智能合成:2D、3D 数字人均已实现嘴型动作的智能合成,其他部位仅支持录播 . 15 3.2.2. 动作捕捉:动作捕捉方案最高可实现毫米级误差 . 16 3.3. 渲染:主打Unreal和Unity渲染引擎,真实性和实时性均大幅提升 . 18 4. 应用场景:虚拟数字人落地场景丰富,偶像营销或为先发赛道. 2
10、0 4.1. 游戏:玩家数字化身需求日益提升,头部游戏厂商具有数字人技术积累 . 20 4.2. 偶像造星:虚拟偶像逐步渗透主流文化,国内大厂纷纷入局虚拟艺人 . 24 4.3. 品牌营销:虚拟代言大幅提升用户吸引效率,外部运营快速引导商业流量变现 27 4.4. 社交:数字人为次世代社交的必要环节,增强用户沉浸及交互体验 . 28 4.5. 影视:动作捕捉技术推动影视虚拟形象创作,打开艺术创作想象空间 . 29 5. 大厂布局:海内外厂商多角度布局虚拟数字人赛道 . 31 5.1. 国内厂商:国内厂商在产业链基础层、平台层和应用层均衡发力 . 31 5.2. 海外厂商:海外厂商聚焦基础层的建
11、设以及AI技术的开发 . 37 6. 可比公司估值 . 40 7. 风险提示 . 41 图表目录 图1:数字人、虚拟人和虚拟数字人的关系图 . 5 图2:虚拟数字人常见分类 . 6 图3:虚拟数字人通用系统框架 . 7 图4:非交互类虚拟数字人系统运作流程 . 8 图5:智能驱动型虚拟数字人运作流程图 . 9 图6:真人驱动型虚拟数字人运作流程 . 9 行业报告 | 行业深度研究 请务必阅读正文之后的信息披露和免责申明 3 图7:虚拟数字人发展沿革 . 9 图8:虚拟数字人产业链视图 . 10 图9:虚拟数字人产业链基础层概览 . 10 图10:全球人工智能技术发展阶段 . 11 图11:虚拟
12、数字人产业发展趋势 . 12 图12:发展趋势 . 13 图13:Human 3D+系统,核心的图像采集使用了佳能的相机设备以及软件开发包 . 14 图14:在猩球崛起中,演员身着动作捕捉服装 . 16 图15:6个惯性传感器的位置(左、右前臂、左、右小腿、头部和骨盆) . 17 图16:游戏黑神话:悟空的演员穿着带有跟踪球的动捕服 . 17 图17:当虚拟数字人的仿真程度达到临界点时,好感度将会跌入谷底 . 18 图18:使用 NVIDIA RTX 和 NVIDIA Quadro GPU处理复杂的渲染工作 . 20 图19:中国游戏整体市场规模(亿元) . 20 图20:中国整体游戏用户规模
13、(亿人) . 20 图21:2021收入排名前100移动游戏产品类型收入分布 . 20 图22:2021收入排名前100移动游戏产品类型占比 . 20 图23:角色是原神(米哈游研发)等开放世界游戏最重要的组成成分之一 . 21 图24:开放世界游戏幻塔(完美世界研发)多角色拟态供玩家选择 . 21 图25:天涯明月刀捏脸通过鼠标拉动面部即可调整,操作简便 . 22 图26:多角度多维度调整骨骼及面部 . 22 图27:网易伏羲智能捏脸项目-现广泛用于网易游戏中 . 23 图28:韩国创作者金贤日基于Unity开发的数字人类 SUA . 23 图29:SUA可以通过实时面部捕捉来展现各种表情
14、. 23 图30:MetaHuman Creator操作界面 . 24 图31:MetaHuman Creator 提供多种捏脸素材 . 24 图32:2017-2023年中国虚拟偶像核心市场和带动市场规模及预测 . 24 图33:2021年中国网民追星情况调查 . 25 图34:中国追星网民支持和关注虚拟偶像的比例 . 25 图35:2021年中国网民追星情况调查 . 25 图36: 2021中国网民为虚拟偶像花费金额与现实偶像对比调查 . 25 图37:2020年1月-2020年11月B站VUP直播收入和付费人数 . 26 图38:VUP已成为B站的重要UP主类型 . 26 图39:洛天依
15、X时尚BAZZAR . 26 图40:A-soul虚拟女团 . 26 图41:虚拟代言人市场分析 . 27 图42:花西子虚拟品牌代言人 . 27 图43:屈臣氏虚拟品牌代言人屈臣曦 . 27 图44:虚拟美妆达人-柳夜熙 . 28 图45:数字人社交代表产品 . 29 图46:电影史上虚拟数字人动捕技术发展沿革 . 29 图47:阿丽塔:战斗天使动作捕捉画面与最终画面对比 . 30 行业报告 | 行业深度研究 请务必阅读正文之后的信息披露和免责申明 4 图48:双子杀手通过动捕模具校准威尔史密斯脸上跟踪点 . 31 图49:双子杀手电影呈现效果-年轻版数字人威尔史密斯 . 31 图50:阿凡
16、达Weta Digital 多人动捕技术 . 31 图51:国内厂商-全链条 . 32 图52:国内厂商-娱乐内容 . 33 图53:国内厂商-广告营销 . 34 图54:国内厂商-虚拟数字人运营 . 35 图55:国内厂商-虚拟数字人技术服务 . 36 图56:国内厂商-人工智能 . 36 图57:国内厂商-动作捕捉 . 37 图58:国内厂商-建模渲染 . 37 图59:海外厂商-人工智能 . 38 图60:海外厂商-人工智能 . 38 图61:海外厂商-渲染建模 . 39 图62:海外厂商-动作捕捉 . 39 图63:海外厂商-综合技术 . 40 图64:海外厂商-VRAR . 40 表
17、1:数字人、虚拟人和虚拟数字人对比 . 5 表2:虚拟数字人特征表 . 6 表3:虚拟IP和虚拟世界第二分身对比. 6 表4:二次元、3D卡通、3D超写实、真人形象对比 . 7 表5:虚拟数字人应用领域、场景及充当角色 . 11 表6:国家相关支持政策 . 12 表7:五横两纵 . 14 表8:结构光扫描重建与相机阵列扫描重建分类 . 14 表9:人体动态三维重建与光场成像的区别 . 15 表10:2D与3D视频合成逻辑区别 . 15 表11:主流动作捕捉方案 . 16 表12:主流动作捕捉方案性能对比 . 18 表13:离线渲染与实时渲染对比 . 19 表14:互联网公司虚拟艺人行业布局 .
18、 26 表15:国内虚拟数字人可比公司估值 . 41 表16:海外虚拟数字人可比公司估值 . 41 行业报告 | 行业深度研究 请务必阅读正文之后的信息披露和免责申明 5 1. 名词概览:计算机技术打造虚拟数字人 1.1. 定义:数字人、虚拟人、虚拟数字人被赋予特定人物身份 虚拟人、数字人、虚拟数字人的目标是通过计算机图形学技术(Computer Graphic,CG)创造出与人类形象接近的数字化形象,并赋予其特定的人物身份设定,在视觉上拉近和人的心理距离,为人类带来更加真实的情感互动。按照各定义特征的要求,数字人的范畴包含虚拟人,虚拟人的范畴包含虚拟数字人。 图 1:数字人、虚拟人和虚拟数字
19、人的关系图 资料来源:CG世界、天风证券研究所 对于不要求必须具备交流互动能力时,数字人、虚拟人、虚拟数字人这三者概念可以认为是等同的。但在严格意义下它们又有细微的差别。虚拟人的身份是虚构的,现实世界中不存在的。数字人强调角色存在于数字世界。虚拟数字人强调虚拟身份和数字化制作特性。 表 1:数字人、虚拟人和虚拟数字人对比 描述 人物形象 数字人 “数字人”一词来自于英文 Digital Human,强调了它存在于数字世界。数字人的身份设定可以是按照现实世界中的人物进行设定,外观也可以完全一致,按照真人还原制作的数字人也可以称为数字孪生 Doug Roble的照片和其数字孪生渲染图 明星龚俊数字
20、人 虚拟人 网络上流行的虚拟网红、虚拟主播,称之为虚拟人(Virtual Human),之所以称之为虚拟,第一点人物的身份是虚构的,现实世界中不存在的 19岁洛杉矶虚拟网红Lil Miquela 虚拟国风偶像翎Ling 虚拟数字人 虚拟数字人指存在于非物理世界中,由计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创造及使用,并具有多重人类特征(外貌特征、人类表演能力、人类交互能力等)的综合产物 香港雀巢咖啡推出的虚拟代言人Zoe 火爆传播的超写实数字人AYAYI 资料来源:量子位、CG 世界、OVERDOPE、天风证券研究所 行业报告 | 行业深度研究 请务必阅读正文之后的信息
21、披露和免责申明 6 虚拟数字人宜具有形象能力、表达能力和感知互动能力三大特征。 表 2:虚拟数字人特征表 特征 描述 形象能力 拥有人的外观,具有特定的相貌、性别和性格等人物特征 表达能力 拥有人的行为,具有用语言、面部表情和肢体动作表达的能力 感知互动能力 拥有人的思想,具有识别外界环境、并能与人交流互动的能力 资料来源:智东西、天风证券研究所 1.2. 划分:人格象征和图形维度是虚拟数字人常见的分类依据 图 2:虚拟数字人常见分类 资料来源:2021年虚拟数字人深度产业报告、量子位、天风证券研究所 根据人格象征,虚拟数字人可分为虚拟IP和虚拟世界第二分身 表 3:虚拟IP和虚拟世界第二分身
22、对比 虚拟 IP 虚拟世界第二分身 描述 虚拟IP指其在现实世界中并不存在对应的真人,其外貌特征、基本人设、各类偏好、背景信息等均由人为设定 虚拟世界第二分身主要面向的是未来的虚拟世界,把为每个人创造自己的虚拟化分身为最终目的,满足个人在虚拟 核心价值 满足IP运营的视频化、碎片化、实时化需求;创造更为稳定、易得、低成本的IP一创造全新虚拟数字人IP;或将漫画、小说等护立体化运营。 满足个人对虚拟身份的需求一为社交、娱乐、Metaverse设计脱离于现实世界的第二分身 行业报告 | 行业深度研究 请务必阅读正文之后的信息披露和免责申明 7 未来推动力 新世代对虚拟化内容的向往;使用真人IP的风
23、险增加;品牌方对定制化代言人的需求 新世代对虚拟化内容的向往:Metaverse 带动的虚拟数字人基础设施普及率 主要赛道 文娱领域 互联网社交、游戏、虚拟内容 资料来源:量子位、天风证券研究所 根据人物图形维度,虚拟数字人可分为 2D 和 3D 两大类,从外形上可分为卡通、写实等风格,综合来看可分为二次元、3D卡通、3D超写实、真人形象四种类型。 表4:二次元、3D卡通、3D 超写实、真人形象对比 特点 人物形象 二次元 在平面空间呈现,只能以单个视角去浏览,在制作过程中已经确定了视角,用户不可自行更换视角 初音未来(日本区VOCALOID 虚拟歌姬) 洛天依(中国区VOCALOID虚拟歌姬
24、) 3D卡通 三维立体模型,可呈现在立体空间,能够以任意视角去浏览。产品制造团可设定用户可见的视角 虚拟助手度晓晓IP形象 度晓晓APP 3D超写实 与真实的人类极为接近,或者在真人基础上有一定程度的卡通化 虚拟偶像 - AYAYI 浦发银行数字员工 - 小浦 真人形象 真人形象虚拟数字人的特征来源于真人,目前主要应用于AI合成主播 AI合成主播 新小浩 AI合成主播新小萌 资料来源:中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员会、CG世界、维科网、IXDC、CBNData、荔枝网、SUNNEWS、萌娘百科、天风证券研究所 1.3. 框架:五大模块构成虚拟数字人通用
25、系统框架 人物形象根据人物图形资源的维度,可分为 2D 和 3D 两大类;语音和动画生成模块可分别基于文本生成对应的人物语音以及人物动画;音视频合成显示模块将语音和动画合成视频;交互模块根据语音语义识别用户的意图,并决定数字人后续的语音和动作。 图 3:虚拟数字人通用系统框架 行业报告 | 行业深度研究 请务必阅读正文之后的信息披露和免责申明 8 资料来源:中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员会、天风证券研究 交互模块为扩展项,根据其有无,可将数字人分为交互型数字人和非交互型数字人。 非交互型虚拟数字人系统依据目标文本生成对应的人物语音及动画,并合成音视频呈
26、现给用户。 图 4:非交互类虚拟数字人系统运作流程 资料来源:中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员会、天风证券研究所 交互型数字人根据驱动方式的不同可分为智能驱动型和真人驱动型。 1)智能驱动型数字人可通过智能系统自动读取并解析识别外界输入信息,根据解析结果决策数字人后续的输出文本,然后驱动人物模型生成相应的语音与动作来使数字人跟用户互动。该人物模型是预先通过 AI 技术训练得到的,可通过文本驱动生成语音和对应动画,业内将此模型称为TTSA(Text To Speech & Animation)人物模型。 2)真人驱动型数字人则是通过真人来驱动数字人,主要原
27、理是真人根据视频监控系统传来的用户视频,与用户实时语音,同时通过动作捕捉采集系统将真人的表情、动作呈现在虚拟数字人形象上,从而与用户进行交互。 行业报告 | 行业深度研究 请务必阅读正文之后的信息披露和免责申明 9 图 5:智能驱动型虚拟数字人运作流程图 图 6:真人驱动型虚拟数字人运作流程 资料来源:中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员会、天风证券研究所 资料来源:中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员会、天风证券研究所 2. 行业情况分析:虚拟数字人市场广阔,应用领域不断拓展 2.1. 行业沿革:虚拟数字人已处高速成长阶
28、段 虚拟数字人从最早的手工绘制到现在的 CG(Computer Graphics,电脑绘图)、人工智能合成,虚拟数字人大致经历了萌芽、探索、初级和成长四个阶段 图 7:虚拟数字人发展沿革 资料来源:中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员会、天风证券研究所 2.2. 产业链:随理论技术日益成熟,商业模式持续演进丰富产业链 当前虚拟数字人理论和技术日益成熟,应用范围不断扩大,产业正在逐步形成、不断丰富,相应的商业模式也在持续演进和多元化。 行业报告 | 行业深度研究 请务必阅读正文之后的信息披露和免责申明 10 图 8:虚拟数字人产业链视图 资料来源:中国人工智能
29、产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员会、天风证券研究所 2.2.1. 基础层:厂商深耕软硬件行业,具有深厚技术壁垒 基础层为虚拟数字人提供基础软硬件支撑,硬件包括显示设备、光学器件、传感器、芯片等,基础软件包括建模软件、渲染引擎。显示设备是数字人的载体,既包括手机、电视、投影、LED 显示等 2D 显示设备,也包括裸眼立体、AR、VR 等 3D 显示设备。光学器件用于视觉传感器、用户显示器的制作。传感器用于数字人原始数据及用户数据的采集。芯片用于传感器数据预处理和数字人模型渲染、AI 计算。建模软件能够对虚拟数字人的人体、衣物进行三维建模。渲染引擎能够对灯光、毛发、衣物
30、等进行渲染,主流引擎包括 Unity Technologies 公司的 Unity 3D、Epic Games 公司的 Unreal Engine 等。总体来看,处于基础层的厂商已经深耕行业多年,已经形成了较为深厚的技术壁垒。 图 9:虚拟数字人产业链基础层概览 资料来源:头豹研究院、天风证券研究所 2.2.2. 平台层:提供多元技术支持,赋予虚拟数字人真实及灵动感 平台层包括软硬件系统、生产技术服务平台、AI 能力平台,为虚拟数字人的制作及开发提供技术能力。建模系统和动作捕捉系统通过产业链上游的传感器、光学器件等硬件获取真人/实物的各类信息,利用软件算法实现对人物的建模、动作的重现;渲染平台
31、用于模型 行业报告 | 行业深度研究 请务必阅读正文之后的信息披露和免责申明 11 的云端渲染。解决方案平台基于自身技术能力为广大客户提供数字人解决方案。AI 能力平台提供计算机视觉、智能语音、自然语言处理技术能力。平台层汇聚的企业较多,腾讯、百度、搜狗、魔珐科技、相芯科技均有提供相应数字人技术服务平台。 图 10:全球人工智能技术发展阶段 资料来源:头豹研究院、天风证券研究所 2.2.3. 应用层:带领虚拟数字人切入商业化赛道 应用层是指虚拟数字人技术结合实际应用场景领域,切入各类,形成行业应用解决方案,赋能行业领域。按照应用场景或行业的不同,已经出现了娱乐型数字人(如虚拟主播、虚拟偶像)、
32、教育型数字人(如虚拟教师)、助手型数字人(如虚拟客服、虚拟导游、智能助手)、影视数字人(如替身演员或虚拟演员)等。不同外形、不同功能的虚拟数字人赋能影视、传媒、游戏、金融、文旅等领域,根据需求为用户提供定制化服务。 表 5:虚拟数字人应用领域、场景及充当角色 领域 场景 角色 影视 数字替身特效可以帮助导演实现现实拍摄中无法表现的内容和效果,已成为特效商业大片拍摄中的重要技术手段和卖点。 数字替身 虚拟演员 传媒 定制化虚拟主持人/主播/偶像,支持从音频/文本内容一键生成视频,实现节目内容快速、自动化生产,打造品牌特有 IP 形象,实现观众互动,优化观看体验。 虚拟主持人 虚拟主播 虚拟偶像
33、游戏 越来越真实的数字人游戏角色使游戏者有了更强的代入感,可玩性变得更强。 数字角色 金融 通过智能理财顾问、智能客服等角色,实现以客户为中心的、智能高效的人性化服务。 智能客服 智能理财顾问 文旅 博物馆、科技馆、主题乐园、名人故居等虚拟小剧场、虚拟导游、虚拟讲解员。 虚拟导游 虚拟讲解员 教育 基于 VR/AR 的场景式教育,虚拟导师帮助构建自适应/个性化学习环境。 虚拟教师 医疗 以数字人实现家庭陪护/家庭医生/心理咨询,实时关注家庭成员身心健康,并及时提供应对建议。 心理医生 家庭医生 零售 场景切入构建线下零售服务新资料来源:天风证券研究所流程。电商直播在虚拟数字人与真人主播和观众互
34、动,介绍商品。 顾客服务数字人 商家管理数字人 虚拟主播 资料来源:中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员会、天风证券研究所 2.3. 政策:近期多项政策推动虚拟数字人新兴科技产业发展 行业报告 | 行业深度研究 请务必阅读正文之后的信息披露和免责申明 12 表 6:国家相关支持政策 政策名称 颁布日期 颁布机构 政策内容 关于加快推动区块链技术应用和产业发展的指导意见 2021年5月27日 工业和信息化部,中央网络安全和信息化委员会 以培育具有国际竞争力的产品和企业为目标,以深化实体经济和公共服务领域融合应用为路径,加强技术攻关,夯实产业基础,壮大产业主体,
35、培育良好生态,实现产业基础高级化和产业链现代化。推动区块链和互联网、大数据、人工智能等新一代信息技术融合发展,建设先进的区块链产业体系 新型数据中心发展三年行动计划(2021-2023年) 2021年7月4日 工业和信息化部 以赋能数字经济发展为目标,推动新型数据中心建设布局优化、网络质量提升、算力赋能加速、产业链稳固增强、绿色低碳发展、安全保障提高,打造新型智能算力生态体系,有效支撑各领域数字化转型,为经济社会高质量发展提供新动能 新一代人工智能发展规划 2021年7月8日 国务院 规划提出六方面重点任务。一是构建开放协同的人工智能科技创新体系。二是培育高端高效的智能经济。三是建设安全便捷的
36、智能社会。四是加强人工智能领域军民融合。五是构建泛在安全高效的智能化基础设施体系。六是前瞻布局新一代人工智能重大科技项目 新一代人工智能伦理规范 2021年9月25日 国家新一代人工智能治理专业委员会 旨在将伦理道德融入人工智能全生命周期,为从事人工智能相关活动的自然人、法人和其他相关机构等提供伦理指引 广播电视和网络视听“十四五”科技发展规划 2021年10月20日 国家广播电视总局 加快推进制播体系技术升级,强化人工智能、大数据、区块链在内容选题、素材集成、编辑 制作、内容审核、媒资管理、字幕制作等环节的应用,促进制播流程智能化。推动虚拟主播、动画手语广泛应用于新闻播报、天气预报、综艺科教
37、等节目生产,创新节目形态,提高制播效率和智能化水平 “十四五”信息通信行业发展规划 2021年11月16日 工业和信息化部 在引领消费升级,培育高品质数字生活方面,国家支持各类企业运用 5G、人工智能、虚拟现实、增强现实、3D打印等新技术构建形式多样的线上消费场景,探索人机互动新模式,大力拓展便捷化线上服务应用 资料来源:中国工信产业网、产业政策大数据平台、国家广播电视总局、天风证券研究所 2.4. 行业趋势:优质技术仍待普及,受众群体仍待拓展 虚拟数字人产业生产及运营成本高,优劣差异化显著,受众群体不断拓展,因而虚拟数字人价值凸显,应用领域不断拓展,未来有望加速商业化进程。 图 11:虚拟数
38、字人产业发展趋势 行业报告 | 行业深度研究 请务必阅读正文之后的信息披露和免责申明 13 资料来源:头豹研究所,天风证券研究所 采集制作流程简单化、一体化,迭代式提升真实感 未来虚拟数字人制作技术将更加简单,更加一体化、自动化设备同步获取模型、身体、表情等所有数据,无需穿戴专业传感设备。 交互方式衍变,智能化程度不断加深 全双工技术将推进数字人交互方式的演变,使得数字人拥有一次唤醒、多次交互能力具备实时智能响应、只能打断、智能纠错、多轮对话等功能。 实现多场景、多领域的融合、应用及落地 目前虚拟数字人发展环境整体情况还处于未成熟的起步阶段,随着虚拟数字人技术的精进和市场价值的释放,将更深入地
39、融入影视、金融、文旅等各个领域。 虚拟数字人目前仍处于孵化培育阶段,以企业服务为形式的 2B2C服务为重点。未来驱动力包括代际变化、技术门槛降低、虚拟化趋势、VR 设备回暖等原因。在各行业逐渐意识到其技术可行性和商业价值后,虚拟数字人行业将有望快速进入高速发展期。 图 12:发展趋势 资料来源:量子位,天风证券研究所 3. 技术架构:建模、驱动、渲染三大关键技术构成底层架构 行业报告 | 行业深度研究 请务必阅读正文之后的信息披露和免责申明 14 虚拟数字人基础技术架构包括“五横两纵”。“五横”是指用于数字人制作、交互的五大技术模块,即人物生成、人物表达、合成显示、识别感知、分析决策等模块。其
40、中,人物生成,即人物建模方面 2D 数字人较为简单,3D 数字人需要额外使用三维建模技术。人物表达包括语音生成和动画生成。动画生成则包含驱动和渲染两大部分。“两纵”是指 2D、3D 数字人,2D 数字人和3D数字人在技术架构方面基本一致。3D 数字人需要额外使用三维建模技术生成数字形象,信息维度增加,所需的计算量更大。 表 7:五横两纵 2D数字人 3D数字人 人物生成 无 人物建模等 人物表达 语音生成、动画生成(驱动、渲染)等 合成显示 终端显示技术 识别感知 语音语义识别、人脸识别、动作识别等 分析决策 知识库、对话管理等 资料来源:智东西、天风证券研究所 3.1. 建模:主流技术仍为静
41、态扫描,动态光场成为未来重点发展方向 建模技术分为静态扫描建模和动态光场重建,目前主流技术仍为静态扫描,相比静态重建技术,具有高视觉保真度的动态光场三维重建技术不仅可以重建人物的几何模型,还可一次性获取动态的人物模型数据,并高品质重现不同视角下观看人体的光影效果,成为数字人建模重点发展方向。 静态扫描建模技术 静态扫描建模技术可分为结构光扫描重建和相机阵列扫描重建,结构光扫描重建扫描时间长,对于人体这类运动目标在友好度和适应性方面都差强人意,更多的应用于工业生产、检测领域。相机阵列扫描重建替代结构光扫描重建克服了以上问题成为人物建模主流方式。随着拍照式相机阵列扫描重建得到飞速发展,目前可实现毫
42、秒级高速拍照扫描(高性能的相机阵列精度可达到亚毫米级),并成功应用于游戏、电影、传媒等行业。 表 8:结构光扫描重建与相机阵列扫描重建分类 扫描类型 扫描精度 扫描时间 特点 应用领域 结构光扫描重建 0.1 毫米级 1 秒以上,甚至达到分钟级 运动目标适应性差 应用于工业生产、检测等领域 相机阵列扫描重建 毫秒级, 高性能可达亚毫米级 高速拍照扫描 人物建模主流方式 应用于游戏、电影、传媒等领域 资料来源:智东西、天风证券研究所 国际上 IR、Ten24 等公司将静态重建技术完全商业化,服务于好莱坞大型影视数字人制作。凌云光近年来大力发展立体视觉并研发了高精度人体3D建模系统Human 3D
43、+,其中核心的三维几何和彩色数据采集部分均使用了以佳能专业镜头,配合佳能 SDK 软件开发包及凌云光专用 3D 建模软件能快速、清晰成像并高速储存,自动完成高精度人体全身或局部重建,再利用三维动画制作软件对重建结果进行处理,得到高真实度数字人物。 图 13:Human 3D+系统,核心的图像采集使用了佳能的相机设备以及软件开发包 行业报告 | 行业深度研究 请务必阅读正文之后的信息披露和免责申明 15 资料来源:佳能中国公众号,天风证券研究所 动态光场重建技术 动态光场重建是目前世界上最新的深度扫描技术,此技术可忽略材质,直接采集三维世界的光线,然后实时渲染出真实的动态表演者模型,为 3D 建
44、模提供更加丰富的图像信息,它主要包含人体动态三维重建和光场成像两部分: 表 9:人体动态三维重建与光场成像的区别 技术类型 研究领域 技术特点 相关应用厂商 人体动态三维重建 计算机视觉、计算机图形学等领域 采用摄像机阵列采集动态数据,可重建高低频几何、纹理、材质、三维运动信息。 Microsoft、Google、Intel、Facebook 等,其中 Microsoft 的 108 摄像机 MRstudio已经在全球各大洲均有建设 ,Google 的 Relightable 系统中包含模型重建、动作重建、光照重建的全部功能 国内清华大学、商汤科技、华为等也展开了相关研究,并取得国际水平的同步
45、进展。 光场成像 计算摄像学领域 光场可以存储空间中所有光线的方向和角度,从而产出场景中所有表面的反射和阴影,这为人体三维重建提供了更加丰富的图像信息。 资料来源:智东西、天风证券研究所 3.2. 驱动:智能合成,动作捕捉迁移成为主流动作生产方式 3.2.1. 智能合成:2D、3D 数字人均已实现嘴型动作的智能合成,其他部位仅支持录播 2D、3D 数字人嘴型动作智能合成的底层逻辑类似,均建立在输入文本到输出音频与输出视觉信息的关联映射。 表 10:2D与 3D视频合成逻辑区别 2D视频 3D视频 数学表达 像素表达 3D模型对应的BlendShape 向量表达 动作形式 动作有限,固定且重复
46、动作灵活,可任意驱动 表现形态 只呈现正面 可呈现三维立体形象 驱动方式 通过视频算法训练而成 驱动方式多样,包括视频算法训练 资料来源:头豹研究所,量子位,天风证券研究所 其中3D视频驱动方式为以下三个步骤: 1)视频算法训练:对已采集到的文本到语音和嘴型视频的数据进行模型训练,得到一个输入任意文本均可驱动嘴型的模型。 2)语音自动识别:对语音进行标注,绑定数据与动作,使得虚拟数字人对特定词语或语境做出相应动作。 3)动捕设备采集:需真人穿戴动捕设备,动捕设备与真人肢体动作相绑定,可实时传递到虚拟数字人身上。 行业报告 | 行业深度研究 请务必阅读正文之后的信息披露和免责申明 16 3.2.
47、2. 动作捕捉:动作捕捉方案最高可实现毫米级误差 通过将捕捉采集的动作迁移至数字人是目前 3D 数字人动作生成的主要方式,核心技术是动作捕捉。动作捕捉是指通过数字手段记录现实人们的运动过程。同时,动作捕捉系统根据实现原理的不同,可以分成光学动作捕捉、惯性动作捕捉、Track 设备+IK 算法的动作捕捉、以人工智能为主的动作捕捉方案。现阶段,光学式和惯性式动作捕捉占据主导地位,基于计算机视觉的动作捕捉成为聚焦热点。 表 11:主流动作捕捉方案 光学动作捕捉方案 惯性动作捕捉方案 Track设备+IK算法 以人工智能为核心 优点 动作捕捉精度高 保真程度较高 专业度高 价格较低 不依赖场地环境 市
48、场较广 保真度程度较高 简单易上手 成本较低 缺点 对拍摄环境要求高 技术复杂高 造价成本高 应用范围较小 动作捕捉精度较低 容易发生位置漂移 动作捕捉精度较低场地要求较高 技术复杂度较高 动作捕捉精度较低 自由度较低 视野固定 实用复杂难度:光学动作捕捉方案Track设备+IK算法惯性动作捕捉方案以人工智能为核心 保真程度:光学动作捕捉方案惯性动作捕捉方案Track设备+IK算法以人工智能为核心 资料来源:智东西、天风证券研究所 光学动作捕捉 光学动作捕捉是在演员身上粘贴能够反射红外光的Marker(马克点),摄像机通过反光来捕捉这些马克点的位置变化,从而完成对演员的动作捕捉。目前,光学动作
49、捕捉方案能通过高帧率的捕捉,实现毫米级误差精度,能对人物动作还原最为精细,但这类捕捉方案对于背景环境的要求较高,技术门槛也同样较高。 图 14:在猩球崛起中,演员身着动作捕捉服装 资料来源:虚拟空间艺术公共号,天风证券研究所 受到光线传播的限制,数据采集难免有丢失的情况发生,在相对较大的拍摄空间中,需要同时修正几十个摄像机的参数,稍微移动一下就需要对摄像机参数进行重新标定,想做到 行业报告 | 行业深度研究 请务必阅读正文之后的信息披露和免责申明 17 电影级别的精确捕捉,还是很耗时费力的。对于大范围的行走和奔跑等日常活动,需要精心控制的移动摄像机来记录足够的运动信息,这也很难实现的。在光学动
50、作捕捉设备和方案上,国内外都涌现出一些较为优秀的公司代表,比如英国的Vicon,美国的 OptiTrack 和魔神(MotionAnalysis),国内的 Nokov、uSens、青瞳视觉等。 惯性动作捕捉 主要是基于惯性测量单元(Inertial Measurement Unit,IMU)来完成对人体动作的捕捉,即把集成了加速度计、陀螺仪和磁力计的 IMU 绑在人体的特定骨骼节点上,通过算法对测量数值进行计算,从而完成动作捕捉。这种惯性动作捕捉方案价格相对低廉且精度较低,会随着使用时间的增加产生累积误差,发生位置漂移。这类捕捉方案需要大量复杂的硬件设备和严格的影棚环境,技术门槛也同样较高,并