中信建投证券:看虚拟人浪潮背后的投资逻辑及机遇

2021-12-31 08:22:37

  虚拟人,是运用先进技术构建真人的“数字孪生”,放在元宇宙中看,是元宇宙的用户交互界面。整个行业从20世纪初开始起步,随着CG、动作捕捉、AI等技术革新,行业经历探索期,初期,到2020年进入成长期,乘着元宇宙爆发的红利,虚拟人的形态和应用场景不断丰富,变现路径和市场潜力明确,商业化模式虽未完全成熟,但也在向多元化方向持续演进。玩家方面,国内外大厂以及垂直领域公司纷纷入局,行业有望迎来加速成长。

  海外虚拟人布局:各国发展趋势差异明显,方向各有侧重

  美国在技术和平台层的优势最为雄厚,以英伟达、Epic Games为代表的各大科技、游戏巨头布局虚拟人市场,推出虚拟人制作平台。在应用层面,美国公司更偏向泛娱乐方向,着重虚拟IP的打造。欧洲各国更关注关怀陪伴等“精神”层面追求,叠加较成熟的“拟人化”技术,在特定场景提供情感向的服务方面更为突出,落地场景包含医疗顾问、日常陪伴等。相较欧美而言,受亚洲思想文化等因素影响,日韩虚拟偶像的发展势头尤为迅猛,虚拟人主要在文娱方面落地。日本二次元文化根植,在虚拟人的接受度和发展速度上拥有其他国家难以企及的优势,是最早形成虚拟人商业化的市场,风格上二次元+超写实风格共同发展。韩国形成全链路的发展模式,技术端,以三星为代表的技术大厂在相关领域布局多年,是元宇宙的主导力量之一,应用端,韩国落地场景丰富,涵盖服务层和娱乐全方面的虚拟人应用。

  国内外发展对比:海外底层技术及平台领跑,国内应用场景丰富

  从产业链看,海外与国内在上游技术水平、产品模式、以及下游落地场景均有一定差异。在底层技术层面,国外起步较早,综合实力相对领先,能够更好的切入相对需要更高交互能力的服务型场景。而在国内,移动互联网发展迅速,元素多元,相对在应用端创新能力较强,在触达用户的广度上更具优势,直播场景是我国特有的虚拟人落地场景。

  风险提示:虚拟人技术发展不及预期;政策监管不明晰;法律问题;伦理和道德问题

  元宇宙概念的大火带动了很多人对未来的无限遐想,与元宇宙紧密相关的虚拟数字人的热度也在提升。但其实,虚拟人并非是元宇宙赛道独有,但一定程度上,元宇宙带动了虚拟人的热潮,从两者的关系上来说,在元宇宙中,虚拟人是元宇宙的用户交互界面,与虚拟人互动成为与虚拟世界交互的手段。因此,未来虚拟人将可能是元宇宙中角色实现方式。

  元宇宙每往前走一步,都会带动数字产业的一次爆发。元宇宙是在移动互联网和互联网的基础上做虚实世界的融合,它对未来的影响更加深远,在产业规模上,体量应该比移动互联网要高一个数量级。在未来的元宇宙中,虚拟人数量将会超过线亿,如此多的虚拟人对应的是一个巨大的市场和机遇。

  虚拟数字人,是存在于数字世界的“人”, 利用信息技术与人工智能技术将人体全身及肢体动作全方位的进行数字化、可视化“复制”,最终达到将现实生活中的人精确的在数字世界中模拟构建出来。简单来说,就是运用先进技术构建真人的“数字孪生”。与具备实体的机器人不同,虚拟数字人依赖显示设备存在,我们所知的很多虚拟人都要通过手机、电脑或者智慧大屏等设备才能显示。市面上也多将其称为为虚拟形象、虚拟人、数字人等,代表性的细分应用包括虚拟助手、虚拟客服、虚拟偶像/主播等。

  具体来说,虚拟数字人可拆分为三大核心要素:“虚拟”,“数字”和“人”,其中,人是最核心的要素,是否能高度拟人化,提供自然逼真的相处体验是虚拟人在各个场景能否落地的关键。所谓拟人化,关键有三点:其一,外表是否高度“拟人”,虚拟数字人的面部长相和整体形象。会受到虚拟数字人类别、制作细节、渲染水平、设计审美等影响;其二,行为是否“拟人”:具体行为包括面部表情、形体表达、语音表述等会受到驱动方式、驱动模型类别、训练数据、驱动模型精度等影响,呈现不同程度的逼真效果;其三,交互能力上是否“拟人”:虚拟数字人与现实世界的交互水平,就是拥有人的思想,具有识别外界环境、并能与人交流互动的能力,包括回答内容、肢体反应等,会受到语音识别能力、自然语言理解及处理水平、知识图谱、预先设置知识库等影响。

  1.1 虚拟数字人的发展历程:技术成熟驱动行业发展,场景内容不断丰富

  虚拟人这一概念并不是到今天才出现的,从20世纪80年代开始,人们就开始在现实世界尝试引入虚拟人。起初的虚拟人技术主要是以手工绘制为主,日本动画《超时空要塞》播出后,动画官方以女主角林明美的名义将剧中插曲按照偶像专辑进行发售,她被看作全球首个“虚拟歌手”。由英国人创作的虚拟人Max Headroom也拍摄了多部电影和广告片。值得注意的是,这些虚拟人都是呈散点状出现,并且一时喧嚣后没有在社会上引发更大的水花,因此这一阶段的虚拟人还处在萌芽阶段。

  21世纪初,随着CG、动作捕捉技术革新,虚拟人进入探索期,落地场景主要以影视娱乐行业为主。在影视方面,利用动作捕捉技术,经过计算机处理得到虚拟角色,用于电影制作中的数字替身。虚拟偶像方面,日本开发了第一款被广泛认可的虚拟人“初音未来”,她在商业领域的现象级成功使得虚拟偶像加速向产业化、职业化方向迈进,并开拓出了更多的细分领域。但这一阶段的虚拟人虽然达到实用水平,但造价较高,呈现形式也相对粗糙。

  在最近 5 年,得益于人工智能技术的突破,虚拟人的制作得以简化、可交互性更强,进入了发展的快车道。当前更是在建模的精细度、动作捕捉和 AI 交互不断提升,虚拟人以达到写实级逼真程度,且具备情感表达和沟通交流的能力。近年来,虚拟人已经在更多的场景落地,已成功应用至银行、医疗、教育、政务、通信各行各业,逐渐进入主流市场。IP虚拟人方面,海外各类Vtuber,国内Bilibili等平台的Vup涌入市场;非IP虚拟人方面:这一阶段,一些科技公司已经着手布局虚拟人赛道,例如:新华社与搜狗联合发布“AI合成主播”,浦发银行和百度共同发布提供及融服务的数字员工“小浦”。

  从2020年至今,踩着元宇宙概念爆发的红利,越来越多的虚拟数字人如雨后春笋般涌现出来,商业价值逐步显现。除了娱乐公司与MCN机构,各头部大厂也纷纷入局这一赛道,布局不同类型的虚拟人IP,虚拟数字人正成为“Z世代”在各大社交平台上追逐崇拜的形象。目前,虚拟数字人正朝着智能化、便捷化、精细化、多样化发展,步入成长期。

  1.2 技术架构:真人驱动与计算驱动,双技术路线共同推进

  当前虚拟数字人仍处在急速发展期,尚未形成统一的系统框架。我们引用人工智能产业发展联盟的框架,将虚拟数字人的通用系统分为5个部分:人物形象、语音生成、动画生成、音视频、合成显示、交互等。交互模块为扩展项,可智能识别用户意图,决定其后续语音和动作,驱动数字人下一轮交互。根据是否有交互模块分为非交互型虚拟数字人和交互型虚拟数字人,后者又根据驱动方式的不同分为真人驱动型和计算驱动型。非交互型虚拟人相对运作流程较简单,发展相对较早,目前布局的厂商也比较多。但未来的发展趋势整体还是着重于交互型虚拟人。

  人物形象按照维度分为2D、3D两类,2D数字人相对简单,3D数字人需要额外使用三维建模技术生成数字形象,所需的计算量更大。当前节点,还难以做到低成本的3D虚拟形象日常化应用,比如今年爆火的虚拟直播行业,目前正处于2D往3D升级的过程中,由于3D直播的成本还难以降下来,绝大部分的虚拟主播仍以2D/Live 2D露出,这客观上造成了日常直播中的演出效果、和观众的互动方式的局限性。

  真人驱动型技术成本较低,使用互动感高,多应用于泛娱乐领域,包括虚拟偶像、虚拟主播、影视等领域;智能驱动型虚拟人技术要求更高,初始投入高,在交互能力上弱于真人型,一般用在企业服务上。提升运作效率。

  真人驱动型数字人通过真人来驱动数字人,主要原理是真人根据视频监控系统传来的用户视频,与用户实时语音,同时通过动作捕捉采集系统将真人的表情、动作呈现在虚拟数字人形象上,从而与用户进行交互。这种技术思路可以看作是传统影视制作中,CG技术的进一步延续,近年来主要的技术突破在于动作捕捉环节,无需昂贵的动捕设备,简单普通摄像头结合理想的识别算法通用能实现较为精准的驱动,显著降低了精细虚拟内容生成的门槛。由于具有真人参与和操作,真人驱动型虚拟人具有更好的灵活度和互动效果。基于这样的特点,在使用场景上,一方面真人驱动型能够在运用在影视内容创作中以减少生产成本,另一方面,可以应用在虚拟偶像,直播中完成高互动性,时间上碎片化的活动内容。

  在计算驱动型中,虚拟数字人的语音表达、面部表情、具体动作将主要通过深度学习模型的运算结果实时或离线驱动,在渲染后实现最终效果。计算驱动的虚拟人最终呈现方式效果受到各感知技术,包括语音合成、NLP、语音识别等各类技术综合影响。

  为了使虚拟人更具有“拟人化”的动态,支撑人物形象的真实性和交互的体验感,在技术层面上,需要以下三大核心技术:

  CG建模/图像迁移技术:影响人物外观的呈现。具体体现为虚拟数字人外观的拟人程度。国内外在该项上的技术差异,部分导致了目前国内外玩家主要专注于不同的细分场景和发展路径。

  自然语言处理(NLP)交互技术:支撑交互体验。NLP以对话能力为核心,继文本对话助手、语音AI助手后,该技术继续在虚拟数字人中发挥核心作用,是视作为虚拟数字人的大脑。在AI交互助手方面已有理想成效

  计算机视觉(CV)等深度学习模型:模型效果受到数据量、计算框架、关键特征点等因素深刻影响。语音驱动的深度学习模型效果很大程度决定了能否呈现自然的面部表情变动、肢体变动等,除此之外,能否对情感等因素进行特别设计,同样会产生重要影响。

  1.3产业链:海外技术层领先,国内着重应用端创新

  当前,虚拟数字人技术和理论日渐成熟,应用场景不断丰富,可广泛与各行业领域相结合,变现路径和市场潜力明确,商业化模式虽未完全成熟,但也在向多元化方向持续演进。就产业链来看,海外与国内在上游技术水平、产品模式、以及下游落地场景均有一定差异。在底层技术层面,国外起步较早,综合实力相对领先,能够更好的切入相对需要更高交互能力的服务型场景。而在国内,移动互联网发展迅速,元素多元,相对在应用端创新能力较强,尤其是中国特色的直播场景,是虚拟数字人商业化的一大特色模式。

  就现在的产业现状来看,产业链上游为虚拟人生产要素,包括技术和内容两个部分。在技术领域,一部分公司提供全栈式技术服务,另一部分公司则从垂类技术模块切入,包括人工智能、动作捕捉、建模渲染等。上游技术厂商深耕行业多年,已经形成了较为深厚的技术壁垒。在内容方面,内容IP持有方和艺人IP持有方均可成为虚拟人的人格来源。

  产业链中游是平台层,包括软硬件系统、生产技术服务平台、AI 能力平台,为虚拟数字人的制作及开发提供技术能力。AI 能力平台提供计算机视觉、智能语音、自然语言处理技术能力。其中AI 技术是虚拟数字人行业核心驱动力量,目前,全球的AI技术已经达到成熟阶段,技术成熟度高,产业上正在加速与实体经济深度融合,助力产业转型升级。平台层汇聚的企业较多,综合类互联网大厂例如腾讯、、搜狗,垂直类厂商魔珐科技、相芯科技等均有提供相应数字人技术服务平台。

  应用层是虚拟数字人实际的应用场景,目前的应用场景主要包括传媒、、影视、金融、文旅、医疗等行业,形成行业整体解决方案,赋能各领域发展。虚拟数字人技术、产品与不同行业相结合,于生产生活相结合,其规模化、可复制化、可定制化的特性可大幅改善传统流程,提升业务效率的同时增强用户体验,给传统领域带来变革。

  1.4 商业模式:服务+身份两大应用齐发力,商业价值凸显,行业天花板高

  基于应用场景的不同,虚拟数字人可以划分为服务型虚拟数字人和身份型虚拟数字人,两者的核心功能、产出定位、代表应用、产业价值均明显不同。得益于虚拟IP的巨大潜力以及虚拟第二分身的起步,未来身份型虚拟人可能占主导地位,服务型虚拟人相对稳定发展,未来多模态AI助手将在金融、政务、文旅等领域逐步发展。

  于海内外技术水平差异,国外在CG技术方面具有优势,能够打造具有高度关怀感的虚拟数字人,国外的服务型虚拟人率先在医疗等场景落地,开发虚拟陪伴助手、心理咨询顾问等;国内的服务型虚拟人主要用于替代真人进行播报等内容生成,并进行简单问答交互等。

  服务型虚拟人:以服务为主,单个虚拟人产生的经济效益相比身份型较小,但作为虚拟世界的基础要素,可以创造出非常可观的市场空间。根据其核心服务功能以及底层技术的区别可分为替代真人服务和多模态AI助手。

  身份型虚拟人:与缺乏人格象征的服务型虚拟人相比,身份型数字人强调其本身身份。身份型虚拟人主要分为两种形式,一种是在现实世界里,具有独立人设,能够通过照片、视频、广告、演唱会、直播等方式进行活动并变现的虚拟IP和虚拟偶像;另一种是未来在元宇宙中,人们创造的第二虚拟身份,是与虚拟世界交互的手段。虚拟IP和虚拟偶像近几年迅速破圈,是当前最受关注的一大类别,市场规模已经非常可观

  行业天花板高,未来市场有望过百亿美元。以对话式AI来测算行业虚拟人行业规模,其中包括语音助手、客户服务聊天和虚拟数字人。根据Adroit Market Research 报告,全球对话式人工智能平台市场规模预计将从2019年的40亿美元增长到2025年的170亿美元。这一预测是在新冠病毒爆发之前发布的,因此,由于宅家经济的影响,市场规模可能会增长甚至比预想的还要多。就目前来看,虚拟数字人这一市场行业天花板高,商业化实现路径明确,且已出现了有相当竞争力的技术公司,近两年,在各行业开始意识到其技术可行性和商业价值,以及元宇宙的进一步推动后,行业将快速进入高速发展期。

  我们认为,虚拟数字人的应用场景众多,可广泛与各行业领域相结合,变现路径和市场潜力明确,行业潜力大,未来主要的驱动力有:

  1)用户代际变化,“Z世代”对虚拟世界的接受度更高,对新形式的内容消费更为渴望;

  2)AI、CG建模等相关技术日渐成熟,行业门槛降低,成本端有所下降;

  3)需求驱动,首先人们需要有温度的服务,相比较语音,文字等传统形式,虚拟人这种可视化的形象和交互性更能与用户贴近;其次虚拟人能大幅提高效率,减少人力成本;

  4)虚拟数字人与各行业结合,有很大的创新和应用空间,能带来创新价值。作为元宇宙主要的交互载体,虚拟人具有明确的巨大增长潜力,未来基于NFT、VR等有更多理想的延展空间。

  二、海外多路巨头布局虚拟人,各国发展侧重不同

  从底层技术到应用场景不断丰富,各类玩家纷纷入局不同领域。前面我们提到,虚拟人产业链由上至下可分为两大类,一类是底层技术和平台层,为虚拟人提供底层技术、制作平台。这类公司是以、Epic Games、Unity为代表的技术壁垒深厚的海外巨头,他们基于自身技术优势向下游生产技术服务平台延伸,为虚拟人提供制作平台;一类是应用层,目前主要有专业服务与虚拟偶像IP两个方向的应用。专注于将虚拟人应用于场景的公司更注重利用高级自然语言处理技术与人机交互作用,以虚拟人为消费者提供专业化的服务或情感关怀,其所涉及的领域已包括医疗、金融、互联网、零售与电子商务、等领域。而虚拟偶像IP应用方面,这类公司或自己创造并运营虚拟偶像,或与娱乐公司合作共同打造虚拟偶像,除了技术要求,他们还利用相应的营销手段将虚拟人打造成新一代网红。其利润主要来自虚拟人的商业价值。

  各国发展趋势差异明显,方向各有侧重,美国科技巨头持续领航。从地区发展趋势来看,虚拟人在美国、欧洲、日本和韩国的发展形态各不相同。美国平台层的优势最为雄厚,各大科技、巨头纷纷布局虚拟人市场,推出虚拟人制作平台。而在应用层面,美国公司则更偏向与文娱方向的虚拟人应用以及虚拟偶像的打造。欧洲各国则在应用层中的领域更为突出,且奥克兰、新西兰发展表现亮眼,虚拟人服务范围、落地场景广泛。相较欧美而言,受亚洲思想文化等因素影响,日韩虚拟偶像的发展势头尤为迅猛,虚拟人主要在文娱方面落地。日本早在1982年就因虚拟歌姬林明美成为了第一个创造虚拟偶像的国家,目前以初音未来、绊爱为代表的二次元虚拟偶像依然非常活跃,同时日本也不断进军超写实的虚拟偶像。韩国综合发展,既有三星这类科技巨头持续发力技术和平台端,也有各虚拟人开发公司、游戏公司、娱乐公司等深度布局虚拟人在泛娱乐行业应用。

  综合来看,美国企业虚拟人上拥有全链路的布局,发展远超其他国家。在技术层面,美国主要以,Epic Games等为核心进行技术和平台方面的布局,拥有绝对优势。生态应用端,美国最早出现虚拟人的概念是在20世纪80年代,更多的应用于医学领域,更好地探究人类的身体构造。在商业化领域,美国虚拟人布局起步比日本要晚,在20世纪初才迅速成长起来,主要是在《指环王》等一系列电影中的运用。由于美国拥有几乎全球最大的社交平台Instagram、Meta、视频分享社区YouTube等,在虚拟人落地场景上也主要以泛娱乐为主。美国在应用端多是以MCN为主,拥有全球TOP级的KOL,美国热度较高的虚拟人多为超写实的KOL型虚拟人。

  作为CPU的发明者、人工智能计算的引领者,无论是对于元宇宙还是虚拟人,英伟达都展示出了足够强大的技术、足够自信的野心——布局比真实世界更大的经济体。英伟达未来的元宇宙业务愿景将以Omniverse为主线。未来的目标是:形成一套以 Omniverse为平台,并拥有强大算力支撑和先进硬件基础的元宇宙体系。Omniverse平台定位:基于 USD (通用场景描述),专注于实时仿真、数字协作的云平台。其特色在于,拥有高度逼真的物理模拟引擎以及高性能渲染能力。基于此平台发布的系列扩展应用,将实现多种场景的虚拟化。与此同时,英伟达在视觉传达、虚拟语音、机器学习、云端进出等关键技术环节,开发或升级了相应的软件和硬件,搭建起强大的技术保障和关联产品体系。

  英伟达对虚拟人的理解是,虚拟人也应该有感情、能够体会到喜怒哀乐,且能够把喜怒哀乐实时地通过语言、表情等来体现。英伟达在GTC大会上新发布的Omniverse Avatar,能够让ISV、开发者和用户自己根据各式各样的创造性思维,打造逼真的世界、高度还原的物体以及能够实时互动具有真实情感的虚拟人。

  Omniverse Avatar是基于语音、机器视觉、自然语言处理等技术形成的交互式AI产品,集成了视频渲染能力(Omniverse)、语音识别与交互(Riva、Maxine)、自然语言处理(NeMo Megatron)、 AI推荐(Merlin)。该平台可以用来帮助开发者创建虚拟角色,进而有效地形成立体肖像并进行人机对话。同时这些角色具备视觉处理和语言能力,为创建人工智能助手打开了大门,这些助手几乎可以为任何行业轻松定制。这些可以帮助处理数十亿的日常客户服务互动,包括餐厅订单、交易、进行个人预约和预订等等。目前Avatar已经落地的应用场景主要是服务型的虚拟数字人。

  GTC大会上引起市场关注的“14秒虚拟黄仁勋”,就是英伟达在虚拟人上的一次探索。这一次“以假乱真”的尝试,让英伟达在数字人研发路径中的第一步,“做得逼真”得以实现。未来,英伟达将逐步实现其在数字人上的阶段性目标:以语音语义驱动数字人,以及最终实现真实与虚拟人的完全交互。而在2021年上线的中国探月官方纪录片《飞向月球》第二季中首次出现的采用的是Omniverse平台制作的超写实虚拟人,也预示着,英伟达Omniverse Avatar也将逐步迈进传媒娱乐领域。

  英伟达抢先布局,有望在虚拟世界中通过提供可复用的底层功能,高效制造庞大数量的、高交互质量的服务型虚拟助手,实现经济效益的提升,而服务型虚拟人在未来将成为元宇宙中最大的虚拟人市场,战略布局更加长远。此外,通过将物理渲染、物理引擎等技术固化算法到芯片中,结合自研的AI技术,英伟达能够进一步整合产业链上下游,持续赋能开发者,增强竞争力与商业化变现能力。

  Epic Games是一家总部位于美国的互动娱乐公司和3D引擎技术提供商,创立于1991年,创始人为现任首席执行官Tim Sweeney.Epic旗下的《堡垒之夜》是全世界最受欢迎的游戏之一。Epic开发了虚幻引擎,广泛应用于游戏、电影电视、建筑、汽车等各个行业。Epic也推出了Epic Games商城、Epic在线服务等内容分发系统,同虚幻引擎一起,为开发者和创作者构建了数字化生态系统。

  除了游戏,Epic Games的另一大产品,虚幻引擎(Unreal Engine),有望成为多行业3D可视化的首选工具。虚幻引擎起源于Epic早期的自制游戏Unreal,从1999年正式面向开发者后,虚幻引擎经过了20年的不断迭代升级,已经成为基于物理渲染的核心商业引擎,特别是在提供3D写实风格的数字画面效果上具有技术领先性。虚幻引擎的优势主要体现在高品质3D写实风格的内容创作上。创作者可以使用虚幻引擎创建、修改并实时渲染逼线D效果。虚幻引擎在技术深度和前沿技术探索覆盖上广受业界关注,特别是在工业化和自动化生产上的积累,是未来能够高效创作高质量内容的稳健保障。虚拟引擎目前已被广泛用于游戏、电影制作中

  在虚拟人的制作方面,Epic Games希望减少创作者制作的时间与精力,使内容制作者们更有效率,让一个预算很少的几人团队有可能打造出跨时代的高质量游戏,甚至连孩子都能轻松创作出属于自己的虚拟人。因此,2021年2月,Epic推出基于虚拟引擎驱动的MetaHuman Creator,它可以在不牺牲质量的前提下,使虚拟人的创作时间从数周乃至数月缩短到一小时以内,让零基础用户也能“捏人成功”。本质上讲,MetaHuman Creator是辅助的视频游戏角色创建工具,带有一些诸如发型、面部、肤色等的预设,设计者可以混合并匹配这些预设,然后再对人物细节进行修改。为了使创造的新角色更加可信,MetaHuman Creator的所有数据均来自真实、合理的人脸,并使这些虚拟人与现实生活中的动作捕捉演员相互连接,为视频游戏、电影、电视和其他制式的人机交互场景服务。

  从技术以及布局来看,由于引擎是内容供给的关键因素,也因此成为了虚拟人的底层建筑,故而Epic很早就已开始在3D甚至4D引擎布局,除了虚拟引擎数十年的研发,把 3Lateral、Cubic Motion 和 Quixel 等公司引入 Epic 技术架构也是MetaHuman Creator取得突破性成果的关键。具体技术上,首先是高效的模版混合技术,可以融合多张基础脸后快速得到一个全新面孔,且栩栩如生,拥有细腻的微表情动画;二是云端渲染,使用者无须拥有高端显卡,本地操作通过网络传输到云端,渲染后传回视频流,使制作过程做到轻量、优质、便捷。但这种方式也有局限性,利用已有人脸数据意味着无法随心所欲地创造角色。因此,工具定位在零基础操作、高品质、快生产,小团队可以直接生成自己的作品主角,大幅提升美术效果、节约创作成本;大公司则可以批量制作3A级游戏中的NPC。

  MetaHuman Creator在虚拟人领域成功的技术突破,使得虚拟人的制作在某种程度上能够“飞入寻常百姓家”,在虚拟人制作领域取得一定的先机。再加上工农公司叛逆冒险的精神、游戏内容制作上与元宇宙的契合。Epic Games或许有潜力创造出真正符合元宇宙精神内核的作品,成为元宇宙赛道上独特的领跑者。

  Epic Games处于一级市场,尚未上市或公布上市计划。在2021年4月完成新一轮融资后,Epic宣布现在的股权估值为287亿美元。在21年4月的融资轮后,已经有多家世界著名的基金公司成为Epic的投资人。来自于游戏产业内的投资人主要是腾讯和索尼,其中腾讯具有董事会提名权。

  与Epics Game旗下的Unreal Engine(虚拟引擎)齐头并进的跨平台开发引擎是Unity。在当今的游戏引擎市场中,二者形成了双头垄断竞争格局。

  从技术角度来看,Unity天然适用于虚拟人的设计。Unity引擎广泛应用的游戏被普遍认为是当前最接近元宇宙的产品形态和应用场景,且其3D引擎技术已应用到现实多个场景。Unity引擎的现有的通用渲染管线URP、HDRP高清渲染管线,以及Unity研发重点Auto Streaming流式渲染技术等都是虚拟人和元宇宙建设所必需的。

  仅从虚拟人制作的角度来看,虽然Unity在数字孪生上也进行了研发,但目前只发布了了制作了一个数字人的Demo,而没有像MetaHuman Creator那样专门为虚拟人设计的平台发布,且制作流程相对复杂。这些特征决定了在虚拟人赛道上,Unity和英伟达的Omniverse Avatar类似,面对的是更加专业化的人群。

  但从公司布局来看,Unity则是希望从游戏引擎拓展至交互式内容创作引擎。随着元宇宙概念的兴起,作为底层技术支撑的内容引擎, Unity找到了一种解释自己的新框架。根据招股说明书,上市前两年,Unity在数字孪生、工业互联网、汽车、运输、建筑、VR/AR、数字城市等领域投入了4.5亿美元的研发成本,并通过收购Applier、deltaDNA、Finger Food、Multiplay和Vivox等工具型公司,进一步向满足所有创作者需求的一站式集成平台演变。目前其非游戏客户与合作伙伴包括谷歌、微软、Facebook、亚马逊、宝马、本田、沃尔沃、迪士尼、三星、华为、小米等等,涵盖汽车设计、建筑建造、影视动画等多个领域。

  Fable Studio最初是一家沉浸式VR叙事类型娱乐公司,在凭借《Wolves in the Walls》获得了艾美奖后,Fable将重心从虚拟现实转向了虚拟人,推出首个人工智能角色Lucy,一个8岁小女孩。Fable Studio的前瞻性就体现在将虚拟和现实有机结合,将Lucy从虚拟现实中“拉”出来,让人们可以通过网络与她进行对话。在上个月推出Lucy的alpha测试后,已经有7000人在测试的等待名单上排队了。在整体风格上,Fable更在意虚拟人的故事感,意在营造温暖的情感关怀。

  在对虚拟人的理解上,Fable Studio认为,现实生活中人们有时会产生孤独感、距离感,会渴望交流和陪伴,但疫情正加速拉远社交距离,这间接地繁荣了对话型虚拟生命的市场。因此Fable的定位是打造一个陪伴式虚拟生命,为用户提供可以一起交流,一起学习和活动的朋友。2021年,Fable Studio推出了两个陪伴式AI虚拟生命——Charlie和Beck,生成类语言模型的加入有望显著提升虚拟个人助手的日常交互能力。除了没有实体,她们能像真人一样与用户进行对话,满足人们的沟通和陪伴需求。

  在技术层面上,Fable的虚拟人都是将计算机动画的艺术作品与人工智能技术相结合的产物。并在技术上都依赖于Fable工作室设计的AI向导引擎和GPT-3 技术。其中,GPT-3技术是由OpenAI公司提供的自然语言处理模型,可以基于互联网上的文本,生成较为逼真的拟人文本。

  在未来规划上,Fable将选择时尚和医疗保健领域的合作对象,希望共同创建一个虚拟角色,为角色创造背景故事、生活和审美。因此角色会发生什么,或者他们将如何与朋友互动等等,都将由Fable与其合作伙伴共同决定。迄今为止Fable融资超过四轮,曾获得来自GFR Fund 和 SDVentures等基金的融资。

  不同于Fable的温暖,整体风格逗趣搞怪的Genies是一家制作3D虚拟化身的美国科技公司,属于数字孪生领域。与传统意义上的超写实的虚拟人不同的是,Genies致力于为客户创建数字版本的Avatar Agency,制定个性化头像和装扮,并在NFT的支持下,建立虚拟化身和及其周边商品的交易市场,并提供平台使用户可以以虚拟形象进行社交活动。

  从虚拟形象的整体风格来看,Genies制作的虚拟形象类似于国内的“脸萌”,或一种“3D卡通形象”。从Genie虚拟形象的用途来看,Genie明显聚焦于社交、娱乐以及交易领域。一旦用户创建了自己的Genie人物,就可以通过Genies与GIF 数据库 Giphy的合作在其它社交媒体上使用Genie与朋友聊天。Genie虚拟形象会根据用户选择的表情做出相应的动作与表情。

  从技术层面来看,Genies虚拟人的核心技术是其自研发3D虚拟化身SDK,它创建起一个数字身份生态系统,使消费者可以将他们的化身从一个平台转移到另一个平台。为保证虚拟人物的“高保线D的虚拟化身使用的是Unity引擎,该引擎不仅保证了画面上的接近,还可提供语音支持,将语音合成到虚拟化身中。

  从Genies的走红以及发展路线来看,Genies采取了和明星合作的策略,其合作艺人包括吴彦祖、Justin Bieber、Cardi B、蕾哈娜等。具体来说,即让明星和用户都可以在平台自建一个虚拟形象,呈现的形象未必是本人,可以是宠物、玩具,甚至外星人,可以是3D图像、动图、短动画。正是在这种名人效应的加持下,Genies迅速走红,并逐步与Gucci、New Balance、世卫组织等品牌或组织达成了合作,推出定制化虚拟物品。在有了定制化虚拟物品的之后,Genies又与投资方Der Labs以及从事虚拟货币业务的Coinbase Ventures合作,并趁着NFT红遍欧美艺术圈之际,让名人的虚拟化身及其化身商品作为NFT进行交易。同时,Genies推出自己的官方的SDK,帮助用户将创造3D虚拟化身集成到不同平台,迅速将自己的产品推广出去。除此之外,Genies从2020年开始进军游戏行业,将虚拟形象技术应用在游戏开发上。几番运营之后,公司目前估值超过 1 亿美元。

  与Genies类似,同样属于数字孪生领域科技公司是ObEN,一家横跨AI、AR和VR的科技企业,主要是为消费者和明星打造个性化人工智能。2017年,该公司初次进入大众视野,ObEN因其明星人工智能为驱动的全新娱乐方式,与领先的语音合成、图像视觉重构以及自然语言处理领域的技术领先,同时获得腾讯与软银的投资。但在各大科技巨头纷纷布局虚拟人赛道的今天,ObEN陷入了底层技术无法与科技巨头比肩,运营方式也相较Genies落后一大截的尴尬境地。

  从ObEN虚拟形象的制作上来看,用户只需提供一张自拍照及一段语音,就可以获得与本人极为相似的人工智能形象,并支持用户将化身应用到共享VR空间,与朋友、家人交流,观看比赛、表演。

  从底层技术来看,ObEN 主要的应用了两方面的而技术,3D头像和AI驱动。3D头像使用的面部动作捕捉技术,可以将2D自拍瞬间转换成可以移植到各种平台中的3D头像。而AI 技术自动生成语音则可以通过简短的录音生成具有聊天机器人功能的功能性 AI 语音,并且与生成的头像配对。

  从合作企业与明星来看ObEN已经与软银和HTC Vive的VR体验,以及韩国SM娱乐和中国SNH48等偶像团体达成合作,但其广度、深度以及知名度均不及Genies。

  不同于专业服务应用层,虚拟偶像应用层的公司只会精心打造一个或几个虚拟人,并像真人明星一样去营销运作,并通过虚拟偶像的商业价值获取利润。现阶段,虚拟偶像的商业变现主要来自两部分,即以品牌代言、广告合作等为主的B端和以游戏、演唱会、直播带货、打赏、周边为主的C端。

  在美国,最为著名的虚拟网红是来自Brud工作室的Lil Miquela,在Instagram平台粉丝数排名第一,为310万;同属美国的Guggimon从19年11月的第十名迅速攀升至第二名。

  虚拟偶像定位上,Brud 官方给 Miquela 的定位是“Z世代潮流引领者”。她拥有独特的外形、时尚的穿搭、音乐的才华、鲜明的人设。比如,Miquela 在Instagram上的照片,都是按照现在美国95后的立场、偏好设计的。同时,Miquela也会为性别和种族平等发声,会与观点不同者辩论。在时间的积累下,Lil Miquela背后的故事与人设的打造逐渐丰满,俨然是一副真人偶像的样子,在此基础上进行商业变现合作则更加顺其自然。

  商业营销上,Brud选择将Lil Miquela最大特点——“真实”进行了营销式打造与技术上的放大。Lil Miquela这种写实需要技术与艺术,但从某种意义上讲更重要的是营销的加持,引起粉丝的好奇并让粉丝相信。为了营造真实感,Brud 会在社交媒体让Miquela展示妈妈的高中毕业照,回复粉丝的私信,访者的身份采访,甚至和真人谈了一场恋爱。

  商业模式上,虚拟网红是虚拟的,但他们是可控的,他们的受众是真实存在的,这也是他们的商业价值所在。在通过上述操作将粉丝量积累到一定高度后,Miquela开始变现自己的商业价值,从接广告、代言、与时尚名人合影,她甚至推出了自己的服装品牌。Lil Miquela陆续登上知名杂志,逐步和香奈儿、巴宝莉、Prada、Supreme、Calvin Klein、Vans还有三星等品牌展开了合作,也创办属于自己的时尚品牌Club 404。而她和CAA的最新合作也意味着Miquela未来可能涉足影视行业。这样,从商业模式角度来讲Miquela将与真实明星别无二致。据报道,Lil Miquela在2019年的总营收折合成人民币约为7600万元。

  虽然投入不少,但虚拟偶像在有着和真人偶像一样的商业变现模式上,带来的收益远也并不亚于真人偶像。但相较于后者,虚拟偶像的安全性和可控性都更高,运营公司拥有可以自由定制容貌、人设不会崩塌,性格稳定性和工作配合度几乎拉满,更为重要的是,虚拟偶像还掌握了所有技能,甚至可以突破时间和空间的限制——24小时不眠不休,并且在多地同时进行工作,这大幅提高了生产力。

  除此之外,虚拟偶像的造星路径一旦形成模式,便可以无限复制。Lil Miquela背后的版权所有公司Brud在成功地凭空创造出一个与真人无异的虚拟偶像后,还接连复制出了Blawko、Bermuda等虚拟偶像,试图打造一个“Brud宇宙”。但或许是受限于人们对虚拟人尚未成熟的接受度,Brud之后推出的两位虚拟偶像,热度都不如Miquela。粉丝们可以出于好奇喜欢一个虚拟偶像,但暂时没有办法接受虚拟偶像大面积出现挑战真实明星。对于偶像而言,能不能变现,依然取决于粉丝买不买账,因此未来以Miquela为代表的众多虚拟偶像,或许需要等待粉丝对虚拟人的进一步了解与观念的转变。

  多模态AI助手功能可以理解为助手型虚拟数字人,不仅能够在特定场景下基于用户系统高度个性化,还可以实现通用化交互。目前,多模态学习技术主要的应用还是集中在语音和视觉的多模态识别上,在未来的聊天机器人或者智能助手上,多模态学习将帮助智能机器人综合处理图像、声音和文字信息,同时可以进行综合模态,甚至包括情感等特征信息的输出与表达。多模态AI助手一般基于真人形象,给客户提供关怀感和真实感,在通用场景或特定关怀类场景中提供顾问、关怀、陪伴、事务处理等服务,未来在电商购物,医疗康复、个性化经济等有广泛应用。

  相对来说,欧洲的虚拟人公司重点发展可以在特定场景下提供情感价值的多模态AI助手,全球走在前列,重点的落地场景包含医疗顾问、日常陪伴、个性化理财顾问,心里咨询顾问、购物助理等。这种情感向的场景,对“拟人化”的要求极高,公司需要在前期预制虚拟形象的外观和交互行动上大量投入,相比国内,海外公司对真人的还原度有明显优势。除了欧洲外,这一应用也在其他韩国等地开始布局,但总体来说,由于欧洲文化原因,更关注关怀陪伴等“精神”层面追求,叠加较成熟的“拟人化”技术,在特定场景提供情感向的服务方面,欧洲走在整个世界前列。

  Machines是一家总部位于新西兰的公司, 是通用人工智能领域的领导者。期初,Machines主要为客户定制虚拟人,并应用于客户服务、宣传视频和等方面。而伴随着元宇宙的兴起,Soul Machines也计划为元宇宙创建“数字劳动力”。

  在技术方面,Soul Machines虚拟人是在其自研发的Digital DNA Studio上创建,在Humans OS 2.0 的系统上运行的。具体来看,Digital DNA Studio是一个基于云的自动化工作室,这可以让品牌跨多个设备制作数字人形原型。而Humans OS 2.0 的系统则由两部分构成:数字大脑和自主动画。由数字大脑复制人类大脑日常互动的处理方式,由自主动画对外部刺激自主反馈。而在引擎上,Soul Machines 的灵魂引擎可以充当操作的大脑,模拟控制注意力、学习、感知和行为的基本认知过程。在上述技术条件以及生物识别技术和人工智能的支持下,Soul Machines 的虚拟人可以记住面孔并根据之前的互动确定最佳反应。除了自研发的技术,Soul Machines还利用现有平台和服务(例如 IBM 的 Watson)来识别多种语言和口音。

  在虚拟人服务领域方面,Soul Machines虚拟人以及扩展服务至消费品、娱乐、金融服务、卫生保健、教育、公共部门、房地产、零售和电子商务、科技与媒体、电信和呼叫中心等to B 场景。目前已经服务了包括谷歌、AWS、奔驰、IBM等在内的众多公司。在未来的元宇宙场景,Soul Machines的创始人认为,AI虚拟人将作为这个平台的数字工作者,类似于具有情感的NPC,根据用户的个性、心情和场景,提供贴心的服务和互动。,未来的战略上,Soul Machines希望通过游戏来打开市场,比如在游戏中植入AI虚拟人作为NPC,这可能会帮助游戏开发者省去开发游戏角色的成本。

  在这个领域颇有建树的还有总部位于新西兰和奥斯汀科技公司UneeQ。在公司目标以及使命方面,UneeQ希望提供超越聊天机器人的体验,而无限接近于人类提供的服务。并将通过AI虚拟化来改变客户体验视为自己的使命。

  在虚拟人作品方面,目前UneeQ主要有数字爱因斯坦、健康顾问苏菲、金融助手丹尼尔·卡尔特等各具特色、不同专业的虚拟人。在2021年12月15日,UneeQ和与心理健康平台Mentemia合作,推出全球首个数字心理健康教练。

  在技术方面,UneeQ虚拟人的技术可分为三个部分:知识计算引擎、CG数字动画&捕捉、语音合成。但目前这三个方便的技术都需要其他技术公司的支持。以数字人爱因斯坦为例,UneeQ借助了WolframAlpha知识计算引擎,使爱因斯坦能够回答一系列STEM领域的问题。再利用了视觉特效公司Goodbye Kansas Studios的CG数字动画&捕捉。最后,请Aflorithmic团队提供语音合成技术,准确地再现了Digital Einstein的声音、表情和口音(带有德国口音)。而在运行系统上,UneeQ和Soul Machines一样,都选择了Human OS用于驱动数字人的AI系统。在服务领域方面,UneeQ 数字人正在医疗保健、、保险、教育、电信、零售和心理健康等领域工作。

  相较于Soul Machines,UneeQ的一个缺憾是过于依赖外部技术支持,其核心技术都不是自行研发的,这无疑会加重公司的运营风险与成本。

  相对于Soul Machines和UneeQ虚拟人服务领域之广,位于新西兰的Replikr则更加专注于医疗垂直领域的虚拟人服务。产品方面,Replikr主要为医疗保健领域提供使用对话式 AI ,令其与患者和团队进行更智能的互动。技术方面,Replikr主要依靠的是深度学习技术Generative AI、和自然语言处理相结合的Conversational AI,主要采用的是世界领先的IBM Watson AI。

  Synthesia是英国一家专注于帮助可和合成虚拟人视频的公司。Synthesia的核心目标是使创建商业虚拟人视频就像编写电子邮件或制作 PPT一样简单。即利用Synthesia平台,无需演员、相机、麦克风和摄制组,只需输入一段文字即可生成对应的视频内容,并配有会说话的人形动画头像。

  在产品方面,目前Synthesia主要的产品是面向B端客户的SaaS产品——Synthesia STUDIO和个性化视频——API.Synthesia支持40多种虚拟形象,在Synthesia Studio上,用户可以选择系统默认的人物或者创建自己的AI化身进行视频创作。同时,为了防止恶意制作虚拟人物视频,Synthesia内置了多层安全性和身份验证,并且会进行审核,因此用户无需担心自己的虚拟化身被恶意使用。此外,Synthesia还支持50多种不同的语言,从而消除语言障碍,形成个性化本土化的视频内容。而在视频之外的虚拟人赛道上,Synthesia也为客户提供人工生成的avatar形象库或者让客户自己创建属于自己的avatar头像。

  在技术方面,Synthesia主要是将 AR、VR、计算机视觉、深度学习、Deepfake技术等技术应用于视频。在服务场景方面,Synthesia产品主要应用于企业传播、数字视频营销和广告本地化,目前已经服务于全球4500多家公司,包括安永、耐克、谷歌、BBC、乐事薯片等。

  未来,在全球的虚拟人市场需求正在快速增长的背景下,完善虚拟人功能显然是Synthesia当前拓展的重要应用方向。结合Synthesia在视频领域的先行优势,其长期愿景已转变为“让每个人都可以仅用一台笔记本电脑,制作一部完全合成的好莱坞电影。”

  欧洲在虚拟IP上的应用主要集中在时尚领域,打造出各类出圈虚拟模特,时尚KOL。由于欧洲占据优质的时尚资源,高端时尚圈和顶奢大牌众多,凭借资源优势,欧洲地区打造的虚拟人更多以Instagram上的网红、模特等形式出现。主要的商业变现方式是以广告为主。

  2018年,黑人超模 Shudu 诞生自摄影师 Cameron James-Wilson 之手,其灵感来自 Duckie Thot 和一个叫做南非公主的芭比娃娃,属于超写实型的虚拟偶像。在人设上,Shudu是一位身材高挑、气质高冷的黑人模特。因此在虚拟人运营上Shudu高冷且不接地气,在社交媒体上除了“工作照”基本不发其他照片。另外,技术的加持以及肤色的原因使得Shudu形象非常逼真,当她首次以 Rihanna的彩妆品牌Fenty Beauty模特身份出现时,人们甚至分辨不出她是虚拟的。

  在商业模式上,不同于Lil Miquela依靠Ins上的粉丝积累,Shudu走的是高级模特路线。在Fenty Beauty的惊艳亮相后,其超模高级形象开始被更多品牌看中。此后,她便开始与无数包括高奢服装和珠宝在内的品牌合作,成为了世界上第一位名副其实的虚拟超模。其独特的外形、气质、关注度以及品牌的认可也获得了虚拟模特公司The Diigitals的青睐,并与之顺利签约。

  从Shudu现有的发展路线以及创作初衷来看,Shudu主要专注于高级模特领域。未来Shudu也有望向其他虚拟模特一样拓展其商务至其他领域,获取更大的商业价值。

  来自法国的Noonoouri是2018年蹿红的虚拟偶像。Noonoouri最大的特点是,她并不酷似线D 动画人物,更像是一种非真人的梦幻化的存在。在人物设定上,Noonoouri形象定位是具有贵族血统的名流后代,她的人物性格设定强调形象的虚拟和梦幻性。其设计及运用团队希望她与真实产生距离感,从而扩展虚拟形象边界。因此,主创为Noonoouri主打三重“C”创建——可爱,好奇和高级时装,这也深化了Noonoouri的性格路线。目前。她在Ins上拥有将近40万的粉丝数。

  在商业模式上,目前Noonoouri由其创始团队Zuber的工作室运营,通过社交平台和高端模特经纪公司不断拓宽其影响力。具体来看,Noonoouri在2018年2月通过纽约时装周期的精彩表现获得了比较不错的评价,并正式入驻Instagram,现在在Ins上拥有将近40万的粉丝数,且在后续运营中逐渐获得了受到著名设计师、模特和名人的认可。之后她顺利签约IMG Models,并持续担任《Vogue Me》和《 Glamour Brazil》的封面模特。商业价值上她主打与高端时尚品牌代言合作,包括Dior、Versace等高端时尚品牌,活跃在各大主流高端时尚杂志圈,并在Instagram上与大量法国、美国时尚界名流和明星往来。据《福布斯》,Noonoouri的累计营收已经突破960万人民币。

  在众多超写实虚拟人中,Noonoouri形象无疑是独树一帜的,而其运营方式更像是Miquela和Shudu的结合。因此未来Noonoouri或许会涉及更多时尚及影视领域。

  ACGN文化深植的日本社会,在虚拟人的接受度和发展速度上拥有其他国家难以企及的优势。 如今日本虚拟人以虚拟偶像为主,风格上二次元热度持续,也涌现了一批超写实风格的虚拟IP,各自发展出不同的营销风格和产业布局,并共同带动虚拟产业整体发展。此外,除了原创外貌人设的虚拟人,日本还有公司推出主要服务于名人,为真人制作虚拟人的“数字孪生”服务。当前,虚拟人以新颖、稳定和科技感吸引众多内容公司、消费品公司纷纷入局,进一步扩展了虚拟人市场。

  目前日本市场环境对虚拟人较为友好,虚拟人的市场影响力和商业价值仍有发展潜力。2018年,绊爱成为日本国家旅游局访日观光大使,可以看出日本主流市场对虚拟产业的认可态度。除了虚拟偶像方面,随着元宇宙概念大热,虚拟平台搭建如HIKKY、Cluster等公司的发展引人注目,都为虚拟人扩大活动范围提供机会,甚至可以期待用户和虚拟人在虚拟空间互动的可能。

  总体来说,日本是最早形成虚拟人商业化的市场,在品牌建设、市场营销、娱乐和时尚等方面的商业化探索已经比较成熟,未来很有可能改变现有的销售、促销和客户服务方式。除了娱乐方面模式的改变,日本也开始积极探索虚拟人在健康、社会、教育和培训方面的应用。

  随着虚拟形象的不断发展,日本广告巨头也宣布进军该领域。CyberAgent成立于1998年,以广告代理业务起家,现已位居日本网络广告业四巨头之首。随着全球虚拟人市场的发展,2021年10月14日, CyberAgent以旗下AI技术研发组织“AI Lab”数字人研究中心的成立,正式进军虚拟人技术研发领域。

  从虚拟人产品及服务的布局来看,在此次数字人研究中心成立前,CyberAgent就已在“高精度还原人体”方面做过诸多研究和尝试。其旗下子公司Cyberhuman productions,就是一家以“人类与技术融合”为中心开展研发的集团,并已经制作出较为出名的雀巢全新虚拟代言人“Zoe”。而早在2021年8月,CyberAgent就已经推出“Digital Twin Label”数字孪生服务。该项服务旨在为艺人名人制作生成高还原3D CG形象,甚至可以替代明星本人参与虚拟空间活动、出演广告,乃至舞蹈和乐器演出,并在首发广告宣传片中展示了一比一还原超模富永爱的过程。

  在技术方面,“Digital Twin Label”数字孪生服务使用了3D扫描、音频收集等技术。而最新成立的数字人研究中心则将以“生成基于深度学习的写实人体表现”为目标,从建模、光影到运动效果等多方面进行研究,力求提高制作速度的同时,自动生成各种人类动作,创造高精细度的数字人。值得注意的是,结合CyberAgent本身在广告业的深厚实力,CyberAgent对AI技术的运用不止于内容制作,还能根据产品和用户定位生成关键词和文案,预测投放效果,分析市场并选择投放渠道等。实现AI在广告业务上的全流程应用。

  在数字人领域的未来规划方面,研究中心希望数字人能活跃在广告、电视、服务业等领域,更好地为企业市场活动提供帮助。即实现虚拟人领域从广告向文娱全平台的拓展。

  写实风格虚拟人风靡全球前,日本早已出现了萌系二次元画风的虚拟偶像。因此,目前在日本活跃的虚拟人外形大致分为二次元、超写实两种类型。这两种风格的虚拟人在产业,布局和盈利方式都有所不同。

  日本虚拟偶像疯狂增长,商业价值凸显。自2017年年底开始,日本虚拟偶像数量一路飙升,根据User Local统计,截止到2020年1月虚拟偶像的数量已经超过1万人,几乎保持在每月1000人以上的速度递增。虚拟偶像人数增长的背后伴随的是大量资本的投入。据日本最大的创投企业数据库INITIAL统计,从2016年到2020年9月4日,5年间共有164亿日元(约合10.08亿元人民币)投入VTuber领域。资本的投入和玩家数量的激增反应了整个日本虚拟偶像市场的火热。随着产业逐渐成熟,虚拟偶像的商业价值也在水涨船高,在根据Playboard发布统计显示,2020年获得Superchat(在主播直播时付费发送醒目的评论,类似于“粉丝打赏”)收入最多的YouTube Channel前十位中,有九位来自日本,其中七位都是虚拟偶像,简单来说,就是2020年YouTube上获粉丝打赏收入最多的前十大Up主中,有七位都是虚拟偶像。

  二次元风格发展历史长、粉丝群体稳固,拥有深厚根基和成熟产业链。大致打造流程可总结:打造外形及人设,聚集人气,随后发行唱片、周边,开演唱会,出演节目,接广告代言等。早期初音未来活跃时期,人设完善和人气聚集主要依靠粉丝的二次创作,设定也逐渐饱满。但依靠二创的模式不稳定且难以复制,因此,随着虚拟产业发展,开始有公司专门制作和运营虚拟偶像,现今的vTuber出道自带完整人设背景,且拥有配套营销方案。在制作方面,二次元虚拟人制作成本低,准入门槛也在不断降低。最初vTuber外形设计和制作一般需要付费,现在已经有各运营平台推出免费自定义功能,用户可以自由创建自己的虚拟角色,准入门槛进一步降低,更多的看在内容上的设定和营销方式。

  写实风格虚拟人在营销模式上与二次元风格类似,依靠社交平台、公益等方式积攒知名度,而后通过广告、演唱会等方式盈利。但在制作上,由于需要极大的贴近真人形象,又需要避免恐怖谷的效应,写实风格虚拟人前期投入成本极高,更加技术导向。除了C端,写实虚拟人公司的另外一个重要盈利方式是为提供toB技术服务。

  初音未来诞生于2007年。当时的CRYPTON FUTURE MEDIA以雅马哈的 Vocaloid 系列语音合成程序为基础开发音源库,并以此制作发售了虚拟歌姬软件角色主唱系列,虚拟歌姬初音未来也由此走进大众视野。因此,从本质上来讲,初音未来就是一款歌曲合成软件。初音未来至今已成为二次元文化象征性符号之一,给日本虚拟产业奠定了良好的发展基础。

  从商业模式来看,不同于有公司专门制作和运营,出道自带完整人设背景,且拥有配套营销方案的虚拟偶像。在初音未来主要依靠粉丝的二次创作一次次“出圈”,并逐渐饱满人物设定。初音未来的音源本身自由度和可塑性高,发售后很快有用户产出高质量音乐作品。在歌曲引起共鸣后,在日本“同人文化”的基础上,用户开始创作插图或PV视频。通过这些优秀音乐与优秀作品的引流,初音未来又引来国内外文学、绘画、舞蹈、游戏等领域创作者进行衍生创作,形成创作连锁,并进一步扩宽受众。在某种意义上,除了音源与人设,初音未来的成功离不开在日本漫画与同人文化。

  从商业价值来看,在上述商业模式的良性循环下,初音未来迅速在日本乃至世界掀起热潮,先后接下丰田、宝马、LV等品牌的广告和代言,与美国流行歌手lady gaga同台演出,创下的销售和播放纪录不胜枚举。

  绊爱,2016年由日本虚拟娱乐公司Activ8推出,是世界上第一位同时也是目前为止最知名的虚拟主播,首次使用了VTuber这一概念,开启以vTuber为主的二次元风格虚拟人新时代。绊爱出道,成功在日本掀起一股“绊爱”热潮,出道3个月YouTube粉丝数就超过了20万;到了2018年7月15日,绊爱的主频道“A.I.Channel”订阅人数突破200万人。目前在YouTube主频道和游戏分频粉丝总数超400万,视频总播放量超6亿。在上述亮眼数据的支持下,绊爱先后发行单曲、开演唱会,出演电视节目、游戏及动漫等。走红之后,为了更好地运营,Activ8成立独立公司Kizuna AI事务所,专门处理绊爱相关事务。

  从技术来看,与完全电子合成的初音未来不同,虚拟主播的声音和动作都有真人(中之人)实时对应。通过动作及面部捕捉技术,绊爱能更加灵活地与观众交谈互动,进行长时间直播。因此绊爱的走红也是其凭借着非凡的毅力在近乎日更的高强度更新中的坚持。

  商业价值上,2018年,绊爱成为日本国家旅游局访日观光大使,这一举动在后来也被视为对日本对虚拟产业的认可。国际方面,绊爱出道不到一年就引起BBC、The Verge等媒体关注,并于2019年被杂志《NEWS-WEEK》评为“世界尊敬的100名日本人”。并且据统计,绊爱的粉丝群体仅约30%为日本人,剩余70%来自海外。

  绊爱的出道成功带起vTuber热潮,为虚拟主播初期推广“破圈”做出巨大贡献。截至2021年10月,vTuber总数已突破1.6万人,头部vTuber也已大换血。根据实时数据,2021年11月,除绊爱外,频道粉丝数排名前五的vTuber皆为2019年以后出道。2020年出道的鲨鱼少女Gawr Gura,粉丝数于今年9月超越绊爱主频道,跃居第一,至今已达358万人。

  日本初代AI虚拟偶像Imma是由日本科技公司Aww制作并运营的虚拟人。在制作上,Imma只有头部为3DCG制作而成,身体和背景均为实拍。在虚拟人设定上,相较于二次元虚拟偶像偏卡哇伊的风格不同的是,Imma是一位对潮流文化感知明显的时尚独立都市女生。从出生之日,Imma就走在了潮流最前端:标志发型,鉴于温柔与平静之间的面部表情,极具原宿风的街拍打扮。

  在商业模式上,当前Imma与美国虚拟偶像Lil Miquela类似,不断积累粉丝,主打时尚路线,主要活跃于时尚、公益等领域,目前其Instagram账号已拥有35.4万粉丝。她的工作与真人网红别无二致,主要是“拍摄”各国时尚杂志封面,偶尔分享生活日常。

  在商业价值上,目前Imma已经与保时捷、宜家、迪奥、屈臣氏等多家品牌达成广告和代言合作。除了商业合作之外,2021年3月,Aww公司利用虚拟人不受时空限制的特点,让Imma参与了柬埔寨某村庄女性支援活动。Imma因此获得日本内阁府设立的“Cool Japan Matching Award 2021”鼓励奖。

  作为日本第一家写实虚拟人经纪公司Aww,除了运营虚拟人并通过广告变现外,Aww还开发了独家制作引擎MASTER MODEL,为公司拓展外包业务。该引擎集合了虚拟人制作所需基础技术,并能模拟真实衣料质感。此外,Aww还提供与AI、XR技术关联的新兴领域业务

  虚拟模特MEME是众多超写实虚拟人中比较独特的存在,她没有精致的外表、时尚的装扮,MEME的设计理念就是“一个不完美的女孩”,其设计师松下仁美认为,虚拟人也应该有多样性,而不全是精致的洋娃娃,MEME的外形和人设也由此诞生。在人设上,。MEME在社交平台分享的内容也是普通女孩的日常生活和烦恼。其公司称,希望以这种“真实性”模糊现实与虚拟的界限,唤起共鸣。从行业未来方向看,MEME的出现,为虚拟人的制作和运营提供了更多的可能。

  韩国在虚拟数字人领域独树一帜,以三星为代表的技术大厂在相关领域尤其是技术层面布局多年,是元宇宙的主导力量之一。在应用层面,韩国落地场景丰富,涵盖服务层和娱乐全方面的虚拟人应用。三星、LG等韩国大型集团瞄准虚拟人在生活服务行业的可能,而韩国泛娱乐领域,虚拟人开发公司Sidus-X率先推出Rozy等虚拟模特以代替真人代言广告,Pulse9则推出虚拟女团进军虚拟偶像市场。四大娱乐社则专注于真实艺人的虚拟形象打造,对虚拟偶像抱以观望姿态。

  对于虚拟人的未来商业模式,多家企业抛出成为To B或To C的“虚拟娱乐平台”“虚拟娱乐集团”之目标,但当下,虚拟名人声量的拓展、多场景化的应用仍是有待韩国虚拟人相关企业解决的难题。

  作为科技巨头的韩国三星也开发了自己的虚拟人Neon.Neon更加专注于虚拟人的专业化服务上,这种选择也与首尔政府的理念相契合,2021年11月3日,首尔市政府宣布建立元宇宙平台,提出虚拟世界提供城市公共服务的政策。

  在CES 2020上,韩国三星STAR Labs正式展出了人工智人项目NEON。与一般“虚拟人”不同的是,它不会是百科般的语音助手,而能像真人一样快速响应对话,做出真实的表情神态。形象来看,Neon具有真人大小,具有专业化的形象。Neon具有自己的个性,可以像人类一样交谈、行动、表达情感、甚至学习,可以灵活应对真人的不同态度,互动记忆严格保密。从服务领域来看,Neon可以充当老师,财务顾问,临床医生,礼宾,演员,发言人或电视主播。

  Neon主要包含三个产品:Neon view、Frame、Studio.Neon View主要应用到手机中,支持视频聊天形式,使Neon能够以更加动态、智能的方式回答人类。Neon Frame旨在打造Neon的形象,主要专注于互动服务。Neon Studio则可以输出任何编入的程序,比如不同的语言和不同的情绪应对模式,并结合完整的表情来配合。用户和企业应用Neon 的所有记录都将保密。

  从技术来看,Neon由三星专有技术平台CORE R3和SPECTRA支持。CORE R3通过计算创建栩栩如生的虚拟人,并凭借不到几毫秒的延迟,使Neon可以实时做出反应。同时,CORE R3平台可以与其他的专业或增值服务的系统进行连接。而三星仍处于开发阶段的SPECTRA,则将在智能、学习、情感和记忆方面完善CORE R3,从而使Neon能够进一步完全沉浸其中。

  在偶像行业本身就相当成熟的韩国,各广告公司和娱乐公司也进行了虚拟偶像的布局。比如,在韩国尚未有虚拟模特先例的情况下,Sidus Studio X团队凭借其广告业务与技术背景和对本土市场的判断率先入局。

  制作技术方面,韩国主流虚拟人技术分为CG和AI两种路线,虚拟模特Lucy、虚拟偶像Eternity等皆采用AI技术或Deepfake打造,而拥有电影制作技术的Sidus则采用CG技术为主。

  Sidus-X是韩国3D影像企业LOCUS的子公司,去年八月推出韩国第一虚拟模特Rozy,目前以虚拟广告模特和Instagram红人的身份活动。在人设上,Rozy的人设是一位22岁“ENFP”女性,爱好关注环保、瑜伽、时尚、旅行等话题,目前Ins粉丝数为10万+。作为韩国头部虚拟模特,Rozy的打造手法与世界顶流Miquela相似,都建立网红形象,进而引流至品牌代言,扩展多领域可能性。

  技术方面,其制作公司Sidus利用母公司LOCUS的CG或VFX技术为其赋能,并在此基础上进行案例研究。Rozy便是以计算机绘图技术(CG)进行开发的,即以真人为对象拍摄后,通过CG将平面上绘制的Rozy脸部进行3D建模。鉴于真人脸部移动时骨骼和皮肤会一起运动,同时眼睛的眨动会带动其周边骨骼和神经的移动,为确保逼真度,Sidus在贴图工序中还植入皮肤、骨骼、神经网络等。

  在营运模式上,其运营公司为保证Rozy的Instagram帖子点赞数和评论数,设置了一个专业化的团队在社交平台上扮演Rozy与粉丝“沟通”。在模特事业方面,2021年4月27日,Rozy签约韩国顶级模特经纪公司Esteem。这也意味着Esteem将与Sidus共同管理Rozy的经纪业务。而随着该合约的签署,未来Rozy将进一步扩大活动领域,尝试歌手和演员的身份。

  在商业价值方面,Rozy所属公司Sidus-X以社交平台为营销中心,主攻广告代言这一变现来源。Rozy已与多家企业签订广告合同和赞助,包括Banyantree酒店、新韩生活、GucciX三星电子等,签订专属合约8件,关联赞助商品超过100件。据Sidus-X代表白承烨透露,截止2021年末Rozy将获得10亿韩元以上收益。

  Sidus StudioX也计划以Rozy在社交媒体上的声量为立足点,以技术和营销能力为基础,打造更多虚拟模特,创造各种虚拟人内容。短期计划上,Sidus除推出更多虚拟模特IP,扩展合作品牌方,还在策划3人组虚拟偶像男团。从长远发展来看,Sidus意在于元宇宙世界中成为“第一虚拟娱乐集团”。

  DOB Studio是韩国一家AI技术开发初创公司,利用AI脸部数据分析技术,推出虚拟歌手Rui,在Youtube频道RuiCovery上传翻唱视频。

  在人物设定上, Rui的脸部数据来源于多位偶像练习生,因此在性格上也继承了练习生们喜欢唱歌的特性。除此之外,Rui还关注儿童虐待话题,也因此Rui成为了韩国新生命福利财团的数字宣传大使。

  在商业模式上,除歌手事业外,Rui还进军了模特与时尚领域。如在2021年8月,Rui与CJ Onstyle针对MZ世代顾客,合作推出了时装品牌“the edge”。目前Rui在Youtube有3.05万订阅者。

  Eternity是AI图像企业Pulse9在2021年3月推出的虚拟偶像女团。Eternity也有自己特定的人物设定:原本在一颗与地球有平行时间的星球AIA上生活,但作为AIA能量源的“红花”即将耗尽,为寻找解决方法,Eternity来到地球并尝试与与人类沟通。不一样的人物设定给未来虚拟IP的打造提供了更多想象空间。

  在技术上,11位Eternity成员的形象都由Pulse9的Deep Real AI服务生成。在商业模式上,Eternity主要以发行单曲为主。目前,Eternity两首歌曲《Im Real》和《No Filter》MV在Youtube观看量分别为86万和180万。在未来规划上,据Eternity官网,今后Eternity11位成员会以全体或小分队形式活动,并在歌手之外,还计划成为Youtuber和网络红人。

  韩国娱乐公司主打艺人Avatar。四大传统娱乐社中,SM最先布局新技术领域,为推出虚实结合的女团aespa铺垫。2017年和2019年,韩国顶级偶像公司SM分别与美国AI初创企业obEN、Intel工作室合作,开展AI与艺人IP集合的新内容代理业务,并推出男团NCT127《Superhuman》的360度舞台。

  在技术布局背景下,SM推出了由四位真人成员和各自虚拟形象组成的新女团Aespa。现实世界艺人通过数字世界以AI Brain与avatar交流。在舞台表演上,四位成员的avatar有时会融入Aespa舞台,形成八人女团的表演。同时,JYP、YG、HYBE三大社对虚拟社交平台Zepeto的运营公司Naver Z投资共170亿韩元,展开艺人虚拟形象和虚拟粉丝见面会等合作。

  在虚拟偶像领域,韩国企业的打法各不相同,传统偶像公司偏向打造真人偶像的虚拟分身,作为现有艺人IP的衍生,让艺人的虚拟形象依附于现实艺人为其创造更多价值,并没有孵化纯虚拟艺人IP的动作;而技术背景公司推出的虚拟偶像则意图复刻Kpop偶像打造模式,以“零丑闻”为优势,在Kpop偶像市场分一杯羹。

  国内虚拟人类型更加多元化,应用场景更丰富,在触达用户的广度上更具优势。目前虚拟数字人行业处于孵化培育阶段,但其发展速度较快,市场一片火热。从细分市场看,国虚拟偶像产业逐渐走入发展的高峰期,在群众娱乐需求持续增长以及网络和影像音频技术不断迭代的环境下,虚拟偶像及虚拟IP等方向发展迅速,2020年核心产业规模达到34.6亿。服务型虚拟数字人主要以替代真人服务方式为主,主要落地于虚拟直播,虚拟客服能场景,近期也进一步推进在游戏、金融、文旅、教育、智能服务等场景的应用,未来有望多点开花。拥有深厚技术壁垒的互联网巨头加快脚步布局虚拟人市场,如、网易,以及投资于ObEN、并宣布数智人项目打造数字员工的腾讯。

  本质上讲,目前国内的虚拟人公司大多是传统的AI公司,并在虚拟人赛道上以文娱服务领域的虚拟人起家,如虚拟主持人等。随着AYAYI和柳夜熙等虚拟偶像的成功,国内文娱类虚拟人公司也逐渐更加关注虚拟偶像IP这一赛道,并有利用该IP打造属于自己的“生态宇宙”的趋势,比如柳夜熙的制作公司次世文化。同时,在逐步完善直播运用方案、IP运营,也会逐渐向其他领域拓展。

  而在技术上,目前国内也有部分技术能力较强的科技公司正在打造自己的虚拟人平台和引擎,如中科深智、科大讯飞和黑镜科技等。同时国内部分公司已经意识到自己在虚拟人动作细腻程度上、外貌逼真度等方面略微落后于海外,这些不足也有望成为未来国内虚拟人技术公司重点攻破的对象。

  从以上国内外虚拟人公司的情况来看,国内外在技术、细分市场、商业模式等方面存在较大差异。这种差异除了有技术本身的限制和商业侧重的不同,也与各地区的思想文化、文娱产业链以及消费习惯有关。同时,我国直播业态兴起、互联网元素复杂、人口基数大等多方面因素也造成下游应用端的差别。

  技术层面:海外底层技术相对发展较快,在CG、驱动等方面更具优势,可以打造出更逼真的虚拟人。欧美在技术上更多采用的是高保真+技术驱动的思路。具体来看,海外公司大多追求真实性,因此也更偏向于结合光场技术进行线建模,比如Omniverse制作的“以假乱真”的黄旭仁。并且,欧美技术巨头的驱动技术也使得虚拟人肌肉与骨骼的细节驱动效果更好,更加高度还原了人体的运动状况。

  除了技术上,这种差异也可能来源于国内审美对风格化,造型出彩的倾向性,以及对虚拟偶像市场的着重关注。

  细分市场:1)国内外目前的共同市场是自动生成虚拟内容,但由于在外表细节、预设模板、配套系统等方面的差异,国外在该细分市场具有较为明显的产品和客户优势。2)应用端,国内以及亚太区更加注重风格化和专业服务领域,比如虚拟主播、虚拟偶像以及虚拟IP运营等;而欧美地区更加全方位发展,除此之外,也着重于虚拟人提供专业服务应用场景,强调对人的情感关怀。

  商业模式:国外更为标准化,会提供大量预设的虚拟数字人形象,并提供更为丰富的音色、模板等。国内提供相对有限,部分厂商会基于用户需求进行特定设计,定制化项目占比较高;国外的交付以特定虚拟数字人为主,会在客户方完成训练与迭代,国内以内容交付为主

  尽管短期内,基于技术、商业侧重和文化的影响,这种差异性或将持续,各地公司会在不同赛道上发展细分市场,但长期来看,由于数字虚拟人本质的共通,海内外各国可能会出现加速融合的趋势。

  虚拟人可以替代真人进行服务,降低了对真人表演的需求,减少了标准化内容的制作成本,提升效率和质量。在企业飞速发展的今天,业务的快速更迭使得服务类人力培养成本升高,培养难度增加,服务质量参差不齐。而5G时代下客户群体对内容的需求逐渐由图文转向视频形式,传统信息交互模式下信息传递质量较低。

  虚拟人可以代替真人,应用在一些不可能的场景中。虚拟人可以打破时间和空间上的限制,在应用场景上有更多选择。

  虚拟人具有“拟人化”优势,提供更多的关怀感和真实感。基于真人形象的虚拟人,能够跟用户建立起共情,增强用户信任感和安全感,能够在通用场景或特定关怀类场景中提供顾问、关怀、陪伴、事务处理等服务。

  虚拟数字人内容生产平台逐渐丰富,使用者只需将需要播报的内容输入平台,选择主持人相关参数后,即可快速生成相关播报视频。海外方面,以Hour one和Synthesia为代表的的内容平台,配有不同虚拟形象和多个标准化模板,支持虚拟内容自动生成,比如根据文本,自动生成虚拟数字人的视频。国内厂商以、相芯科技、火山引擎为代表的,发布以新闻播报为主要场景的内容平台产品。内容生产平台的成熟,进一步降低了应用门槛。

  以虚拟直播为例,虚拟直播由于没有时长限制、成本可控,价格等优势,是目前最成熟,成功商业化的场景。随着电商直播的需求旺盛,虚拟人在各大电商平台的应用越加广泛,虚拟主播可以实现与观众AI交互,进行7*24小时不间断直播,节省人力成本,扩大直播销售额。国内市场竞争激烈,部分厂商开始提供一站式服务,随着应用成熟,虚拟直播的使用门槛和价格门槛大幅下降,价格已经从数万级下降至数千级。

  虚拟客服在现实中通过一体化大屏等终端进行交互服务,在线上通过App更好的服务客户。减少企业人力成本。由于客服场景相对明确和规范化的服务需求和业务流程,在现有技术的限制下,成为理想的虚拟人落地场景。京东打造的虚拟“数字人”客服已开启内测,积极探寻人机交互新模式,24小时不间断工作,降低了重复性工作的时间和人力成本。

  2021年6月,腾讯互娱旗下NExT Studios与新华社联合打造了首位数字记者“小诤”,在神州十二号载人飞船执行任务期间向观众介绍了空间站内设、航天员生活等。相较于通过专业训练培养一名真人记者进入空间站,虚拟人的外部限制和所需投入更少,且能与数字内容和场景有机结合,例如小诤在视频中的新华社“火星分社”向观众展示火星样貌。未来在一些真人难以实现或实现成本极高的场景下,虚拟人或能成为替代解决方案。

  虚拟人还可以打破在空间上的限制,未来有可能与购物场景结合落地,和VR/AR技术一起打造真实购物场景,让消费者获得与线下一致的购物体验亦或是超越线下的购物体验。

  以汽车购物场景为例,零售企业可以通过光场技术快速创建复杂的线D逼真视图。例如,VR全景虚拟看车的应用,给客户一个新颖的网上360度全景试驾体验。结合VR全景技术搭建汽车三维互动展示系统,将汽车进行3D环拍精细重建,360度细致还原汽车细节。客户通过鼠标操作能随意放大缩小任何角落,体验开关车门、开关车灯,切换车身颜色等,丰富的交互功能,让客户在家也能体验新车观看的愉悦感,此外,还能够搭配虚拟主持人讲解提高销售商的形象及专业,增加客户信服度及订购意向。在汽车展示方面,虚拟看车能够更好的突出汽车的设计理念和特色,相对于传统的销售人员的介绍,VR体验更能真切解释汽车的性能,比如说在虚拟场景中展示不同路况驾驶车辆的不同效果、应对冰雪天气有什么特殊技能等,都是现实看车中无法体验和感受的,将优点极大的展示给客户,能够在起到宣传作用的同时提高销售率。在选车方面,顾客可以带上VR设备,进入到虚拟场景中,选择车内部不同的座椅皮质颜色、内饰款式、车载音响等很多可以改变的东西,挑选自己心仪的样式,打造属于自己的专属汽车未来通过虚拟现实技术的进一步发展,有望通过创造虚拟人形。

下一篇:互相入股对方子公司 博瑞传播与哔哩哔哩“亲上加亲”
上一篇:兴业银行荣膺“2021中国年度银行”大奖
返回顶部小火箭