商汤科技智能产业研究院院长田丰在活动演讲中表示,数字人正在从有颜无智的“CG数字模特”,进化为可提高生产力、驱动创新服务的“拟人服务式AI”,融入数字中国的千行百业,成为数字经济的新交互媒介、新商业智能服务、新政务便民窗口。
从电影中逼真的CG人物,到能够与我们面对面进行互动的智能服务助手,数字人会经历几级进化?
近日,在“中国元宇宙发展高峰论坛”上,商汤科技联合增强现实核心技术产业联盟(CARA)共同发布AI数字人白皮书——《企业级AI数字人数字经济发展“新动能”》,定义数字人的发展五阶段。
商汤科技智能产业研究院院长田丰在活动演讲中表示,数字人正在从有颜无智的“CG数字模特”,进化为可提高生产力、驱动创新服务的“拟人服务式AI”,融入数字中国的千行百业,成为数字经济的新交互媒介、新商业智能服务、新政务便民窗口。
一、从L1到L5,AI数字人阶梯式进化
从形象写实到理解智能,从手工制作到自动生产,整个AI数字人的进化历程,可以划分为五个阶段:
L1级:主要以人工制作为主;
L2级:依靠动捕设备采集表情、肢体等动作,例如电影动画制作;
L3级:可依靠算法驱动口型、表情和动作,例如虚拟化身实时互动;
L4级:实现部分智能化交互,在垂直领域创新服务模式;
L5级:实现完全智能化交互,打造真正的个性化虚拟助手;
达到L4级别,意味着数字人实现了AI仿真动画生成能力与自然语言理解能力的结合。
此时的数字人,可通过学习大量真人会话、语气、表情和动作,根据表达内容生成相应神态和全身动作,输出栩栩如生的拟人效果。同时,结合AI算法在制作流程中的深度融合(AIGC),制作效率也得到了大幅提升。
也只有达到L4或更高级别,AI数字人才能真正走入千行百业,推动生产力变革。
二、“量产”高级别AI数字人,提效百业
作为AI数字人技术领导者,商汤以原创的多模态交互、深度学习和全栈式的AIGC(AIGeneratedContent)技术,构建了智能化生成、智能化驱动和智能化交互三大引擎,打造出“一站式”AI数字人生产流水线,让AI数字人“更聪明、更专业”,并实现“听得懂,看得见,说得出”的人机交互效果。
得益于自动化流水线,商汤已根据行业需求,快速、灵活地创建了诸多不同角色的AI数字人,在文旅、展馆、金融、教育、商超等实体产业中规模化应用。
比如,在上海中共一大纪念馆中,商汤AI数字人担任讲解员,为参会者讲解党史;在广州永旺商城,商汤AI数字人则是导购员,为顾客提供智能的问询服务;在宁波银行上海分行,商汤AI数字人担任大堂经理,提供各类业务咨询和问题回复;在医院场景,AI数字人可以为患者进行分诊导诊,为患者带来有温度的关怀;在智能汽车车舱中,AI数字人还可化身虚拟行车伴侣,为人车交互融入更多情感元素。
伴随技术的发展,AI数字人将不仅局限于我们所看到的人物形象,它也会成为可以通过不断机器学习,突破想象力的AI智能体。
未来,无论在现实世界还是影视、游戏作品中,AI数字人都将无处不在,为我们增添娱乐体验、带来便捷服务、实现效率提升,深刻改变人们的生活和工作方式。