只需一张静态肖像,一段语音输入,便能自动生成长达一分钟、画质达1080p/48帧的流畅数字人视频——这不再是科幻桥段。近日,快手旗下“可灵AI”正式上线全新功能,标志着其在AI数字人领域的深度布局已进入公测阶段。

这一动作也宣告着,又一家互联网巨头正式加入AI虚拟人赛道的激烈角逐。
事实上,数字人的身影早已悄然渗透进我们的数字生活。从抖音直播间24小时不间断带货的虚拟主播,到京东商城里风格各异的AI导购员,再到百度推出的高拟真交互客服,这些由大模型驱动的“非人类员工”正以前所未有的速度重构内容生产与用户服务的底层逻辑。
那么,这场席卷全行业的技术浪潮,究竟意味着什么?是短暂的技术炫技,还是预示着人机交互方式的根本性变革?当虚拟形象开始拥有情绪、个性甚至创作力,我们是否正在见证一个虚实融合新时代的开启?
01 大厂为何集体押注AI数字人?
从百度到华为,从字节跳动到腾讯,几乎所有科技巨头都在加速布局数字人生态。这股热潮的背后,远不止是追逐风口那么简单。
以今年6月百度优选的一场直播为例:罗永浩的数字人分身携手助手朱萧木的虚拟形象,完成了一场长达7小时的带货直播。数据显示,该场次累计观看人数破130万,GMV高达5500万元,其中三分之一商品销量甚至超越了老罗本人此前的直播表现。
更令人惊叹的是,这位“AI老罗”并非简单复读脚本。他能主动插话、随机抽奖、调侃观众,语言风格和临场反应高度还原真人特质。支撑这一切的,是背后大模型对知识库的1.3万次调用,以及自动生成的9.7万字产品话术——这种持续输出能力,让多数真人主播都难以企及。
再看另一个现象级案例:AI歌手Yuri。这位蓝发挑染、手持骷髅麦克风的虚拟偶像,其首支单曲《SURREAL》从作曲、编曲、演唱到MV制作,全部由AI独立完成。歌曲上线后播放量迅速突破700万,并成功打入日本与北美音乐榜单。她甚至登上了外滩大会的舞台,从容演讲,台风稳健,彻底颠覆了“虚拟人缺乏灵魂”的传统认知。
由此可见,2025年的AI数字人已实现三大跃迁:交互更加自然生动,具备主动对话与情感表达能力;成本大幅压缩,如京东言犀数字人日均成本不足百元,仅为真人主播的十分之一;应用场景空前拓展,覆盖电商、文娱、教育、金融等多个领域。
如今的数字人,早已摆脱“会动的照片”标签。在多模态大模型的赋能下,它们不仅能理解用户意图,还能进行内容创作与情感共鸣,效率与稳定性甚至超越人类。

简而言之,AI数字人正从概念演示走向商业闭环,成为企业降本增效、提升用户体验的关键抓手。谁能在这一轮技术竞赛中抢占先机,谁就有可能握紧通往未来数字世界的入场券。
02 群雄并起,各家技术路线百花齐放
据IDC预测,到2026年,中国AI数字人市场规模将突破百亿大关。艾媒咨询数据则显示,2025年相关产业总规模有望超六千亿元,较2023年翻倍增长。如此广阔的前景,自然引来群雄逐鹿。
百度持续深耕高说服力数字人生态,提出“梦蝶计划”与“繁星计划”,不仅扶持头部主播打造数字分身,更向中小企业免费开放10万个慧播星数字人账号,并投入亿元级补贴,推动普惠化应用。
京东聚焦电商场景,凭借言犀数字人实现“低成本+高转化”模式。其618期间推出的六大行业定制形象,精准匹配不同品类需求,直播转化率提升30%,表现优于八成真人主播。
字节跳动则推出OmniHuman-1.5,通过单图+音频输入生成极具表现力的动态视频,在动作连贯性与表情细腻度上实现突破,为影视、广告等创意行业提供新工具。
华为依托盘古大模型与MetaStudio平台,打造一站式数字人“云工厂”,支持快速克隆形象与声音,已在金融、医疗、文旅等领域落地应用。
此外,腾讯、商汤等企业也在不断加码,推动数字人向更广泛的社会场景渗透。可以预见,掌握数字人核心技术的企业,将在AI时代赢得更多话语权。
03 小结
无论是直播间里的带货达人,还是舞台上的虚拟歌姬,亦或是手机另一端的智能客服,AI数字人都在重新定义“存在”的边界。它不仅是技术集成的成果,更是人类探索数字化生存方式的重要实践。
未来已来,只是尚未均匀分布。而这场关于虚拟与现实融合的旅程,才刚刚启航。

(文中未标注来源的图片均来源于网络)
