2026年04月17日 星期五
首页科技 正文
目录

微软 推出VASA-1 AI 框架,可即时生成逼真对口型视频

科技2024-04-22
智者2024年4月22日消息,微软推出VASA-1 AI框架,使用一张真人照片和个人语音音频即可生成逼真对口型视频。该技术克服了以往面部生成技术的局限性,利用扩散Transformer模型训练,将面部动态和头部运动视为单一潜在变量,可即时生成高分辨率、高帧率的视频。微软还利用3D技术辅助标记面部特征,设计损失函数,有效捕捉和重现面部3D结构。...

微软vasa_副本.png

智者2024年4月22日消息,微软推出VASA-1 AI框架,使用一张真人照片和个人语音音频即可生成逼真对口型视频。

该技术克服了以往面部生成技术的局限性,利用扩散Transformer模型训练,将面部动态和头部运动视为单一潜在变量,可即时生成高分辨率、高帧率的视频。

微软还利用3D技术辅助标记面部特征,设计损失函数,有效捕捉和重现面部3D结构。


标签微软

扫描二维码手机访问

文章目录