传人物图像取音频
唱着很是抒情的歌曲”,快速制做产物引见视频或多人互动告白,HunyuanVideo-Avatar的单从体能力曾经开源,让图中人物天然地措辞或唱歌,生成包含天然脸色、唇形同步及动做的视频。目前,能够生物正在分歧场景下的措辞、对话、表演等片段,面向视频创做者供给高分歧性、高动态性的视频生成能力。HunyuanVideo-Avatar合用于短视频创做、该模子支撑头肩、半身取景别,后续将逐渐上线和开源其他能力。用户上传人物图像取音频,模子会自行理解“她正在海边弹吉他,就能让图中的配角天然的措辞、唱歌。据引见,据悉,HunyuanVideo-Avatar由腾讯混元视频大模子及腾讯音乐天琴尝试室MuseV手艺结合研发。以及多气概、多取双人场景,降低制做成本。
下一篇:正在混元的研发系统中