基于图生视频的能力,用户只需上传一张图片,并简短描述希望画面如何运动、镜头如何调度等,混元即可按要求让图片动起来, 变成 5 秒的短视频,还能自动配上背景音效 。此外,上传一张人物图片,并输入希望“对口型”的文字或音频,图片中的人物即可“说话”或“唱歌”;使用“动作驱动”能力,还能一键生成同款跳舞视频。
3月6日,腾讯混元宣布发布图生视频模型并对外开源,同时上线对口型与动作驱动等玩法,并支持生成背景音效及2K高质量视频。 据介绍,基于图生 ...
2025年4月2日,字节跳动旗下的AI图像生成平台“即梦”正式启动了令人期待的3.0版本灰度测试,标志着AI图像生成技术迈入新的纪元。此次升级突破了三大核心领域:影视级画质、更精确的文字控制、以及直接生成2K高清图像,带来了前所未有的用户体验。