昆仑万维旗下skywork ai正式开源其自主研发的视频生成大模型——skyreels-v3。
据官方介绍,该模型是一套先进的多模态视频生成系列,统一架构下原生支持三大关键功能:参考图像生成视频(Reference Images-to-Video)、视频时序延展(Video Extension)以及音频驱动虚拟人(Talking Avatar),兼顾高保真度与强可控性。
- 参考图像生成视频:仅需输入1至4张参考图及文本描述,即可生成画面连贯、动态自然的视频,精准复现原始图像中的人物身份、姿态、构图与风格细节;
- 视频时序延展:可对已有视频片段进行时间维度上的无缝延伸与叙事拓展,既支持单镜头平滑延长时间轴,也内置五种专业级电影转场逻辑,实现多镜头智能切换;
- 音频驱动虚拟人:基于单张人物肖像图与语音输入,自动生成唇形、表情、神态与语音高度同步的“数字人”视频,兼容长时长输出及多角色协同对话场景。

值得一提的是,上述三项能力以模块化形式解耦设计,各模块均经过深度调优,既可独立调用,亦支持按需组合使用。Skywork AI团队依托企业级数据清洗流程、毫秒级推理优化技术及高效稳定的大规模训练框架,在生成质量、响应速度与部署成本之间实现卓越平衡,多项核心评测指标已比肩甚至超越当前业界顶尖方案。

GitHub 开源地址:https://www.php.cn/link/2ea3bbe4bd6170e7d1439523953dd068
API 接口(限时免费体验):https://www.php.cn/link/4337f7ca32a4a36b744e31b93244e926










