0

0

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

星夢妙者

星夢妙者

发布时间:2025-01-09 08:19:57

|

455人浏览过

|

来源于php中文网

原创

最近,ai 科技评论发现,国产视频生成模型 open-sora 在开源社区悄悄更新了!

现在单镜头支持长达16秒的视频生成,分辨率最高可达720p,并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频、视频到视频和无限长视频的生成需求。我们来试试效果。

生成个横屏圣诞雪景,发b站:

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

再生成个竖屏,发抖音

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

还能生成单镜头16秒的长视频,这下人人都能过把编剧瘾了:

视频详见:https://mp.weixin.qq.com/s/Z88inagkuFn8svLu788TVQ

怎么玩?指路GitHub:https://github.com/hpcaitech/Open-Sora

更酷的是,Open-Sora 依旧全部开源,包含最新的模型架构、最新的模型权重、多时间/分辨率/长宽比/帧率的训练流程、数据收集和预处理的完整流程、所有的训练细节、demo示例 和 详尽的上手教程。

1、Open-Sora技术报告全面解读

最新功能概览

•支持长视频生成;

•视频生成分辨率最高可达720p;

•单模型支持任何宽高比,不同分辨率和时长的文本到图像、文本到视频、图像到视频、视频到视频和无限长视频的生成需求;

•提出了更稳定的模型架构设计,支持多时间/分辨率/长宽比/帧率训练;

•开源了最新的自动数据处理全流程。

时空扩散模型ST-DiT-2

多阶段训练

根据Open-Sora技术报告指出,Open-Sora采用了一种多阶段训练方法,每个阶段都会基于前一个阶段的权重继续训练。相较于单一阶段训练,这种多阶段训练通过分步骤引入数据,更高效地实现了高质量视频生成的目标。

初始阶段大部分视频采用144p分辨率,同时与图片和 240p,480p 的视频进行混训,训练持续约1周,总步长81k。第二阶段将大部分视频数据分辨率提升至240p和480p,训练时长为1天,步长达到22k。第三阶段进一步增强至480p和720p,训练时长为1天,完成了4k步长的训练。整个多阶段训练流程在约9天内完成,与Open-Sora1.0相比,在多个维度提升了视频生成的质量。

统一的图生视频/视频生视频框架

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

支持图像和视频条件化处理的掩码策略

此外,作者团队还贴心地为推理阶段提供了掩码策略配置的详细指南,五个数字的元组形式在定义掩码策略时提供了极大的灵活性和控制力。

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

掩码策略配置说明

支持多时间/分辨率/长宽比/帧率训练

OpenAI Sora的技术报告[3]指出,使用原始视频的分辨率、长宽比和长度进行训练可以增加采样灵活性,改善帧和构图。对此,作者团队提出了分桶的策略。

具体怎么实现呢?通过深入阅读作者发布的技术报告,我们了解到,所谓的桶,是(分辨率,帧数,长宽比)的三元组。团队为不同分辨率的视频预定义了一系列宽高比,以覆盖大多数常见的视频宽高比类型。在每个训练周期epoch开始之前,他们会对数据集进行重新洗牌,并将样本根据其特征分配到相应的桶中。具体来说,他们会将每个样本放入一个分辨率和帧长度均小于或等于该视频特性的桶中。

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

Open-Sora 分桶策略

数据收集和预处理流程

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

Open-Sora 数据处理流程

2、Open-Sora 性能全方位评测

视频生成效果展示

Open-Sora最令人瞩目的亮点在于,它能够将你脑中的景象,通过文字描述的方式,捕捉并转化为动人的动态视频。那些在思维中一闪而过的画面和想象,现在得以被永久地记录下来,并与他人分享。在这里,笔者尝试了几种不同的prompt,作为抛砖引玉。

比如,笔者尝试生成了一个在冬季森林里游览的视频。雪刚下不久,松树上挂满了皑皑白雪,暗色的松针和洁白的雪花错落有致,层次分明。

又或者,在一个静谧夜晚中,你身处像无数童话里描绘过黑暗的森林,幽深的湖水在漫天璀璨的星河的照耀下波光粼粼。

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

在空中俯瞰繁华岛屿的夜景则更是美丽,温暖的黄色灯光和丝带一样的蓝色海水让人一下子就被拉入度假的悠闲时光里。

会译·对照式翻译
会译·对照式翻译

会译是一款AI智能翻译浏览器插件,支持多语种对照式翻译

下载

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

城市里的车水马龙,深夜依然亮着灯的高楼大厦和街边小店,又有另一番风味。

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

除了风景之外,Open-Sora还能还原各种自然生物。无论是红艳艳的小花:

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

还是慢悠悠扭头的变色龙, Open-Sora都能生成较为真实的视频。

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

笔者还尝试了多种prompt测试,还提供了许多生成的视频供大家参考,包括不同内容,不同分辨率,不同长宽比,不同时长。

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

笔者还发现,仅需一个简洁的指令,Open-Sora便能生成多分辨率的视频短片,彻底打破创作限制。

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

分辨率:16*240p

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

分辨率:32*240p

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

分辨率:64*360p

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

分辨率:480*854p

我们还可以喂给Open-Sora一张静态图片让它生成短片

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

Open-Sora 还可以将两个静态图巧妙地连接起来,轻触下方视频,将带您体验从下午至黄昏的光影变幻,每一帧都是时间的诗篇。

视频详见:https://mp.weixin.qq.com/s/Z88inagkuFn8svLu788TVQ

再比如说我们要对原有视频进行编辑,仅需一个简单的指令,原本明媚的森林便迎来了一场鹅毛大雪。

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

我们也能让Open-Sora 生成高清的图片

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

值得注意的是,Open-Sora的模型权重已经完全免费公开在他们的开源社区上,不妨下载下来试一下。由于他们还支持视频拼接功能,这意味着你完全有机会免费创作出一段带有故事性的小短片,将你的创意带入现实。

权重下载地址:https://github.com/hpcaitech/Open-Sora

当前局限与未来计划

尽管在复现类Sora文生视频模型的工作方面取得了不错的进展,但作者团队也谦逊地指出,当前生成的视频在多个方面仍有待改进:包括生成过程中的噪声问题、时间一致性的缺失、人物生成质量不佳以及美学评分较低。对于这些挑战,作者团队表示,他们将在下一版本的开发中优先解决,以期望达到更高的视频生成标准,感兴趣的朋友不妨持续关注一下。我们期待Open-Sora社区带给我们的下一次惊喜。

开源地址:https://github.com/hpcaitech/Open-Sora

参考文献:

[1] https://github.com/hpcaitech/Open-Sora/blob/main/docs/report_02.md

[2] Tay, Yi, et al. "Ul2: Unifying language learning paradigms." arXiv preprint arXiv:2205.05131(2022).

[3] https://openai.com/research/video-generation-models-as-world-simulators

Open-Sora 全面开源升级:支持单镜头 16s 视频生成和 720p 分辨率

相关专题

更多
github中文官网入口 github中文版官网网页进入
github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started,GitHub 是一种基于云的平台,可在其中存储、共享并与他人一起编写代码。 通过将代码存储在GitHub 上的“存储库”中,你可以: “展示或共享”你的工作。 持续“跟踪和管理”对代码的更改。

244

2026.01.21

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2033

2024.08.16

C++ 高级模板编程与元编程
C++ 高级模板编程与元编程

本专题深入讲解 C++ 中的高级模板编程与元编程技术,涵盖模板特化、SFINAE、模板递归、类型萃取、编译时常量与计算、C++17 的折叠表达式与变长模板参数等。通过多个实际示例,帮助开发者掌握 如何利用 C++ 模板机制编写高效、可扩展的通用代码,并提升代码的灵活性与性能。

10

2026.01.23

php远程文件教程合集
php远程文件教程合集

本专题整合了php远程文件相关教程,阅读专题下面的文章了解更多详细内容。

29

2026.01.22

PHP后端开发相关内容汇总
PHP后端开发相关内容汇总

本专题整合了PHP后端开发相关内容,阅读专题下面的文章了解更多详细内容。

21

2026.01.22

php会话教程合集
php会话教程合集

本专题整合了php会话教程相关合集,阅读专题下面的文章了解更多详细内容。

21

2026.01.22

宝塔PHP8.4相关教程汇总
宝塔PHP8.4相关教程汇总

本专题整合了宝塔PHP8.4相关教程,阅读专题下面的文章了解更多详细内容。

13

2026.01.22

PHP特殊符号教程合集
PHP特殊符号教程合集

本专题整合了PHP特殊符号相关处理方法,阅读专题下面的文章了解更多详细内容。

11

2026.01.22

PHP探针相关教程合集
PHP探针相关教程合集

本专题整合了PHP探针相关教程,阅读专题下面的文章了解更多详细内容。

8

2026.01.22

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 2.9万人学习

Git版本控制工具
Git版本控制工具

共8课时 | 1.5万人学习

Git中文开发手册
Git中文开发手册

共0课时 | 0人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号