万相2.6系列模型已正式上线,针对专业级影视制作与高精度图像创作需求完成全方位能力跃升。
据官方消息,全新发布的万相2.6是国内首个具备角色扮演能力的视频生成模型,全面支持音画精准同步、多镜头智能编排及音频驱动视频生成等进阶功能。目前已在阿里云百炼平台与通义万相官网同步开放使用。

万相2.6视频生成核心升级
- 角色扮演能力: 实现“万物皆可入戏”,模型可深度解析输入视频中人物的外貌特征与声音特质,并依据文本指令生成单人、多人乃至人与物体互动的多样化视频内容。
-
多镜头智能叙事: 支持将简短提示词自动转化为结构清晰的分镜脚本,输出包含多个镜头的连贯叙事视频,并确保角色、场景、光照等关键元素在不同镜头间高度一致。 - 高保真音画同步: 在多人对话类场景中表现稳定,语音自然流畅,声线质感显著增强,同时支持更富感染力的背景音乐与原创歌曲生成。
- 15秒长时序视频生成: 最长可生成15秒视频(参考视频时长为10秒),大幅拓展时空表达维度,助力更完整、更具张力的故事呈现。
-
音频驱动式生成: 用户可输入文本+音频组合,模型据此智能生成匹配节奏与情绪的多镜头演绎视频。

万相2.6文生图能力进阶亮点
艺术风格:美学高度与精准控制并重
- 深度解构艺术语义:对各类风格化关键词理解更透彻,风格还原更忠实,画面整体调性统一、结构完整。
- 多风格有机融合:支持不同艺术流派自然交织,过渡细腻无痕,激发更具原创性的视觉表达。
- 细节表现力跃升:在肌理质感、色彩层次、笔触逻辑等微观层面刻画更精细,赋予图像更强叙事性与艺术感染力。
写实人像:真实感与光影表现双突破
在人像生成任务中,人物表情生动自然、皮肤纹理真实可信,显著降低“AI痕迹”。模型从构图逻辑到光影建模进行联合优化,呈现出更具电影感与人文温度的人像视角。
图文协同生成:面向设计场景的智能生产力工具
支持基于中英文长文本内容,结合专业级视觉设计规范与图文排版逻辑,精准生成宣传海报、信息图表、教学插画、图文报告等多种实用型视觉内容,实现信息传达与美学表达的深度融合。
详情请参阅:https://www.php.cn/link/aab06e3e504518afa70bf9613e7e32e6
当前可通过以下方式体验万相2.6:
✅ 阿里云百炼平台调用API接口
✅ 登录通义万相官网直接试用
https://www.php.cn/link/877638212861256c9cc89c428b96a29e
https://www.php.cn/link/f5995c90359dcd1defe22a90d936fc78
源码获取地址:点击下载










