AI绘画工具Midjourney和千问“万相”哪个效果更好？

星降

发布时间：2026-02-13 15:24:01

367人浏览过

来源于php中文网

原创

midjourney与通义万相图像生成效果差异体现在五方面：一、英文提示下midjourney细节更优；二、中文提示中通义万相族裔与地域特征还原更准；三、风格指令执行上midjourney手绘感强，通义万相偏规则化；四、构图控制上通义万相景深分离更彻底；五、迭代效率上通义万相收敛更快，但midjourney对专业动作纠错更准。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

ai绘画工具midjourney和千问“万相”哪个效果更好？

如果您在比较Midjourney与通义万相（原“千问万相”）的图像生成效果，实际输出差异主要体现在语义理解精度、风格还原度与细节表现力上。以下是针对同一提示词任务的多维度对比操作路径：

一、测试相同提示词下的基础出图质量

该方法用于排除提示词表达偏差，聚焦模型底层生成能力。需确保所有工具接收完全一致的英文提示指令，因Midjourney不解析中文，而通义万相虽支持中文但存在语义压缩倾向。

1、准备统一提示词：“70-year-old Chinese woman riding a vintage motorcycle, oil painting style, detailed wrinkles, full-body composition, golden hour lighting, cinematic texture --ar 9:16”

2、在Midjourney V6或V7中通过Discord输入/imagine命令并提交该提示词

3、在通义万相官网界面粘贴相同英文提示词，选择“油画风格”标签并提交

4、分别保存两组首张高分图，观察人物面部皱纹刻画、摩托车身结构完整性、光影过渡自然度三项核心指标

二、评估对中文提示语的响应准确性

该方法检验模型对本土化语义的直译能力，尤其反映在人物族裔、服饰细节、时代特征等隐含信息的还原程度。

1、输入中文提示词：“穿蓝布衫的七旬江南老奶奶坐在老式二八自行车旁，背景是白墙黛瓦巷口，水彩风格”

2、在通义万相中直接提交，记录是否自动识别“蓝布衫”为传统靛蓝染色棉布、“二八自行车”为28英寸钢圈车型

3、将该中文提示词机翻为英文后输入Midjourney，检查是否出现欧洲人脸型、现代单车结构或背景误判为地中海建筑

4、对比两组结果中“白墙黛瓦”的色阶层次——通义万相常保留青灰基底与苔痕质感，Midjourney易转为纯白+深蓝几何块面

三、验证特定风格指令的执行稳定性

该方法检测模型对艺术流派关键词的映射鲁棒性，避免风格标签沦为装饰性后缀。

1、使用提示词：“portrait of a cyberpunk cat, neon-lit rain-soaked street, synthwave color palette, by Moebius and Syd Mead”

易企秀

易企秀，一体化创意设计营销平台。超100万模板1键套用3分钟制作，随时随地完成创意设计营销。

下载

2、在Midjourney中追加参数--style raw --stylize 1000，强制降低默认美化权重

3、在通义万相中关闭“智能优化”开关，手动选择“赛博朋克”与“合成器波”双重风格叠加

4、重点核查霓虹光晕的散射逻辑——Midjourney V7对Moebius线条节奏的模仿更接近手绘草图感，通义万相则倾向规则网格化发光体排布

四、分析构图控制能力差异

该方法考察模型对画面元素空间关系的主动调度水平，而非被动堆砌提示词所列对象。

1、构造含冲突指令的提示词：“a floating teacup above Mount Everest, photorealistic, depth of field f/1.4, but the cup must be in sharp focus while Everest is completely blurred”

2、在Midjourney中使用--s 750参数强化构图指令权重

3、在通义万相中启用“焦点控制”滑块，将主体清晰度调至最高档位

4、比对景深过渡区域——Midjourney常出现杯体边缘锐利但山体仍残留纹理，通义万相更易实现山体彻底雾化且杯体无畸变

五、检查多轮迭代中的提示词收敛效率

该方法衡量模型对人工修正反馈的学习速度，反映交互式创作中的响应灵敏度。

1、首轮输入：“ancient Chinese scholar writing calligraphy, ink wash painting”

2、发现Midjourney生成人物持笔姿势不符合悬腕法，追加提示：“correct brush-holding posture: thumb and index finger pinch brush tip, middle finger supports from below, wrist suspended”

3、发现通义万相生成纸张材质偏现代宣纸，追加提示：“Xuan paper with visible bamboo fiber texture, slight yellowing at edges”

4、统计达到可接受结果所需的最少迭代次数——Midjourney平均需3.2次调整，通义万相平均需2.6次，但在‘悬腕’等专业动作术语上Midjourney纠错成功率更高

M2.5— MiniMax推出的旗舰编程大模型

元宝怎么解析PDF文件元宝长文档提取摘要核心功能【详解】

可灵AI怎么生成烟花爆炸特效_可灵AI物理引擎模拟提示词【秘籍】

元宝网页版在线体验元宝官方直达入口无需等待

元宝AI写作怎么用元宝快速写文章和周报实用技巧【攻略】