需通过LoRA微调实现个人画风学习,包括:一、构建高一致性数据集(30+同作者原图,768×768中心裁切);二、人工强化风格锚点标签;三、Kohya_ss中调优参数(LoRA for Conv2d 3x3,Rank=128等);四、双阶段训练(512→768分辨率渐进);五、结构化验证与负向标签注入。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果您希望让 Stable Diffusion 学会特定的个人画风,而非通用风格或人物形象,则需通过 LoRA 微调技术注入该画风的核心视觉特征。以下是实现该目标的进阶训练步骤:
一、高一致性画风数据集构建
画风训练成败高度依赖输入图像的风格纯度与结构一致性。低杂度、高辨识度的原始素材是模型捕捉笔触、色彩倾向、构图逻辑的前提。
1、严格筛选不少于 30 张原创作品,确保全部出自同一作者之手,且为未压缩、无水印、无后期滤镜的原始输出文件。
2、统一裁切至 768×768 像素(必须为64的整数倍),避免拉伸变形;对非正方形原图采用中心裁切,保留主体结构完整。
3、禁用任何自动增强类预处理(如对比度拉伸、锐化),仅允许使用 bilinear 插值缩放;若存在多尺寸原图,优先保留 1024×1024 及以上分辨率样本并分组处理。
二、语义级打标与风格锚点强化
普通打标器(如 wd14-tagger)难以识别抽象画风特征,需人工介入构建“风格锚点标签”,使模型聚焦于线条密度、色相分布、明暗过渡等不可见维度。
1、运行 wd14-tagger 插件,阈值设为 0.25,启用 deepbooru 模式,生成初始 tag 文件。
2、手动编辑每张图对应的 .txt 标签文件,在自动标签后追加至少三项风格锚点,例如:flat_coloring, thick_contour_line, limited_palette_5_colors, low_saturation_skin_tone。
3、将全部标签文件中重复出现频次低于 3 次的 tag 全部删除,保留高频共性描述,形成最终精简标签集。
三、Kohya_ss GUI 中关键参数调优
Kohya_ss 默认参数面向人物微调,画风训练需针对性调整学习率衰减节奏、梯度累积策略与噪声调度方式,防止风格特征被基础纹理覆盖。
1、在 “Training Parameters” 区域设置:Learning Rate 为 1e-4,Text Encoder 学习率设为 5e-5,启用 “Use Gradient Checkpointing”。
2、在 “Network Settings” 中选择 LoRA 类型为 LoRA for Conv2d 3x3,Rank 设为 128,Alpha 设为 64,确保卷积层权重更新充分。
3、在 “Advanced Settings” 中启用 “Cache Latents to RAM”,勾选 “No Flip Augmentation”,并将 “Max Token Length” 改为 225 以适配长风格描述词。
四、双阶段渐进式训练流程
一次性训练易导致风格漂移或过拟合局部细节,采用先粗后细的两阶段策略可稳定收敛方向并提升泛化能力。
1、第一阶段(基础风格捕获):使用 512×512 分辨率、Batch Size=2、Epoch=10,仅启用 “Low Rank Adaptation” 和 “Network Dropout=0.1”,不启用任何正则化项。
2、第二阶段(细节强化):加载第一阶段产出的 .safetensors 模型,切换至 768×768 分辨率、Batch Size=1、Epoch=5,启用 “Cosine with Warmup” 学习率调度,Warmup Steps 设为 100。
3、在第二阶段中,将所有训练图的 prompt 后缀统一追加固定风格强化短语,例如:style_of_xxx_artist, ink_wash_effect, hand_drawn_texture。
五、训练后风格验证与负向标签注入
模型输出需经结构化验证,确认其真正习得画风逻辑而非简单记忆训练图;负向提示工程可抑制默认模型固有风格干扰。
1、使用固定 seed(如 12345)与统一 prompt(如 “a cat, full body, white background”)生成 9 张图,观察线条粗细、阴影位置、色彩饱和度是否呈现训练集中的统计规律。
2、若发现写实光影或过度平滑渲染,立即在 negative prompt 中加入:photorealistic, realistic lighting, smooth shading, high detail skin texture, photographic grain。
3、将验证图与原始训练图并排比对,重点检查边缘处理方式、色块边界清晰度、留白比例三项指标是否一致;任一指标偏差超 15%,需回退至第二阶段重新训练。










