LoRA | Ryo's Blog

PyTorch 实现 Stable Diffusion LoRA 训练脚本：从数据预处理到模型修改与训练循环

2025-03-29

> 本文详细介绍了如何使用 PyTorch 从零开始编写 Stable Diffusion LoRA 训练脚本，包括数据预处理、模型修改、训练循环、参数保存与加载等关键步骤。特别强调了 LoRA 层的手动实现和在 UNet 的 Cross-Attention 层注入 LoRA 的原因，以及在其他层应用 LoRA 的可能性和注意事项。此外，还提供了代码示例和参数效率的讨论，帮助读者深入理解 LoRA 在 Stable Diffusion 微调中的应用。

> [!reasoning]-

>

#深度学习 #Stable Diffusion #LoRA #参数高效微调 #模型训练 #学习笔记

Stable Diffusion UNet 内部结构

2025-03-28

> [!summary]

> 以下内容为 Cursor 中拥有 codebase 上下文的情况下与 claude-3.7-sonnet 的对话记录

在 `train_text_to_image_lora.py` 脚本中，LoRA（Low-Rank Adaptation）通过在模型的特定层中插入低秩矩阵来实现微调。这种方法通过添加两个低秩矩阵来调整模型的权重，而不改变原始权重，从而实现参数高效的微调。

#深度学习 #Stable Diffusion #LoRA #参数高效微调 #模型训练 #学习笔记

LoRA微调中的矩阵初始化策略：A随机与B零初始化

2025-03-05

> 本文是与 Deepseek-R1 模型+Search 的对话记录，详细探讨了 LoRA（低秩适应）微调技术中矩阵初始化策略的数学原理。文章分析了为什么在 LoRA 中矩阵 A 采用随机初始化而矩阵 B 采用零初始化的原因，包括保持初始模型稳定性、确保梯度更新有效性、实现逐步学习的低秩更新等方面。同时，文章也解释了为什么反向初始化策略（B随机而A为零）在理论上存在问题，会导致梯度消失和训练效率下降。这些分析有助于理解深度学习中参数高效微调技术的设计原理。

> [!reasoning]-

> 嗯，这个问题是关于LoRA（低秩适应）初始化的。为什么在初始化的时候，矩阵A是随机初始化的，而矩阵B是零初始化的呢？我需要仔细思考一下。

#深度学习 #LoRA #参数高效微调 #模型训练 #学习笔记