Ryo's Blog
  • Articles
  • Learn from AI
  • Tags
  • More
  • ...
#杂技#Blog#杂谈#C++#Python#数据结构#算法#排序#算法竞赛#设计模式#笔记#GitHub#AWS#CI/CD#IaC#DevOps#VSCode#Hexo#JavaScript#Kubernetes#Docker#Cloud Native#Cursor#可视化#数学#工具#Nextjs#Tag1#Tag2#单行Tag#Tag#Tag/Tag2#Tag3#Linux#systemctl#journalctl#timedatectl#BasicKnowledge#Operation#Signal#memory#schedule#Cloud Computing#PyTorch#ONNX#深度学习#模型部署#学习笔记#OpenCV#图像处理#Rust#编程语言#Windows#macOS#可执行文件#LoRA#参数高效微调#模型训练#反向传播#自动微分#GoLang#Memory Management#Deep Learning#Model Management#Neural Networks#ResNet#Mathematics#协议#IoT#物联网#消息队列#Stable Diffusion#Concurrency#Scheduler#Goroutine#test#wiki#page1#subpage1#page2#subpage2#subpage3#subpage34#page3
PyTorch 实现 Stable Diffusion LoRA 训练脚本:从数据预处理到模型修改与训练循环
2025-03-29

> 本文详细介绍了如何使用 PyTorch 从零开始编写 Stable Diffusion LoRA 训练脚本,包括数据预处理、模型修改、训练循环、参数保存与加载等关键步骤。特别强调了 LoRA 层的手动实现和在 UNet 的 Cross-Attention 层注入 LoRA 的原因,以及在其他层应用 LoRA 的可能性和注意事项。此外,还提供了代码示例和参数效率的讨论,帮助读者深入理解 LoRA 在 Stable Diffusion 微调中的应用。

> [!reasoning]-

>

#深度学习#Stable Diffusion#LoRA#参数高效微调#模型训练#学习笔记
Stable Diffusion UNet 内部结构
2025-03-28

> [!summary]

> 以下内容为 Cursor 中拥有 codebase 上下文的情况下与 claude-3.7-sonnet 的对话记录

在 `train_text_to_image_lora.py` 脚本中,LoRA(Low-Rank Adaptation)通过在模型的特定层中插入低秩矩阵来实现微调。这种方法通过添加两个低秩矩阵来调整模型的权重,而不改变原始权重,从而实现参数高效的微调。

#深度学习#Stable Diffusion#LoRA#参数高效微调#模型训练#学习笔记
PyTorch 自动微分与反向传播机制原理解析
2025-03-06

> 本文为用户与 DeepSeek 的问答。主题为 PyTorch 的反向传播机制。本文从数学原理、计算图机制和实际需求三个方面深入解释其工作原理,并结合 PyTorch 的自动微分(Autograd)系统进行说明。

> [!query]

>

#PyTorch#深度学习#反向传播#自动微分#学习笔记
LoRA微调中的矩阵初始化策略:A随机与B零初始化
2025-03-05

> 本文是与 Deepseek-R1 模型+Search 的对话记录,详细探讨了 LoRA(低秩适应)微调技术中矩阵初始化策略的数学原理。文章分析了为什么在 LoRA 中矩阵 A 采用随机初始化而矩阵 B 采用零初始化的原因,包括保持初始模型稳定性、确保梯度更新有效性、实现逐步学习的低秩更新等方面。同时,文章也解释了为什么反向初始化策略(B随机而A为零)在理论上存在问题,会导致梯度消失和训练效率下降。这些分析有助于理解深度学习中参数高效微调技术的设计原理。

> [!reasoning]-

> 嗯,这个问题是关于LoRA(低秩适应)初始化的。为什么在初始化的时候,矩阵A是随机初始化的,而矩阵B是零初始化的呢?我需要仔细思考一下。

#深度学习#LoRA#参数高效微调#模型训练#学习笔记
深度学习模型文件格式对比:pth、safetensor 与 onnx
2024-11-29

> 本页面介绍了三种机器学习模型文件格式:.pth、.safetensor 和 .onnx。主要内容包括每种格式的定义、保存的内容、用途以及它们之间的区别和转换方法。

PyTorch 中的`.pth`文件通常用于保存模型的权重(parameters)和训练过程中的优化器状态(optimizer state)。具体来说,一个`.pth`文件可能包含以下内容:

1. **模型状态字典(Model state dictionary)**:

#PyTorch#ONNX#深度学习#模型部署#学习笔记
© 2023 Ryo Jerry Yu. All rights reserved.