VAE
DDPM
DDIM
SMLD
SDE/ODE
PyTorch
Part2 DDPM
阅读全文 →
VAE
DDPM
DDIM
SMLD
SDE/ODE
PyTorch
引言
在上一篇博客中,我们详细梳理了变分自编码器(VAE)的理论基础。本篇博客将通过 PyTorch 实现一个简单的 VAE,并结合代码逐步解析其背后的数学原理,帮助大家更好地理解 VAE 的工作机制。
1. 数据准备
我们以经典的 MNIST 数据集为例,使用 PyTorch 的 DataLoader 加载数据:
# --- 数据准备 (MNIST) ---
transform...
阅读全文 →
VAE
DDPM
DDIM
SMLD
SDE/ODE
PyTorch
Part1 从 VAE 到扩散模型
1.0 快速理解
VAE的本质类似于把图片展平后(可以看做一个维度非常大的向量,如32*32*3的图(长宽深,第三个通常为rgb)展平就是个约3000维的向量)后映射(encoder)到一个维度小的向量(隐变量),然后我们再次将小的向量映射(decoder)回到大向量并还原为图片。
补充:隐变量z的要求?
答:出于简单性的考量,我们人为...
阅读全文 →
VAE
DDPM
DDIM
SMLD
SDE/ODE
PyTorch
前言
这是我在研究扩散模型(Diffusion Models)过程中的一些心得总结。本文将以Tutorial on Diffusion Models for Imaging and Vision(arxiv:2403.18103v1)的讲解思路为参考,从理论到实践,系统介绍 Diffusion Models 的核心原理与延伸拓展。
Part0 预备知识
0.1 概率论基础
0.1.1...
阅读全文 →