Yiyu Qiu

Undergraduate Student
Shanghai Jiao Tong University
3500063778@sjtu.edu.cn

About Me

我是上海交通大学IEEE试点班计算机科学与技术专业的大三学生。我的研究兴趣集中在生成式AI和机械学习领域,特别是扩散模型(Diffusion Models)的理论与应用。

在过去两年中,我积累了从工程实践到科研创新的多元化经验:

🔬 科研经历: 深入研究Diffusion Models和Classifier-Free Guidance(CFG),具有CIFAR-10、CelebA-64、MNIST等数据集的实际训练经验
🛠️ 工程实践: 参与RAG，知识图谱相关后端搜索系统的工程化实现与优化
💡 创新项目: 完成多个具有挑战性的课程项目,涵盖智能Agent、大语言模型优化、全栈开发等方向

目前,我正在准备一篇关于Diffusion Models的科研论文(投稿中),并计划总结技术博客分享扩散模型的理论与工程化经验。

Research Interests

Generative AI: Diffusion Models, Classifier-Free Guidance (CFG), Image Synthesis
Reinforcement Learning: Multi-Armed Bandits, Agent-based Systems
Machine Learning Systems: RAG Architecture, Model Training Optimization
Natural Language Processing: Large Language Model Optimization

News

[2025.09-2026.01] 完成基于Pythia-2.8B的StreamingLLM优化项目
[2025.09-2026.01] 完成智能台球Agent系统开发
[2025.01-2025.04] 参与基于混合搜索的知识问答后端工程化项目
[2024.07-2025.01] 参与文档版式识别技术研究工程化项目

Publications

论文投稿中...

Blog Posts

Diffusion Models 知识梳理2：DDPM

2025年03月04日

Part2 DDPM
阅读全文 →
VAE代码实践与原理解析

2025年03月03日

引言在上一篇博客中，我们详细梳理了变分自编码器（VAE）的理论基础。本篇博客将通过 PyTorch 实现一个简单的 VAE，并结合代码逐步解析其背后的数学原理，帮助大家更好地理解 VAE 的...
阅读全文 →
Diffusion Models 知识梳理1：VAE

2025年03月02日

Part1 从 VAE 到扩散模型 1.0 快速理解 VAE的本质类似于把图片展平后（可以看做一个维度非常大的向量，如32*32*3的图（长宽深，第三个通常为rgb）展平就是个约3000...
阅读全文 →

查看所有博客 →

Technical Skills

深度学习框架: PyTorch, TensorFlow
研究方向: Diffusion Models (DDPM, DDIM), CFG, Reinforcement Learning
数据集经验: CIFAR-10, CelebA-64, MNIST
工程技能: RAG架构, 模型训练优化, 全栈开发
编程语言: Python, JavaScript

Selected Projects

智能台球Agent系统

基于PoolTool物理引擎的强化学习Agent

课程项目 - 人工智能理论概论

Code

设计并实现了基于强化学习和贝叶斯优化的台球智能Agent,结合PoolTool物理引擎进行策略优化和决策推理。

StreamingLLM优化研究

Pythia-2.8B模型上的StreamingLLM复现与创新

课程项目 - 自然语言处理

Code Report

在Pythia-2.8B模型上复现StreamingLLM算法,并尝试组合多种优化方案提升长文本处理性能。

本地化12306票务系统

基于Vibe Coding的全栈开发实践

课程项目 - 软件工程

Demo

通过Vibe Coding快速构建本地部署的票务系统,实现完整的前后端交互功能。

Powered by Jekyll and Minimal Light theme.