About Me
我是上海交通大学IEEE试点班计算机科学与技术专业的大三学生。我的研究兴趣集中在生成式AI和机械学习领域,特别是扩散模型(Diffusion Models)的理论与应用。
在过去两年中,我积累了从工程实践到科研创新的多元化经验:
- 🔬 科研经历: 深入研究Diffusion Models和Classifier-Free Guidance(CFG),具有CIFAR-10、CelebA-64、MNIST等数据集的实际训练经验
- 🛠️ 工程实践: 参与RAG,知识图谱相关后端搜索系统的工程化实现与优化
- 💡 创新项目: 完成多个具有挑战性的课程项目,涵盖智能Agent、大语言模型优化、全栈开发等方向
目前,我正在准备一篇关于Diffusion Models的科研论文(投稿中),并计划总结技术博客分享扩散模型的理论与工程化经验。
Research Interests
- Generative AI: Diffusion Models, Classifier-Free Guidance (CFG), Image Synthesis
- Reinforcement Learning: Multi-Armed Bandits, Agent-based Systems
- Machine Learning Systems: RAG Architecture, Model Training Optimization
- Natural Language Processing: Large Language Model Optimization
News
- [2025.09-2026.01] 完成基于Pythia-2.8B的StreamingLLM优化项目
- [2025.09-2026.01] 完成智能台球Agent系统开发
- [2025.01-2025.04] 参与基于混合搜索的知识问答后端工程化项目
- [2024.07-2025.01] 参与文档版式识别技术研究工程化项目
Publications
论文投稿中...
Blog Posts
Technical Skills
- 深度学习框架: PyTorch, TensorFlow
- 研究方向: Diffusion Models (DDPM, DDIM), CFG, Reinforcement Learning
- 数据集经验: CIFAR-10, CelebA-64, MNIST
- 工程技能: RAG架构, 模型训练优化, 全栈开发
- 编程语言: Python, JavaScript
Selected Projects
-
基于PoolTool物理引擎的强化学习Agent
课程项目 - 人工智能理论概论
设计并实现了基于强化学习和贝叶斯优化的台球智能Agent,结合PoolTool物理引擎进行策略优化和决策推理。
-
Pythia-2.8B模型上的StreamingLLM复现与创新
课程项目 - 自然语言处理
在Pythia-2.8B模型上复现StreamingLLM算法,并尝试组合多种优化方案提升长文本处理性能。
-
基于Vibe Coding的全栈开发实践
课程项目 - 软件工程
通过Vibe Coding快速构建本地部署的票务系统,实现完整的前后端交互功能。
Powered by Jekyll and Minimal Light theme.