这个仓库用于记录学习大语言模型(Large Language Model,LLM)相关的知识、实践和心得体会。
本项目致力于构建一个完整的大语言模型(LLM)学习体系,从理论基础到实践应用,系统化地记录学习过程和经验总结。
- 深度学习与 NLP 基础知识
- Transformer 架构与核心原理
- 主流大语言模型技术解析
- 实践应用与部署优化
- 前沿技术追踪与研究
- 系统化学习路径:按照难度递进,从基础到进阶规划学习路线
- 实践导向:包含大量实践案例和代码实现
- 前沿追踪:持续更新业界最新技术发展
- 开源分享:汇总优质学习资源,促进知识交流
- 想系统学习 LLM 的开发者
- 对 AI 领域感兴趣的学习者
- 需要应用 LLM 技术的从业者
- 按照知识体系规划的顺序循序渐进学习
- 在 docs 目录查看详细的学习笔记
- 在 experiments 目录获取实践代码
- 在 resources 目录找到相关学习资源
- 定期更新学习笔记和实践心得
- 持续补充优质学习资源
- 跟踪记录最新技术发展
- 优化和完善知识体系
.
├── docs/ # 文档和学习笔记
├── experiments/ # 实验代码和结果
├── resources/ # 相关资源和参考材料
└── README.md # 项目说明
- 深度学习基础
- 神经网络原理
- 反向传播
- 优化算法
- Transformer 架构
- 自注意力机制
- 多头注意力
- 位置编码
- 自然语言处理基础
- 分词技术
- 词向量
- 语言模型基础
- 预训练技术
- 自监督学习
- 预训练目标
- 数据处理和清洗
- 提示工程(Prompt Engineering)
- 提示设计模式
- 上下文学习(In-context Learning)
- 思维链(Chain-of-Thought)
- 参数高效微调(PEFT)
- LoRA
- Prefix Tuning
- P-Tuning
- GPT 系列
- GPT-3/4 原理
- InstructGPT
- ChatGPT
- LLaMA 系列
- LLaMA 1/2
- Alpaca
- Vicuna
- 其他开源模型
- BLOOM
- ChatGLM
- Falcon
- 模型部署
- 量化技术
- 推理优化
- 分布式部署
- 应用开发
- API 集成
- RAG(检索增强生成)
- Agent 开发
- 评估指标
- 性能评估
- 安全性评估
- 偏见检测
- 优化方法
- 提示优化
- 上下文优化
- 输出质量优化
- 隐私保护
- 安全防护
- 伦理准则
- 法律法规