Skip to content

mudi24/llm-learn

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

LLM 学习笔记

这个仓库用于记录学习大语言模型(Large Language Model,LLM)相关的知识、实践和心得体会。

项目简介

项目目标

本项目致力于构建一个完整的大语言模型(LLM)学习体系,从理论基础到实践应用,系统化地记录学习过程和经验总结。

学习范围

  • 深度学习与 NLP 基础知识
  • Transformer 架构与核心原理
  • 主流大语言模型技术解析
  • 实践应用与部署优化
  • 前沿技术追踪与研究

特色亮点

  1. 系统化学习路径:按照难度递进,从基础到进阶规划学习路线
  2. 实践导向:包含大量实践案例和代码实现
  3. 前沿追踪:持续更新业界最新技术发展
  4. 开源分享:汇总优质学习资源,促进知识交流

适用人群

  • 想系统学习 LLM 的开发者
  • 对 AI 领域感兴趣的学习者
  • 需要应用 LLM 技术的从业者

使用指南

  1. 按照知识体系规划的顺序循序渐进学习
  2. 在 docs 目录查看详细的学习笔记
  3. 在 experiments 目录获取实践代码
  4. 在 resources 目录找到相关学习资源

更新计划

  • 定期更新学习笔记和实践心得
  • 持续补充优质学习资源
  • 跟踪记录最新技术发展
  • 优化和完善知识体系

目录结构

.
├── docs/          # 文档和学习笔记
├── experiments/   # 实验代码和结果
├── resources/     # 相关资源和参考材料
└── README.md      # 项目说明

知识体系

1. 基础理论 (重要程度:⭐⭐⭐⭐⭐)

  • 深度学习基础
    • 神经网络原理
    • 反向传播
    • 优化算法
  • Transformer 架构
    • 自注意力机制
    • 多头注意力
    • 位置编码
  • 自然语言处理基础
    • 分词技术
    • 词向量
    • 语言模型基础

2. LLM 核心技术 (重要程度:⭐⭐⭐⭐⭐)

  • 预训练技术
    • 自监督学习
    • 预训练目标
    • 数据处理和清洗
  • 提示工程(Prompt Engineering)
    • 提示设计模式
    • 上下文学习(In-context Learning)
    • 思维链(Chain-of-Thought)
  • 参数高效微调(PEFT)
    • LoRA
    • Prefix Tuning
    • P-Tuning

3. 模型架构 (重要程度:⭐⭐⭐⭐)

  • GPT 系列
    • GPT-3/4 原理
    • InstructGPT
    • ChatGPT
  • LLaMA 系列
    • LLaMA 1/2
    • Alpaca
    • Vicuna
  • 其他开源模型
    • BLOOM
    • ChatGLM
    • Falcon

4. 实践应用 (重要程度:⭐⭐⭐⭐)

  • 模型部署
    • 量化技术
    • 推理优化
    • 分布式部署
  • 应用开发
    • API 集成
    • RAG(检索增强生成)
    • Agent 开发

5. 评估与优化 (重要程度:⭐⭐⭐)

  • 评估指标
    • 性能评估
    • 安全性评估
    • 偏见检测
  • 优化方法
    • 提示优化
    • 上下文优化
    • 输出质量优化

6. 伦理与安全 (重要程度:⭐⭐⭐)

  • 隐私保护
  • 安全防护
  • 伦理准则
  • 法律法规

About

大语言模型(LLM)学习笔记,系统梳理从理论基础到实践应用的完整知识体系,包含 Transformer、预训练、微调等核心技术,以及主流开源模型的实践经验。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors