- Apple Silicon (M1/M2/M3): 8GB RAM+ (推荐 16GB+)
- NVIDIA GPU: 6GB+ VRAM, CUDA 11.8+
- CPU: 16GB RAM+ (不推荐,速度较慢)
- Python 3.9 或更高版本
- macOS 12.3+ (使用 MLX)
- Linux/Windows (使用 PyTorch)
git clone https://github.com/Dajucoder/LLM-Local.git
cd LLM-Localpython -m venv venv
# macOS/Linux
source venv/bin/activate
# Windows
venv\Scripts\activate根据你的硬件选择相应的安装方式:
pip install -r requirements-mlx.txtMLX 是 Apple 专为 Apple Silicon 优化的机器学习框架,性能最佳。
# 首先安装 PyTorch (CUDA 版本)
pip install torch --index-url https://download.pytorch.org/whl/cu118
# 然后安装其他依赖
pip install -r requirements-cuda.txtpip install -r requirements.txt运行设备检测:
python main.py --info这会显示你的硬件信息和推荐的后端。
默认情况下,模型会下载到项目根目录的 models/ 文件夹中。
如果要更改模型存储位置,可以编辑 config/config.yaml:
advanced:
cache_dir: "./models" # 修改为你想要的路径或者设置环境变量:
export HF_HOME=/path/to/your/models如果模型下载速度慢,可以设置镜像:
export HF_ENDPOINT=https://hf-mirror.com或在 ~/.bashrc / ~/.zshrc 中添加:
echo 'export HF_ENDPOINT=https://hf-mirror.com' >> ~/.zshrc
source ~/.zshrcA: MLX 仅支持 Apple Silicon (M1/M2/M3)。如果你使用的是 Intel Mac,请使用 PyTorch。
A: 确保安装的 PyTorch 版本与你的 CUDA 版本匹配:
# 检查 CUDA 版本
nvidia-smi
# 安装对应版本的 PyTorch
# CUDA 11.8
pip install torch --index-url https://download.pytorch.org/whl/cu118
# CUDA 12.1
pip install torch --index-url https://download.pytorch.org/whl/cu121A: 尝试以下方法:
- 使用更小的模型 (如 Qwen2.5-1.5B)
- 使用量化模型 (4-bit/8-bit)
- 减少
max_new_tokens参数
A:
- 设置 HuggingFace 镜像 (见上文)
- 使用已经转换好的 mlx-community 模型
- 手动下载模型到本地目录
安装完成后,查看 使用指南 开始使用!