本仓库是我学习具身智能/人形机器人方向的个人笔记与练习记录,内容涵盖仿真环境搭建、强化学习、模仿学习等方向。
- 会用 ChatGPT/DeepSeek 和 Google
- 会用 Linux
linux指令.txt:Linux 常用指令备忘录,包含文件操作、进程管理、GPU 监控、训练日志等
- 会用 Git 和 GitHub
学习传统机器人学中的基础知识,比如基础坐标变换、正逆运动学、动力学、控制理论等,在 PyBullet/Mujoco 仿真中实现基于传统运动控制的机械臂物体抓取。
参考资料:
- Introduction to Robotics: Mechanics and Control — Stanford
- Robotic Manipulation — MIT
- PyBullet:https://github.com/bulletphysics/bullet3
- MuJoCo:https://mujoco.org/
- 闯关游戏:https://rcfs.ch/
Robotics_NTU/- 台大《机器人学》课堂笔记整理及配套可视化
EI_Mujoco/hello_mujoco.py- MuJoCo 入门练习:创建简单场景、加载物理模型、运行仿真循环
- 学习强化学习基础,在 Gymnasium(OpenAI Gym 的后续维护版本)环境中按推荐顺序训练并测试;
- 在 PyBullet/Mujoco 中训练机械臂抓取策略,体会 Sim2Real 过程。
参考资料:
- Introduction to Reinforcement Learning, 2nd & David Silver's UCL Course
- UCB CS285 Deep Reinforcement Learning
- Gymnasium:https://gymnasium.farama.org/index.html
RL_Basics/- 强化学习基础学习路线与笔记入口:先理解 MDP、Bellman、MC/TD、Q-learning、Policy Gradient、Actor-Critic
Gymnasium_Basics/- Gymnasium 入门任务路线,按推荐顺序推进:
FrozenLake-v1 -> CartPole-v1 -> Pendulum-v1 -> LunarLander-v3
- Gymnasium 入门任务路线,按推荐顺序推进:
Gymnasium_Robotics/- 机器人强化学习任务路线:
FetchReach-v3 -> FetchPush-v3 -> FetchPickAndPlace-v3
- 机器人强化学习任务路线:
Robot_Grasping_RL/- 自定义机械臂抓取任务规划:观测设计、动作空间、奖励函数、训练阶段拆分、Sim2Real 检查项
EI_Mujoco/hello_mujoco.py- MuJoCo 仿真起点,后续可扩展为自定义机械臂抓取环境
推荐完成顺序:
RL_Basics -> Gymnasium_Basics -> Gymnasium_Robotics -> Robot_Grasping_RL
- 复现模仿学习经典 baseline:Diffusion Policy
- 学习 HuggingFace 机器人学习框架 LeRobot
学习并利用现有 VLA 大模型(OpenVLA / Pi / GR00T 等),探索用开源数据集训练专用 VLA 模型。
参考资料:
- OpenVLA:https://github.com/openvla/openvla
- Pi:https://github.com/Physical-Intelligence/openpi
- GR00T:https://github.com/NVIDIA/Isaac-GR00T
- Open-X Embodiment:https://robotics-transformer-x.github.io/
- Large Models:https://stanford-cs336.github.io/spring2025/
- 桌面级任务规划
- 参考论文 "Code as Policies" (ICRA 2023):https://code-as-policies.github.io/
- 用 Prompt 驱动现有 LLM/VLM 完成任务;
- Finetune 现有 LLM/VLM 完成任务。
- 场景级任务规划
- 配置仿真环境,跑通 baseline;
- 设计 ICL 或 CoT 方法提升具身规划效果。
可选仿真环境/Benchmark:
- EAI:https://github.com/embodied-agent-interface/embodied-agent-interface
- EmbodiedBench:https://github.com/EmbodiedBench/EmbodiedBench
参考论文:
复现 OmniH2O 的人形机器人运动控制方法,学习仿真训练与 Sim2Real 流程。
参考资料:
- Unitree Robotics GitHub:https://github.com/unitreerobotics
- HOVER:https://github.com/NVlabs/HOVER
- Underactuated Robotics — MIT
- 如何做研究
- 会议期刊
- 机器人:Science Robotics, RSS, CoRL, ICRA, IROS, RLC
- 机器学习:ICLR, NeurIPS, ICML
- 计算机视觉:CVPR, ICCV, ECCV
- 自然语言处理:ACL, EMNLP, COLM
- 在线研讨班






