Skip to content

Travor278/EI-learning-notes

Repository files navigation

具身智能入门学习笔记

中文版本 | English Version

本仓库是我学习具身智能/人形机器人方向的个人笔记与练习记录,内容涵盖仿真环境搭建、强化学习、模仿学习等方向。

入门基础

  • 会用 ChatGPT/DeepSeek 和 Google
  • 会用 Linux
    • linux指令.txt:Linux 常用指令备忘录,包含文件操作、进程管理、GPU 监控、训练日志等
  • 会用 Git 和 GitHub

任务一:基于传统运动学的机械臂物体抓取

任务一

学习传统机器人学中的基础知识,比如基础坐标变换、正逆运动学、动力学、控制理论等,在 PyBullet/Mujoco 仿真中实现基于传统运动控制的机械臂物体抓取。

参考资料:

对应当前仓库内容

  • Robotics_NTU/
    • 台大《机器人学》课堂笔记整理及配套可视化
  • EI_Mujoco/hello_mujoco.py
    • MuJoCo 入门练习:创建简单场景、加载物理模型、运行仿真循环

任务二:基于强化学习的机械臂物体抓取

任务二

  1. 学习强化学习基础,在 Gymnasium(OpenAI Gym 的后续维护版本)环境中按推荐顺序训练并测试;
  2. 在 PyBullet/Mujoco 中训练机械臂抓取策略,体会 Sim2Real 过程。

参考资料:

对应当前仓库内容

  • RL_Basics/
    • 强化学习基础学习路线与笔记入口:先理解 MDP、Bellman、MC/TD、Q-learning、Policy Gradient、Actor-Critic
  • Gymnasium_Basics/
    • Gymnasium 入门任务路线,按推荐顺序推进:FrozenLake-v1 -> CartPole-v1 -> Pendulum-v1 -> LunarLander-v3
  • Gymnasium_Robotics/
    • 机器人强化学习任务路线:FetchReach-v3 -> FetchPush-v3 -> FetchPickAndPlace-v3
  • Robot_Grasping_RL/
    • 自定义机械臂抓取任务规划:观测设计、动作空间、奖励函数、训练阶段拆分、Sim2Real 检查项
  • EI_Mujoco/hello_mujoco.py
    • MuJoCo 仿真起点,后续可扩展为自定义机械臂抓取环境

推荐完成顺序:

  • RL_Basics -> Gymnasium_Basics -> Gymnasium_Robotics -> Robot_Grasping_RL

任务三:基于模仿学习的机械臂物体抓取

任务三

  1. 复现模仿学习经典 baseline:Diffusion Policy
  2. 学习 HuggingFace 机器人学习框架 LeRobot

任务四:基于 VLA 大模型的机械臂物体抓取

任务四

学习并利用现有 VLA 大模型(OpenVLA / Pi / GR00T 等),探索用开源数据集训练专用 VLA 模型。

参考资料:

任务五:基于 LLM/VLM 大模型的任务规划

任务五a

  • 桌面级任务规划

任务五b

  • 场景级任务规划
    • 配置仿真环境,跑通 baseline;
    • 设计 ICL 或 CoT 方法提升具身规划效果。

可选仿真环境/Benchmark:

参考论文:

任务六:基于强化学习的人形机器人运动控制

任务六

复现 OmniH2O 的人形机器人运动控制方法,学习仿真训练与 Sim2Real 流程。

参考资料:

前沿研究

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors