### Question Category | 问题类别 Usage / How-to | 使用方式咨询 ### Your Question | 你的问题 请问下,训练agent使用的轨迹数据是怎么收集和清洗、给reward打分的? ### Context / Background | 背景信息 _No response_
Question Category | 问题类别
Usage / How-to | 使用方式咨询
Your Question | 你的问题
请问下,训练agent使用的轨迹数据是怎么收集和清洗、给reward打分的?
Context / Background | 背景信息
No response