您好,感谢您优秀的工作!我在运行 run_RL.sh 时没有找到与 reward_kwargs 相关的配置,这导致后续运行出错。不确定论文中使用的奖励策略是否需要额外的设置,想请教是否有相关说明或建议的配置方式?
您好,感谢您优秀的工作!我在运行 run_RL.sh 时没有找到与 reward_kwargs 相关的配置,这导致后续运行出错。不确定论文中使用的奖励策略是否需要额外的设置,想请教是否有相关说明或建议的配置方式?