在使用 1.13.0 版本进行 LoHa 训练时,发现 GPU 占用率相比 1.12.0 版本有明显下降。 在 1.12.0 版本中,显卡可以稳定保持在 99% 的满载状态; 更新到 1.13.0 版本后,使用相同的参数和数据集,GPU 占用率出现波动(锯齿状),平均只有 90% 左右(甚至更低),无法跑满。 <img width="339" height="104" alt="Image" src="https://github.com/user-attachments/assets/812a928c-07d2-45ce-8786-5336411001ca" /> <img width="360" height="108" alt="Image" src="https://github.com/user-attachments/assets/2d06d4e2-b35b-4eec-9310-fe403df27640" />
在使用 1.13.0 版本进行 LoHa 训练时,发现 GPU 占用率相比 1.12.0 版本有明显下降。
在 1.12.0 版本中,显卡可以稳定保持在 99% 的满载状态;
更新到 1.13.0 版本后,使用相同的参数和数据集,GPU 占用率出现波动(锯齿状),平均只有 90% 左右(甚至更低),无法跑满。