极高的 TPS 很适合 agent 应用,但 2.5B 模型对边缘还是有点吃力了。你们推荐的最低推理配置是多少?是否考虑上线 MinerU API?
极高的 TPS 很适合 agent 应用,但 2.5B 模型对边缘还是有点吃力了。你们推荐的最低推理配置是多少?是否考虑上线 MinerU API?