Skip to content

Fix offload model parsing for namespaced model ids#33

Open
kylezhang wants to merge 1 commit into
Tencent:mainfrom
kylezhang:fix/offload-model-ref
Open

Fix offload model parsing for namespaced model ids#33
kylezhang wants to merge 1 commit into
Tencent:mainfrom
kylezhang:fix/offload-model-ref

Conversation

@kylezhang
Copy link
Copy Markdown

背景

config.offload.model 现在用 split("/", 2)provider/model。遇到这类模型 ID 时:

siliconflow/deepseek-ai/DeepSeek-V4-Flash

实际传给模型服务的 model 会变成 deepseek-ai,后面的 DeepSeek-V4-Flash 被截掉,最终导致接口返回 badRequest。

修改

  • 新增共享的 parseModelRef,只按第一个 / 拆 provider,后面的内容保留为完整 model id。
  • offload.model 本地 LLM 初始化改用同一套解析逻辑。
  • contextWindow 查找也改用同一套解析,避免带命名空间的模型 ID 匹配失败。
  • 保留 clean-context-runner 原有导出,避免影响已有引用。
  • 补充 parser 测试,并更新 offload model 配置说明。

验证

npx vitest run src/utils/model-ref.test.ts
npm run build:plugin
git diff --check

Fixes #24

@Maxwell-Code07
Copy link
Copy Markdown
Collaborator

感谢修复!解决了 #24 的问题,使用统一的 parseModelRef 只在第一个 / 处分割,是处理多层命名空间 modelId 的正确方式。我们会尽快审查,审完后给你反馈。

Thanks! 🙏

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

[Feature] 希望offload modelId兼容 类似 siliconflow/deepseek-ai/DeepSeek-V4-Flash 这样的id

2 participants