OpenAICLI / OpenAI Responses~/.codex/config.toml

只填这些

Base URLhttps://api.tokenmp.cn/v1
API Keysk-tmp-...
模型glm-5.1 / mimo-v2.5-pro
协议OpenAI
配置位置~/.codex/config.toml

直接复制配置

model_provider = "tokenmp"
model = "glm-5.1"
model_context_window = 202752
model_auto_compact_token_limit = 180000
model_max_output_tokens = 131072

[model_providers.tokenmp]
name = "TokenMP"
base_url = "https://api.tokenmp.cn/v1"
wire_api = "responses"
supports_websockets = false
requires_openai_auth = true
codex   -c model_provider="tokenmp"   -c model="glm-5.1"   -c model_context_window=202752   -c model_auto_compact_token_limit=180000

关键参数

Provider
model_providers.<id>.base_url / wire_api

TokenMP 走 /v1 Responses 兼容入口;如果当前网关未启用 WebSocket,应设置 supports_websockets = false。

上下文窗口
model_context_window

覆盖 Codex 对模型上下文窗口的假设;GLM-5.1 可用 202752,MiMo-V2.5-Pro 可用 1048576。

自动压缩
model_auto_compact_token_limit

达到该 token 数附近自动压缩会话;建议设置为上下文窗口的 85%-90%,给工具调用和最终输出留余量。

最大输出
model_max_output_tokens

用于声明/覆盖单次响应输出上限;GLM-5.1 与 MiMo-V2.5-Pro 可按 131072 配置。

模型目录
model_catalog_json

可指向本地 catalog,让 Codex 识别自定义模型元数据;远端 URL 支持情况以当前 Codex CLI 版本为准。

推荐模型

GLM-5.1
上下文 200K(TokenMP 按 202752 配置)
输出 128K(131072)
GLM-5 / GLM-5-Turbo
上下文 200K
输出 128K
MiMo-V2.5-Pro
上下文 1M(常见精确值 1048576)
输出 128K(131072)

验证

codex 能正常创建会话、读取文件并完成一次简单修改建议,即配置成功。

常见坑

  • 点击标题旁的 # 后可直接复制或分享到配置、压缩、验证等具体段落。
  • 如果 Codex 报 unsupported model 或上下文窗口不正确,先检查 model_provider、model 和 model_context_window 是否同级。
  • 如果出现 max output 或 context length 错误,先把 model_auto_compact_token_limit 降到上下文的 85% 左右,再降低单次 max_tokens。
  • 常见排障路径:确认 /v1/responses 可用、API Key 未过期、Panel 中该模型处于 active、余额或 Coding Plan 足够。

参考