OpenAICLI / OpenAI Responses~/.codex/config.toml
只填这些
| Base URL | https://api.tokenmp.cn/v1 |
|---|---|
| API Key | sk-tmp-... |
| 模型 | glm-5.1 / mimo-v2.5-pro |
| 协议 | OpenAI |
| 配置位置 | ~/.codex/config.toml |
直接复制配置
model_provider = "tokenmp"
model = "glm-5.1"
model_context_window = 202752
model_auto_compact_token_limit = 180000
model_max_output_tokens = 131072
[model_providers.tokenmp]
name = "TokenMP"
base_url = "https://api.tokenmp.cn/v1"
wire_api = "responses"
supports_websockets = false
requires_openai_auth = truecodex -c model_provider="tokenmp" -c model="glm-5.1" -c model_context_window=202752 -c model_auto_compact_token_limit=180000关键参数
Provider
model_providers.<id>.base_url / wire_apiTokenMP 走 /v1 Responses 兼容入口;如果当前网关未启用 WebSocket,应设置 supports_websockets = false。
上下文窗口
model_context_window覆盖 Codex 对模型上下文窗口的假设;GLM-5.1 可用 202752,MiMo-V2.5-Pro 可用 1048576。
自动压缩
model_auto_compact_token_limit达到该 token 数附近自动压缩会话;建议设置为上下文窗口的 85%-90%,给工具调用和最终输出留余量。
最大输出
model_max_output_tokens用于声明/覆盖单次响应输出上限;GLM-5.1 与 MiMo-V2.5-Pro 可按 131072 配置。
模型目录
model_catalog_json可指向本地 catalog,让 Codex 识别自定义模型元数据;远端 URL 支持情况以当前 Codex CLI 版本为准。
推荐模型
GLM-5.1
上下文 200K(TokenMP 按 202752 配置)
输出 128K(131072)
输出 128K(131072)
GLM-5 / GLM-5-Turbo
上下文 200K
输出 128K
输出 128K
MiMo-V2.5-Pro
上下文 1M(常见精确值 1048576)
输出 128K(131072)
输出 128K(131072)
验证
codex 能正常创建会话、读取文件并完成一次简单修改建议,即配置成功。
常见坑
- 点击标题旁的 # 后可直接复制或分享到配置、压缩、验证等具体段落。
- 如果 Codex 报 unsupported model 或上下文窗口不正确,先检查 model_provider、model 和 model_context_window 是否同级。
- 如果出现 max output 或 context length 错误,先把 model_auto_compact_token_limit 降到上下文的 85% 左右,再降低单次 max_tokens。
- 常见排障路径:确认 /v1/responses 可用、API Key 未过期、Panel 中该模型处于 active、余额或 Coding Plan 足够。