OpenAI Codex CLI

OpenAICLI / OpenAI Responses~/.codex/config.toml

只填这些

Base URL	https://api.tokenmp.cn/v1
API Key	sk-tmp-...
模型	glm-5.1 / mimo-v2.5-pro
协议	OpenAI
配置位置	~/.codex/config.toml

直接复制配置

model_provider = "tokenmp"
model = "glm-5.1"
model_context_window = 202752
model_auto_compact_token_limit = 180000
model_max_output_tokens = 131072

[model_providers.tokenmp]
name = "TokenMP"
base_url = "https://api.tokenmp.cn/v1"
wire_api = "responses"
supports_websockets = false
requires_openai_auth = true

codex   -c model_provider="tokenmp"   -c model="glm-5.1"   -c model_context_window=202752   -c model_auto_compact_token_limit=180000

关键参数

Provider

model_providers.<id>.base_url / wire_api

TokenMP 走 /v1 Responses 兼容入口；如果当前网关未启用 WebSocket，应设置 supports_websockets = false。

上下文窗口

model_context_window

覆盖 Codex 对模型上下文窗口的假设；GLM-5.1 可用 202752，MiMo-V2.5-Pro 可用 1048576。

自动压缩

model_auto_compact_token_limit

达到该 token 数附近自动压缩会话；建议设置为上下文窗口的 85%-90%，给工具调用和最终输出留余量。

最大输出

model_max_output_tokens

用于声明/覆盖单次响应输出上限；GLM-5.1 与 MiMo-V2.5-Pro 可按 131072 配置。

模型目录

model_catalog_json

可指向本地 catalog，让 Codex 识别自定义模型元数据；远端 URL 支持情况以当前 Codex CLI 版本为准。

验证

codex 能正常创建会话、读取文件并完成一次简单修改建议，即配置成功。

常见坑

点击标题旁的 # 后可直接复制或分享到配置、压缩、验证等具体段落。
如果 Codex 报 unsupported model 或上下文窗口不正确，先检查 model_provider、model 和 model_context_window 是否同级。
如果出现 max output 或 context length 错误，先把 model_auto_compact_token_limit 降到上下文的 85% 左右，再降低单次 max_tokens。
常见排障路径：确认 /v1/responses 可用、API Key 未过期、Panel 中该模型处于 active、余额或 Coding Plan 足够。

参考

OpenAI Codex 配置参考

← Claude Code Trae →

只填这些

直接复制配置

关键参数

推荐模型

验证

常见坑

参考