AnthropicCLI / Anthropic~/.claude.json 或 Shell 环境变量
只填这些
| Base URL | https://api.tokenmp.cn/v1 |
|---|---|
| API Key | sk-tmp-... |
| 模型 | glm-5.1 / mimo-v2.5-pro |
| 协议 | Anthropic |
| 配置位置 | ~/.claude.json 或 Shell 环境变量 |
直接复制配置
{
"env": {
"ANTHROPIC_BASE_URL": "https://api.tokenmp.cn/v1",
"ANTHROPIC_AUTH_TOKEN": "sk-xxx...",
"ANTHROPIC_MODEL": "glm-5.1",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.1",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.1",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-5.1"
}
}export ANTHROPIC_BASE_URL=https://api.tokenmp.cn/v1
export ANTHROPIC_AUTH_TOKEN=sk-xxx...
export ANTHROPIC_MODEL=glm-5.1
claude关键参数
模型与网关
ANTHROPIC_BASE_URL / ANTHROPIC_AUTH_TOKEN / ANTHROPIC_MODEL通过 Anthropic 兼容入口接入 TokenMP;模型名建议使用 Panel 或 /v1/models 中的可用 ID。
上下文窗口
CLAUDE_CODE_MAX_CONTEXT_TOKENS仅在 DISABLE_COMPACT 同时设置时覆盖 Claude Code 对当前模型上下文的假设;普通接入不建议关闭压缩。
自动压缩阈值
CLAUDE_AUTOCOMPACT_PCT_OVERRIDE默认约 95% 上下文容量触发;可设 50 等更早压缩,超过默认阈值不会提高触发点。
最大输出
CLAUDE_CODE_MAX_OUTPUT_TOKENS为多数请求设置输出上限;调大后会挤占自动压缩前可用的有效上下文。
MCP 输出
MAX_MCP_OUTPUT_TOKENS(默认 25000)限制 MCP 工具响应进入上下文的 token 数;工具输出超过 10000 token 会提示风险。
推荐模型
GLM-5.1
上下文 200K(TokenMP 按 202752 配置)
输出 128K(131072)
输出 128K(131072)
GLM-5 / GLM-5-Turbo
上下文 200K
输出 128K
输出 128K
MiMo-V2.5-Pro
上下文 1M(常见精确值 1048576)
输出 128K(131072)
输出 128K(131072)
验证
Claude Code 正常回复且无 401 / 402 / 429 报错,即表示配置成功。
常见坑
- 如果工具要求 Messages 路径,使用 /v1/messages;如果要求 Base URL,填写 https://api.tokenmp.cn/v1。
- 高频编程建议优先选择 Coding Plan,避免长会话频繁按量扣减。
- 如果关闭自动压缩,长任务更容易在工具结果或最终输出阶段触发上下文溢出。