AnthropicCLI / Anthropic~/.claude.json 或 Shell 环境变量

只填这些

Base URLhttps://api.tokenmp.cn/v1
API Keysk-tmp-...
模型glm-5.1 / mimo-v2.5-pro
协议Anthropic
配置位置~/.claude.json 或 Shell 环境变量

直接复制配置

{
  "env": {
    "ANTHROPIC_BASE_URL": "https://api.tokenmp.cn/v1",
    "ANTHROPIC_AUTH_TOKEN": "sk-xxx...",
    "ANTHROPIC_MODEL": "glm-5.1",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.1",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.1",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-5.1"
  }
}
export ANTHROPIC_BASE_URL=https://api.tokenmp.cn/v1
export ANTHROPIC_AUTH_TOKEN=sk-xxx...
export ANTHROPIC_MODEL=glm-5.1

claude

关键参数

模型与网关
ANTHROPIC_BASE_URL / ANTHROPIC_AUTH_TOKEN / ANTHROPIC_MODEL

通过 Anthropic 兼容入口接入 TokenMP;模型名建议使用 Panel 或 /v1/models 中的可用 ID。

上下文窗口
CLAUDE_CODE_MAX_CONTEXT_TOKENS

仅在 DISABLE_COMPACT 同时设置时覆盖 Claude Code 对当前模型上下文的假设;普通接入不建议关闭压缩。

自动压缩阈值
CLAUDE_AUTOCOMPACT_PCT_OVERRIDE

默认约 95% 上下文容量触发;可设 50 等更早压缩,超过默认阈值不会提高触发点。

最大输出
CLAUDE_CODE_MAX_OUTPUT_TOKENS

为多数请求设置输出上限;调大后会挤占自动压缩前可用的有效上下文。

MCP 输出
MAX_MCP_OUTPUT_TOKENS(默认 25000)

限制 MCP 工具响应进入上下文的 token 数;工具输出超过 10000 token 会提示风险。

推荐模型

GLM-5.1
上下文 200K(TokenMP 按 202752 配置)
输出 128K(131072)
GLM-5 / GLM-5-Turbo
上下文 200K
输出 128K
MiMo-V2.5-Pro
上下文 1M(常见精确值 1048576)
输出 128K(131072)

验证

Claude Code 正常回复且无 401 / 402 / 429 报错,即表示配置成功。

常见坑

  • 如果工具要求 Messages 路径,使用 /v1/messages;如果要求 Base URL,填写 https://api.tokenmp.cn/v1。
  • 高频编程建议优先选择 Coding Plan,避免长会话频繁按量扣减。
  • 如果关闭自动压缩,长任务更容易在工具结果或最终输出阶段触发上下文溢出。

参考