上下文与输出限制速查
先确认模型窗口,再配置工具侧压缩和 max tokens,避免长会话溢出。
| 工具 | 类型 | 上下文配置 | 输出上限 | 压缩 / 摘要 |
|---|---|---|---|---|
| Claude Code | CLI / Anthropic | 跟随模型;可用 CLAUDE_CODE_MAX_CONTEXT_TOKENS 覆盖假设 | CLAUDE_CODE_MAX_OUTPUT_TOKENS | 自动压缩默认约 95%;可用 CLAUDE_AUTOCOMPACT_PCT_OVERRIDE 提前 |
| OpenAI Codex CLI | CLI / OpenAI Responses | model_context_window | model_max_output_tokens | model_auto_compact_token_limit |
| Trae | IDE | 跟随 Trae 内置模型识别 | 由 Trae 和上游共同限制 | 无细粒度压缩配置 |
| OpenCode | CLI / TUI | provider model limit.context | provider model limit.output | compaction.auto / prune / reserved |
| Hermes | CLI / Agent | model.context_length(总上下文窗口) | model.max_tokens(单次输出上限,建议留空或按需限制) | compression.enabled / compression.threshold / summary_model |
| OpenClaw | CLI / Agent | contextWindow(按当前 schema) | 请求侧或 provider 透传 max_tokens | 遵循工具会话管理 |
| WorkBuddy | AI Agent | 由 Agent 自动管理 | 由上游模型限制 | Agent 自动管理上下文 |
工具列表
Claude Code — Anthropic 官方 CLI,适合高频 AI 编程和项目级代码修改。Anthropic
OpenAI Codex CLI — OpenAI 官方本地编程 Agent,可通过 Responses 兼容入口接入 TokenMP。OpenAI
Trae — 字节跳动推出的 AI IDE,基于 VS Code,支持 OpenAI 兼容端点接入国产模型。OpenAIOpenCode — 终端 TUI 编程助手,使用 OpenAI Compatible Provider 接入 TokenMP。OpenAI
Hermes — Nous Research Hermes Agent CLI,可通过 custom Provider 接入任意 OpenAI 兼容 /v1/chat/completions 端点,适合命令行问答、自动化脚本和轻量代码任务。OpenAIOpenClaw — 支持配置文件和环境变量两种接入方式的 AI 编程工具。OpenAI
WorkBuddy — 腾讯云 CodeBuddy 推出的 AI Agent 办公工具,自主规划并交付多模态复杂任务。OpenAI