工具集成 | TokenMP

上下文与输出限制速查

先确认模型窗口，再配置工具侧压缩和 max tokens，避免长会话溢出。

工具	类型	上下文配置	输出上限	压缩 / 摘要
Claude Code	CLI / Anthropic	跟随模型；可用 CLAUDE_CODE_MAX_CONTEXT_TOKENS 覆盖假设	CLAUDE_CODE_MAX_OUTPUT_TOKENS	自动压缩默认约 95%；可用 CLAUDE_AUTOCOMPACT_PCT_OVERRIDE 提前
OpenAI Codex CLI	CLI / OpenAI Responses	model_context_window	model_max_output_tokens	model_auto_compact_token_limit
Trae	IDE	跟随 Trae 内置模型识别	由 Trae 和上游共同限制	无细粒度压缩配置
OpenCode	CLI / TUI	provider model limit.context	provider model limit.output	compaction.auto / prune / reserved
Hermes	CLI / Agent	model.context_length（总上下文窗口）	model.max_tokens（单次输出上限，建议留空或按需限制）	compression.enabled / compression.threshold / summary_model
OpenClaw	CLI / Agent	contextWindow（按当前 schema）	请求侧或 provider 透传 max_tokens	遵循工具会话管理
WorkBuddy	AI Agent	由 Agent 自动管理	由上游模型限制	Agent 自动管理上下文