API 服务运行中

国产 AI 模型统一 API 网关

兼容 OpenAI / Anthropic 协议,多渠道智能路由,订阅与按量资源统一管理。一个 base_url 接入国产模型能力。

from openai import OpenAI

client = OpenAI(
    api_key="sk-xxx...",
    base_url="https://api.tokenmp.cn/v1"
)

response = client.chat.completions.create(
    model="mimo-v2.5-pro",
    messages=[{"role": "user", "content": "你好"}]
)
print(response.choices[0].message.content)
24
国产大模型
7
Agent 工具适配
2
OpenAI / Anthropic 协议
60/min
默认 API 速率上限

为 AI 编程而生

从零配置到生产,TokenMP 让你的 Agent 不再受限于单一提供商。

协议无差别接入

把 base_url 换成 TokenMP 端点,现有 OpenAI SDK 与 Anthropic 格式请求都可以平滑迁移。

  • /v1/chat/completions(OpenAI 格式)
  • /v1/messages(Anthropic 格式)
  • 流式输出、Function Call 与推理模型场景

智能渠道调度

多渠道按健康、容量、质量、权重与价格综合选择,请求失败时自动绕行可用上游。

  • 健康状态与容量动态参与路由
  • 429 / 5xx 分级冷却,降低连续失败
  • 多 Key 池轮询,减少单点不可用影响

灵活双轨计费

Coding Plan 适合高频 Agent 调用,Token 套餐适合按量负载,公开价格从接口实时读取。

  • Coding / Token 两类资源分开展示
  • 订阅与按量资源可按场景组合
  • 支持兑换码补充套餐或余额

全链路可观测

每条请求记录模型、Token、延时和状态。联系管理员可通过请求记录定位 Trace ID,对应排查上游状态、路由尝试和失败原因。

  • 请求日志记录首字延时与总耗时
  • 账户额度、余额和账单流水清晰可查
  • 保留 Trace ID 便于定位问题

简单透明的定价

首页只说明计费方式;完整套餐、价格和可用状态在定价页集中展示。

Coding Plan
适合 Claude Code、Codex、Trae 等高频 Agent 编程场景,按请求窗口计量。
Token Plan
适合聊天、总结、批处理和长文本任务,按实际 token 消耗扣减。
账单可追溯
请求日志和账单流水在 Panel 中统一查看,排障时保留 Trace ID。

三步完成接入

从注册账号到第一个 API 请求,不需要改变原有 OpenAI SDK 的调用习惯。

  1. 1

    注册账号

    创建 TokenMP 账号,进入用户面板准备开通套餐。

    免费注册
  2. 2

    创建 API Key

    在 Panel 的密钥页面创建自己的 Key。Key 只展示一次,请妥善保存。

    前往密钥页
  3. 3

    发送第一个请求

    把客户端 base_url 指向 TokenMP,其余参数沿用熟悉的协议格式。

    阅读快速开始

常用兼容入口

创建 Key 后,先从模型列表确认可用模型,再按客户端协议选择对应入口。

GET/v1/models获取可用模型列表
POST/v1/chat/completionsOpenAI Chat Completions
POST/v1/responsesOpenAI Responses
POST/v1/messagesAnthropic Messages 兼容

开始使用 TokenMP

注册后即可进入 Panel 创建 API Key、查看套餐额度,并用兼容接口接入你的应用。

已有账号? 登录 或直接进入 Panel