flykey
发布于 2026-06-01 / 1 阅读
0

主流大模型 API 通用错误码手册(含国内主流平台)

前言

本文整理了HTTP 标准状态码 + 国内主流大模型平台专属业务错误码,覆盖 OpenAI 兼容体系、MiniMax、DeepSeek、智谱 GLM、通义千问(阿里百炼)等,同时配套问题排查方向与通用异常处理策略,适用于对接大模型 API 开发、运维、问题排查及接口标准化落地。


一、通用 HTTP 状态码(全平台通用)

HTTP 状态码是所有大模型 API 统一基础错误标识,分为客户端异常(4xx)服务端异常(5xx) 两大类。

1. 4xx 客户端错误(请求方问题,无需频繁重试)

HTTP 码 错误名称 错误说明 排查方向
400 Bad Request 请求格式错误、JSON 解析失败、参数缺失、Prompt 为空、字段类型不合法 校验请求体、JSON 格式、必填参数、文本内容
401 Unauthorized 鉴权失败:API Key 不存在、未携带密钥、Token 过期、签名错误 核对 API Key、请求头、密钥有效期
402 Payment Required 账户余额不足、套餐已耗尽(预付费平台高频出现) 查看账户账单、完成充值
403 Forbidden 权限受限:IP 封禁、地域限制、模型未开通使用权限、接口白名单拦截 检查IP白名单、账号权限、模型开通状态
404 Not Found 接口地址错误、模型名称不存在、接口已下线 核对请求URL、模型名称拼写
422 Unprocessable Entity 参数校验不通过:温度/采样值越界、单轮上下文超长、参数取值非法 检查模型参数范围、输入文本长度
429 Too Many Requests 接口限流:RPM(每分钟请求数)、TPM(每分钟Token数)、并发数超限 降低调用频率、控制并发、申请提升配额、增加重试机制
499 Client Closed Request 客户端主动断开连接(流式输出场景高发) 优化客户端超时配置、避免强制中断请求

2. 5xx 服务端错误(平台侧问题,可适度重试)

HTTP 码 错误名称 错误说明 排查方向
500 Internal Server Error 模型服务内部异常、程序Bug、依赖服务故障 短时重试,持续报错联系平台客服
502 Bad Gateway 网关/反向代理异常,上游推理服务无响应 间隔重试,属于平台链路问题
503 Service Unavailable 服务过载、平台临时维护、算力资源耗尽 停止高频调用,延后重试
504 Gateway Timeout 网关超时,长文本/大模型推理耗时过长 缩短输入内容、更换轻量模型、调大客户端超时时间

二、主流大模型平台专属业务错误码

在 HTTP 状态码基础上,各平台会返回自定义业务码/错误描述,用于精细化定位问题。

1. OpenAI 及全兼容体系(通用接口标准)

主流开源模型、中转服务均沿用该错误字段:

错误字段 对应HTTP码 含义
invalid_request_error 400 请求参数、格式非法
authentication_error 401 密钥鉴权失败
permission_error 403 账号无对应模型/接口权限
rate_limit_error 429 接口触发限流
server_error 500 服务端内部错误
context_length_exceeded 422 上下文长度超出模型上限
model_not_found 404 指定模型不存在

2. MiniMax(稀宇科技)

国内主流大模型平台,统一使用数字业务码:

业务码 含义 对应场景
1000 未知错误 未归类的突发异常
1001 请求超时 推理/网络超时
1002 RPM 限流 每分钟请求数超限
1004 鉴权失败 API Key / Token 无效
1008 账户余额不足 账户欠费、套餐用完
1026 输入内容违规 Prompt 命中安全风控、敏感内容
1027 输出内容违规 模型回复触发安全拦截
1039 TPM 限流 Token 调用量超限

3. DeepSeek(深度求索)

以 HTTP 码 + 英文描述为主,无大量自定义数字码:

标识 对应HTTP码 含义
Insufficient Balance 402 账户余额不足
model_not_found 404 模型名称错误/未上线
context_length_exceeded 422 上下文超长
参数非法 422 自定义字段、参数取值不符合要求

4. 智谱 GLM

数字业务码为主,聚焦鉴权场景:

业务码 含义
1000 认证失败
1001 未携带 Token
1002 Token 非法
1003 Token 已过期

5. 通义千问 / 阿里百炼

以英文错误标识为主,侧重参数与安全风控:

错误标识 含义
InvalidParameter 参数非法、文本超长、字段错误
FaqRuleBlocked 内容命中安全规则,被拦截
ServiceUnavailableError 服务临时不可用、角色配置非法

三、场景化快速排查对照表

日常对接可根据现象直接定位根因,提升排错效率:

故障现象 匹配错误码 核心处理方案
密钥登录/调用失败 401、1004、1000(智谱) 核对API Key、请求头、密钥有效期
调用频繁被拦截 429、1002、1039 降低QPS、增加间隔、开启退避重试
无法发起新调用,提示欠费 402、1008 账户充值、核查账单与套餐
输入文本直接被拒绝 400、1026、FaqRuleBlocked 过滤敏感内容、精简Prompt
接口长时间转圈、超时断开 504、1001 缩短输入文本、更换小模型、调大超时时间
模型无返回、服务报错 500、502、503 短时重试,持续异常联系平台运维
填写模型名后调用404 404、model_not_found 核对官方模型名称、接口地址

四、通用代码异常处理规范

对接多模型平台时,统一异常处理逻辑,避免服务雪崩:

  1. 4xx 客户端错误 不重复重试,优先校验请求参数、密钥、内容合规性,直接返回前端/业务层错误提示。
  2. 429 限流错误 采用指数退避重试(1s → 2s → 4s),限制最大重试次数(建议3次以内),同时全局控制并发量。
  3. 5xx 服务端错误 有限次数重试(23次),重试间隔25秒,多次失败则判定服务不可用,停止调用。
  4. 内容风控拦截(1026/1027/FaqRuleBlocked) 直接返回合规提示,禁止重试,避免重复触发风控。
  5. 余额不足(402/1008) 触发告警通知,暂停批量调用,引导账户充值。

五、补充说明

  1. 国内所有合规大模型均已上线内容安全风控,涉政、违规、敏感内容会触发 1026/1027 类拦截,属于正常安全策略。
  2. 长上下文、多模态、复杂 Agent 推理场景,更容易出现 504 超时,建议拆分请求、分步调用。
  3. 不同平台限流规则(RPM/TPM)独立,多模型混用时需分别做流控管理。