主流大模型 API 通用错误码手册（含国内主流平台）

前言

本文整理了HTTP 标准状态码 + 国内主流大模型平台专属业务错误码，覆盖 OpenAI 兼容体系、MiniMax、DeepSeek、智谱 GLM、通义千问（阿里百炼）等，同时配套问题排查方向与通用异常处理策略，适用于对接大模型 API 开发、运维、问题排查及接口标准化落地。

一、通用 HTTP 状态码（全平台通用）

HTTP 状态码是所有大模型 API 统一基础错误标识，分为客户端异常(4xx)、服务端异常(5xx) 两大类。

1. 4xx 客户端错误（请求方问题，无需频繁重试）

HTTP 码	错误名称	错误说明	排查方向
400	Bad Request	请求格式错误、JSON 解析失败、参数缺失、Prompt 为空、字段类型不合法	校验请求体、JSON 格式、必填参数、文本内容
401	Unauthorized	鉴权失败：API Key 不存在、未携带密钥、Token 过期、签名错误	核对 API Key、请求头、密钥有效期
402	Payment Required	账户余额不足、套餐已耗尽（预付费平台高频出现）	查看账户账单、完成充值
403	Forbidden	权限受限：IP 封禁、地域限制、模型未开通使用权限、接口白名单拦截	检查IP白名单、账号权限、模型开通状态
404	Not Found	接口地址错误、模型名称不存在、接口已下线	核对请求URL、模型名称拼写
422	Unprocessable Entity	参数校验不通过：温度/采样值越界、单轮上下文超长、参数取值非法	检查模型参数范围、输入文本长度
429	Too Many Requests	接口限流：RPM（每分钟请求数）、TPM（每分钟Token数）、并发数超限	降低调用频率、控制并发、申请提升配额、增加重试机制
499	Client Closed Request	客户端主动断开连接（流式输出场景高发）	优化客户端超时配置、避免强制中断请求

2. 5xx 服务端错误（平台侧问题，可适度重试）

HTTP 码	错误名称	错误说明	排查方向
500	Internal Server Error	模型服务内部异常、程序Bug、依赖服务故障	短时重试，持续报错联系平台客服
502	Bad Gateway	网关/反向代理异常，上游推理服务无响应	间隔重试，属于平台链路问题
503	Service Unavailable	服务过载、平台临时维护、算力资源耗尽	停止高频调用，延后重试
504	Gateway Timeout	网关超时，长文本/大模型推理耗时过长	缩短输入内容、更换轻量模型、调大客户端超时时间

二、主流大模型平台专属业务错误码

在 HTTP 状态码基础上，各平台会返回自定义业务码/错误描述，用于精细化定位问题。

1. OpenAI 及全兼容体系（通用接口标准）

主流开源模型、中转服务均沿用该错误字段：

错误字段	对应HTTP码	含义
invalid_request_error	400	请求参数、格式非法
authentication_error	401	密钥鉴权失败
permission_error	403	账号无对应模型/接口权限
rate_limit_error	429	接口触发限流
server_error	500	服务端内部错误
context_length_exceeded	422	上下文长度超出模型上限
model_not_found	404	指定模型不存在

2. MiniMax（稀宇科技）

国内主流大模型平台，统一使用数字业务码：

业务码	含义	对应场景
1000	未知错误	未归类的突发异常
1001	请求超时	推理/网络超时
1002	RPM 限流	每分钟请求数超限
1004	鉴权失败	API Key / Token 无效
1008	账户余额不足	账户欠费、套餐用完
1026	输入内容违规	Prompt 命中安全风控、敏感内容
1027	输出内容违规	模型回复触发安全拦截
1039	TPM 限流	Token 调用量超限

3. DeepSeek（深度求索）

以 HTTP 码 + 英文描述为主，无大量自定义数字码：

标识	对应HTTP码	含义
Insufficient Balance	402	账户余额不足
model_not_found	404	模型名称错误/未上线
context_length_exceeded	422	上下文超长
参数非法	422	自定义字段、参数取值不符合要求

4. 智谱 GLM

数字业务码为主，聚焦鉴权场景：

业务码	含义
1000	认证失败
1001	未携带 Token
1002	Token 非法
1003	Token 已过期

5. 通义千问 / 阿里百炼

以英文错误标识为主，侧重参数与安全风控：

错误标识	含义
InvalidParameter	参数非法、文本超长、字段错误
FaqRuleBlocked	内容命中安全规则，被拦截
ServiceUnavailableError	服务临时不可用、角色配置非法

三、场景化快速排查对照表

日常对接可根据现象直接定位根因，提升排错效率：

故障现象	匹配错误码	核心处理方案
密钥登录/调用失败	401、1004、1000(智谱)	核对API Key、请求头、密钥有效期
调用频繁被拦截	429、1002、1039	降低QPS、增加间隔、开启退避重试
无法发起新调用，提示欠费	402、1008	账户充值、核查账单与套餐
输入文本直接被拒绝	400、1026、FaqRuleBlocked	过滤敏感内容、精简Prompt
接口长时间转圈、超时断开	504、1001	缩短输入文本、更换小模型、调大超时时间
模型无返回、服务报错	500、502、503	短时重试，持续异常联系平台运维
填写模型名后调用404	404、model_not_found	核对官方模型名称、接口地址

四、通用代码异常处理规范

对接多模型平台时，统一异常处理逻辑，避免服务雪崩：

4xx 客户端错误 不重复重试，优先校验请求参数、密钥、内容合规性，直接返回前端/业务层错误提示。
429 限流错误 采用指数退避重试（1s → 2s → 4s），限制最大重试次数（建议3次以内），同时全局控制并发量。
5xx 服务端错误 有限次数重试（2~~3次），重试间隔2~~5秒，多次失败则判定服务不可用，停止调用。
内容风控拦截（1026/1027/FaqRuleBlocked） 直接返回合规提示，禁止重试，避免重复触发风控。
余额不足(402/1008) 触发告警通知，暂停批量调用，引导账户充值。

五、补充说明

国内所有合规大模型均已上线内容安全风控，涉政、违规、敏感内容会触发 1026/1027 类拦截，属于正常安全策略。
长上下文、多模态、复杂 Agent 推理场景，更容易出现 504 超时，建议拆分请求、分步调用。
不同平台限流规则（RPM/TPM）独立，多模型混用时需分别做流控管理。

菜单

分享

主流大模型 API 通用错误码手册（含国内主流平台）

前言

一、通用 HTTP 状态码（全平台通用）

1. 4xx 客户端错误（请求方问题，无需频繁重试）

2. 5xx 服务端错误（平台侧问题，可适度重试）

二、主流大模型平台专属业务错误码

1. OpenAI 及全兼容体系（通用接口标准）

2. MiniMax（稀宇科技）

3. DeepSeek（深度求索）

4. 智谱 GLM

5. 通义千问 / 阿里百炼

三、场景化快速排查对照表

四、通用代码异常处理规范

五、补充说明

大模型 API 接口格式全解析：主流规范、流式/非流式、演进趋势

USB4-V2版本和雷电5的关系（一文读懂，不搞复杂术语）

SAP GUI 760版本设置快捷登录

浏览器常用快捷键大全（通用 + Chrome 专属 + Edge 专属）

frp（Fast Reverse Proxy）

中国三大运营商国际骨干网络介绍

Sun-Panel如何增加网站访问记录统计代码

全球频谱总表

笔记本电池详细信息查询方式（无需安装第三方软件）

虚拟内存参数调整