AI 回复空白 / 截断 / 突然停止:六大原因与对策
"我发消息 AI 没反应"、"AI 说一半就停了"、"AI 输出突然就没了"——这一篇把所有"回复异常"的情况按现象归类,对症下药。
空回复最容易让人怀疑人生,但其实 80% 是流式输出的锅——往下看你就懂。
先分清你遇到的是哪种异常
| 现象 | 编号 |
|---|---|
| AI 完全没回复,连个字都没有 | A |
| AI 开始回复了,但中途停止 | B |
| AI 回复正常但内容很短 | C |
| AI 回复后突然没了,再问也没反应 | D |
A. 完全没回复
如果是发消息直接报 500 / Internal Server Error,先看 《Valid 但 500 完整排查》。这一篇专门讲"看起来没问题但其实不通"的场景。
A1. 内容审查触发(最常见)
某些内容(特别是 NSFW、暴力、政治)会触发上游审查,返回空。
怎么排查:换一句"健康"的话试试。如果换一句就有了,就是审查。
怎么解决:
- 用反审查能力强的预设
- 用对内容容忍度高的模型(Claude 比 OpenAI 宽松,Gemini 严格)
- 修改触发审查的关键词
A2. Max Tokens 设太小
如果你把 Max Tokens 设成 50 或更小,AI 可能根本来不及说话就被截断。
正常值:2000-4000
A3. API 余额耗尽
最容易被忽视的原因。余额=0 时连接显示 valid,但发消息返回空白或 500。
怎么排查:去 API 商家的余额查询页看。
B. 中途停止
B1. Stream(流式)连接被代理切断
中转商如果用了不稳定的代理,流式输出会被随机切断。
症状:每次都在不同位置截断,没有规律。
解决:在 API 设置里关闭 Stream,改用非流式。一次性收到全部内容,没法中途切断。
B2. 模型自己判定该停了
模型遇到某些"停止序列"(Stop Sequence)会主动停。
解决:把酒馆的 Stop Strings 清空或调整。
B3. 上下文已经满了
对话太长,AI 没空间继续输出。
解决:见 长对话总结技巧(待发布),先做一次总结。
C. 回复正常但太短
C1. 预设的回复长度引导不够
默认提示词不会要求 AI 长篇大论。
解决:在系统提示加:
每次回复至少 300 字,详细描写动作、表情、心理和环境。
C2. Max Tokens 偏低
Max Tokens 控制"最多多长"。如果设了 500,AI 就不会超过 500。
正常值:2000-4000(按需提高)
C3. 角色卡里写了"简短风格"
有些角色卡作者会写"用简洁的方式回答"。改角色卡描述即可。
D. 突然完全失联
D1. 上游渠道挂了
特征:所有用户同时反馈,几小时前还能用。
解决:等 30-60 分钟,或切备用渠道。
D2. Key 被风控
连续大量请求可能触发风控。
解决:换一个 Key,或等几小时。
D3. 浏览器 / 网络问题
特征:换网络 / 换设备就好了。
万能的"反截断"技巧
不管是哪种截断,这 3 个设置先试一遍:
- 关闭 Stream(80% 截断问题都能解决)
- Max Tokens 调到 4000
- 预设里加反截断指令:
不要中途停止回复,完整地表达你的想法。
即使内容很长,也要一次性输出完整。
没办法时的最后一招:换模型
Gemini 系列突然空回——重试 1-2 次还不行,换到 Claude 或 GPT 试试。同一个角色卡同一段对话,换模型立刻有反应是常见的。
不同模型对相同内容的容忍度差异巨大。一个不行换一个,不是认输,是聪明做法。