"我发消息 AI 没反应"、"AI 说一半就停了"、"AI 输出突然就没了"——这一篇把所有"回复异常"的情况按现象归类,对症下药。

空回复最容易让人怀疑人生,但其实 80% 是流式输出的锅——往下看你就懂。

先分清你遇到的是哪种异常

现象 编号
AI 完全没回复,连个字都没有 A
AI 开始回复了,但中途停止 B
AI 回复正常但内容很短 C
AI 回复后突然没了,再问也没反应 D

A. 完全没回复

如果是发消息直接报 500 / Internal Server Error,先看 《Valid 但 500 完整排查》。这一篇专门讲"看起来没问题但其实不通"的场景。

A1. 内容审查触发(最常见)

某些内容(特别是 NSFW、暴力、政治)会触发上游审查,返回空。

怎么排查:换一句"健康"的话试试。如果换一句就有了,就是审查。

怎么解决

  • 用反审查能力强的预设
  • 用对内容容忍度高的模型(Claude 比 OpenAI 宽松,Gemini 严格)
  • 修改触发审查的关键词

A2. Max Tokens 设太小

如果你把 Max Tokens 设成 50 或更小,AI 可能根本来不及说话就被截断。

正常值:2000-4000

A3. API 余额耗尽

最容易被忽视的原因。余额=0 时连接显示 valid,但发消息返回空白或 500。

怎么排查:去 API 商家的余额查询页看。

B. 中途停止

B1. Stream(流式)连接被代理切断

中转商如果用了不稳定的代理,流式输出会被随机切断。

症状:每次都在不同位置截断,没有规律。

解决:在 API 设置里关闭 Stream,改用非流式。一次性收到全部内容,没法中途切断。

B2. 模型自己判定该停了

模型遇到某些"停止序列"(Stop Sequence)会主动停。

解决:把酒馆的 Stop Strings 清空或调整。

B3. 上下文已经满了

对话太长,AI 没空间继续输出。

解决:见 长对话总结技巧(待发布),先做一次总结。

C. 回复正常但太短

C1. 预设的回复长度引导不够

默认提示词不会要求 AI 长篇大论。

解决:在系统提示加:

每次回复至少 300 字,详细描写动作、表情、心理和环境。

C2. Max Tokens 偏低

Max Tokens 控制"最多多长"。如果设了 500,AI 就不会超过 500。

正常值:2000-4000(按需提高)

C3. 角色卡里写了"简短风格"

有些角色卡作者会写"用简洁的方式回答"。改角色卡描述即可。

D. 突然完全失联

D1. 上游渠道挂了

特征:所有用户同时反馈,几小时前还能用。

解决:等 30-60 分钟,或切备用渠道。

D2. Key 被风控

连续大量请求可能触发风控。

解决:换一个 Key,或等几小时。

D3. 浏览器 / 网络问题

特征:换网络 / 换设备就好了。

万能的"反截断"技巧

不管是哪种截断,这 3 个设置先试一遍:

  1. 关闭 Stream(80% 截断问题都能解决)
  2. Max Tokens 调到 4000
  3. 预设里加反截断指令
不要中途停止回复,完整地表达你的想法。
即使内容很长,也要一次性输出完整。

没办法时的最后一招:换模型

Gemini 系列突然空回——重试 1-2 次还不行,换到 Claude 或 GPT 试试。同一个角色卡同一段对话,换模型立刻有反应是常见的。

不同模型对相同内容的容忍度差异巨大。一个不行换一个,不是认输,是聪明做法。


相关阅读