AI 回复空白 / 截断 / 突然停止:六大原因与对策

SillyTavern 中文教程站编辑组·最后更新 2026-03-29

SillyTavern AI 回复异常完整排查:回复为空、中途截断、内容太短、突然失联四种现象分别对应的原因和解决方案,含万能反截断技巧。覆盖 Safety Filter、Max Tokens 设置、模型自身限制、流式中断、Connection Timeout 5 大成因的精准识别与处理。

"我发消息 AI 没反应"、"AI 说一半就停了"、"AI 输出突然就没了"——这一篇把所有"回复异常"的情况按现象归类，对症下药。

空回复最容易让人怀疑人生,但其实 80% 是流式输出的锅——往下看你就懂。

先分清你遇到的是哪种异常

现象	编号
AI 完全没回复，连个字都没有	A
AI 开始回复了，但中途停止	B
AI 回复正常但内容很短	C
AI 回复后突然没了，再问也没反应	D

A. 完全没回复

如果是发消息直接报 500 / Internal Server Error,先看《Valid 但 500 完整排查》。这一篇专门讲"看起来没问题但其实不通"的场景。

A1. 内容审查触发（最常见）

某些内容（特别是 NSFW、暴力、政治）会触发上游审查，返回空。

怎么排查：换一句"健康"的话试试。如果换一句就有了，就是审查。

怎么解决：

用反审查能力强的预设
用对内容容忍度高的模型（Claude 比 OpenAI 宽松，Gemini 严格）
修改触发审查的关键词

A2. Max Tokens 设太小

如果你把 Max Tokens 设成 50 或更小，AI 可能根本来不及说话就被截断。

正常值：2000-4000

A3. API 余额耗尽

最容易被忽视的原因。余额=0 时连接显示 valid，但发消息返回空白或 500。

怎么排查：去 API 商家的余额查询页看。

B. 中途停止

B1. Stream（流式）连接被代理切断

中转商如果用了不稳定的代理，流式输出会被随机切断。

症状：每次都在不同位置截断，没有规律。

解决：在 API 设置里关闭 Stream，改用非流式。一次性收到全部内容，没法中途切断。

B2. 模型自己判定该停了

模型遇到某些"停止序列"（Stop Sequence）会主动停。

解决：把酒馆的 Stop Strings 清空或调整。

B3. 上下文已经满了

对话太长，AI 没空间继续输出。

解决：见长对话总结技巧（待发布），先做一次总结。

C. 回复正常但太短

C1. 预设的回复长度引导不够

默认提示词不会要求 AI 长篇大论。

解决：在系统提示加：

每次回复至少 300 字，详细描写动作、表情、心理和环境。

C2. Max Tokens 偏低

Max Tokens 控制"最多多长"。如果设了 500，AI 就不会超过 500。

正常值：2000-4000（按需提高）

C3. 角色卡里写了"简短风格"

有些角色卡作者会写"用简洁的方式回答"。改角色卡描述即可。

D. 突然完全失联

D1. 上游渠道挂了

特征：所有用户同时反馈，几小时前还能用。

解决：等 30-60 分钟，或切备用渠道。

D2. Key 被风控

连续大量请求可能触发风控。

解决：换一个 Key，或等几小时。

D3. 浏览器 / 网络问题

特征：换网络 / 换设备就好了。

万能的"反截断"技巧

不管是哪种截断，这 3 个设置先试一遍：

关闭 Stream（80% 截断问题都能解决）
Max Tokens 调到 4000
预设里加反截断指令：

不要中途停止回复，完整地表达你的想法。
即使内容很长，也要一次性输出完整。

没办法时的最后一招：换模型

Gemini 系列突然空回——重试 1-2 次还不行，换到 Claude 或 GPT 试试。同一个角色卡同一段对话，换模型立刻有反应是常见的。

不同模型对相同内容的容忍度差异巨大。一个不行换一个，不是认输，是聪明做法。