Temperature / Top P / Top K 参数详解:决定 AI '性格'的旋钮

SillyTavern 中文教程站编辑组·最后更新 2026-04-15

SillyTavern 生成参数完整解析。Temperature 温度、Top P 核采样、Top K、Frequency Penalty、Presence Penalty 各自的原理与三大模型实战组合配方。覆盖角色扮演适合的参数搭配、跑团高创意配方、写作质量优先配方,带每种配方对应的 AI 表现差异演示。

打开酒馆设置,你会看到一堆参数:Temperature、Top P、Top K、Frequency Penalty、Presence Penalty……

新人通常的反应是:全部默认,别动了。

但是真的会用预设的人,这些参数决定了 AI 的"性格"。同一个角色卡,参数不同,出来的体验天差地别。

这一篇把这几个参数讲透。

先讲一个概念:AI 怎么"决定下一个字"

AI 不是直接"想"出下一个字,而是:

给所有可能的下一个字算一个概率
例如"今天天气很__":
- "好" 35%
- "热" 22%
- "冷" 15%
- "棒" 8%
从这个概率列表里抽一个

参数就是控制"怎么抽"的旋钮。

Temperature 温度

最重要的参数,控制随机性。

0.0:总是选概率最高的那个。每次回复一模一样,机械。
0.5:相对保守,会选高概率的几个里随机。
1.0:按原始概率分布选(中性,平衡)。
1.5:把概率拉平,低概率的字也有机会被选——更有"创意"。
2.0:基本失控,经常蹦出莫名其妙的字。

怎么调:

想要稳定、不出戏:0.7-0.9
平衡(推荐起步):1.0
想要更有想象力、更不可预测:1.1-1.3
写诗、文学创作:1.2-1.5

和模型有关:

Claude 对温度敏感,1.0 起步,不超过 1.2
Gemini 可以稍高,1.0-1.2
GPT 系列推荐 0.8-1.0

Top P (Nucleus Sampling) 核采样

控制"采样池"大小。

工作原理:

Top P = 0.9 意思是"从累积概率达到 90% 的那批字里抽"
比如概率最高的 20 个字加起来 90%,就只从这 20 个字里抽
后面那些极低概率的字直接砍掉

怎么调:

0.9 几乎是行业默认。直接保持 0.9。
调到 1.0(关闭)= 所有字都可能被选(极少用)
调到 0.7 以下 = 池子太小,容易重复

老实讲:这个参数大多数时候不动。Temperature 已经够你折腾了。

Top K

控制"采样池"大小的另一种方式。

Top K = 50 意思是"只从概率最高的前 50 个字里抽"
跟 Top P 类似,但用的是"固定数量"而不是"累积概率"

两个参数的区别:

Top P 像"宽进严出":根据上下文动态决定多少字进池
Top K 像"硬限数":不管什么情况,池子里最多就 K 个

重要警告:

Claude 不支持 Top K——填了就报错
OpenAI 不支持 Top K
只有部分 Gemini 渠道和本地模型支持

怎么办:

用 Claude / OpenAI:Top K 留空或填 0
用 Gemini:可以填,推荐 40-50
用本地模型:按模型推荐填

Frequency Penalty 频率惩罚

控制"重复"。

工作原理:某个字越频繁出现,后续被选中概率越低。

0:不管重复
0.1-0.3:轻微抑制重复(推荐)
0.5+:强烈抑制重复——但可能让 AI 词不达意(为了避免常用字,选了奇怪的词)

重要警告:

Claude 不支持——填了 0.1 都给你 500 报错。必须 = 0
Gemini / GPT 支持

怎么调:

Claude:0
Gemini:0.1-0.2
GPT:0.1
DeepSeek:0.1-0.2

Presence Penalty 存在惩罚

跟 Frequency Penalty 类似,但更强:

Frequency Penalty:根据出现次数惩罚(出现越多次惩罚越大)
Presence Penalty:只看有没有出现过(出现过就一律惩罚同样幅度)

效果:鼓励 AI 引入新话题、新概念,不要总绕着同一件事说。

警告:

Claude 不支持——也必须 = 0
其他模型 0.1-0.25

Max Tokens

不是性格参数,但很关键。

最大回复长度。设 500,AI 就最多回复 500 token(约 350 字)。

设太小:AI 中途被强制截断
设太大:浪费 token,慢

Stop Strings 停止序列

碰到这个字符串,AI 立刻停止。

新手不要乱填。默认空着。

参数能调,但能不调就别调。先把预设和模型选对,参数留到最后微调。

一些"组合配方"

我自己用的几个组合:

Claude 系列角色扮演主力(详见 Claude 全系深度指南): Temperature: 1.0 Top P: 0.9 Top K: 留空 Frequency Penalty: 0 Presence Penalty: 0 Max Tokens: 3000

Gemini 系列长篇连载: Temperature: 1.1 Top P: 0.9 Top K: 40 Frequency Penalty: 0.15 Presence Penalty: 0.2 Max Tokens: 4000

GPT 系列平衡场景: Temperature: 0.9 Top P: 0.9 Top K: 0 Frequency Penalty: 0.1 Presence Penalty: 0.1 Max Tokens: 2000

一句结语

参数不是"高级玩家专属"。真的想让 AI 演得好,你得懂它的旋钮。但也别走极端——参数解决不了所有问题,预设和模型本身才是根本。

先讲一个概念:AI 怎么"决定下一个字"

Temperature 温度

Top P (Nucleus Sampling) 核采样

Top K

Frequency Penalty 频率惩罚

Presence Penalty 存在惩罚

Max Tokens

Stop Strings 停止序列

一些"组合配方"

一句结语

相关阅读