Temperature / Top P / Top K 参数详解:决定 AI '性格'的旋钮
打开酒馆设置,你会看到一堆参数:Temperature、Top P、Top K、Frequency Penalty、Presence Penalty……
新人通常的反应是:全部默认,别动了。
但是真的会用预设的人,这些参数决定了 AI 的"性格"。同一个角色卡,参数不同,出来的体验天差地别。
这一篇把这几个参数讲透。
先讲一个概念:AI 怎么"决定下一个字"
AI 不是直接"想"出下一个字,而是:
- 给所有可能的下一个字算一个概率
- 例如"今天天气很__":
- "好" 35%
- "热" 22%
- "冷" 15%
- "棒" 8%
- 从这个概率列表里抽一个
参数就是控制"怎么抽"的旋钮。
Temperature 温度
最重要的参数,控制随机性。
- 0.0:总是选概率最高的那个。每次回复一模一样,机械。
- 0.5:相对保守,会选高概率的几个里随机。
- 1.0:按原始概率分布选(中性,平衡)。
- 1.5:把概率拉平,低概率的字也有机会被选——更有"创意"。
- 2.0:基本失控,经常蹦出莫名其妙的字。
怎么调:
- 想要稳定、不出戏:0.7-0.9
- 平衡(推荐起步):1.0
- 想要更有想象力、更不可预测:1.1-1.3
- 写诗、文学创作:1.2-1.5
和模型有关:
- Claude 对温度敏感,1.0 起步,不超过 1.2
- Gemini 可以稍高,1.0-1.2
- GPT 系列 推荐 0.8-1.0
Top P (Nucleus Sampling) 核采样
控制"采样池"大小。
工作原理:
- Top P = 0.9 意思是"从累积概率达到 90% 的那批字里抽"
- 比如概率最高的 20 个字加起来 90%,就只从这 20 个字里抽
- 后面那些极低概率的字直接砍掉
怎么调:
- 0.9 几乎是行业默认。直接保持 0.9。
- 调到 1.0(关闭)= 所有字都可能被选(极少用)
- 调到 0.7 以下 = 池子太小,容易重复
老实讲:这个参数大多数时候不动。Temperature 已经够你折腾了。
Top K
控制"采样池"大小的另一种方式。
- Top K = 50 意思是"只从概率最高的前 50 个字里抽"
- 跟 Top P 类似,但用的是"固定数量"而不是"累积概率"
两个参数的区别:
- Top P 像"宽进严出":根据上下文动态决定多少字进池
- Top K 像"硬限数":不管什么情况,池子里最多就 K 个
重要警告:
- Claude 不支持 Top K——填了就报错
- OpenAI 不支持 Top K
- 只有部分 Gemini 渠道和本地模型支持
怎么办:
- 用 Claude / OpenAI:Top K 留空或填 0
- 用 Gemini:可以填,推荐 40-50
- 用本地模型:按模型推荐填
Frequency Penalty 频率惩罚
控制"重复"。
工作原理:某个字越频繁出现,后续被选中概率越低。
- 0:不管重复
- 0.1-0.3:轻微抑制重复(推荐)
- 0.5+:强烈抑制重复——但可能让 AI 词不达意(为了避免常用字,选了奇怪的词)
重要警告:
- Claude 不支持——填了 0.1 都给你 500 报错。必须 = 0
- Gemini / GPT 支持
怎么调:
- Claude:0
- Gemini:0.1-0.2
- GPT:0.1
- DeepSeek:0.1-0.2
Presence Penalty 存在惩罚
跟 Frequency Penalty 类似,但更强:
- Frequency Penalty:根据出现次数惩罚(出现越多次惩罚越大)
- Presence Penalty:只看有没有出现过(出现过就一律惩罚同样幅度)
效果:鼓励 AI 引入新话题、新概念,不要总绕着同一件事说。
警告:
- Claude 不支持——也必须 = 0
- 其他模型 0.1-0.25
Max Tokens
不是性格参数,但很关键。
最大回复长度。设 500,AI 就最多回复 500 token(约 350 字)。
- 设太小:AI 中途被强制截断
- 设太大:浪费 token,慢
推荐:
- 短对话:1000-2000
- 长篇创作:3000-4000
- 极限:模型支持的最大(通常 4096-8192)
Stop Strings 停止序列
碰到这个字符串,AI 立刻停止。
新手不要乱填。默认空着。
参数能调,但能不调就别调。先把预设和模型选对,参数留到最后微调。
一些"组合配方"
我自己用的几个组合:
Claude 系列角色扮演主力(详见 Claude 全系深度指南): Temperature: 1.0 Top P: 0.9 Top K: 留空 Frequency Penalty: 0 Presence Penalty: 0 Max Tokens: 3000
Gemini 系列长篇连载: Temperature: 1.1 Top P: 0.9 Top K: 40 Frequency Penalty: 0.15 Presence Penalty: 0.2 Max Tokens: 4000
GPT 系列平衡场景: Temperature: 0.9 Top P: 0.9 Top K: 0 Frequency Penalty: 0.1 Presence Penalty: 0.1 Max Tokens: 2000
一句结语
参数不是"高级玩家专属"。 真的想让 AI 演得好,你得懂它的旋钮。 但也别走极端——参数解决不了所有问题,预设和模型本身才是根本。