打开酒馆设置,你会看到一堆参数:Temperature、Top P、Top K、Frequency Penalty、Presence Penalty……

新人通常的反应是:全部默认,别动了

但是真的会用预设的人,这些参数决定了 AI 的"性格"。同一个角色卡,参数不同,出来的体验天差地别。

这一篇把这几个参数讲透。

先讲一个概念:AI 怎么"决定下一个字"

AI 不是直接"想"出下一个字,而是:

  1. 给所有可能的下一个字算一个概率
  2. 例如"今天天气很__":
    • "好" 35%
    • "热" 22%
    • "冷" 15%
    • "棒" 8%
  3. 从这个概率列表里抽一个

参数就是控制"怎么抽"的旋钮。

Temperature 温度

最重要的参数,控制随机性

  • 0.0:总是选概率最高的那个。每次回复一模一样,机械。
  • 0.5:相对保守,会选高概率的几个里随机。
  • 1.0:按原始概率分布选(中性,平衡)。
  • 1.5:把概率拉平,低概率的字也有机会被选——更有"创意"。
  • 2.0:基本失控,经常蹦出莫名其妙的字。

怎么调:

  • 想要稳定、不出戏:0.7-0.9
  • 平衡(推荐起步):1.0
  • 想要更有想象力、更不可预测:1.1-1.3
  • 写诗、文学创作:1.2-1.5

和模型有关:

  • Claude 对温度敏感,1.0 起步,不超过 1.2
  • Gemini 可以稍高,1.0-1.2
  • GPT 系列 推荐 0.8-1.0

Top P (Nucleus Sampling) 核采样

控制"采样池"大小。

工作原理:

  • Top P = 0.9 意思是"从累积概率达到 90% 的那批字里抽"
  • 比如概率最高的 20 个字加起来 90%,就只从这 20 个字里抽
  • 后面那些极低概率的字直接砍掉

怎么调:

  • 0.9 几乎是行业默认。直接保持 0.9
  • 调到 1.0(关闭)= 所有字都可能被选(极少用)
  • 调到 0.7 以下 = 池子太小,容易重复

老实讲:这个参数大多数时候不动。Temperature 已经够你折腾了。

Top K

控制"采样池"大小的另一种方式。

  • Top K = 50 意思是"只从概率最高的前 50 个字里抽"
  • 跟 Top P 类似,但用的是"固定数量"而不是"累积概率"

两个参数的区别:

  • Top P 像"宽进严出":根据上下文动态决定多少字进池
  • Top K 像"硬限数":不管什么情况,池子里最多就 K 个

重要警告:

  • Claude 不支持 Top K——填了就报错
  • OpenAI 不支持 Top K
  • 只有部分 Gemini 渠道和本地模型支持

怎么办:

  • 用 Claude / OpenAI:Top K 留空或填 0
  • 用 Gemini:可以填,推荐 40-50
  • 用本地模型:按模型推荐填

Frequency Penalty 频率惩罚

控制"重复"。

工作原理:某个字越频繁出现,后续被选中概率越低。

  • 0:不管重复
  • 0.1-0.3:轻微抑制重复(推荐)
  • 0.5+:强烈抑制重复——但可能让 AI 词不达意(为了避免常用字,选了奇怪的词)

重要警告:

  • Claude 不支持——填了 0.1 都给你 500 报错。必须 = 0
  • Gemini / GPT 支持

怎么调:

  • Claude:0
  • Gemini:0.1-0.2
  • GPT:0.1
  • DeepSeek:0.1-0.2

Presence Penalty 存在惩罚

跟 Frequency Penalty 类似,但更强:

  • Frequency Penalty:根据出现次数惩罚(出现越多次惩罚越大)
  • Presence Penalty:只看有没有出现过(出现过就一律惩罚同样幅度)

效果:鼓励 AI 引入新话题、新概念,不要总绕着同一件事说。

警告:

  • Claude 不支持——也必须 = 0
  • 其他模型 0.1-0.25

Max Tokens

不是性格参数,但很关键。

最大回复长度。设 500,AI 就最多回复 500 token(约 350 字)。

  • 设太小:AI 中途被强制截断
  • 设太大:浪费 token,慢

推荐:

  • 短对话:1000-2000
  • 长篇创作:3000-4000
  • 极限:模型支持的最大(通常 4096-8192)

Stop Strings 停止序列

碰到这个字符串,AI 立刻停止。

新手不要乱填。默认空着。

参数能调,但能不调就别调。先把预设和模型选对,参数留到最后微调。

一些"组合配方"

我自己用的几个组合:

Claude 系列角色扮演主力(详见 Claude 全系深度指南): Temperature: 1.0 Top P: 0.9 Top K: 留空 Frequency Penalty: 0 Presence Penalty: 0 Max Tokens: 3000

Gemini 系列长篇连载: Temperature: 1.1 Top P: 0.9 Top K: 40 Frequency Penalty: 0.15 Presence Penalty: 0.2 Max Tokens: 4000

GPT 系列平衡场景: Temperature: 0.9 Top P: 0.9 Top K: 0 Frequency Penalty: 0.1 Presence Penalty: 0.1 Max Tokens: 2000

一句结语

参数不是"高级玩家专属"。 真的想让 AI 演得好,你得懂它的旋钮。 但也别走极端——参数解决不了所有问题,预设和模型本身才是根本


相关阅读