Google 的 Gemini 在最近这两年突飞猛进。从最初被吐槽"不如 GPT-3.5"到现在成为很多重度玩家的主力——尤其是写长篇的

但 Gemini 也是脾气最古怪的——你以为它跑得好好的,它突然给你来一个空白回复。

这一篇讲清楚 Gemini 全家桶的差异、什么时候用、怎么用对。具体版本号每隔几个月会更新,本文不写死任何版本号——以你用的当时最新版为准

产品分档(长期稳定)

Gemini 的产品分档比较稳定:

  • Gemini Flash 模型(及更轻量的 Flash-Lite):轻量、快、便宜
  • Gemini Pro 模型:平衡档(对应 Claude Sonnet 那个层级)
  • Gemini Ultra / Advanced 模型(部分版本叫这个):旗舰

版本号会细分多代——但直接用最新一代。Google 的迭代速度很快,新版几乎全方位优于旧版。

Gemini 最强的特点:长上下文

Gemini 系列从早期开始就以"上下文长"著称。当前主流的 Pro 和 Flash 都已经达到百万 token 级别(约 75 万中文字)。

这意味着:够你聊几个月不用做总结

这是 Gemini 在长篇连载场景下被推崇的根本原因——你不必频繁停下来做记忆管理,可以一直往下写。

Gemini Flash 模型:性价比之王

如果你刚接触 AI 角色扮演,Gemini Flash 模型 是值得第一个尝试的:

  • 极便宜(便宜到几乎是免费的)
  • 速度极快(回复几乎瞬时)
  • 文笔能用(不算精致但不假)
  • 上下文长

什么场景用 Flash:

  • 新手入门,先跑通流程
  • 日常聊天,不太追求文笔
  • 想试不同的角色卡,但不舍得花 Claude 的钱
  • 做总结、做翻译(性价比无敌)

Flash 的弱点:

  • 复杂心理刻画不如 Claude Sonnet
  • 偶尔会犯逻辑错误
  • 对复杂世界书的处理有时不到位

某些版本还有更轻量的 Flash-Lite,价格更低,速度更快——适合做大批量自动化任务。

Gemini Pro 模型:中端主力

Gemini Pro 模型 是当前 Claude Sonnet 模型 最大的竞争者。

  • 文笔明显比 Flash 好
  • 上下文长度和 Sonnet 同档(都是百万级)
  • 价格友好(通常是 Sonnet 的 1/2 - 2/3)

什么场景用 Pro:

  • 你写长篇连载,需要保留大量历史对话
  • 你的角色卡和世界书加起来 30K+ 字
  • 你想用 Claude 但预算紧

Pro 的弱点(也是 Gemini 全系的问题):

  • 偶尔空回(后面专门讲)
  • 流式输出处理不稳定
  • 对反审查相对严

Gemini Ultra/Advanced 模型:为什么不一定推荐

Gemini 旗舰版价格逼近 Claude Opus,但综合表现:

  • 长上下文还是强(继承全家桶优势)
  • 写作质量比 Pro 提升不明显(差距小)
  • 多模态(理解图片、3D 等)是真亮点

如果你只做角色扮演:Pro 已经足够,旗舰版性价比反而不如 Pro。 如果你做多模态(自动配图、图片识别等):旗舰版才能体现差距。

Gemini 的脾气:你必须知道的问题

1. 空回复

最让人崩溃的现象:

  • 你发一句话
  • AI 回复了个空白
  • 你重发,还是空白

原因复杂,包括:

  • 内容触发审查(Gemini 内容审核相对严)
  • 流式输出代理断裂
  • 模型自己判定停了

解决方案:

  • 关闭流式输出(关掉 Stream)
  • 重新生成一次(80% 概率好转)
  • 检查内容是否敏感
  • 备用模型顶上

2. 反截断必须做

Gemini 比 Claude 更容易"中途停"。

预设里必须有反截断指令,大致内容:

不要中途停止回复。完整地表达你的想法,即使内容很长。 不要以问号、删节号或开放式结尾结束。

3. 关闭 Stream 是金科玉律

几乎所有 Gemini 用户都开非流式。空回复 / 截断的全套排查见 《AI 回复空白 / 截断》。流式带来的体验提升,远不如它带来的稳定性损失。

Penalty 参数怎么设

跟 Claude 不同,Gemini 支持 Frequency / Presence Penalty

  • Frequency Penalty: 0.1-0.2(防重复)
  • Presence Penalty: 0.1-0.25(鼓励新内容)
  • Temperature: 1.0-1.2
  • Top P: 0.9
  • Top K: 40-50(Gemini 支持,Claude 不支持)

国内怎么用 Gemini

跟 Claude 一样:

  • 官方需要 Google 账号、海外 IP、海外信用卡
  • 95% 中文玩家走中转

中转价格比 Claude 便宜很多,这也是 Gemini 在国内特别流行的原因之一

长上下文场景特别提醒:Gemini 的上下文虽然长,但按量计费下,长上下文 token 成本会快速堆高。如果你经常使用 50 万+ token 的对话,强烈建议选按次计费的渠道,详见 按次 vs 按量计费

老版本还能用吗?

可以。Gemini 老版本(比如 Pro 系列的上一代)通常:

  • 价格更便宜
  • 中转商支持更广
  • 预设和反截断方案适配更成熟

实战经验:除非新版有重大功能突破,老版本通常更稳。

选型方法论

  • 日常使用、长篇连载:Gemini Pro 模型(主力)
  • 极致文笔关键剧情:切到 Claude Sonnet/Opus
  • 总结/翻译/批处理:Gemini Flash 模型 / Flash-Lite
  • 主渠道挂了的备份:多备一个中转商

新人推荐:Flash 起步,Pro 升级。

相关阅读