Gemini 全家桶解析:Flash 和 Pro 的真实差异
Google 的 Gemini 在最近这两年突飞猛进。从最初被吐槽"不如 GPT-3.5"到现在成为很多重度玩家的主力——尤其是写长篇的。
但 Gemini 也是脾气最古怪的——你以为它跑得好好的,它突然给你来一个空白回复。
这一篇讲清楚 Gemini 全家桶的差异、什么时候用、怎么用对。具体版本号每隔几个月会更新,本文不写死任何版本号——以你用的当时最新版为准。
产品分档(长期稳定)
Gemini 的产品分档比较稳定:
- Gemini Flash 模型(及更轻量的 Flash-Lite):轻量、快、便宜
- Gemini Pro 模型:平衡档(对应 Claude Sonnet 那个层级)
- Gemini Ultra / Advanced 模型(部分版本叫这个):旗舰
版本号会细分多代——但直接用最新一代。Google 的迭代速度很快,新版几乎全方位优于旧版。
Gemini 最强的特点:长上下文
Gemini 系列从早期开始就以"上下文长"著称。当前主流的 Pro 和 Flash 都已经达到百万 token 级别(约 75 万中文字)。
这意味着:够你聊几个月不用做总结。
这是 Gemini 在长篇连载场景下被推崇的根本原因——你不必频繁停下来做记忆管理,可以一直往下写。
Gemini Flash 模型:性价比之王
如果你刚接触 AI 角色扮演,Gemini Flash 模型 是值得第一个尝试的:
- 极便宜(便宜到几乎是免费的)
- 速度极快(回复几乎瞬时)
- 文笔能用(不算精致但不假)
- 上下文长
什么场景用 Flash:
- 新手入门,先跑通流程
- 日常聊天,不太追求文笔
- 想试不同的角色卡,但不舍得花 Claude 的钱
- 做总结、做翻译(性价比无敌)
Flash 的弱点:
- 复杂心理刻画不如 Claude Sonnet
- 偶尔会犯逻辑错误
- 对复杂世界书的处理有时不到位
某些版本还有更轻量的 Flash-Lite,价格更低,速度更快——适合做大批量自动化任务。
Gemini Pro 模型:中端主力
Gemini Pro 模型 是当前 Claude Sonnet 模型 最大的竞争者。
- 文笔明显比 Flash 好
- 上下文长度和 Sonnet 同档(都是百万级)
- 价格友好(通常是 Sonnet 的 1/2 - 2/3)
什么场景用 Pro:
- 你写长篇连载,需要保留大量历史对话
- 你的角色卡和世界书加起来 30K+ 字
- 你想用 Claude 但预算紧
Pro 的弱点(也是 Gemini 全系的问题):
- 偶尔空回(后面专门讲)
- 流式输出处理不稳定
- 对反审查相对严
Gemini Ultra/Advanced 模型:为什么不一定推荐
Gemini 旗舰版价格逼近 Claude Opus,但综合表现:
- 长上下文还是强(继承全家桶优势)
- 写作质量比 Pro 提升不明显(差距小)
- 多模态(理解图片、3D 等)是真亮点
如果你只做角色扮演:Pro 已经足够,旗舰版性价比反而不如 Pro。 如果你做多模态(自动配图、图片识别等):旗舰版才能体现差距。
Gemini 的脾气:你必须知道的问题
1. 空回复
最让人崩溃的现象:
- 你发一句话
- AI 回复了个空白
- 你重发,还是空白
原因复杂,包括:
- 内容触发审查(Gemini 内容审核相对严)
- 流式输出代理断裂
- 模型自己判定停了
解决方案:
- 关闭流式输出(关掉 Stream)
- 重新生成一次(80% 概率好转)
- 检查内容是否敏感
- 备用模型顶上
2. 反截断必须做
Gemini 比 Claude 更容易"中途停"。
预设里必须有反截断指令,大致内容:
不要中途停止回复。完整地表达你的想法,即使内容很长。 不要以问号、删节号或开放式结尾结束。
3. 关闭 Stream 是金科玉律
几乎所有 Gemini 用户都开非流式。空回复 / 截断的全套排查见 《AI 回复空白 / 截断》。流式带来的体验提升,远不如它带来的稳定性损失。
Penalty 参数怎么设
跟 Claude 不同,Gemini 支持 Frequency / Presence Penalty。
- Frequency Penalty: 0.1-0.2(防重复)
- Presence Penalty: 0.1-0.25(鼓励新内容)
- Temperature: 1.0-1.2
- Top P: 0.9
- Top K: 40-50(Gemini 支持,Claude 不支持)
国内怎么用 Gemini
跟 Claude 一样:
- 官方需要 Google 账号、海外 IP、海外信用卡
- 95% 中文玩家走中转
中转价格比 Claude 便宜很多,这也是 Gemini 在国内特别流行的原因之一。
长上下文场景特别提醒:Gemini 的上下文虽然长,但按量计费下,长上下文 token 成本会快速堆高。如果你经常使用 50 万+ token 的对话,强烈建议选按次计费的渠道,详见 按次 vs 按量计费。
老版本还能用吗?
可以。Gemini 老版本(比如 Pro 系列的上一代)通常:
- 价格更便宜
- 中转商支持更广
- 预设和反截断方案适配更成熟
实战经验:除非新版有重大功能突破,老版本通常更稳。
选型方法论
- 日常使用、长篇连载:Gemini Pro 模型(主力)
- 极致文笔关键剧情:切到 Claude Sonnet/Opus
- 总结/翻译/批处理:Gemini Flash 模型 / Flash-Lite
- 主渠道挂了的备份:多备一个中转商
新人推荐:Flash 起步,Pro 升级。