模型选择指南

新模型不断发布，因此本指南重点关注目前与 Caret 配合良好的模型。随着形势变化，我们会持续更新。

当前顶级模型

模型	上下文窗口	输入价格*	输出价格*	最适合
Claude Sonnet 4	1M tokens	$3-6	$15-22.50	可靠的工具使用，复杂代码库
Qwen3 Coder	256K tokens	$0.20	$0.80	编程任务，开源灵活性
Gemini 2.5 Pro	1M+ tokens	TBD	TBD	大型代码库，文档分析
GPT-5	400K tokens	$1.25	$10	最新 OpenAI 技术，三种模式

*每百万令牌

模型	上下文窗口	输入价格*	输出价格*	注释
DeepSeek V3	128K tokens	$0.14	$0.28	日常编程的极佳价值
DeepSeek R1	128K tokens	$0.55	$2.19	预算推理冠军
Qwen3 32B	128K tokens	不等	不等	开源，多个提供商
Z AI GLM 4.5	128K tokens	TBD	TBD	MIT许可，混合推理

*每百万令牌

性能注意：大多数模型在 400-500K tokens 左右开始质量下降，即使它们声称有更高的限制。

查看 OpenRouter 的 Caret 使用统计了解社区的真实使用模式。

Caret 使用自动压缩自动处理上下文限制。当您接近模型的限制时，Caret 会总结对话以继续工作。您无需微管理这个过程。

如果您想要可靠性，请从 Claude Sonnet 4 开始。一旦熟悉后，尝试开源选项以找到最适合您工作流程和预算的选择。

形势变化很快——这些建议反映了目前有效的选择，但要留意新版本的发布。