Skip to main content

^ 图像工具

Careti的AI可以生成分析图像。

与Cline的区别

功能ClineCareti
图像生成不支持通过generate_image工具支持
图像分析 (非视觉模型)不支持通过analyze_image工具支持
比例/尺寸设置不支持可在UI中配置
基于参考图像生成不支持支持Image-to-Image

图像生成

使用示例

用户: 创建一张可爱的猫咪图片
AI: [使用generate_image工具] → 生成图像 → 保存到assets/

配置选项

选项说明
比例16:9, 9:16, 4:3, 3:4, 1:1图像宽高比
尺寸1K, 2K, 3K, 4K图像分辨率

设置位置: Settings > Image Generation

保存位置

生成的图像保存在项目的assets/文件夹中:

assets/
├── img_abc123.png # 生成的图像
└── img_abc123.md # 元数据 (提示词、设置等)

图像分析

视觉模型 vs 文本模型

模型类型图像分析方法
视觉模型 (GPT-4o, Claude 3.5等)通过read_file直接分析
文本模型 (o1, GLM-4等)使用analyze_image工具

使用示例

# 非视觉模型 (GLM-4.7等)
用户: [附加图像] 这张图片里有什么?
AI: [使用analyze_image工具] → 使用Gemini Flash分析 → 返回结果

分析模型选择

使用文本模型时,可以选择用于图像分析的模型:

  • gemini-2.5-flash (默认)
  • gemini-3.0-flash-preview

设置位置: Settings > Model Info > Image Analysis Model

认证要求

工具要求
generate_image需要Careti登录
analyze_image需要Careti登录 (仅文本模型)

配置

自动批准设置

设置默认值说明
generateImagestrue启用图像生成工具
analyzeImagestrue启用图像分析工具

设置位置: Settings > Auto-approve

安全性

图像分析批准

文件位置行为
工作区内✅ 自动批准
工作区外⚠️ 需要用户批准

图像格式

支持的图像扩展名:

  • .png, .jpg, .jpeg, .webp
  • .gif, .avif, .bmp, .tiff

已知限制

  1. 需要认证: 图像工具需要Careti登录
  2. 单次执行: 图像工具一次只能运行一个
  3. 尺寸限制: 图像最大像素为7500px

相关文档