^ 图像工具
Careti的AI可以生成和分析图像。
与Cline的区别
| 功能 | Cline | Careti |
|---|---|---|
| 图像生成 | 不支持 | 通过generate_image工具支持 |
| 图像分析 (非视觉模型) | 不支持 | 通过analyze_image工具支持 |
| 比例/尺寸设置 | 不支持 | 可在UI中配置 |
| 基于参考图像生成 | 不支持 | 支持Image-to-Image |
图像生成
使用示例
用户: 创建一张可爱的猫咪图片
AI: [使用generate_image工具] → 生成图像 → 保存到assets/
配置选项
| 选项 | 值 | 说明 |
|---|---|---|
| 比例 | 16:9, 9:16, 4:3, 3:4, 1:1 | 图像宽高比 |
| 尺寸 | 1K, 2K, 3K, 4K | 图像分辨率 |
设置位置: Settings > Image Generation
保存位置
生成的图像保存在项目的assets/文件夹中:
assets/
├── img_abc123.png # 生成的图像
└── img_abc123.md # 元数据 (提示词、设置等)
图像分析
视觉模型 vs 文本模型
| 模型类型 | 图像分析方法 |
|---|---|
| 视觉模型 (GPT-4o, Claude 3.5等) | 通过read_file直接分析 |
| 文本模型 (o1, GLM-4等) | 使用analyze_image工具 |
使用示例
# 非视觉模型 (GLM-4.7等)
用户: [附加图像] 这张图片里有什么?
AI: [使用analyze_image工具] → 使用Gemini Flash分析 → 返回结果
分析模型选择
使用文本模型时,可以选择用于图像分析的模型:
gemini-2.5-flash(默认)gemini-3.0-flash-preview
设置位置: Settings > Model Info > Image Analysis Model
认证要求
| 工具 | 要求 |
|---|---|
generate_image | 需要Careti登录 |
analyze_image | 需要Careti登录 (仅文本模型) |
配置
自动批准设置
| 设置 | 默认值 | 说明 |
|---|---|---|
generateImages | true | 启用图像生成工具 |
analyzeImages | true | 启用图像分析工具 |
设置位置: Settings > Auto-approve
安全性
图像分析批准
| 文件位置 | 行为 |
|---|---|
| 工作区内 | ✅ 自动批准 |
| 工作区外 | ⚠️ 需要用户批准 |
图像格式
支持的图像扩展名:
.png,.jpg,.jpeg,.webp.gif,.avif,.bmp,.tiff
已知限制
- 需要认证: 图像工具需要Careti登录
- 单次执行: 图像工具一次只能运行一个
- 尺寸限制: 图像最大像素为7500px
相关文档
- 文档读取工具 - AI直接读取文档功能
- AI组织知识与规则标准化 - 项目规则管理