Skip to main content

^ ドキュメント読み取りツール

CaretiのAIはパスを指定するだけで様々なドキュメントファイルを直接読み取ることができます。ユーザーがファイルを添付する必要はありません。

Clineとの違い

機能ClineCareti
PDF読み取りユーザー添付時のみAIがパスで直接読み取り
DOCX/XLSX読み取りユーザー添付時のみAIがパスで直接読み取り
ハングル (HWPX)未サポートサポート
ハングル 5.0 (HWP)未サポートサポート
PowerPoint (PPTX)未サポートサポート
Jupyter Notebook未サポートサポート

サポート形式

形式拡張子説明
PDF.pdfテキスト抽出
Word.docx最新のWord文書
Excel.xlsx最新のExcelスプレッドシート
PowerPoint.pptxスライドテキスト抽出
ハングル (新型).hwpxハングル 2014以降
ハングル (旧型).hwpハングル 5.0 ~ 2010
Jupyter.ipynbノートブックセル内容

未サポート形式

レガシーバイナリ形式はサポートしていません:

形式拡張子代替案
Word 97-2003.doc.docxに変換
Excel 97-2003.xls.xlsxに変換
PowerPoint 97-2003.ppt.pptxに変換

変換ツール: LibreOffice、Google Docs、Microsoft Office

使い方

例1: 仕様書の分析

ユーザー: docs/spec.pdf を分析して
AI: [ドキュメント読み取りツール使用] → PDF内容抽出 → 分析結果を提供

例2: ハングル文書の読み取り

ユーザー: 契約書.hwp の内容を要約して
AI: [ドキュメント読み取りツール使用] → HWPテキスト抽出 → 要約を提供

例3: Excelデータの分析

ユーザー: sales-report.xlsx のデータを分析して
AI: [ドキュメント読み取りツール使用] → スプレッドシートデータ抽出 → 分析結果を提供

セキュリティ

パス保護

  • パス正規化によるディレクトリトラバーサル攻撃を防止
  • ワークスペース内のファイルは自動承認
  • 外部ファイルはユーザー承認が必要

ファイルサイズ制限

  • 最大50MB
  • 超過時は明確なエラーメッセージを表示

設定

ドキュメント読み取りツールはデフォルトで有効です。読み取り専用の操作なので、別途の設定トグルはありません。

既知の制限事項

  1. 画像/チャート非対応: 文書内の画像、チャートはテキストに変換されません
  2. 複雑なレイアウト: 表、マルチカラムレイアウトは単純なテキストに変換されます
  3. 元の書式の損失: フォント、色などの書式情報は抽出されません

関連ドキュメント