Go Gemini API PDF Processing CLI
PDF → AI処理システム
Gemini APIを使ったPDF解析・データ抽出パイプライン。大量ドキュメントからの構造化データ自動生成を目的に開発。
背景・動機
[TODO: なぜこのシステムを作る必要があったか。どんなドキュメントを、どんな目的で処理したいのか。 例: 「大量の請求書PDFを手動でスプレッドシートに転記していた」「研究論文から引用箇所を自動抽出したかった」など]
解決したかった課題
[TODO: 手作業でやっていた場合の問題点を具体的に。 例:
- 月に○件のPDFを手動処理していてN時間かかっていた
- OCRだけでは表や複雑なレイアウトに対応できなかった
- 抽出精度のばらつきが問題だった]
技術選定の理由
GoをメインCLIに選んだ理由: [TODO: PythonではなくGoを使った理由。バイナリの配布・速度・型安全性のどれが主な動機か]
Gemini APIを選んだ理由: [TODO: OpenAI等と比較してGemini APIを選んだ理由。コスト・PDF対応の容易さ・精度など]
実装のポイント
[TODO: アーキテクチャの工夫を具体的に。 例:
- PDF → テキスト抽出 → プロンプト構築 → API呼び出し → JSON検証 のパイプライン設計
- プロンプトエンジニアリングで精度を上げた工夫
- エラー時のリトライ・部分的な失敗への対応]
現在の状況・課題
[TODO: 現時点で動いている範囲と、まだ未解決の問題を正直に書く。 開発中であれば「現在○○を実装中」と明記する。「検証中」より具体的に]