ポートフォリオに戻る
Go Gemini API PDF Processing CLI

PDF → AI処理システム

Gemini APIを使ったPDF解析・データ抽出パイプライン。大量ドキュメントからの構造化データ自動生成を目的に開発。

背景・動機

[TODO: なぜこのシステムを作る必要があったか。どんなドキュメントを、どんな目的で処理したいのか。 例: 「大量の請求書PDFを手動でスプレッドシートに転記していた」「研究論文から引用箇所を自動抽出したかった」など]

解決したかった課題

[TODO: 手作業でやっていた場合の問題点を具体的に。 例:

  • 月に○件のPDFを手動処理していてN時間かかっていた
  • OCRだけでは表や複雑なレイアウトに対応できなかった
  • 抽出精度のばらつきが問題だった]

技術選定の理由

GoをメインCLIに選んだ理由: [TODO: PythonではなくGoを使った理由。バイナリの配布・速度・型安全性のどれが主な動機か]

Gemini APIを選んだ理由: [TODO: OpenAI等と比較してGemini APIを選んだ理由。コスト・PDF対応の容易さ・精度など]

実装のポイント

[TODO: アーキテクチャの工夫を具体的に。 例:

  • PDF → テキスト抽出 → プロンプト構築 → API呼び出し → JSON検証 のパイプライン設計
  • プロンプトエンジニアリングで精度を上げた工夫
  • エラー時のリトライ・部分的な失敗への対応]

現在の状況・課題

[TODO: 現時点で動いている範囲と、まだ未解決の問題を正直に書く。 開発中であれば「現在○○を実装中」と明記する。「検証中」より具体的に]