面接音声をWhisperXでローカル文字起こし→話者分離し、Gemini APIで良かった点・改善点・スコアを自動分析するWebアプリ。設計〜デプロイまで全工程を個人開発し実動中。
「無料・ローカル・一般論にならない分析」を同時に満たす面接フィードバックツールが存在しなかったため自作。面接音声をアップロードするとWhisperX(large-v3-turbo)でローカル文字起こし・話者分離を行い、Gemini APIが良かった点・改善点・スコアを自動生成する。設計・実装・テスト・デプロイ・セキュリティ対策まで全工程を一人で担当。
| レイヤー | 技術 |
|---|---|
| バックエンド | Python / FastAPI / WhisperX(large-v3-turbo) |
| 分析 | Gemini API(gemma-3-27b-it) |
| フロントエンド | React / Vite / TypeScript |
| 認証 / DB | Supabase(PostgreSQL + RLS + JWT) |
| インフラ | Cloudflare Tunnel(バックエンド)+ Cloudflare Pages(フロントエンド) |
vad_onset/offset=0.1・chunk_size=30 を設定し、長い音声での発話取りこぼしを防止フェーズ0(スクリプト単体)→ フェーズ11(UX改善・本番公開)まで約2週間で完成。実際の就活カジュアル面談音声(複数社)で動作確認済み。