本ツールは、キャプチャーされた会議録画を音声解析し、効率的な議事録作成をサポートするツールです。
mp4あるいはwav形式の音声データをアップロードするだけで、自動的に文字起こしを行い、要約やフォーマット整形された議事録を生成します。
こちらのコードはバックエンドの改訂版になります。
フロントエンド → HTTPリクエストを送信 → AzureAppService
AzureAppService → queueにメッセージを追加 → AzureFunctions(queueトリガ-/Container環境にデプロイ
AzureAppService = ルートディレクトリ・queueTriger
AzureFunctions = ルートディレクトリ・api/app
- 音声文字起こし: Azure Speech Serviceで音声ファイルを文字起こしをします。
- 要約機能: 文字起こしされたデータをAzure OpenAIに渡し、プロンプトを投げ要約の生成を行います。
- 要約された議事録の保存: 要約された議事録をワードファイルとして保存することが可能です。
- フロントエンド: React(Material UI)
- バックエンド: FastAPI
- クラウドサービス: Azure Speech Service, Azure OpenAI
- ストレージ: Azure Blob Storage
以下の手順で環境構築を行ってください。
-
リポジトリをクローン
git clone https://github.com/sakuya10969/voice_recognition.git cd voice_recognition -
依存関係のインストール
cd client npm install cd .. cd api pip install -r requirements.txt