OpenAIのWhisperを活用して文字起こしを行うためのソフトウェアです。
graph LR
A[音声ファイル] --> B[FFmpeg<br/>WAV変換]
B --> C[Faster-Whisper<br/>文字起こし]
C --> D[CSV出力<br/>タイムスタンプ付き]
style A fill:#e3f2fd
style B fill:#fff3e0
style C fill:#fff3e0
style D fill:#ffebee
- Whisper
- models
base.pt(速度重視)small.pt(精度重視)- small(精度重視)
- medium(最高精度)
- Python Embeddable(Python環境)
- Python 3.11.4
Whisper.py(Whisper)- Faster-Whisper.py(Faster-Whisper)
- FFmpeg.exe(音声変換)
- models
- Transcribe-Suppoter
- Suppoter.html
- Suppoter.js
- css
- bootstrap5.3.0
- js
- bootstrap5.3.0
- index.html(GUI表示)
- main.js(メインプロセス処理)
- renderer.js(レンダラプロセス処理)
- preload.js(メインプロセスとレンダラプロセス間のIPC通信に係る初期定義)
使用するには、Whisper及びFFmpeg.exeを指定のディレクトリに配置する必要があります。
また、ローカル環境で実行する場合は、Whisperのモデル・Python Embeddableをあらかじめダウンロードしておく必要があります。
- FFmpeg = src/Whisper/FFmpeg.exe
Whisper = src/Whisper/Whisper.pyv2.0.0で廃止- Faster-Whisper = src/Whisper/FasterWhisper.py
- models -> small,medium = src/Whisper/models/small,medium Faster-Whisper
- Python Embeddable = src/Whisper/Python Embeddable.zipの中身
- models =
src/Whisper/models/xxx.ptv2.0.0で廃止 なお、pipの整備とFaster-whisperのインポートが必要です。
- FFmpeg.exeのダウンロード
- Python Embeddableのダウンロード
- pipのインストール
Whisperのインストール- Faster-Whisperのインストール
Whisperモデルのダウンロード- Faster-Whisperモデルのインストール
- Electronプロジェクトのビルド を行います。なお、buildに当たってはWindows環境を利用します。
bootstrapのバージョンを引き上げる- Transcribe-Suppoterの機能を向上する
Whisperの高速化を図る(faster-whisperの利用など)- LICENSEファイルを整備する
| バージョンの段階 | 例 | 開発者へのメッセージ |
|---|---|---|
| 開発中 | v0.x.x |
このモジュールがまだ開発中であり、不安定であることを示します。このリリースは、後方互換性や安定性を保証しません。 |
| メジャーバージョン | v1.x.x |
後方互換性のない、公開APIの変更を示します。このリリースは、以前のメジャーバージョンとの後方互換性を保証しません。 |
| マイナーバージョン | vx.4.x |
後方互換性のある、公開APIの変更を示します。このリリースは後方互換性と安定性を保証します。 |
| パッチバージョン | vx.x.1 |
モジュールの公開APIや依存関係に影響を与えない変更を示します。このリリースは後方互換性と安定性を保証します。 |
| プレリリースバージョン | vx.x.x-beta.2 |
アルファ版やベータ版のような、リリース前のマイルストーンであることを示します。このリリースは安定性を保証しません。 |
