Skip to content

toyfer/AITranscribe-Electron

Repository files navigation

Display Git Log FullBuild AITranscribe-Electron for Windows PertialBuild AITranscribe-Electron for Windows

AITranscribe

概要

OpenAIのWhisperを活用して文字起こしを行うためのソフトウェアです。

処理フロー概要

graph LR
    A[音声ファイル] --> B[FFmpeg<br/>WAV変換]
    B --> C[Faster-Whisper<br/>文字起こし]
    C --> D[CSV出力<br/>タイムスタンプ付き]
    
    style A fill:#e3f2fd
    style B fill:#fff3e0
    style C fill:#fff3e0
    style D fill:#ffebee
Loading

ドキュメント

ビルド手順

ディレクトリ構造

  • Whisper
    • models
      • base.pt(速度重視)
      • small.pt(精度重視)
      • small(精度重視)
      • medium(最高精度)
    • Python Embeddable(Python環境)
      • Python 3.11.4
    • Whisper.py(Whisper)
    • Faster-Whisper.py(Faster-Whisper)
    • FFmpeg.exe(音声変換)
  • Transcribe-Suppoter
    • Suppoter.html
    • Suppoter.js
  • css
    • bootstrap5.3.0
  • js
    • bootstrap5.3.0
  • index.html(GUI表示)
  • main.js(メインプロセス処理)
  • renderer.js(レンダラプロセス処理)
  • preload.js(メインプロセスとレンダラプロセス間のIPC通信に係る初期定義)

使用方法

使用するには、Whisper及びFFmpeg.exeを指定のディレクトリに配置する必要があります。
また、ローカル環境で実行する場合は、Whisperのモデル・Python Embeddableをあらかじめダウンロードしておく必要があります。

  • FFmpeg = src/Whisper/FFmpeg.exe
  • Whisper = src/Whisper/Whisper.pyv2.0.0で廃止
  • Faster-Whisper = src/Whisper/FasterWhisper.py
    • models -> small,medium = src/Whisper/models/small,medium Faster-Whisper
  • Python Embeddable = src/Whisper/Python Embeddable.zipの中身
  • models = src/Whisper/models/xxx.ptv2.0.0で廃止 なお、pipの整備とFaster-whisperのインポートが必要です。

GitHubActions

  1. FFmpeg.exeのダウンロード
  2. Python Embeddableのダウンロード
  3. pipのインストール
  4. Whisperのインストール
  5. Faster-Whisperのインストール
  6. Whisperモデルのダウンロード
  7. Faster-Whisperモデルのインストール
  8. Electronプロジェクトのビルド を行います。なお、buildに当たってはWindows環境を利用します。

今後の課題

  1. bootstrapのバージョンを引き上げる
  2. Transcribe-Suppoterの機能を向上する
  3. Whisperの高速化を図る(faster-whisperの利用など)
  4. LICENSEファイルを整備する

バージョン番号の整理方法

image

バージョンの段階 開発者へのメッセージ
開発中 v0.x.x このモジュールがまだ開発中であり、不安定であることを示します。このリリースは、後方互換性や安定性を保証しません。
メジャーバージョン v1.x.x 後方互換性のない、公開APIの変更を示します。このリリースは、以前のメジャーバージョンとの後方互換性を保証しません。
マイナーバージョン vx.4.x 後方互換性のある、公開APIの変更を示します。このリリースは後方互換性と安定性を保証します。
パッチバージョン vx.x.1 モジュールの公開APIや依存関係に影響を与えない変更を示します。このリリースは後方互換性と安定性を保証します。
プレリリースバージョン vx.x.x-beta.2 アルファ版やベータ版のような、リリース前のマイルストーンであることを示します。このリリースは安定性を保証しません。

About

No description or website provided.

Topics

Resources

License

Stars

Watchers

Forks

Packages

 
 
 

Contributors