AITranscribe

概要

OpenAIのWhisperを活用して文字起こしを行うためのソフトウェアです。

処理フロー概要

graph LR
    A[音声ファイル] --> B[FFmpeg<br/>WAV変換]
    B --> C[Faster-Whisper<br/>文字起こし]
    C --> D[CSV出力<br/>タイムスタンプ付き]
    
    style A fill:#e3f2fd
    style B fill:#fff3e0
    style C fill:#fff3e0
    style D fill:#ffebee

ドキュメント

処理フロー図 - アプリケーションの処理フローを視覚化したドキュメント
アーキテクチャ概要 - システム設計と技術的詳細の説明

ビルド手順

ディレクトリ構造

Whisper
- models
  - ~~base.pt(速度重視)~~
  - ~~small.pt(精度重視)~~
  - small(精度重視)
  - medium(最高精度)
- Python Embeddable(Python環境)
  - Python 3.11.4
- ~~Whisper.py(Whisper)~~
- Faster-Whisper.py(Faster-Whisper)
- FFmpeg.exe(音声変換)
Transcribe-Suppoter
- Suppoter.html
- Suppoter.js
css
- bootstrap5.3.0
js
- bootstrap5.3.0
index.html(GUI表示)
main.js(メインプロセス処理)
renderer.js(レンダラプロセス処理)
preload.js(メインプロセスとレンダラプロセス間のIPC通信に係る初期定義)

使用方法

使用するには、Whisper及びFFmpeg.exeを指定のディレクトリに配置する必要があります。
また、ローカル環境で実行する場合は、Whisperのモデル・Python Embeddableをあらかじめダウンロードしておく必要があります。

FFmpeg = src/Whisper/FFmpeg.exe
~~Whisper = src/Whisper/Whisper.py~~v2.0.0で廃止
Faster-Whisper = src/Whisper/FasterWhisper.py
- models -> small,medium = src/Whisper/models/small,medium Faster-Whisper
Python Embeddable = src/Whisper/Python Embeddable.zipの中身
models = ~~src/Whisper/models/xxx.pt~~v2.0.0で廃止なお、pipの整備とFaster-whisperのインポートが必要です。

GitHubActions

FFmpeg.exeのダウンロード
Python Embeddableのダウンロード
pipのインストール
~~Whisperのインストール~~
Faster-Whisperのインストール
~~Whisperモデルのダウンロード~~
Faster-Whisperモデルのインストール
Electronプロジェクトのビルドを行います。なお、buildに当たってはWindows環境を利用します。

今後の課題

~~bootstrapのバージョンを引き上げる~~
Transcribe-Suppoterの機能を向上する
~~Whisperの高速化を図る(faster-whisperの利用など)~~
LICENSEファイルを整備する

バージョン番号の整理方法

バージョンの段階	例	開発者へのメッセージ
開発中	`v0.x.x`	このモジュールがまだ開発中であり、不安定であることを示します。このリリースは、後方互換性や安定性を保証しません。
メジャーバージョン	`v1.x.x`	後方互換性のない、公開APIの変更を示します。このリリースは、以前のメジャーバージョンとの後方互換性を保証しません。
マイナーバージョン	`vx.4.x`	後方互換性のある、公開APIの変更を示します。このリリースは後方互換性と安定性を保証します。
パッチバージョン	`vx.x.1`	モジュールの公開APIや依存関係に影響を与えない変更を示します。このリリースは後方互換性と安定性を保証します。
プレリリースバージョン	`vx.x.x-beta.2`	アルファ版やベータ版のような、リリース前のマイルストーンであることを示します。このリリースは安定性を保証しません。

Name		Name	Last commit message	Last commit date
Latest commit History 159 Commits
.github/workflows		.github/workflows
assets		assets
src		src
tests		tests
.eslintrc.json		.eslintrc.json
.gitignore		.gitignore
ARCHITECTURE.md		ARCHITECTURE.md
DEVELOPMENT.md		DEVELOPMENT.md
ELECTRON_UPGRADE.md		ELECTRON_UPGRADE.md
LICENSE		LICENSE
PROCESSING_FLOW.md		PROCESSING_FLOW.md
README.md		README.md
jest.config.json		jest.config.json
package-lock.json		package-lock.json
package.json		package.json
package_init.json		package_init.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AITranscribe

概要

処理フロー概要

ドキュメント

ビルド手順

ディレクトリ構造

使用方法

GitHubActions

今後の課題

バージョン番号の整理方法

About

Uh oh!

Releases 3

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

AITranscribe

概要

処理フロー概要

ドキュメント

ビルド手順

ディレクトリ構造

使用方法

GitHubActions

今後の課題

バージョン番号の整理方法

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 3

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages