The Open-Source Manga Translation IDE
AI-powered OCR · Smart Cleaning · Pro Typesetting — all in your browser.
komakun-showcase-compressed.mp4
KomaKun! is a browser-based manga/comic translation IDE. Import raw scans, run AI-powered OCR, clean text with neural inpainting, translate with LLMs, and typeset — all in one workspace. No install required for end users.
- Node.js ≥ 18
- pnpm (recommended) or npm / yarn
# 1. Clone
git clone https://github.com/nicejoy/komakun.git
cd komakun
# 2. Install dependencies
pnpm install
# 3. Run development server
pnpm devOpen http://localhost:3000 and create a local profile to start.
KomaKun! relies on external APIs for OCR, inpainting, and translation. You only need 2 API keys to unlock all features if you choose Replicate as your LLM provider.
This key powers OCR (text detection on manga pages). Without it, text auto-detection will not work.
⚠️ This is a Google Cloud API key, different from the Google AI Studio key used for Gemini LLM models.
How to create:
- Go to Google Cloud Console.
- Create a new project (or select an existing one).
- Navigate to APIs & Services → Library.
- Search for Cloud Vision API and click Enable.
- Go to APIs & Services → Credentials.
- Click + CREATE CREDENTIALS → API key.
- Copy the generated key.
- (Recommended) Click Edit API key → under API restrictions, select Restrict key and choose only Cloud Vision API.
Setup in KomaKun!: Settings → Vision API → Paste your key → Validate & Save.
All keys are stored locally in your browser (IndexedDB). They are never sent to any server other than the respective API endpoints.
A single Replicate key powers both inpainting (smart text cleaning) and LLM translation. This is the recommended setup — only 2 API keys total for the full workflow.
How to create:
- Go to replicate.com and sign in.
- Navigate to Account Settings → API tokens.
- Create a new token and copy it.
Setup in KomaKun!:
- Settings → Inpainting → Select Replicate → Paste your key → Save Replicate Key.
- Settings → Model Config → Select Replicate as AI Provider → Choose a model → Validate & Save. The Replicate API key from step 1 is automatically shared — no need to enter it again.
Available Replicate models:
| Model | Description |
|---|---|
| DeepSeek V3.1 | Strong multilingual translation |
| GPT-5.2 | OpenAI's latest via Replicate |
| GPT-4.1 | Balanced cost and quality |
| Gemini 2.5 Flash | Fast and cost-effective |
| Kimi K2.5 | Moonshot AI's flagship |
If you prefer a different LLM provider for translation, KomaKun! also supports:
| Provider | Models | API Key Source |
|---|---|---|
| Google (Gemini) | Gemini 3 Flash, Gemini 2.5 Flash, Gemini 3.1 Pro | Google AI Studio |
| OpenAI | GPT-5.2, GPT-5 Mini, GPT-4.1, GPT-5.2 Pro | OpenAI Platform |
| OpenRouter | 100+ models (dynamically fetched) | OpenRouter |
| Local | Any OpenAI-compatible endpoint (Ollama, etc.) | No key needed |
⚠️ The Google (Gemini) API key is obtained from Google AI Studio, not from Google Cloud Console. It is a separate key from the Cloud Vision API key used for OCR.
Switch providers anytime in Settings → Model Config.
pnpm build # outputs to .next/
pnpm start # serves the production build- Next.js 16 (App Router, Turbopack)
- Tailwind CSS v4 + shadcn/ui
- Framer Motion for animations
- Zustand for state management
- next-intl for i18n (en, zh, zh-TW, ja)
- IndexedDB for local data persistence
- react-konva for canvas rendering
GNU Affero General Public License v3.0 — free to use, fork, and self-host. Any modified version served over a network must also be open-sourced under the same license.
KomaKun!(分镜君!)是一个基于浏览器的漫画翻译 IDE。导入生扫页面,用 AI 进行 OCR 文字识别,神经修复去字,LLM 翻译,专业嵌字——全部在一个工作区完成。终端用户无需安装任何软件。
- Node.js ≥ 18
- pnpm(推荐)或 npm / yarn
# 1. 克隆仓库
git clone https://github.com/nicejoy/komakun.git
cd komakun
# 2. 安装依赖
pnpm install
# 3. 启动开发服务器
pnpm dev打开 **http://localhost:3000**,创建本地档案即可开始使用。
KomaKun! 依赖外部 API 实现 OCR、图像修复和翻译。如果选择 Replicate 作为 LLM 供应商,你只需要 2 个 API 密钥即可解锁全部功能。
用于 OCR(漫画页面文字检测)。没有它,自动文字识别将无法工作。
⚠️ 这是 Google Cloud API 密钥,与下方用于 Gemini LLM 模型的 Google AI Studio 密钥不同。
如何创建:
- 前往 Google Cloud Console。
- 创建新项目(或选择已有项目)。
- 进入 APIs & Services → 库。
- 搜索 Cloud Vision API,点击启用。
- 进入 APIs & Services → 凭据。
- 点击 + 创建凭据 → API 密钥。
- 复制生成的密钥。
- (建议) 点击编辑 API 密钥 → API 限制中选择限制密钥,仅勾选 Cloud Vision API。
在 KomaKun! 中配置: 设置 → Vision API → 粘贴密钥 → 验证并保存。
所有密钥仅存储在浏览器本地(IndexedDB),不会发送到对应 API 端点以外的任何服务器。
一个 Replicate 密钥同时驱动图像修复(智能去字)和 LLM 翻译。这是推荐的配置方式——全流程总共只需 2 个 API 密钥。
如何创建:
- 前往 replicate.com 并登录。
- 进入 Account Settings → API tokens。
- 创建新的 token 并复制。
在 KomaKun! 中配置:
- 设置 → 图像修复 → 选择 Replicate → 粘贴密钥 → 保存 Replicate 密钥。
- 设置 → 模型设置 → 选择 Replicate 作为 AI 供应商 → 选择模型 → 验证并保存。 第 1 步的 Replicate API 密钥会自动共享,无需重复输入。
可用的 Replicate 模型:
| 模型 | 说明 |
|---|---|
| DeepSeek V3.1 | 强大的多语言翻译 |
| GPT-5.2 | 通过 Replicate 使用 OpenAI 最新模型 |
| GPT-4.1 | 性价比均衡 |
| Gemini 2.5 Flash | 快速且经济 |
| Kimi K2.5 | 月之暗面旗舰模型 |
如果你偏好其他 LLM 供应商进行翻译,KomaKun! 还支持:
| 供应商 | 模型 | API 密钥来源 |
|---|---|---|
| Google (Gemini) | Gemini 3 Flash, Gemini 2.5 Flash, Gemini 3.1 Pro | Google AI Studio |
| OpenAI | GPT-5.2, GPT-5 Mini, GPT-4.1, GPT-5.2 Pro | OpenAI Platform |
| OpenRouter | 100+ 模型(动态获取) | OpenRouter |
| 本地 | 任何 OpenAI 兼容端点(Ollama 等) | 无需密钥 |
⚠️ Google (Gemini) 的 API 密钥从 Google AI Studio 获取,不是从 Google Cloud Console。它与 OCR 使用的 Cloud Vision API 密钥是两个不同的密钥。
随时在设置 → 模型设置中切换供应商。
pnpm build # 输出到 .next/
pnpm start # 启动生产服务- Next.js 16(App Router, Turbopack)
- Tailwind CSS v4 + shadcn/ui
- Framer Motion 动画
- Zustand 状态管理
- next-intl 国际化(en, zh, zh-TW, ja)
- IndexedDB 本地数据持久化
- react-konva 画布渲染
GNU Affero 通用公共许可证 v3.0 —— 免费使用、Fork、自建部署。任何通过网络提供服务的修改版本必须同样以相同许可证开源。
KomaKun!(コマくん!)は、ブラウザベースのマンガ翻訳 IDE です。生スキャンをインポートし、AI による OCR でテキストを検出、ニューラルインペインティングで消字、LLM で翻訳、そしてプロ品質の植字——すべてひとつのワークスペースで完結します。エンドユーザーのインストールは不要です。
- Node.js ≥ 18
- pnpm(推奨)または npm / yarn
# 1. クローン
git clone https://github.com/nicejoy/komakun.git
cd komakun
# 2. 依存関係をインストール
pnpm install
# 3. 開発サーバーを起動
pnpm devhttp://localhost:3000 を開き、ローカルプロフィールを作成すれば利用開始です。
KomaKun! は OCR、修復、翻訳に外部 API を使用します。LLM プロバイダーに Replicate を選べば、API キーは 2 つだけで全機能が使えます。
OCR(マンガページのテキスト検出)に使用します。これがないと自動検出は動作しません。
⚠️ これは Google Cloud の API キーであり、下記の Gemini LLM モデル用 Google AI Studio キーとは別物です。
作成手順:
- Google Cloud Console にアクセス。
- 新しいプロジェクトを作成(または既存のものを選択)。
- APIs & Services → ライブラリ に移動。
- Cloud Vision API を検索し、有効にする をクリック。
- APIs & Services → 認証情報 に移動。
- + 認証情報を作成 → API キー をクリック。
- 生成されたキーをコピー。
- (推奨) API キーを編集 → API の制限 で キーを制限 を選び、Cloud Vision API のみを選択。
KomaKun! での設定: 設定 → Vision API → キーを貼り付け → 検証して保存。
すべてのキーはブラウザのローカルストレージ(IndexedDB)にのみ保存されます。各 API エンドポイント以外のサーバーに送信されることはありません。
Replicate キー 1 つでインペインティング(スマート消字)と LLM 翻訳の両方が使えます。推奨のセットアップで、全ワークフローに必要なキーは合計 2 つだけです。
作成手順:
- replicate.com にアクセスしてサインイン。
- Account Settings → API tokens に移動。
- 新しいトークンを作成してコピー。
KomaKun! での設定:
- 設定 → 修復 → Replicate を選択 → キーを貼り付け → Replicate キーを保存。
- 設定 → モデル設定 → AI プロバイダーとして Replicate を選択 → モデルを選択 → 検証して保存。 ステップ 1 の Replicate API キーが自動的に共有されるため、再入力は不要です。
利用可能な Replicate モデル:
| モデル | 説明 |
|---|---|
| DeepSeek V3.1 | 優れた多言語翻訳 |
| GPT-5.2 | Replicate 経由で OpenAI 最新モデル |
| GPT-4.1 | コストと品質のバランス |
| Gemini 2.5 Flash | 高速・低コスト |
| Kimi K2.5 | Moonshot AI のフラッグシップ |
他の LLM プロバイダーを使いたい場合、以下にも対応しています:
| プロバイダー | モデル | API キーの取得先 |
|---|---|---|
| Google (Gemini) | Gemini 3 Flash, Gemini 2.5 Flash, Gemini 3.1 Pro | Google AI Studio |
| OpenAI | GPT-5.2, GPT-5 Mini, GPT-4.1, GPT-5.2 Pro | OpenAI Platform |
| OpenRouter | 100 以上のモデル(動的取得) | OpenRouter |
| ローカル | OpenAI 互換エンドポイント(Ollama 等) | キー不要 |
⚠️ Google (Gemini) の API キーは Google AI Studio から取得します。Google Cloud Console からではありません。OCR 用の Cloud Vision API キーとは別のキーです。
設定 → モデル設定 でいつでもプロバイダーを切り替えられます。
pnpm build # .next/ に出力
pnpm start # 本番ビルドを起動- Next.js 16(App Router, Turbopack)
- Tailwind CSS v4 + shadcn/ui
- Framer Motion(アニメーション)
- Zustand(状態管理)
- next-intl(i18n: en, zh, zh-TW, ja)
- IndexedDB(ローカルデータ永続化)
- react-konva(キャンバスレンダリング)
GNU Affero General Public License v3.0 — 無料で利用、フォーク、セルフホスト可能。ネットワーク経由でサービスを提供する改変版も、同じライセンスでソースを公開する必要があります。