🏥 SoapVoice 醫療語音轉 SOAP 系統

📖 專案說明

SoapVoice 是一套基於本地 LLM 的醫療語音轉 SOAP 病歷系統：

🎤 即時多語語音輸入（中文、英文）
🧠 AI 驅動的醫療語意標準化與術語專業化（73 個內建映射 + 80+ 術語）
📋 結構化 SOAP 病歷自動產出（含 ICD-10 候選碼預填）
📊 ICD-10 診斷代碼映射與專科分類
💊 藥務推薦與醫囑建議
🔐 內網專用安全部署
🖥️ 支援 CLI 命令列介面
🌐 支援 Windows CPU 離線部署（llama.cpp + Gemma 4:E4B 模型）

🚀 快速開始

選項一：離線版本（推薦，Windows 可打包）

# 執行 Python (使用 Gemma 4 模型)
uv sync
USE_LLAMA_CPP=true uv run python src/cli_typer.py main --text "病人胸悶兩天" --model gemma-4-e4b

功能：

✅ SOAP 病歷生成
✅ 術語標準化（73 個內建映射）
✅ ICD-10 分類（96,802 代碼）
✅ 藥物推薦（12,042 藥品）
✅ 醫囑建議（2,102 項目）
✅ RAG 病例範本檢索（1,665 範本）

選項二：線上版本（需要 Ollama）

# 1. 安裝依賴
uv sync

# 2. 安裝並啟動 Ollama
curl -fsSL https://ollama.ai/install.sh | sh
ollama pull qwen2.5:7b

# 3. 啟動 API 服務
uv run uvicorn src.main:app --host 0.0.0.0 --port 8010 --reload

# 4. 確認服務
curl http://localhost:8010/api/v1/clinical/health

🖥️ Windows 離線部署

打包命令

# 安裝 pyinstaller
uv pip install pyinstaller

# 打包
pyinstaller SoapVoice-Offline.spec --clean

產出

dist/SoapVoice/
├── SoapVoice.exe           # 主程式
├── models/
│   ├── gemma-4-E4B-it-Q4_K_M.gguf  # 2.6GB (首選，效能卓越)
│   └── Qwen2.5-7B-Instruct-Q4_K_M.gguf  # 4.4GB (備用)
└── data/
    └── local_db/medical.db               # 70MB

使用方式

# 生成 SOAP
SoapVoice.exe main --text "病人胸悶兩天伴隨呼吸困難"

# 使用 3B 模型（較快）
SoapVoice.exe main --text "病人發燒" --model qwen2.5-3b

# 啟動 API 伺服器
SoapVoice.exe serve --port 8000

# 列出模型
SoapVoice.exe models

📦 模型配置

LLM 模型（SOAP 生成）- GGUF 離線版本

模型	大小	用途	推薦
Qwen2.5-7B-Instruct-Q4_K_M.gguf	4.4 GB	SOAP 生成	✅ 預設
qwen2.5-3b-instruct-q4_k_m.gguf	2 GB	快速推理	⭐ 輕量

LLM 模型 - Ollama 版本

模型	大小	用途	推薦
qwen2.5:7b	4.7 GB	SOAP 生成	✅ 線上預設
qwen2.5:3b	1.9 GB	快速推理	⭐ 輕量
gemma4:e2b	7.2 GB	測試中	🔄

OCR 模型

模型	大小	用途
glm-ocr (Ollama)	2.2 GB	螢幕截圖 OCR（線上）
EasyOCR (離線)	-	繁體中文 + 英文

ASR 模型

模型	大小	用途
qwen2.5:3b	1.9 GB	語音轉文字
faster-whisper	-	備用語音辨識

🖥️ CLI 使用方式

# 文字輸入生成 SOAP
uv run python src/cli_typer.py main --text "病人咳嗽兩天有痰"

# 指定模型
uv run python src/cli_typer.py main --text "病人胸悶" --model qwen2.5:3b

# 啟動 API 伺服器
uv run python src/cli_typer.py serve

# 列出可用模型
uv run python src/cli_typer.py models

📦 API 端點

端點	方法	說明
`/health`	GET	健康檢查
`/api/v1/clinical/normalize`	POST	術語標準化
`/api/v1/clinical/icd10`	POST	ICD-10 分類
`/api/v1/clinical/soap/generate`	POST	SOAP 生成
`/api/v1/extended/process`	POST	擴展 SOAP（含症狀/ICD-10/醫囑/藥物）

SOAP 生成範例

# 使用 qwen2.5:3b
curl -X POST http://localhost:8010/api/v1/clinical/soap/generate \
  -H "Content-Type: application/json" \
  -d '{"transcript": "病人胸悶兩天伴隨呼吸困難", "model": "qwen2.5:3b"}'

# 使用 qwen2.5:7b
curl -X POST http://localhost:8010/api/v1/clinical/soap/generate \
  -H "Content-Type: application/json" \
  -d '{"transcript": "病人胸悶兩天伴隨呼吸困難", "model": "qwen2.5:7b"}'

💾 資料庫內容

資料表	記錄數	用途
icd10_codes	96,802	ICD-10 疾病分類
drugs	12,042	藥品資料
medical_orders	2,102	醫療服務
case_templates	1,665	病例範本（RAG）

🧪 測試

# 所有測試
uv run pytest tests/ -v

# 快速測試（不需模型）
uv run pytest tests/test_nlp.py tests/test_soap.py tests/test_init.py -v

# 帶覆蓋率
uv run pytest tests/ --cov=src --cov-report=html

🛠️ 技術棧

層次	技術
API 框架	FastAPI + uvicorn
語音辨識	Faster-Whisper
LLM	Ollama / llama.cpp
NLP	自建術語映射器 + ICD-10 分類器
向量資料庫	Chroma + SQLite
套件管理	uv

📁 專案結構

SoapVoice/
├── src/
│   ├── main.py              # FastAPI 入口
│   ├── cli.py               # 舊版 CLI
│   ├── cli_typer.py         # Typer CLI
│   ├── offline_server.py    # 離線伺服器
│   ├── api/                 # API 端點
│   │   ├── rest.py
│   │   ├── extended_api.py
│   │   └── websocket.py
│   ├── asr/                 # 語音辨識
│   ├── nlp/                 # 自然語言處理
│   │   ├── terminology_mapper.py
│   │   ├── icd10_classifier.py
│   │   ├── soap_classifier.py
│   │   └── ocr_parser.py
│   ├── soap/                # SOAP 生成
│   ├── llm/                 # LLM 引擎
│   │   ├── ollama_engine.py
│   │   └── llamacpp_engine.py
│   └── db/                  # 資料庫
├── models/                  # GGUF 模型
│   ├── qwen2.5-3b-instruct-q4_k_m.gguf
│   ├── llama-cpp/           # Linux llama.cpp
│   └── windows/             # Windows 執行檔
├── data/
│   ├── local_db/medical.db
│   └── rag/case_templates.db
├── static/                  # Web 前端
├── tests/                   # 測試
├── docs/                   # 文件
│   └── archives/            # 歸檔文件
├── SoapVoice.spec          # PyInstaller 配置
├── docker-compose.yml      # Docker 部署
└── README.md

📄 授權

MIT License

Windows CPU 離線版本模型選擇建議

LLM 模型 (SOAP 生成) 模型推薦量化 gemma4:e4b Q4_0 qwen2.5:7b Q4_K_M 首選: gemma4:e4b — 輸出更詳細，適合醫療記錄

OCR / 螢幕截圖辨識模型類型 PaddleOCR-VL VLM Tesseract 傳統 OCR Windows OneOCR 系統內建建議: PaddleOCR-VL-1.5 — 離線最強，但需 Python 環境輕量替代: Tesseract — Windows 內建，無需安裝

語音轉文字 (ASR) 模型離線支援 Whisper.cpp ✅ 完全離線 Faster-Whisper ✅ Python SenseVoice ✅ ONNX 建議: Whisper.cpp — Windows 支援完善，medium-q5 量化平衡速度與準確度

Windows 離線執行方案工具 llama.cpp whisper.cpp PaddleOCR LM Studio 推薦組合: llama.cpp + whisper.cpp + Tesseract (輕量) 或 PaddleOCR (完整)

Name		Name	Last commit message	Last commit date
Latest commit History 136 Commits
.claude/skills/nicepkg-ai-workflow-content-repurposer		.claude/skills/nicepkg-ai-workflow-content-repurposer
.planning		.planning
config		config
data		data
dist		dist
docs		docs
examples		examples
installer		installer
scripts		scripts
src		src
static		static
tests		tests
.continue-here.md		.continue-here.md
.env		.env
.env.example		.env.example
.gitattributes		.gitattributes
.gitignore		.gitignore
AGENTS.md		AGENTS.md
CompareModel.md		CompareModel.md
README.md		README.md
WinPlanToDo.md		WinPlanToDo.md
conftest.py		conftest.py
docker-compose.yml		docker-compose.yml
generate_audio.py		generate_audio.py
keywords.json		keywords.json
prompt.md		prompt.md
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
run_gui.py		run_gui.py
server.out		server.out
simple.pid		simple.pid
soapvoice.spec		soapvoice.spec
start.sh		start.sh
start_background_server.py		start_background_server.py
start_gui.py		start_gui.py
start_server.py		start_server.py
start_server.sh		start_server.sh
start_server_simple.py		start_server_simple.py
test_p8.sh		test_p8.sh
test_p8_detail.py		test_p8_detail.py
test_prompt.py		test_prompt.py
test_soap_generation.py		test_soap_generation.py
uv.lock		uv.lock
version_info.txt		version_info.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🏥 SoapVoice 醫療語音轉 SOAP 系統

📖 專案說明

🚀 快速開始

選項一：離線版本（推薦，Windows 可打包）

選項二：線上版本（需要 Ollama）

🖥️ Windows 離線部署

打包命令

產出

使用方式

📦 模型配置

LLM 模型（SOAP 生成）- GGUF 離線版本

LLM 模型 - Ollama 版本

OCR 模型

ASR 模型

🖥️ CLI 使用方式

📦 API 端點

SOAP 生成範例

💾 資料庫內容

🧪 測試

🛠️ 技術棧

📁 專案結構

📄 授權

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🏥 SoapVoice 醫療語音轉 SOAP 系統

📖 專案說明

🚀 快速開始

選項一：離線版本（推薦，Windows 可打包）

選項二：線上版本（需要 Ollama）

🖥️ Windows 離線部署

打包命令

產出

使用方式

📦 模型配置

LLM 模型（SOAP 生成）- GGUF 離線版本

LLM 模型 - Ollama 版本

OCR 模型

ASR 模型

🖥️ CLI 使用方式

📦 API 端點

SOAP 生成範例

💾 資料庫內容

🧪 測試

🛠️ 技術棧

📁 專案結構

📄 授權

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages