Selbstgehostete, datenschutzkonforme Alternative zu kommerziellen KI-Diktiergeräten (Plaud Note Pro u.ä.).
Sprachaufnahmen → Telegram-Bot → Transkription → KI-Zusammenfassung → Obsidian Vault.
- Datensouveränität: Alle Daten unter eigener Kontrolle, DSGVO-konform
- Kein Vendor-Lock-in: Jede Komponente austauschbar
- Open Source: FOSS-Stack, transparent und nachvollziehbar
- Lernprojekt: Dokumentierter Aufbauprozess als Proof of Work
🔬 Phase 0 – Orientierung & Konzept (aktiv)
Siehe docs/ROADMAP.md für den aktuellen Stand.
| Dokument | Inhalt |
|---|---|
| PROJECT_LOG.md | Chronologisches Protokoll aller Sessions |
| ROADMAP.md | Phasen und nächste Schritte |
| ARCHITECTURE.md | Technische Architektur und Komponentenwahl |
| DECISIONS.md | Architecture Decision Records |
- Interface: Telegram Bot (Python)
- Transkription: faster-whisper (CPU-basiert)
- Sprechererkennung: pyannote.audio
- Rauschunterdrückung: DeepFilterNet / RNNoise
- KI-Zusammenfassung: LLM via API (Pay-per-Use)
- Vektordatenbank: ChromaDB
- Ausgabe: Obsidian Vault (Markdown + Frontmatter)
- Deployment: Docker Compose
- Hosting: Hetzner VPS (Produktion) + Heimserver (Entwicklung)
~13–23 €/Monat (VPS + LLM-Nutzung)
Noch festzulegen