☕ CaféIA - GraphRAG avec Ollama

Interface graphique Streamlit pour interroger un LLM local via Ollama et alimenter un système RAG (Retrieval-Augmented Generation) avec différents types de documents.

🚀 Fonctionnalités

📤 Upload de documents multiples formats : PDF, DOCX, XLSX, TXT
🤖 Interrogation LLM via Ollama (modèle qwen2.5:14b)
🔍 4 modes de recherche :
- Naive : RAG classique, recherche simple
- Local : Entités et relations proches (1 hop)
- Global : Patterns globaux du knowledge graph
- Hybrid : Combinaison local + global (recommandé pour multi-hop)
📜 Historique des requêtes avec horodatage
🎨 Interface moderne et intuitive

📋 Prérequis

1. Ollama installé et lancé

# Installer Ollama (si pas déjà fait)
curl -fsSL https://ollama.com/install.sh | sh

# Lancer Ollama
ollama serve

2. Télécharger les modèles nécessaires

# Modèle LLM (32K context)
ollama pull qwen2.5:14b

# Modèle d'embeddings
ollama pull nomic-embed-text

3. Python 3.11+

Vérifiez votre version de Python :

python3 --version

🛠️ Installation

1. Activer l'environnement virtuel

source venv/bin/activate

2. Installer les dépendances

pip install -r requirements.txt

🎯 Utilisation

Lancer l'application Streamlit

streamlit run app.py

L'application s'ouvrira automatiquement dans votre navigateur par défaut à l'adresse : http://localhost:8501

Workflow recommandé

Uploader des documents (onglet "📤 Upload Documents")
- Glissez-déposez vos fichiers PDF, DOCX, XLSX ou TXT
- Cliquez sur "🚀 Indexer les documents"
- Attendez la confirmation d'indexation
Interroger le RAG (onglet "💬 Interroger le RAG")
- Saisissez votre question
- Choisissez le mode de recherche (hybrid recommandé)
- Cliquez sur "🔍 Rechercher"
Consulter l'historique (onglet "📜 Historique")
- Visualisez toutes vos requêtes précédentes
- Consultez les réponses obtenues

📁 Structure du projet

CaféIA/
├── app.py                  # Interface Streamlit principale
├── main.py                 # Configuration LightRAG + Ollama
├── document_processor.py   # Extraction de texte (PDF, DOCX, XLSX, TXT)
├── insert_docs.py          # Script d'insertion de documents (CLI)
├── query_demo.py           # Script de démonstration des requêtes (CLI)
├── requirements.txt        # Dépendances Python
├── storage/                # Dossier du knowledge graph (créé automatiquement)
└── venv/                   # Environnement virtuel Python

🔧 Configuration avancée

Vous pouvez modifier les paramètres dans main.py :

Modèle LLM : llm_model_name="qwen2.5:14b"
Context window : llm_model_max_token_size=32768
Parallélisme : llm_model_max_async=2
Dimensions embeddings : embedding_dim=768

🐛 Dépannage

Erreur "Connection refused" lors du lancement

Vérifiez qu'Ollama est bien lancé : ollama serve
Vérifiez que les modèles sont téléchargés : ollama list

Erreur lors de l'extraction de documents

Assurez-vous que toutes les dépendances sont installées :
```
pip install PyPDF2 python-docx openpyxl
```

Réinitialiser le knowledge graph

Si vous voulez repartir de zéro :

rm -rf storage/

🚀 Scripts CLI (optionnels)

Insérer des documents en ligne de commande

python insert_docs.py

Tester les différents modes de requête

python query_demo.py

📚 Documentation

🤝 Contribution

Les contributions sont les bienvenues ! N'hésitez pas à ouvrir une issue ou une pull request.

📝 Licence

Ce projet est fourni à titre éducatif et de démonstration.

☕ Développé avec passion pour CaféIA

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
IMG		IMG
__pycache__		__pycache__
inputs/__enqueued__		inputs/__enqueued__
lightrag/api/webui		lightrag/api/webui
lightrag_webui		lightrag_webui
rag_storage		rag_storage
storage		storage
venv		venv
.gitignore		.gitignore
CafeIA_Deploy_Windows_USB.pdf		CafeIA_Deploy_Windows_USB.pdf
QUICKSTART.md		QUICKSTART.md
READ.txt		READ.txt
README.md		README.md
README_cafeia.md		README_cafeia.md
achats_produits.txt		achats_produits.txt
app.py		app.py
caféIA 02.txt		caféIA 02.txt
clients.csv		clients.csv
config_manager.py		config_manager.py
document_processor.py		document_processor.py
fix_dimensions.py		fix_dimensions.py
fournisseurs_certifications.txt		fournisseurs_certifications.txt
git_connect		git_connect
insert_docs.py		insert_docs.py
lightrag.ipynb		lightrag.ipynb
lightrag.log		lightrag.log
main.py		main.py
query_demo.py		query_demo.py
query_mistral.py		query_mistral.py
requirements.txt		requirements.txt
run_app.sh		run_app.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

☕ CaféIA - GraphRAG avec Ollama

🚀 Fonctionnalités

📋 Prérequis

1. Ollama installé et lancé

2. Télécharger les modèles nécessaires

3. Python 3.11+

🛠️ Installation

1. Activer l'environnement virtuel

2. Installer les dépendances

🎯 Utilisation

Lancer l'application Streamlit

Workflow recommandé

📁 Structure du projet

🔧 Configuration avancée

🐛 Dépannage

Erreur "Connection refused" lors du lancement

Erreur lors de l'extraction de documents

Réinitialiser le knowledge graph

🚀 Scripts CLI (optionnels)

Insérer des documents en ligne de commande

Tester les différents modes de requête

📚 Documentation

🤝 Contribution

📝 Licence

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

☕ CaféIA - GraphRAG avec Ollama

🚀 Fonctionnalités

📋 Prérequis

1. Ollama installé et lancé

2. Télécharger les modèles nécessaires

3. Python 3.11+

🛠️ Installation

1. Activer l'environnement virtuel

2. Installer les dépendances

🎯 Utilisation

Lancer l'application Streamlit

Workflow recommandé

📁 Structure du projet

🔧 Configuration avancée

🐛 Dépannage

Erreur "Connection refused" lors du lancement

Erreur lors de l'extraction de documents

Réinitialiser le knowledge graph

🚀 Scripts CLI (optionnels)

Insérer des documents en ligne de commande

Tester les différents modes de requête

📚 Documentation

🤝 Contribution

📝 Licence

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages