RAGentA: Multi-Agent Retrieval-Augmented Generation for Attributed Question Answering

RAGentA is a multi-agent retrieval-augmented generation (RAG) framework for attributed question answering. With the goal of trustworthy answer generation, RAGentA focuses on optimizing answer correctness, defined by coverage and relevance to the question and faithfulness, which measures the extent to which answers are grounded in retrieved documents.

Quick Start

Get RAGentA running in 5 minutes with this minimal example:

# 1. Clone the repository
git clone https://github.com/Naieem-55/multi-agent-RAG.git
cd multi-agent-RAG

# 2. Create virtual environment
python -m venv env
source env/bin/activate  # Windows: env\Scripts\activate

# 3. Install dependencies (choose one)
pip install -r requirements.txt          # For API-based usage
pip install -r requirements_local.txt    # For local model inference

# 4. Set environment variables
export AWS_PROFILE=sigir-participant
export AWS_REGION=us-east-1

# 5. Run a simple query
python run_RAGentA.py --single_question "What is machine learning?"

Requirements File Guide

File	Use Case	Description
`requirements.txt`	API-based inference	Lighter dependencies, uses external APIs for LLM
`requirements_local.txt`	Local GPU inference	Full dependencies including PyTorch CUDA support

Features

Multi-Agent Architecture: Uses multiple specialized agents for document retrieval, relevance judgment, answer generation, and claim analysis
Hybrid Retrieval: Combines semantic (dense) and keyword (sparse) search for better document retrieval
Citation Tracking: Automatically tracks citations in generated answers to ensure factual accuracy
Claim Analysis: Analyzes individual claims in answers to ensure relevance and identify knowledge gaps
Follow-Up Processing: Generates follow-up questions for unanswered aspects and integrates additional knowledge
Evaluation Metrics: Includes standard RAG evaluation metrics like MRR, Recall, Precision, and F1

Requirements

Python 3.8+
PyTorch 2.0.0+
CUDA-compatible GPU (recommended)
AWS account with access to OpenSearch and Pinecone (for hybrid retrieval)

Installation

Clone the repository:

git clone https://github.com/Naieem-55/multi-agent-RAG.git
cd multi-agent-RAG

Create and activate a virtual environment:

python -m venv env
source env/bin/activate  # On Windows, use: env\Scripts\activate

Install dependencies:

pip install -r requirements.txt

Configuration

AWS Configuration

RAGentA uses AWS services for document retrieval. You'll need to set up AWS credentials:

Create AWS credentials file:

mkdir -p ~/.aws

Add your credentials to ~/.aws/credentials:

[sigir-participant]
aws_access_key_id = YOUR_ACCESS_KEY
aws_secret_access_key = YOUR_SECRET_KEY

Add your region to ~/.aws/config:

[profile sigir-participant]
region = us-east-1
output = json

Environment Variables

Set the following environment variables:

export AWS_PROFILE=sigir-participant
export AWS_REGION=us-east-1
export HUGGING_FACE_HUB_TOKEN=your_hf_token  # If needed for accessing models

Running RAGentA

RAGentA can be run on a single question or a batch of questions from a JSON/JSONL file.

Process a Single Question

python run_RAGentA.py --model tiiuae/Falcon3-10B-Instruct --n 0.5 --alpha 0.65 --top_k 20 --single_question "Your question here?"

Process Questions from a Dataset

python run_RAGentA.py --model tiiuae/Falcon3-10B-Instruct --n 0.5 --alpha 0.65 --top_k 20 --data_file your_questions.jsonl --output_format jsonl

Parameters

Parameter	Description	Default
`--model`	Model name or path	`tiiuae/falcon-3-10b-instruct`
`--n`	Adjustment factor for adaptive judge bar	`0.5`
`--alpha`	Weight for semantic vs keyword search (0-1)	`0.65`
`--top_k`	Number of documents to retrieve	`20`
`--data_file`	File containing questions (JSON/JSONL)	-
`--single_question`	Process a single question	-
`--output_format`	Output format: json, jsonl, or debug	`jsonl`
`--output_dir`	Directory to save results	`results`

Input/Output Format

Input

{"id": "question_id", "question": "The question text?"}

Output

{
  "id": "question_id",
  "question": "The question text?",
  "passages": [{"passage": "Document content...", "doc_IDs": ["doc_id1"]}],
  "final_prompt": "Final prompt used for generation...",
  "answer": "Generated answer..."
}

System Architecture

RAGentA uses a sophisticated multi-agent architecture:

Query → Hybrid Retrieval → Agent 1 (Predictor) → Agent 2 (Judge) → Agent 3 (Final-Predictor) → Agent 4 (Claim Judge) → Answer
              ↓                    ↓                   ↓                      ↓                        ↓
        Pinecone + OpenSearch   Per-doc answers    Relevance scoring    Cited answer           Gap analysis + Follow-up

Agent Overview

Agent	Purpose	Input	Output
Agent 1 (Predictor)	Generate candidate answers	Query + document	Document-specific answer
Agent 2 (Judge)	Evaluate document relevance	Query + document + answer	Relevance score
Agent 3 (Final-Predictor)	Generate comprehensive answer	Query + filtered docs	Answer with citations
Agent 4 (Claim Judge)	Analyze claims & detect gaps	Answer + claims	Improved answer + follow-ups

Troubleshooting

Common Issues

Issue	Solution
Pinecone connection failed	Verify API key in environment variables; check network connectivity
OpenSearch timeout	Ensure AWS credentials are valid; check region configuration
Out of memory	Reduce `--top_k` or use a smaller model; try `requirements.txt` with API mode
Model download fails	Set `HUGGING_FACE_HUB_TOKEN`; check disk space (models ~10-20GB)
CUDA not available	Install PyTorch with CUDA support: `pip install torch --index-url https://download.pytorch.org/whl/cu118`

Validating Setup

Run the setup validation script:

python -c "
from retrieval.hybrid_retriever import HybridRetriever
retriever = HybridRetriever()
print('Setup validated successfully!')
"

Evaluation

To evaluate RAG performance:

from RAG_evaluation import evaluate_corpus_rag_mrr, evaluate_corpus_rag_recall

mrr_score = evaluate_corpus_rag_mrr(retrieved_docs_list, golden_docs_list, k=5)
recall_score = evaluate_corpus_rag_recall(retrieved_docs_list, golden_docs_list, k=20)

Contributing

Contributions are welcome! Please:

Fork the repository
Create a feature branch (git checkout -b feature/amazing-feature)
Commit your changes (git commit -m 'Add amazing feature')
Push to the branch (git push origin feature/amazing-feature)
Open a Pull Request

License

This project is licensed under the BSD 3-Clause License - see the LICENSE file for details.

Citation

@misc{Besrour2025RAGentA,
  author       = {Ines Besrour and Jingbo He and Tobias Schreieder and Michael Färber},
  title        = {{RAGentA: Multi-Agent Retrieval-Augmented Generation for Attributed Question Answering}},
  year         = {2025},
  eprint       = {2506.16988},
  archivePrefix= {arXiv},
  primaryClass = {cs.IR},
  url          = {https://arxiv.org/abs/2506.16988},
}

Acknowledgments

RAGentA draws inspiration from the MAIN-RAG framework by Chang et al.

Name		Name	Last commit message	Last commit date
Latest commit History 209 Commits
data_preparation		data_preparation
evaluation		evaluation
.gitignore		.gitignore
ARCHITECTURE.md		ARCHITECTURE.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
RAGentA.py		RAGentA.py
README.md		README.md
api_agent.py		api_agent.py
bengali_literature.json		bengali_literature.json
hybrid_retriever.py		hybrid_retriever.py
index_documents.py		index_documents.py
local_agent.py		local_agent.py
local_hybrid_retriever.py		local_hybrid_retriever.py
requirements.txt		requirements.txt
requirements_local.txt		requirements_local.txt
run_BASIC_RAG.py		run_BASIC_RAG.py
run_RAGentA.py		run_RAGentA.py
run_local_rag.py		run_local_rag.py
sample_documents.json		sample_documents.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

RAGentA: Multi-Agent Retrieval-Augmented Generation for Attributed Question Answering

Quick Start

Requirements File Guide

Features

Requirements

Installation

Configuration

AWS Configuration

Environment Variables

Running RAGentA

Process a Single Question

Process Questions from a Dataset

Parameters

Input/Output Format

Input

Output

System Architecture

Agent Overview

Troubleshooting

Common Issues

Validating Setup

Evaluation

Contributing

License

Citation

Acknowledgments

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

RAGentA: Multi-Agent Retrieval-Augmented Generation for Attributed Question Answering

Quick Start

Requirements File Guide

Features

Requirements

Installation

Configuration

AWS Configuration

Environment Variables

Running RAGentA

Process a Single Question

Process Questions from a Dataset

Parameters

Input/Output Format

Input

Output

System Architecture

Agent Overview

Troubleshooting

Common Issues

Validating Setup

Evaluation

Contributing

License

Citation

Acknowledgments

About

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages