Lumen: Un Asistente con IA Emocional Multimodal

Lumen es un asistente de IA conversacional full-stack que ofrece apoyo empático a través de una interfaz de voz, enriqueciendo la interacción con análisis emocional de rostro y tono de voz en tiempo real.

Este repositorio contiene una aplicación moderna y desacoplada, compuesta por un backend de FastAPI que maneja la IA y un frontend de Next.js que ofrece una experiencia de usuario inmersiva.

📄 Paper Académico y Cita

Este proyecto fue formalmente documentado y presentado como un conference paper en el XXIII Encuentro Informático Riojano (EILAR 2025). El trabajo está disponible de forma permanente en Zenodo, donde puedes encontrar la información completa para su citación en diferentes formatos (BibTeX, APA, IEEE, etc.).

🚀 Cómo Empezar

Para poner en marcha el proyecto, necesitas configurar y ejecutar tanto el backend como el frontend por separado.

Paso 1: Configurar el Backend

El backend es responsable de todo el procesamiento de IA, la gestión de la base de datos y la comunicación con APIs externas.

➡️ Instrucciones de configuración del Backend
Paso 2: Configurar el Frontend

El frontend proporciona la interfaz de usuario, captura el audio y video, y se comunica con el backend.

➡️ Instrucciones de configuración del Frontend

📚 Documentación Detallada

Para comprender a fondo el funcionamiento interno del proyecto, la arquitectura y las decisiones de diseño, consulta la documentación centralizada:

Arquitectura y Stack Tecnológico (docs/01_arquitectura_y_stack.md)

Una visión general de la arquitectura cliente-servidor y las tecnologías utilizadas en el frontend y el backend.
Flujo de Datos de una Interacción (docs/02_flujo_de_datos.md)

Un desglose paso a paso de lo que ocurre cuando un usuario habla con Lumen.
Detalles del Backend (docs/03_backend.md)

Información sobre la API, el procesamiento de audio, la lógica de IA y la seguridad.
Detalles del Frontend (docs/04_frontend.md)

Información sobre el análisis facial en el cliente, la gestión de estado y la estructura de componentes.
Esquema de la Base de Datos (docs/05_base_de_datos.md)

Descripción detallada de las tablas, columnas y el sistema de cifrado.

✨ Características Principales

Arquitectura Full-Stack: Backend de FastAPI y frontend moderno de Next.js.
Análisis Emocional Multimodal: Detección facial en el cliente (face-api.js) y reconocimiento vocal en el servidor (Wav2Vec 2.0).
Interacción por Voz Completa: Transcripción con Deepgram y síntesis de voz con Edge-TTS.
IA Conversacional Avanzada: Respuestas empáticas generadas por Llama 3.1 vía Groq.
Memoria Persistente y Cifrada: Base de datos SQLite local con cifrado AES.
Interfaz de Usuario Responsiva: Se adapta a escritorio y móvil para una experiencia consistente.

Name		Name	Last commit message	Last commit date
Latest commit History 47 Commits
.github		.github
backend		backend
docs		docs
frontend		frontend
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Lumen: Un Asistente con IA Emocional Multimodal

📄 Paper Académico y Cita

🚀 Cómo Empezar

📚 Documentación Detallada

✨ Características Principales

About

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Lumen: Un Asistente con IA Emocional Multimodal

📄 Paper Académico y Cita

🚀 Cómo Empezar

📚 Documentación Detallada

✨ Características Principales

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Uh oh!

Contributors

Uh oh!

Languages