Data Analyst | Linguistics & multilingual content specialist | NLP enthusiast
I combine 5+ years of experience in subtitling, localization, and linguistic analysis with training in Data Science and Machine Learning, bringing a unique perspective to language-driven data problems. I'm interested in building data-driven solutions at the intersection of language and AI, from large-scale text processing to classification models, with a growing focus on NLP applications.
Analista de datos | Especialista en contenido multilingüe | Interesada en NLP
Cuento con más de 5 años de experiencia en subtitulado, localización y análisis lingüístico, además de formación en Data Science y Machine Learning, lo que me permite aportar una perspectiva única a los problemas relacionados con los datos lingüísticos. Me interesa desarrollar soluciones basadas en datos a partir de la intersección entre el lenguaje y la IA, desde el procesamiento de textos a gran escala hasta los modelos de clasificación, con un interés cada vez mayor por las aplicaciones relacionadas con el NLP.
Programming languages(Python·SQL)Data analysis(Pandas·NumPy·EDA·Jupyter Notebook)Visualization(Matplotlib·Seaborn·Streamlit)Machine Learning(NLP·LLM·KNN·Scikit-learn·Decision Trees)Tools:Git·GitHub·Flask·Visual Studio Code
- Data Science & Machine Learning Bootcamp · 4Geeks Academy Madrid (2026)
- Máster Oficial en Educación Bilingüe · Universidad Europea de Canarias (2024)
- Máster Propio en Traducción Audiovisual: Subtitulación, Doblaje y Localización · ISTRAD & Universidad de Cádiz (2022)
- Grado en Estudios Ingleses (GPA: 8,87/10) · Universidad Complutense de Madrid (2020)
| English | Español |
|---|---|
| Multiclass supervised classification model to detect dangerous urban sounds in real time (gunshots, sirens, explosions, car crashes). Built a custom dataset of 100K+ records by homogenizing 11 heterogeneous sources. Includes full EDAs, feature engineering, and a hybrid binary/multiclass pipeline. | Modelo de clasificación multiclase supervisada para detectar sonidos urbanos peligrosos en tiempo real (disparos, sirenas, explosiones, accidentes). Dataset de elaboración propia con más de 100.000 registros construido a partir de 11 fuentes heterogéneas. Incluye EDAs, ingeniería de características y un pipeline híbrido binario/multiclase. |
Python Classification Feature engineering EDA |
🌐 Live demo / Demo en vivo |
| English | Español |
|---|---|
| Classification model using K-Nearest Neighbors to predict wine quality based on physicochemical features. Performed exploratory data analysis (EDA), correlation analysis, and feature exploration, followed by model training and evaluation. Deployed as an interactive web app using Streamlit and Render. | Modelo de clasificación con K-Nearest Neighbors para predecir la calidad del vino a partir de características fisicoquímicas. Se llevó a cabo un análisis exploratorio de datos (EDA), un análisis de correlación y una exploración de características, seguidos del entrenamiento y la evaluación del modelo. Fue desplegado como una aplicación web interactiva con Streamlit y Render. |
Python KNN Streamlit EDA |
🌐 Live demo / Demo en vivo |
| English | Español |
|---|---|
| Binary classification model using Random Forest to predict diabetes risk based on clinical data from the Pima Indians Diabetes dataset. Includes EDA, feature analysis, model training, and optimization. Deployed as a web app using Flask and Render. | Modelo de clasificación binaria con Random Forest para predecir el riesgo de diabetes a partir de datos clínicos del dataset Pima Indians Diabetes. Incluye EDA, análisis de características, entrenamiento y optimización del modelo. Fue desplegado como una aplicación web con Flask y Render. |
Python Random Forest Flask Binary classification |
🌐 Live demo / Demo en vivo |
| English | Español |
|---|---|
| Transcribed, translated, and reviewed 150+ talks (English ↔ Spanish), ensuring quality and platform compliance. Developed strong attention to detail, linguistic consistency, and large-scale text datasets. | +150 conferencias de TED transcritas, subtituladas y supervisadas en inglés↔español, garantizando la calidad y el cumplimiento de los requisitos de los clientes. He desarrollado una gran atención al detalle, coherencia lingüística y experiencia en la gestión de conjuntos de datos de texto a gran escala. |
Subtitling QA Localization EN ↔ ES |
TED portfolio |
Spanish (native) · English (C2) · French (B2) · Notions of Italian (B1), Japanese (A2), and Spanish Sign Language (LSE).
📍 Madrid, España · ✉️ mantellinialessandra13@gmail.com · 🔗 LinkedIn · 🎙️ TED portfolio