Alessandra Mantellini alemantellini

Hi, I'm Alessandra Mantellini! 👋 | ¡Hola, soy Alessandra Mantellini! 👋

Data Analyst | Linguistics & multilingual content specialist | NLP enthusiast

I combine 5+ years of experience in subtitling, localization, and linguistic analysis with training in Data Science and Machine Learning, bringing a unique perspective to language-driven data problems. I'm interested in building data-driven solutions at the intersection of language and AI, from large-scale text processing to classification models, with a growing focus on NLP applications.

Analista de datos | Especialista en contenido multilingüe | Interesada en NLP

Cuento con más de 5 años de experiencia en subtitulado, localización y análisis lingüístico, además de formación en Data Science y Machine Learning, lo que me permite aportar una perspectiva única a los problemas relacionados con los datos lingüísticos. Me interesa desarrollar soluciones basadas en datos a partir de la intersección entre el lenguaje y la IA, desde el procesamiento de textos a gran escala hasta los modelos de clasificación, con un interés cada vez mayor por las aplicaciones relacionadas con el NLP.

🛠️ Tools | Herramientas

Programming languages (Python · SQL)
Data analysis (Pandas · NumPy · EDA · Jupyter Notebook)
Visualization (Matplotlib · Seaborn · Streamlit)
Machine Learning (NLP · LLM · KNN · Scikit-learn · Decision Trees)
Tools: Git · GitHub · Flask · Visual Studio Code

📚 Education | Formación

Data Science & Machine Learning Bootcamp · 4Geeks Academy Madrid (2026)
Máster Oficial en Educación Bilingüe · Universidad Europea de Canarias (2024)
Máster Propio en Traducción Audiovisual: Subtitulación, Doblaje y Localización · ISTRAD & Universidad de Cádiz (2022)
Grado en Estudios Ingleses (GPA: 8,87/10) · Universidad Complutense de Madrid (2020)

🚀 Featured projects | Proyectos destacados

🔊 Sound alert detection system · MIVIA | Sistema de detección de alertas sonoras · MIVIA

English	Español
Multiclass supervised classification model to detect dangerous urban sounds in real time (gunshots, sirens, explosions, car crashes). Built a custom dataset of 100K+ records by homogenizing 11 heterogeneous sources. Includes full EDAs, feature engineering, and a hybrid binary/multiclass pipeline.	Modelo de clasificación multiclase supervisada para detectar sonidos urbanos peligrosos en tiempo real (disparos, sirenas, explosiones, accidentes). Dataset de elaboración propia con más de 100.000 registros construido a partir de 11 fuentes heterogéneas. Incluye EDAs, ingeniería de características y un pipeline híbrido binario/multiclase.
`Python` `Classification` `Feature engineering` `EDA`	🌐 Live demo / Demo en vivo

🍷 Wine classifier | Clasificador de vinos

English	Español
Classification model using K-Nearest Neighbors to predict wine quality based on physicochemical features. Performed exploratory data analysis (EDA), correlation analysis, and feature exploration, followed by model training and evaluation. Deployed as an interactive web app using Streamlit and Render.	Modelo de clasificación con K-Nearest Neighbors para predecir la calidad del vino a partir de características fisicoquímicas. Se llevó a cabo un análisis exploratorio de datos (EDA), un análisis de correlación y una exploración de características, seguidos del entrenamiento y la evaluación del modelo. Fue desplegado como una aplicación web interactiva con Streamlit y Render.
`Python` `KNN` `Streamlit` `EDA`	🌐 Live demo / Demo en vivo

🩺 Diabetes predictor · DiabetesScan | Predictor de diabetes · DiabetesScan

English	Español
Binary classification model using Random Forest to predict diabetes risk based on clinical data from the Pima Indians Diabetes dataset. Includes EDA, feature analysis, model training, and optimization. Deployed as a web app using Flask and Render.	Modelo de clasificación binaria con Random Forest para predecir el riesgo de diabetes a partir de datos clínicos del dataset Pima Indians Diabetes. Incluye EDA, análisis de características, entrenamiento y optimización del modelo. Fue desplegado como una aplicación web con Flask y Render.
`Python` `Random Forest` `Flask` `Binary classification`	🌐 Live demo / Demo en vivo

🎙️ Streaming platforms subtitling | Subtitulado para plataformas de streaming

English	Español
Transcribed, translated, and reviewed 150+ talks (English ↔ Spanish), ensuring quality and platform compliance. Developed strong attention to detail, linguistic consistency, and large-scale text datasets.	+150 conferencias de TED transcritas, subtituladas y supervisadas en inglés↔español, garantizando la calidad y el cumplimiento de los requisitos de los clientes. He desarrollado una gran atención al detalle, coherencia lingüística y experiencia en la gestión de conjuntos de datos de texto a gran escala.
`Subtitling` `QA` `Localization` `EN ↔ ES`	TED portfolio

🌍 Languages | Idiomas

Spanish (native) · English (C2) · French (B2) · Notions of Italian (B1), Japanese (A2), and Spanish Sign Language (LSE).

📫 Let's connect! | ¡Contáctame!

📍 Madrid, España · ✉️ mantellinialessandra13@gmail.com · 🔗 LinkedIn · 🎙️ TED portfolio

Provide feedback

Saved searches

Use saved searches to filter your results more quickly