Data Analyst spécialisé dans l'exploitation de données massives et la modélisation prédictive appliquée à la finance et aux politiques publiques. Expérience sur des bases administratives de plusieurs dizaines de millions d'observations (CNAF, DREES). Co-auteur de 2 publications scientifiques.
| Projet | Description | Stack |
|---|---|---|
| Analyse-immobilier | Prime Verte IDF - scraping IAD France, OLS HC3, NLP, 1 839 annonces | Python · Selenium · Statsmodels |
| Bank-marketing-data-mining | Prédiction souscription bancaire - EDA, Logit, RF, XGBoost, KMeans | R · tidymodels · XGBoost |
| Home-credit-scoring | Benchmark 7 modèles ML, CatBoost AUC 0.769 | Python · CatBoost · LightGBM |
| Scoring-credit-hmeq | Scoring crédit HMEQ - imputation PMM, XGBoost | SAS · R · Python |
| Analyse-et-prediction-SPX-SP50 | Prédiction S&P 500 - LSTM, Random Forest, Régression | Python · TensorFlow |
| Quiz-app-streamlit | App quiz OOP - Singleton, scoring proportionnel | Python · Streamlit |
| Machine-Learning | TPs ML - ACP, clustering, KNN | Python · scikit-learn |
| EDA-ML-Process | Guide EDA structuré en 10 étapes | Python · Pandas |
| Streamlit | QCM Statistiques & Probabilités | Python · Streamlit |
Langages
Machine Learning & Statistiques
Méthodes statistiques
Big Data & Data Engineering
BI & Visualisation
Outils & Environnements
- IBM Data Science Professional Certificate - Coursera · Mai 2025
- Google Advanced Data Analytics - Google · Avr. 2025
- Certification AMF - Score A : 91/100 · Oct. 2025
- Hirtzlin I., Capo F., Héraut A., Kouraogo E. et al. (2026). Digital Platforms in the Field of Rare Diseases. Revue Française des Affaires Sociales, pp. 209–228.
- Hirtzlin I., Gallois F., Kouraogo E. et al. (2024). Maladies orphelines et rares : Technologies, Information et Coordination. Centre d'Économie de la Sorbonne, CNRS-UMR 8174.