Skip to content
View EKOURAOGO's full-sized avatar

Block or report EKOURAOGO

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
EKOURAOGO/README.md

Emmanuel KOURAOGO

Data Analyst · Data Scientist


Profil

Data Analyst spécialisé dans l'exploitation de données massives et la modélisation prédictive appliquée à la finance et aux politiques publiques. Expérience sur des bases administratives de plusieurs dizaines de millions d'observations (CNAF, DREES). Co-auteur de 2 publications scientifiques.


Projets GitHub

Projet Description Stack
Analyse-immobilier Prime Verte IDF - scraping IAD France, OLS HC3, NLP, 1 839 annonces Python · Selenium · Statsmodels
Bank-marketing-data-mining Prédiction souscription bancaire - EDA, Logit, RF, XGBoost, KMeans R · tidymodels · XGBoost
Home-credit-scoring Benchmark 7 modèles ML, CatBoost AUC 0.769 Python · CatBoost · LightGBM
Scoring-credit-hmeq Scoring crédit HMEQ - imputation PMM, XGBoost SAS · R · Python
Analyse-et-prediction-SPX-SP50 Prédiction S&P 500 - LSTM, Random Forest, Régression Python · TensorFlow
Quiz-app-streamlit App quiz OOP - Singleton, scoring proportionnel Python · Streamlit
Machine-Learning TPs ML - ACP, clustering, KNN Python · scikit-learn
EDA-ML-Process Guide EDA structuré en 10 étapes Python · Pandas
Streamlit QCM Statistiques & Probabilités Python · Streamlit

Stack technique

Langages

Python R SQL SAS Scala Stata

Machine Learning & Statistiques

scikit-learn XGBoost LightGBM CatBoost TensorFlow statsmodels tidymodels

Méthodes statistiques

Scoring Séries temporelles PLS SEM Clustering NLP Économétrie

Big Data & Data Engineering

Spark Databricks Kafka MongoDB Redis Airflow Denodo

BI & Visualisation

Power BI Tableau Streamlit Plotly ggplot2

Outils & Environnements

Git Linux Jupyter VS Code CASD


Certifications

  • IBM Data Science Professional Certificate - Coursera · Mai 2025
  • Google Advanced Data Analytics - Google · Avr. 2025
  • Certification AMF - Score A : 91/100 · Oct. 2025

Publications scientifiques

  • Hirtzlin I., Capo F., Héraut A., Kouraogo E. et al. (2026). Digital Platforms in the Field of Rare Diseases. Revue Française des Affaires Sociales, pp. 209–228.
  • Hirtzlin I., Gallois F., Kouraogo E. et al. (2024). Maladies orphelines et rares : Technologies, Information et Coordination. Centre d'Économie de la Sorbonne, CNRS-UMR 8174.

Popular repositories Loading

  1. Streamlit Streamlit Public

    Application QCM interactive sur les statistiques et probabilités - Streamlit, session_state, filtrage par thème

    Python 1

  2. Analyse-immobilier Analyse-immobilier Public

    Analyse de la Prime Verte immobilière en Île-de-France : scraping IAD France, NLP, modélisation OLS HC3 sur 1839 annonces

    Python 1

  3. ESG_QCWorkspace ESG_QCWorkspace Public

    Forked from jsboigeESG/ESG_QCWorkspace

    Shared workspace for ESGF_School Quant Connect organization

    Python

  4. EDA-ML-Process EDA-ML-Process Public

    Guide structuré pour l'Exploration des Données (EDA) dans un projet de Machine Learning, avec des étapes détaillées et des exemples de code Python.

  5. Analyse-et-prediction-des-fluctuations-du-cours-du-SPX-SP50 Analyse-et-prediction-des-fluctuations-du-cours-du-SPX-SP50 Public

    Ce projet a pour objectif de prédire l’évolution du cours de l’indice boursier SPX (S&P 500) une semaine à l’avance en utilisant trois modèles de machine learning : 1️⃣ Régression Linéaire 2️⃣ Rand…

    Jupyter Notebook

  6. Machine-Learning Machine-Learning Public

    Travaux pratiques ML - ACP, clustering KMeans et hiérarchique, KNN sur datasets Iris, Decathlon et Tinder

    Jupyter Notebook