ACP - Analyse des Cartes de Crédit

Description du Projet

Ce projet réalise une Analyse en Composantes Principales (ACP) complète sur des données de cartes de crédit afin de segmenter les clients en profils comportementaux distincts. L'objectif est d'identifier des groupes de clients ayant des comportements d'utilisation similaires pour faciliter des stratégies marketing ciblées et une meilleure compréhension du portefeuille client.

Documentation en ligne

Site du projet : https://kwimoad.github.io/ACP-Analyse-Cartes-Credit/

Objectifs

Réduire la dimensionnalité des données de cartes de crédit
Identifier les composantes principales expliquant la variance du comportement client
Segmenter les clients en clusters homogènes
Interpréter et caractériser chaque profil client

Structure du Projet

ACP-Analyse-Cartes-Credit/
│
├── data/
│   ├── raw/                      # Données brutes originales
│   │   └── CC GENERAL (1).csv
│   └── processed/                # Données traitées à chaque étape
│       ├── credit_card_clean.csv
│       ├── credit_card_clean_standardised.csv
│       ├── matrice_corr.csv
│       ├── data_after_ACP.csv
│       ├── clustered_data.csv
│       └── data_pour_Interprétation_des_profils_obtenus.csv
│
├── R/                            # Scripts d'analyse (ordre séquentiel)
│   ├── 01_analyse_exploratoire/
│   ├── 02_pretraitement/
│   ├── 03_centrage_reduction/
│   ├── 04_correlation/
│   ├── 05_test_adequation_acp/
│   ├── 06_acp_calcul/
│   ├── 07_choix_composantes/
│   ├── 08_segmentation_clustering/
│   └── 09_interpretation_profils/
│
├── docs/                         # Documentation HTML générée
│   └── index.html
│
└── README.md

Workflow d'Analyse

Analyse Exploratoire

Script: R/01_analyse_exploratoire/analyse_exploratoire.Rmd

Chargement des données nettoyées
Statistiques descriptives (moyenne, médiane, mode, écart-type, variance)
Analyse de l'asymétrie (skewness)
Visualisations : histogrammes, boxplots, diagrammes en barres
Détection des valeurs aberrantes

Prétraitement des Données

Script: R/02_pretraitement/01_pretraitement.Rmd

Suppression de la colonne identifiant (CUST_ID)
Vérification des types de variables
Détection et traitement des valeurs manquantes
Gestion des doublons
Traitement des outliers avec la méthode IQR (Interquartile Range)

Centrage et Réduction

Script: R/03_centrage_reduction/04_centrage_reduction.Rmd

Centrage : mise à l'échelle des données (moyenne = 0)
Réduction : standardisation des variables (écart-type = 1)
Génération du fichier credit_card_clean_standardised.csv

Analyse de Corrélation

Script: R/04_correlation/05_correlation.Rmd

Calcul de la matrice de corrélation
Visualisation avec heatmap colorée
Identification des variables fortement corrélées
Export de la matrice pour analyses ultérieures

Tests d'Adéquation de l'ACP

Script: R/05_test_adequation_acp/test_adequation_acp.Rmd

Test KMO (Kaiser-Meyer-Olkin)

Mesure la qualité des corrélations entre variables
Interprétation : KMO > 0.6 → données adaptées à l'ACP

Test de Bartlett

Vérifie l'hypothèse de corrélation entre variables
p-value < 0.05 → corrélations significatives

Calcul de l'ACP

Script: R/06_acp_calcul/06_acp_calcul.Rmd

Technologies et Packages R Utilisés

Packages Principaux

# Manipulation de données
library(dplyr)
library(tidyr)

# Visualisation
library(ggplot2)
library(corrplot)
library(ggcorrplot)

# ACP et analyse multivariée
library(FactoMineR)
library(factoextra)
library(psych)

# Clustering
library(factoextra)  # Pour fviz_nbclust, fviz_cluster

# Statistiques
library(e1071)  # Pour skewness

# Tableaux et rapports
library(kableExtra)
library(magrittr)

Installation et Utilisation

Prérequis

R version ≥ 4.0.0
RStudio (recommandé)

Installation des Packages

# Installation des packages nécessaires
install.packages(c(
  "ggplot2", "dplyr", "tidyr", "reshape2",
  "FactoMineR", "factoextra", "psych",
  "corrplot", "ggcorrplot",
  "e1071", "kableExtra", "magrittr", "here"
))

Exécution de l'Analyse

Cloner le projet

git clone https://github.com/votre-repo/ACP-Analyse-Cartes-Credit.git
cd ACP-Analyse-Cartes-Credit

Ouvrir le projet dans RStudio
- Double-cliquer sur ACP-Analyse-Cartes-Credit.Rproj
Exécuter les scripts dans l'ordre
- Commencer par 01_analyse_exploratoire
- Suivre la numérotation jusqu'à 09_interpretation_profils
Consulter les résultats
- Les fichiers HTML générés se trouvent dans chaque dossier d'analyse
- Les données traitées sont dans data/processed/

Résultats Attendus

Fichiers de Sortie

Fichier	Description
`credit_card_clean.csv`	Données nettoyées (sans outliers ni NA)
`credit_card_clean_standardised.csv`	Données standardisées (centrées-réduites)
`matrice_corr.csv`	Matrice de corrélation entre variables
`data_after_ACP.csv`	Données projetées sur les composantes principales
`clustered_data.csv`	Données avec labels de clusters
`data_pour_Interprétation_des_profils_obtenus.csv`	Moyennes par cluster

Visualisations Clés

Histogrammes et boxplots des variables
Heatmap de corrélation
Cercle des corrélations (contribution des variables)
Graphique des valeurs propres (scree plot)
Diagramme du coude pour le clustering
Visualisation des clusters dans l'espace ACP
Comparaison des profils par groupe

Méthodologie

Justification de l'ACP

L'ACP est choisie pour :

Réduire la dimensionnalité : passer de 15+ variables à 2-3 composantes principales
Éliminer la multicolinéarité : créer des axes indépendants
Faciliter l'interprétation : visualisation en 2D/3D
Améliorer le clustering : travailler sur des dimensions décorrélées

Pipeline d'Analyse

Données Brutes
    ↓
Nettoyage (NA, outliers, doublons)
    ↓
Standardisation (Z-score)
    ↓
Tests d'adéquation (KMO, Bartlett)
    ↓
ACP (réduction de dimension)
    ↓
Sélection du nombre de composantes
    ↓
K-means Clustering
    ↓
Interprétation des profils

Contribution

Les contributions sont les bienvenues !

Pour contribuer à ce projet, veuillez consulter le guide complet : CONTRIBUTING.md

Contributions rapides :

Forkez le projet
Créez une branche (git checkout -b feature/amelioration)
Committez vos changements (git commit -m 'feat: ajout fonctionnalité')
Poussez vers la branche (git push origin feature/amelioration)
Ouvrez une Pull Request

Auteurs

AOUAD Abdelkarim & EL OUARDI Abderrahim

Dernière mise à jour : Février 2026

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ACP - Analyse des Cartes de Crédit

Description du Projet

Documentation en ligne

Objectifs

Structure du Projet

Workflow d'Analyse

Analyse Exploratoire

Prétraitement des Données

Centrage et Réduction

Analyse de Corrélation

Tests d'Adéquation de l'ACP

Calcul de l'ACP

Technologies et Packages R Utilisés

Packages Principaux

Installation et Utilisation

Prérequis

Installation des Packages

Exécution de l'Analyse

Résultats Attendus

Fichiers de Sortie

Visualisations Clés

Méthodologie

Justification de l'ACP

Pipeline d'Analyse

Contribution

Auteurs

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 37 Commits
R		R
data		data
docs		docs
.Rhistory		.Rhistory
.gitignore		.gitignore
ACP-Analyse-Cartes-Credit.Rproj		ACP-Analyse-Cartes-Credit.Rproj
CONTRIBUTING.md		CONTRIBUTING.md
README.md		README.md

Folders and files

Latest commit

History

Repository files navigation

ACP - Analyse des Cartes de Crédit

Description du Projet

Documentation en ligne

Objectifs

Structure du Projet

Workflow d'Analyse

Analyse Exploratoire

Prétraitement des Données

Centrage et Réduction

Analyse de Corrélation

Tests d'Adéquation de l'ACP

Calcul de l'ACP

Technologies et Packages R Utilisés

Packages Principaux

Installation et Utilisation

Prérequis

Installation des Packages

Exécution de l'Analyse

Résultats Attendus

Fichiers de Sortie

Visualisations Clés

Méthodologie

Justification de l'ACP

Pipeline d'Analyse

Contribution

Auteurs

About

Topics

Resources

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages