GitHub - Deepu325/Data-Cleaning-and-Preprocessing: DATA ANALYST INTERNSHIP from Event labs-Task 1

Task 1: Data Cleaning and Preprocessing – Data Analyst Internship

Objective Clean and preprocess a raw marketing dataset by:

Handling missing values
Removing duplicate rows
Standardizing text and date formats
Renaming columns
Correcting data types

This process prepares the dataset for analysis and ensures data quality.

Dataset Used

Name:Customer Personality Analysis

Filename: marketing_campaign.csv

Description:The dataset contains customer demographics, spending habits, and campaign response data. Useful for customer segmentation and marketing analysis.

Data Cleaning Steps Performed

Removed Duplicates
- Used drop_duplicates() to eliminate any duplicate entries.
Handled Missing Values
- Filled missing values in the Income column with the median.
- Dropped remaining rows with missing values using dropna().
Standardized Text Fields
- Converted Education and Marital_Status to lowercase and removed extra spaces using .str.lower().str.strip().
Converted Date Formats
- Converted Dt_Customer column to consistent datetime format (DD-MM-YYYY).
Renamed Columns
- Renamed all columns to snake_case using string methods to ensure consistency and readability.
Corrected Data Types
- Created new age column from Year_Birth (2025 - Year_Birth).
- Ensured age is an integer and Dt_Customer is in datetime format.

Tools Used

Python 3.x
Pandas
VS code

Output Files

cleaned_marketing_campaign.csv – Final cleaned dataset
'marketing_campaign' - actual dataset
data_cleaning.py – Python script used for cleaning
README.md – Documentation file (this file)

Kaggle Datasets Suitable for Task 1

✅ Customer Personality Analysis (used)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
README.md		README.md
cleaned_marketing_campaign.csv		cleaned_marketing_campaign.csv
datasheet.py		datasheet.py
marketing_campaign.csv		marketing_campaign.csv

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages