Skip to content

EnriqueDiazO/ProbabilityOneVar

Repository files navigation

📊 Análisis Exploratorio de Datos y Probabilidad en Conjuntos de Datos

Este repositorio contiene diversos proyectos en los que se aplican análisis exploratorio de datos (EDA) y conceptos de probabilidad a diferentes conjuntos de datos. A través de estos ejemplos, se ilustran métodos estadísticos fundamentales y técnicas para analizar distribuciones de datos en múltiples dominios.


📌 Contenido del Repositorio

🔹 Proyecto_Salarios_Precios
    📌 Análisis de salarios y precios históricos.
    📊 Histogramas y preprocesamiento de datos.

🔹 Proy_Education_Career_Success
    🎓 Relación entre educación y éxito profesional.
    📈 Covarianza, correlación y estadísticas descriptivas.

🔹 Proy_Oral_Cancer_Prediction
    🩺 Predicción de cáncer oral con variables de riesgo.
    📊 Probabilidades, análisis estadístico y visualizaciones.

🔹 Proy_Startup_Data
    🚀 Análisis de datos de startups.
    📊 Evaluación de patrones de crecimiento y éxito empresarial.

Cada proyecto contiene:

  • Datasets originales y preprocesados 📂

  • Scripts en R para análisis y visualización 🖥️

  • Gráficos y reportes de resultados 📊

  • Documentación detallada 📝


🎲 Conceptos de Probabilidad Aplicada

En este repositorio se abordan conceptos fundamentales de probabilidad, incluyendo:

Variables Aleatorias
    🎯 Discretas y continuas.
    📏 Funciones de densidad y distribución acumulada.

Estadísticas Descriptivas
    📊 Media, mediana, moda, varianza y desviación estándar.

Probabilidad Condicional
    📌 Tablas de contingencia y teorema de Bayes.

Modelos Probabilísticos
    📈 Distribuciones normales, binomiales y de Poisson.


📊 Análisis Exploratorio de Datos (EDA)

El Análisis Exploratorio de Datos es clave para entender la estructura de un dataset antes de aplicar modelos estadísticos.
Este repositorio cubre:

📌 Información básica de un dataset
📊 Análisis Unidimensional
    - Distribuciones de variables cuantitativas.
    - Frecuencias y gráficos para variables cualitativas.

📉 Análisis Multidimensional
    📌 Relaciones entre variables cuantitativas y cualitativas.
    📊 Diagramas de dispersión, boxplots y correlaciones.

📢 Visualización de Datos
📈 Histogramas, diagramas de dispersión, heatmaps y más.

Diagrama General del Análisis Exploratorio de Datos (EDA)


🚀 Cómo Usar Este Repositorio

🔹 Requisitos Previos

Para ejecutar los scripts y reproducir los análisis, necesitarás:

  • R y RStudio 🔹 Descargar aquí

  • Librerías de R como tidyverse, ggplot2 y dplyr. Puedes instalarlas con:

    install.packages(c("tidyverse", "ggplot2", "dplyr"))

🔹 Uso de Scripts

Cada carpeta contiene un conjunto de scripts en R con análisis específicos.

source("scripts/1_preprocesamiento_esp_dataset.r")
source("scripts/2_analisis_gráfico.r")
source("scripts/3_analisis_probabilidad.r")

📬 Contacto

Si tienes dudas o sugerencias, ¡no dudes en contactarme!

📧 Correo: enriquediaz.profesor@lasallecuernavaca.edu.mx

🐦 Twitter: @EnriqueDiazOca1

💼 LinkedIn: linkedin.com/in/enrique-diaz-ocampo-2377121a4/

About

This repository contains R projects on probability in a single variable. It covers univariate distributions, probability and density functions, random variable simulations, and the Central Limit Theorem. Includes practical examples, code, and visualizations for better understanding. Ideal for students and researchers in statistics.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors