Este repositorio contiene diversos proyectos en los que se aplican análisis exploratorio de datos (EDA) y conceptos de probabilidad a diferentes conjuntos de datos. A través de estos ejemplos, se ilustran métodos estadísticos fundamentales y técnicas para analizar distribuciones de datos en múltiples dominios.
🔹 Proyecto_Salarios_Precios
📌 Análisis de salarios y precios históricos.
📊 Histogramas y preprocesamiento de datos.
🔹 Proy_Education_Career_Success
🎓 Relación entre educación y éxito profesional.
📈 Covarianza, correlación y estadísticas descriptivas.
🔹 Proy_Oral_Cancer_Prediction
🩺 Predicción de cáncer oral con variables de riesgo.
📊 Probabilidades, análisis estadístico y visualizaciones.
🔹 Proy_Startup_Data
🚀 Análisis de datos de startups.
📊 Evaluación de patrones de crecimiento y éxito empresarial.
Cada proyecto contiene:
-
Datasets originales y preprocesados 📂
-
Scripts en R para análisis y visualización 🖥️
-
Gráficos y reportes de resultados 📊
-
Documentación detallada 📝
En este repositorio se abordan conceptos fundamentales de probabilidad, incluyendo:
✅ Variables Aleatorias
🎯 Discretas y continuas.
📏 Funciones de densidad y distribución acumulada.
✅ Estadísticas Descriptivas
📊 Media, mediana, moda, varianza y desviación estándar.
✅ Probabilidad Condicional
📌 Tablas de contingencia y teorema de Bayes.
✅ Modelos Probabilísticos
📈 Distribuciones normales, binomiales y de Poisson.
El Análisis Exploratorio de Datos es clave para entender la estructura de un dataset antes de aplicar modelos estadísticos.
Este repositorio cubre:
📌 Información básica de un dataset
📊 Análisis Unidimensional
- Distribuciones de variables cuantitativas.
- Frecuencias y gráficos para variables cualitativas.
📉 Análisis Multidimensional
📌 Relaciones entre variables cuantitativas y cualitativas.
📊 Diagramas de dispersión, boxplots y correlaciones.
📢 Visualización de Datos
📈 Histogramas, diagramas de dispersión, heatmaps y más.
Para ejecutar los scripts y reproducir los análisis, necesitarás:
-
R y RStudio 🔹 Descargar aquí
-
Librerías de R como
tidyverse,ggplot2ydplyr. Puedes instalarlas con:install.packages(c("tidyverse", "ggplot2", "dplyr"))
Cada carpeta contiene un conjunto de scripts en R con análisis específicos.
source("scripts/1_preprocesamiento_esp_dataset.r")
source("scripts/2_analisis_gráfico.r")
source("scripts/3_analisis_probabilidad.r")📬 Contacto
Si tienes dudas o sugerencias, ¡no dudes en contactarme!
📧 Correo: enriquediaz.profesor@lasallecuernavaca.edu.mx
🐦 Twitter: @EnriqueDiazOca1
💼 LinkedIn: linkedin.com/in/enrique-diaz-ocampo-2377121a4/
