Skip to content

gotoxz/analise-salarios-python

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Análise Estatística de Distribuição de Salários

Projeto acadêmico de análise de dados desenvolvido em Python, com foco em estatística descritiva e visualização de dados. Utiliza um dataset simulado de salários anuais para demonstrar técnicas fundamentais de análise exploratória de dados (EDA).

📋 Descrição

Este projeto realiza uma análise completa da distribuição de salários, incluindo:

  • Geração de dataset realista com dados comuns e outliers
  • Cálculo de medidas descritivas
  • Visualizações profissionais (Histograma e Boxplot)
  • Interpretação automática dos resultados estatísticos
  • Identificação e contextualização de outliers

📊 Resultados

A análise gera os seguintes outputs:

Medidas Descritivas

  • Média: R$ 54.76 mil
  • Mediana: R$ 51.02 mil
  • Moda: R$ 55.00 mil
  • Variância: 799.62
  • Desvio Padrão: 28.28

Visualizações

  • Histograma com curva KDE, linha de média e mediana
  • Boxplot com identificação visual de outliers

Interpretações Automáticas

  • Análise de assimetria da distribuição
  • Identificação de outliers via método IQR
  • Contextualização dos resultados no domínio de negócios

🚀 Como Usar

Pré-requisitos

  • Python 3.7 ou superior
  • Jupyter Notebook ou Google Colab

Instalação das dependências

pip install -r requirements.txt

Executar o Projeto

Opção 1: Jupyter Notebook

jupyter notebook Projeto.ipynb

Opção 2: Google Colab

  • Faça upload do arquivo Projeto.ipynb no Google Colab
  • Execute todas as células em sequência

📦 Estrutura do Projeto

analise-salarios-python/
├── Projeto.ipynb          ← Notebook principal com toda a análise
├── README.md              ← Documentação do projeto
├── requirements.txt       ← Dependências do projeto
└── .gitignore             ← Arquivos ignorados pelo Git

💡 Tecnologias Utilizadas

  • Python 3.7+ — Linguagem principal
  • Pandas — Manipulação e análise de dados
  • NumPy — Computação numérica e geração de dados
  • Matplotlib — Visualizações gráficas
  • Seaborn — Visualizações estatísticas avançadas
  • SciPy — Computação científica e estatística

📈 Sobre o Dataset

O dataset foi gerado de forma controlada para simular uma distribuição realista de salários:

  • 210 registros no total
  • 200 registros com distribuição normal (salários comuns)
    • Média: R$ 50 mil, Desvio Padrão: R$ 15 mil
  • 10 registros simulando executivos/diretores (outliers)
    • Média: R$ 150 mil, Desvio Padrão: R$ 20 mil

Essa composição resulta em uma distribuição com assimetria à direita, fenômeno comum em dados reais de remuneração.

🔍 Principais Descobertas

  1. Assimetria Positiva: A distribuição apresenta cauda alongada à direita
  2. Impacto dos Outliers: A média (R$ 54.76 mil) é maior que a mediana (R$ 51.02 mil), evidenciando o impacto dos salários elevados
  3. Outliers Identificados: 11 registros acima de R$ 89.59 mil, representando cargos executivos
  4. Interpretação de Negócio: Os outliers são esperados e justificados no contexto de uma empresa com hierarquia salarial definida

🔧 Melhorias Futuras

  • Análise com dataset real de mercado de trabalho
  • Comparação entre diferentes setores da economia
  • Modelos preditivos de faixas salariais
  • Dashboard interativo com Plotly ou Streamlit
  • Análise temporal de evolução salarial

👨‍💻 Autor

Desenvolvido como projeto acadêmico em Python com foco em análise estatística e visualização de dados.

📄 Licença

Este projeto é de código aberto e pode ser usado livremente para fins educacionais.

About

EDA of salary distributions with outlier detection via IQR — Python, Pandas, Seaborn, Jupyter

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors