Forest Cover Type Prediction: De Modelos Lineares a Ensembles.
Este projeto tem como objetivo classificar sete tipos diferentes de cobertura florestal na Roosevelt National Forest, Colorado, utilizando variáveis cartográficas e geológicas.
O foco principal foi a análise comparativa entre modelos de aprendizado estocástico (SGD) e modelos baseados em árvores (Random Forest), demonstrando como a complexidade do modelo deve se adequar à natureza dos dados.
Análise Multiclasse: Classificação de 7 espécies de árvores com alta precisão.
Otimização de Performance: Transição de um modelo linear (F1-Score: 0.76) para um modelo de Ensemble (F1-Score: 0.95).
Resultados (Random Forest): O modelo final alcançou uma performance excepcional, mantendo robustez mesmo em classes minoritárias.
| Métrica | Valor |
|---|---|
| Acurácia Geral | 96% |
| F1-Score (Macro) | 0.93 |
| Precisão Média | 0.95 |
| Recall Médio | 0.91 |