Este projeto realiza uma análise exploratória e preditiva sobre a expectativa de vida com base em dados socioeconômicos e de saúde pública. O objetivo é entender os principais fatores que influenciam a longevidade em diferentes países ao longo dos anos e construir modelos que possam prever a expectativa de vida com base em variáveis relevantes.
- Leitura dos dados com
pandas - Tratamento de valores nulos
- Conversão de tipos de dados
- Normalização de variáveis numéricas
- Estatísticas descritivas
- Visualizações com
matplotlibeseaborn- Histogramas
- Gráficos de dispersão
- Mapas de calor de correlação
- Identificação de outliers
- Cálculo de correlação de Pearson
- Análise de multicolinearidade
- Seleção de features com base em importância estatística: Random Forest
- Divisão dos dados em Treino e Teste: train_test_split
- Padronização das variáveis: StandScaler
- Regressão Linear
- Regressão Ridge
- Regressão Lasso
- Validação cruzada com
train_test_split - Parâmetro de Otimização: GridSearch
- Métricas de avaliação:
- R² (coeficiente de determinação)
- RMSE (Root Mean Squared Error)
- MAE (Mean Absolute Error)
- Comparação entre modelos
- Visualização de resíduos
- Interpretação dos coeficientes
- Discussão sobre viés e variância
- Python 3.8+
- Jupyter Notebook
git clone https://github.com/jaquelinesfernandes/Life_expectancy.git
cd Life_expectancy



