Análise de resíduos e ajuste do modelo
O que são resíduos? Como melhorar as predições do modelo?
Os resíduos de um modelo de regressão são as diferenças entre os valores observados e os valores ajustados (a reta do modelo estatístico). Então, quanto maior a distância dos pontos obervados até a reta, maior os resíduos do modelo:
Quando montamos um modelo, queremos aquele que possuiu um melhor ajuste, ou seja: menores valores de resíduos. Para isso, teremos que ajustar os modelos e compará-los, de forma a encontrar o melhor modelo (o mais ajustado).
Dica: Você poderá verificar os valores de resíduos para cada ponto com o pacote broom e a função “augment”:
library(broom)
augment(nome_do_modelo)
Ajustando o modelo
Vamos criar dois modelos com diferentes distribuições e comparar os seus resíduos:
Acima foram criados dois modelos, um poisson e outro gaussiano. Com qual devo ficar? Vamos escolher aquele que possuiu melhores resíduos.
Comparando resíduos do modelo
Existem algumas formas para se compara os resíduos do modelo, mas recomento a função qqPlot do pacote car:
Com os comandos acima, teremos os seguintes gráficos:
O modelo com os melhores resíduos é aquele em que os pontos ficam localizados dentro das linhas pontilhadas azuis. Quanto mais dentro dessas linhas, melhor os resíduos. No caso do exemplo, o modelo possion está melhor ajustado.
Você também poderá fazer um boxplot dos resíduos com o pacote auditor (veja a descrição da função aqui):
Em ambos os casos, ficou claro que o modelo adotado deverá ser o poisson.
Dúvidas? Visite nosso site ou mande um e-mail para viniciusbrbio@gmail.com