Análise de resíduos e ajuste do modelo

O que são resíduos? Como melhorar as predições do modelo?

Vinícius Rodrigues
bio-data-blog
2 min readDec 3, 2020

--

Os resíduos de um modelo de regressão são as diferenças entre os valores observados e os valores ajustados (a reta do modelo estatístico). Então, quanto maior a distância dos pontos obervados até a reta, maior os resíduos do modelo:

A distância dos valores observados da reta (linhas cinzas) são chamados de resíduos.

Quando montamos um modelo, queremos aquele que possuiu um melhor ajuste, ou seja: menores valores de resíduos. Para isso, teremos que ajustar os modelos e compará-los, de forma a encontrar o melhor modelo (o mais ajustado).

Dica: Você poderá verificar os valores de resíduos para cada ponto com o pacote broom e a função “augment”:

library(broom)
augment(nome_do_modelo)

Ajustando o modelo

Vamos criar dois modelos com diferentes distribuições e comparar os seus resíduos:

Acima foram criados dois modelos, um poisson e outro gaussiano. Com qual devo ficar? Vamos escolher aquele que possuiu melhores resíduos.

Comparando resíduos do modelo

Existem algumas formas para se compara os resíduos do modelo, mas recomento a função qqPlot do pacote car:

Com os comandos acima, teremos os seguintes gráficos:

Comparação dos resíduos dos modelos.

O modelo com os melhores resíduos é aquele em que os pontos ficam localizados dentro das linhas pontilhadas azuis. Quanto mais dentro dessas linhas, melhor os resíduos. No caso do exemplo, o modelo possion está melhor ajustado.

Você também poderá fazer um boxplot dos resíduos com o pacote auditor (veja a descrição da função aqui):

Boxplot dos resíduos.

Em ambos os casos, ficou claro que o modelo adotado deverá ser o poisson.

Dúvidas? Visite nosso site ou mande um e-mail para viniciusbrbio@gmail.com

--

--