#ML - Métricas de Regressão

Douglas Hebert Esmerio da Silva
3 min readJan 9, 2019

--

Regressão:

do Inglês: Regression;
do Grego: οπισθοδρόμηση;
do Russo: регрессия;
do Portunhol: Regresiones;

zzzzzz..

Considerações Importantes:

(º)> < — (isso é um pato de perfil).*
(ºvº) < — (isso é um pato 3×4).*

Termos importantes:

Ferrari do Rubinho , Fuscão da massa, Opalão tunado

Bora lá, zero meia!

Métricas

Métricas são recursos relacionados especificamente a cada ‘abordagem’ de Machine Learning. Existem diferentes métricas para diferentes tipos de tarefa, por exemplo: classificação, regressão, ranking, clustering*, topic modeling**,dentre outros. Nesse post, veremos exemplos comuns de métricas aplicadas para tarefas de regressão.

Regressão

Em tarefas de Regressão, a missão do modelo é predizer valores númericos. Por exemplo, se quisermos predizer o valor de uma ação no futuro, considerando o passado de uma empresa e alguns detalhes mais, podemos tratar esse problema com um modelo de regressão.

RMSE

Uma das métricas mais comumente usadas(caraca, comumente usadas, pega essa), se não a mais utilizada, é a RMSE(Root Mean Squared Error). Também conhecida como RMSD (Root Mean Square Deviation), como o nome sugere(quase nem sugere né), é uma regra que baseia-se na “média das diferenças entre as predições e observações reais ao quadrado”.

Formulinha do rolê:

Na fórmula acima, podemos entender os elementos yi como o valor real e ŷi como o valor previsto, um modo bem intuitivo de entender a fórmula é pensar na distância Euclidiana entre o vetor de valores corretos e o vetor de valores previstos mediados por ’n’, onde n é o número de pontos. Abaixo um exemplo claro do Khan Academy de como esse método funciona:

Um bocado intuitivo, né? =D “depois que eu vi o vídeo 318 vezes, lajksajkls”

MAE — Mean Absolute Error

O MAE, ou Erro Absoluto Médio é a métrica mais simples de se entender. Essa métrica consiste em calcular o residual de cada ponto, onde valores residuais negativos e positivos não se anulam. Após esse agrupamento, calculamos então a média desses ‘residuais’.

Fórmulinha do rolê:

Abaixo um exemplo ‘prático’ do cálculo:

Supondo que temos quatro carros à venda com os seguintes valores:

Fuscão da massa: R$10k
Opalão tunado: R$ 60k
Corvette do doguinha: R$ 700k
Ferrari do Rubinho: Ainda aguardamos a chegada dos dados, então 0.

Ok, agora supondo que as predições realizadas sejam:

Fuscão da massa: R$9k
Opalão tunado: R$ 62k
Corvette do doguinha: R$ 699k
Ferrari do Rubinho: R$ 4k

Belê, então nesse caso o cálculo ficaria:

MAE = (Erro do fuscão + Erro do opalão + Erro corvette + Errubinho) / N
MAE = ( (10–9) + (62–60) + (700–699) (4–0) ) / 4
MAE = (1 + 2 + 1 + 4)/4
MAE = 8/4 = 2

Simples que nem colocar ketchup na pizza!

MAPE — Mean Absolute Percentage Error

Meu, MAPE, ou Porcentagem Média do Erro Absoluto, ou Média Porcentagem do Absoluto Erro(?), é uma “espécie de variação” do MAE, porém, essa nos retorna a média percentual do erro absoluto entre as previsões e a realidade.

Diversas organizações optam por focar primeiro no MAPE para avaliar a precisão das previsões. A maioria das pessoas fica mais confortável em pensar em termos percentuais e, em alguns casos essa métrica é até mais importante que o valor propriamente dito.

Considerações Finais

Mais uma vez, podemos ver que além do comportamento do Rubinho ser facilmente previsto por modelos de Machine Learning, as métricas tem variações de acordo com necessidades diferentes, como por exemplo, as métricas exemplificadas hoje diferem das métricas anteriormente vistas para Problemas de Classificação.

O esquema é esse, pra quem leu,

valeu! =)

#dodatadaily

--

--