O que é Regularização

Gustavo Santos
Data Hackers
Published in
4 min readMar 9, 2021

--

O que é regularização, quais os tipos e quando aplicar

Photo by Austin Distel on Unsplash

Introdução

Regressão Linear é um dos algoritmos mais usados na Ciência de Dados. Através dela, objetiva-se prever um valor associado a uma observação, usando como entrada as variáveis (ou características ou atributos) daquela observação. Entretanto, dada a quantidade de dados coletados por inúmeras fontes, por vezes, a quantidade que temos em mãos pode ser excessiva, de modo que grande parte dela será apenas ruído para o seu modelo, causando o underfitting ou overfitting, resultando em baixa performance nas previsões.

Neste artigo, trato dos métodos de regularização de regressão comumente referidos como Lasso ou L1 e Ridge ou L2.

Tais métodos podem ser a solução para esses casos, diminuindo a importância de variáveis desinteressantes para o modelo e aumentando a sua performance.

Por quê fazer Regularização?

A regularização pode ser usada para reduzir a quantidade de variáveis em um modelo de regressão. Afinal, pretendemos ter um modelo simples e generalizável, o qual pode prever valores rapidamente e com boa acurácia.

A Regularização remove os ruídos e deixa o modelo mais simples, generalizável e com melhor performance.

--

--

Gustavo Santos
Data Hackers

Data Scientist. I extract insights from data to help people and companies to make better and data driven decisions. | In: https://www.linkedin.com/in/gurezende/