Seleção de Variáveis (Parte 2)

Gustavo Santos
Data Hackers
Published in
3 min readJan 10, 2021

--

Entenda como utilizar o SelectKBest para escolher as melhores variáveis para o seu modelo de Machine Learning.

Photo by Max van den Oetelaar on Unsplash

A Parte Prática

Na semana passada, escrevi o artigo Estatística para Seleção de Atributos, o qual recomendo a leitura para entender os conceitos teóricos, o que está por trás dessa ferramenta de seleção de variáveis do sklearn. Entretanto, devo dizer que, apesar de ser a segunda parte de um conteúdo, ambos os artigos podem ser lidos de forma independente, servindo ao propósito de te ajudar com essa tarefa.

Métodos de Seleção de Atributos

Selecionar os melhores atributos significa remover aqueles que não melhoram a performance ou apenas adicionam ruído ao modelo.

Existem dois métodos principais que podem ser usados para completar essa tarefa:

  • Método wrapper (embrulho, em tradução livre): são criados vários modelos com diversas combinações de variáveis e escolhe-se aquelas que resultaram na melhor performance para o modelo, de acordo com métricas de avaliação. Uma ferramenta que ilustra esse conceito é a RFE.
  • Método filter (filtro, trad. livre): este é o método em que encaixamos o SelectKBest, onde usamos métodos…

--

--

Gustavo Santos
Data Hackers

Data Scientist. I extract insights from data to help people and companies to make better and data driven decisions. | In: https://www.linkedin.com/in/gurezende/