Um mapa do norte da Europa com um carrinho de brinquedo preto por cima dele
Um mapa do norte da Europa com um carrinho de brinquedo preto por cima dele
Photo by Mihis Alex from Pexels

Compreendendo visualmente duas das situações mais rotineiras no treinamento de modelos

Dois dos conceitos mais conhecidos (e evitados) de qualquer Cientista de Dados são o underfitting e o overfitting de um modelo, onde temos erros na disponibilização de dados a serem fornecidos a um modelo de Machine Learning qualquer, ou ainda temos problemas na própria configuração dos algoritmos. Para aqueles mais experientes e para aqueles que ainda são novatos, vamos todos sair do mesmo ponto:

O que é Underfit e Overfit?

O principal objetivo dos nossos modelos de Machine Learning é entender como os nossos dados preexistentes se comportam e, finalmente, tentar prever como um novo…


Photo by Suzy Hazelwood from Pexels

Dentro de uma empresa de Data Science, PLN se torna algo rotineiro e importante em um dia de trabalho, então como apresentar esses conceitos para novos Cientistas de Dados?

Técnicas de Processamento de Linguagem Natural são extremamente úteis para identificar padrões em textos, entender seus conteúdos, a relevância de um corpus dentre vários outros e até para segmentação de assuntos. Não é incomum Cientistas de Dados adentrarem no universo de manipulação e tratamento de texto em algum ponto de suas carreiras, sendo natural que maneiras diferentes de treinamento desses mesmos cientistas apareçam. …

Matheus Freitag

We either accept reality or take the responsibility to change it.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store