100 Days of ML Code — Day 3

John Theo
johntheology
Published in
1 min readJul 10, 2018

Hoje acabei não "codando".

Esse negocio de data preparation e feature engineering me intriga, pois queria adotar uma metodologia que eu pudesse usar em todos os problemas que eu fosse lidar(mesmo que em alguns casos parecesse redundante). Acredito que isso ajuda no entendimento assim como no compartilhamento do conhecimento, pois poderia criar vários notebooks com o mesmo formato onde o leitor saberia onde encontrar cada informação.

Sendo assim, acabei parando em um artigo aqui no Medium mesmo:

Esse artigo aí me ajudou bastante hoje a entender basicamente os 3 tipos de categoria de problemas que existem no Kaggle:

  • Problemas com dados estruturados
  • Problemas com Processamento de Linguagem Natural (NLPs)
  • Problemas que envolvem manipulação de imagens

Em cada um deles ele mostra um forma de abordar e que o "estilo" de cada engenheiro de ML na hora de abordar o problema influencia bastante.

Não vou ser redundante aqui e reescrever muito do que o o autor já disse no próprio artigo, mas deixo aqui a sugestão de leitura e se mais alguém tiver alguma sugestão comenta aqui por favor.

Até amanhã!

PS.: Ontem o link para o meu kernel não estava funcionando. O Saaj me avisou e vi que era por causa que o Kernel estava privado. O kernel ainda está bem cru pois basicamente só escrevi nele e importei as bibliotecas, mas espero que no decorrer desse desafio de 100 dias de ML eu deixe ele com muito "garbo e elegância"

--

--

John Theo
johntheology

Engenheiro da Computação, musico, esposo, pai. Buscando acertar os detalhes da vida com muita arte.