Um dia de Data Science sob a perspectiva de um QA

Antonio Montanha
3 min readJul 18, 2018

--

Hoje tive o prazer de participar do The Developers Conference São Paulo 2018, um evento sensacional e com uma estrutura incrível. A trilha que escolhi para acompanhar hoje foi a de Data Science, um assunto que venho “namorando” a algum tempo, mas não dediquei tempo para estudar de fato ainda. Então nesse pequeno post vou tentar trazer um pouco do que foi abordado nas palestras na perspectiva de QA.

Diferente do que eu esperava, todas as palestras tiveram abordagens com uma pegada mais conceitual, contando com contextualizações e apresentação de alguns cases, o que possibilitou um maior entendimento e aproveitamento da minha parte, visto que ainda não conheço bem esse universo de ciência de dados. Algo que ficou muito claro, é que na própria definição de Data Science já existem muitas discrepâncias, então deixo a seu cargo procurar e escolher a que mais te agrada.

As palestras cobriram diversos temas, que iam desde apresentações de como montar um modelo que ajude na tomada de decisões e consegue prever os ganhos futuros de uma empresa, até aplicações de Data Science no mundo do futebol e para reconhecimento facial de criminosos ajudando a polícia federal. Então visto esta vasta gama de assuntos abordados, vou fazer um apanhado das coisas que eu julguei serem relevantes de uma forma geral e mais voltada para o universo de QA.

  1. Precisamos parar de pensar em resolver coisas que não são de fato problemas: este ponto foi comentado diversas vezes, e é aplicável mesmo em um contexto de desenvolvimento de software convencional, onde muitas vezes estamos tão ligados na Stack de ferramentas que vamos usar, como modelar, deixar o código limpo, reuso, acoplagem, polimorfismo e afins, e nos esquecemos a real função de um software… resolver algum problema. Em Data Science não é diferente, se ninguém usa a informação que foi processada, ou se a sua ferramenta que consegue dizer o humor da pessoa pela expressão facial não agregou nenhum valor no projeto, então muito provavelmente foi um desperdício de recurso.
  2. Data Science não é algo novo: já se falava de ciência de dados há mais de 30 anos atrás, porém o avanço da tecnologia possibilitou uma maior capacidade de processamento e de armazenamento, o que por sua vez acarretou em um aumento gigantesco no volume de dados gerados. Então são conceitos antigos, que ganharam força devido a situação atual.
  3. Ciência de dados não é um trabalho para “ele”, é um trabalho para “eles”: dentro de Data Science nos temos várias ramificações, dentre elas, Big Data, Machine Learning, Deep Learning, Árvores de Decisão, Redes Neurais dentre várias outras. E da mesma forma que no cenário de desenvolvimento de software convencional não é esperado que um desenvolvedor conheça todas as linguagens, paradigmas, bancos de dados e padrões de projeto (embora algumas vagas por aí digam o contrário), também não é esperado que um cientista de dados seja um especialista em todas estas áreas, o que se espera é que este cientista tenha um conhecimento superficial do todo e um conhecimento aprofundado de um ou mais assuntos específicos, muito semelhante a um desenvolvedor FullStack. Este assunto levou a uma discussão muito interessante, que nos convidou a fazer algumas pontes da ciência de dados com o desenvolvimento tradicional de software, foi evidenciado que em ambos os processos (tradicional e ciência de dados), nos teremos por exemplo pessoas mais focadas em negócio e outras mais focadas no desenvolvimento. Baseado nisso eu questionei os coordenadores da trilha se eles enxergavam a aparição de um papel de QA no mundo de Data Science, alguém realmente focado em garantir a qualidade como parte do processo, e a resposta foi: SIM.

De acordo com o que eu vi hoje e na própria visão de especialistas na área, a ascensão da ciência de dados trará com elas novas oportunidades e novos papeis a serem desempenhados, e como foi dito inúmeras vezes hoje:

“ alguém vai fazer, o que você pode decidir é se vai ser você ou não”.

Coordenadores da Trilha: Antônio Marques e Amelia Pessoa.

--

--