Não confunda BI com Data Science, por favor.
Estou vendo muitas empresas contratando profissionais com o título de Data Science, e (muitas vezes por entender que é o profissional de dados mais “caro” da empresa) colocando eles para ser “head” da área de BI da empresa. Que erro! Isso não se faz.
Não só por desestimular o profissional (muitos não aceitariam tal “desafio”), mas principalmente por não usar todo seu potencial, e com isso, você ter menos retorno para sua empresa / marca / cliente.
Ambos têm sua importância dentro da empresa, seja a área de BI ou DS. Ambas extremamente importantes, porém com premissas. modo de trabalho e produtos finais muito distintos.
As funções e entregas de um e outro são bem distintas. E temos que tomar cuidado com nossos clientes (internos ou externos) ou até mesmo como materializamos uma entrega / demanda para eles. Geralmente queremos colocar tudo isso em um report, dashboard, apresentação… está aí onde começamos a nos complicar.
Todo chefe, C-level, cliente adora um bom dashboard, automático, bem desenvolvido… e isso é função de um Data Analytics / BI desenvolver, automatizar (com ajuda dos “codings” quando necessário). É sua função, seja qual for a solução. Mas não é, nem de perto, a função de um Data Science, essa é bem diferente disso.
PS. Se você ainda confunde um pouco o que faz um Data Science, o Data Analytics (seu BI) ou até mesmo conceitualmente o que é o Big Data, esse vídeo curto da Simplilearn pode ajudar.
Qual o problema do meu super report automático e com todas as infos?
Nenhum. (Aliás, espero que nenhum).
Espero que nenhum pois há muitos reports / dashs que são lindos, mas de difícil interpretação, sem nenhum tipo de acompanhamento real no dia a dia do cliente final. Ele acha lindo, aprova, mas não usa para nada (ou só usa para montar ppt / .key para o chefe apenas).
Criando dashboard você está desenvolvendo algo que será usado por um terceiro (seja ele quem for) acreditando que ele terá total condições de ler e interpretar tudo que está ali, tirando suas próprias conclusões e a partir delas, tomando suas ações.
Aí que mora o grande perigo, sua área de BI trabalha intensamente, não é simples o desenvolvimento e automatização (apesar de há muitos anos existirem sistemas que criam e automatizam reports e dashboards para facilitar o data visualization na tomada de decisão do negócio) e se a entrega final não tiver valor de fato para o usuário, será mais um trabalho a ser jogado fora.
Muita atenção aqui para saber se, sua área de BI está de fato criando valor ao seu negócio, ou ao negócio do seu cliente.
Qual de fato é a função então do Data Science?
A ciência de dados por sua essência tem como principais atividades a arte de combinar estatísticas, matemática, programação para busca de insights, informações e encontrar padrões nos dados coletados, para resolver um problema ou entender uma necessidade / oportunidade de negócio.
As marcas e empresas entendem que hoje há uma grande disponibilidade / volume de dados que se bem trabalhados, se torna uma grande vantagem competitiva. As empresas que conseguem utilizar esses dados de forma eficiente e com eficácia também são mais rápidas na busca da decisão assertiva ao seu negócio, sua curva de crescimento é maior. É muito importante para um cientista de dados a sua habilidade em definir e compreender problemas de negócio, habilidades analíticas, habilidades de programação, habilidades estatísticas, habilidades de aprendizado de máquina, visualização de dados e muito mais. Óbvio que nem todo profissional precisa saber ou conhecer tudo, mas aí entra o padrão que é montar um time multidisciplinar que se complementa em competências.
Falo mais sobre como montar times de sucesso em análise de dados nesse texto aqui:
Enfim, diante disso temos o papel de um Cientista de Dados. Se sua empresa possui volumosos conjuntos de dados estruturados e também não estruturados, e que pode aprender e tirar informações valiosas para apoio à tomada de decisão, sua empresa pode contratar um cientista de dados.
A Ciência de Dados é uma disciplina pioneira. Cientistas de Dados muitas vezes empregam o método científico para a exploração de dados, formação de hipóteses e testes de hipóteses (através de simulação e muita modelagem estatística). Importante desse profissional é de fato gerar conhecimento novo para a empresa, valioso, explorando padrões e anomalias nos seus dados de negócios.
Uma observação aqui é que muitas empresas não coletam essas informações sobre seu negócio de maneira precisa. Por exemplo, uma rede de lojas físicas que não usa / coleta nenhuma informação das suas câmeras ou wifi por exemplo, para entender comportamento do consumidor dentro da loja, ou que não cruza os dados de clientes físicos da sua loja com os dados do seu e-commerce. Muitas vezes isso não é feito por simples falta de conhecimento da empresa de saber que era possível ser feito.
Muito dos estudos de um cientista de dados se passa pelo famoso Big Data, e soluções de plataformas de dados baseadas em nuvem são comuns aqui. Certamente esse profissional tem que saber atuar nessas plataformas, bem como cientistas de dados com foco em negócios podem usar técnicas de machine learning para obter insights de grandes conjuntos de dados. Eles são qualificados em matemática, estatística e programação, e usam essas habilidades para gerar modelos preditivos por exemplo, com plataformas como Python, R.
E não basta só saber analisar os dados, a importância do Storytelling para quem trabalha com dados é imensa, muita atenção aqui. Não basta você ser um gênio na arte de analisar dados se ninguém entender o que você fez ou o que deve ser feito com seu produto final, é essencial cuidar de como seu estudo vai ser contado e para quem.
Li um artigo do Paulo Vasconcellos que fala especialmente sobre “Data Storytelling”. Ele define como uma “técnica crucial para um Cientista ou Analista de Dados que precisa explicar sua linha de pensamento para outras pessoas, tendo elas conhecimento técnico ou não. É nesse momento que sua habilidade de comunicação será muito importante, afinal, ninguém gosta de ver uma apresentação maçante ou ler um texto chato, certo? Resumidamente, Data Storytelling é o ato de você explicar o que você fez, como fez e por quê fez, tudo isso de forma que mantenha seu leitor ou ouvinte engajado”. Acho a melhor definição sobre o assunto, e fica a dica de leitura abaixo.
Sendo direto e reto…
Crie sim e abuse do data visualization em seus reports e dashboards para acompanhar os principais KPIs do seu negócio, aqueles 10, 12 no máximo que mais importam para você (e seu time de BI prepara e mantêm eles atualizados).
Agora, separe seu time de Data Science para atuar naqueles problemas e/ou oportunidades que de fato vão mudar seu negócio (seja aumentar receita, descobrir novo nicho de atuação, diminuir custo, aumentar tráfego de plataforma, criar ou mudar produto e/ou linha de produção, sejam quais forem eles), um de cada vez, focado. A entrega final depois dessa jornada é muito mais valiosa que um trabalho mediano de mais report para contar o passado desse problema / oportunidade. Olhe como fazer diferente daqui para frente, aprendendo com o passado, não reportando ele.
Ferramentas para um, e para outro…
No quadro simples abaixo listo algumas ferramentas, tanto para o time de BI, quanto para o time de Data Science. Simples e fácil de entender.
Bom trabalho!