O big data, a inteligência artificial e o futuro da transformação digital
Com certeza você já foi impactado pela ciência de dados e pelo business intelligence durante esta época de COVID-19.
No exemplo acima, você pode ver uma plataforma de business intelligence utilizada para analisar dados quantitativos sobre o avanço do coronavírus no Brasil.
A ciência de dados consiste na aplicação da metodologia científica, utilizando técnicas da matemática, estatística e programação para conseguir validar hipóteses de negócio, criar algoritmos e modelos matemáticos.
Já o business intelligence, consiste na criação de produtos de dados a partir dos processos da ciência de dados. Uma diferença entre os dois é que ambos estão próximos do negócio. Porém, a ciência de dados está mais ligada a metodologia científica, enquanto o business intelligence está mais ligado a tecnologia e a programação.
A ciência de dados, que já é aplicada a muitos anos na academia, se tornou mainstream nos últimos tempos, e hoje, é um dos termos mais citados no hype da tecnologia. No entanto, a inteligência artificial, machine learning, deep learning e tantas aplicações ligadas à robótica e automação que vemos na atualidade, já existem a muito tempo, como mostra o gráfico abaixo.
Hoje em dia, para nós que vivemos em um mundo que muda bastante, essa diferenciação está mais relacionada com a aplicação e a forma de produtização.
Eu acredito que, de forma geral, a nomenclatura da tecnologia não importa no final das contas, o que importa é o valor gerado por meio de produtos de dados.
Existem diversos exemplos de aplicações singulares da inteligência artificial, como:
- classificação de e-mail que contêm spam;
- traçar o perfil bancário e entender sobre qual o limite ideal para cada perfil de consumidor de cartões;
- robôs inteligentes que abrem portas e dão cambalhotas da Boston Dynamics;
- os carros autônomos do Elon Musk.
Transformação digital
Muitas vezes, quando os empreendedores estão idealizando seus negócios, não têm um produto tecnológico em mãos. Entretanto, muitos empreendimentos têm acesso a dados de altíssimo valor e até conseguem movimentar bilhões de dólares com planilhas de Excel.
Empresas como Netflix, Spotify, Google, Facebook, Amazon, e tantas outras, apostam fortemente na utilização dos dados para melhorar a experiência de seus usuários e criar novos produtos.
Atualmente, essas empresas são extremamente valorizadas pelos dados que possuem sobre seus usuários, mas muitas vezes entraram em polêmicas sobre o que faziam com dados sensíveis de tais usuários. Esse fato gerou a criação da Lei Geral de Proteção dos Dados (LGPD), que se tornou uma obrigação para as empresas com relação à privacidade dos seus usuários.
Em minha visão, a forma que os negócios utilizam seus dados é o primeiro passo para a transformação digital. Isso fica claro quando analisamos o quanto o engenheiro de dados está se tornando cada vez mais valorizado para o mercado. Hoje, esse cargo é o que está no hype, quando falamos de dados. É bem simples: se você não tiver dados, o seu cientista de dados não vai ter trabalho.
O engenheiro de dados se assegura de que os dados estejam disponíveis para análise e que possam ser manuseados de forma segura. Esse profissional cria reservatórios para centralizar os dados de diversas fontes, os famosos data lakes, de forma que a empresa possa obter valor por meio dos dados que possui, seja em aplicação de ciência de dados, business intelligence ou inteligência artificial.
O objetivo de uma empresa orientada a dados é extrair conhecimento dos seus dados, e com isso, ganhar vantagem competitiva em seus negócios.
Entre suas responsabilidades, está incluído:
- coletar dados
- transformar dados
- armazenar dados
- disponibilizar dados
A diferença do engenheiro para o cientista de dados é que o cientista tem um grande foco em análise de negócio a partir dos dados, e o engenheiro tem um forte conhecimento em estatística e algoritmos.
Está cada vez mais claro que as empresas orientadas por dados é que vão sobreviver a crise, e assim, serão as próximas a se tornarem bilionárias.
Um exemplo de como iniciar um projeto, que vai ter como resultado um produto de dados, é por meio da análise de dados.
Projeto — Táxi voador em Nova York
Abaixo você poderá ver partes de um projeto que realizei para o nanodegree Data Product Manager da Udacity, uma organização educacional internacional que oferece cursos de alta tecnologia no forma de MOOC (massive open online course).
Na visualização acima, temos a distribuição de dados relacionados a viagens de Táxi em Nova York. Essa base de dados analisada, mostra diversos pontos de pickup (ponto de partida de Táxi).
Nessa outra visualização, temos a distribuição da densidade de “pickups” com base em uma mapa de calor. Nesse caso, o objetivo foi mostrar a densidade de “pickups” com base no código postal.
Aqui podemos analisar a quantidade viagens com base na hora do dia, e também, no dia da semana que tem a maior frequência de viagens, ficando claro em quais momentos a utilização do taxi voador seria mais efetiva.
Durante o processo também precisei aplicar a ciência de dados para fazer a análise exploratória e a limpeza dos dados, além de criar uma coluna de preço por meio de um algoritmo para calcular o preço. Você pode visualizar parte do processo na imagem abaixo:
Nesse gráfico acima podemos visualizar a aceitação dos usuários em relação a utilização do serviço de táxi voador. Nesse caso, o objetivo foi visualizar a relação entre usuários que responderam sim ou não sobre a utilização do serviços.
Então, foram criadas quatro principais visualizações com o objetivo de responder hipóteses relacionadas a aceitação do serviço por região, gênero, idade e valor que pagaria por milha ao utilizar o serviço.
A segunda parte do projeto foi totalmente focada em pegar os conhecimentos adquiridos com as análises, e a partir disso criar produtos com base em uma visão de negócios guiada por dados. E assim, criar OKR´s (objetivos chave), KPI´s (indicadores de performance), e também, o MVP do projeto de lançamento do MVP do taxi voador.
Conclusão
O objetivo com esse post foi te mostrar o futuro da transformação digital está intrinsecamente ligado a utilização dos dados, e a capacidade de aprimora-los e gerar produtos de valor com base na cultura orientada a dados.
O primeira parte dessa formação foi o nanodegree: Applying Data Science to Product Management. Nesse momento acabo de iniciar o segundo passo da formação com o nanodegree: Establishing Data Infrastructure.
Em breve volto com mais conteúdos. #fiqueemcasa