Sedução e fracasso do big data sem contexto

Érica Briones
Inovação.ninja
Published in
8 min readFeb 8, 2023

Em março de 2011 a McKinsey lançou o relatório especial “Big Data: the next frontier for innovation, competition, and productivity” (MANYIKA et al., 2011), no qual afirmava que big data se tornaria um elemento essencial competitivo, que estabeleceria novas ondas de crescimento produtivo, inovação, e excedente de consumidores.

A difusão do termo “big data” pode ser traçada a este relatório e similares da IBM que foram lançados no mesmo período (BEAN, 2020). Não obstante, o relatório da McKinsey foi presciente ao afirmar que “líderes em todos os setores iriam lidar com as implicações do uso de big data, não somente alguns poucos gerentes orientados a dados” (MANYIKA et al., 2011). Em retrospecto, este foi o insight chave do relatório, e deste ponto em diante dados não mais estariam restritos ao uso de alguns “poucos gerentes”, mas sim a todos os líderes de todos os setores (BEAN, 2020).

O advento do big data foi recebido com entusiasmo por fundos de venture capital e comunidades de investidores. Em novembro de 2011, a Accel Partner anunciou o lançamento de um fundo de investimento de U$ 100 milhões para investir em empresas de big data disruptivas. Dois anos depois, um segundo fundo foi lançado, de mais U$ 100 milhões, com o entendimento de que no último período o mercado havia focado em variedade, volume e velocidade, mas o valor para o usuário final não havia sido endereçado com a mesma intensidade. Acreditava-se numa aceleração na taxa de inovação de big data, com uma nova geração de empreendedores reimaginando formas de extrair o maior valor possível de big data, e mudando fundamentalmente a forma como trabalha-se e processava-se informações (BEAN, 2020).

Em 2021 completou-se uma década desde tais declarações e, de acordo com achados da indústria, a promessa permanece em sua maioria não realizada (BEAN, 2020). No relatório “2020 Big Data and Executive Survey” da New Vantage Partners, com 1000 executivos C-Level responsáveis por iniciativas de dados temos que (BEAN, 2020):

  • Somente 26,8% das organizações dizem terem alcançado uma cultura de dados;
  • Somente 37,8% das organizações consideravam-se data-drive;
  • Somente 45,1% das organizações estavam competindo em dados e analytics;

A realidade é que, para a grande maioria das empresas, a adoção de iniciativas de big data não acontece da noite para o dia, ela se desdobra ao longo de muitos anos, cheia de barreiras e desafios, um processo complexo que requer alinhamento de negócios e tecnologia, bem como de perspectivas e práticas de negócio. Apesar de hoje em dia termos mais dados disponíveis do que nunca, uma enorme capacidade de processamento, e tecnologia de ponta para a administração, catalogação, extração, análise, e geração de relatórios, a conexão entre investimentos em dados que se transformam em insights com grandes impactos de sucesso para o negócio permanece uma ambição elusiva para a maioria das organizações (BEAN, 2020).

Os desafios para que iniciativas de big data sejam bem sucedidas são muitos (LAWTON, 2022), entretanto num mundo onde estima-se que até 2025 sejam gerados 463 exabytes de dados por dia (“10 Stats On The Challenges Of Data Analysis Today”, 2022), e somente 29,2% dos executivos experimentam impacto nos objetivos de negócio com o uso de dados (NEWVANTAGE PARTNERS LLC, 2021), acredita-se que seja necessário explorar além das iniciativas de Inteligência Artificial no que concerne a análise de dados, pois até mesmo estas em 2020 tinham somente 15% das organizações conseguindo tirar proveito de suas capacidades em produção (PRESS, 2020).

De acordo com Wang (2016) “what is measurable isn’t the same as what is valuable”. Nesse sentido, a obsessão corporativa com a coleta e análise de dados está se tornando um fim em si mesmo, e atualmente 65% das organizações reportam possuírem mais dados do que são capazes de analisar (“10 Stats On The Challenges Of Data Analysis Today”, 2022). Tal obsessão reduz significativamente o tipo de conhecimento que é produzido, valorizado e gera ação a seu respeito (ROKKA; SITZ, 2018).

Análises produzidas a partir de big data possuem limitações em relação aos resultados que podem produzir. Os dados, por exemplo, são descontextualizados, sem informar às organizações o contexto no qual uma ação ocorreu, o humor ou situação na qual estava inserido o consumidor. Na ausência de tais informações, perde-se uma capacidade valiosa de se extrair mais retorno sobre o que foi coletado (ROKKA; SITZ, 2018).

Além disso, big data não é capaz de extrair experiências corporais, sensoriais e afetivas de uma pessoa. Mede-se suas reações fisiológicas, mas não de forma profunda e plena os estados emocionais, da mesma forma, que a análise de humor em textos não acessa emoções, e sim traços de sua narrativa. Isto é problemático uma vez que a vida das pessoas é essencialmente a respeito de experiências, logo isto implica uma visão míope sobre os fenômenos observados. Ou seja, big data não viabiliza uma profunda compreensão dos fenômenos, e sim as correlações entre variáveis, não necessariamente numa relação de causalidade (ROKKA; SITZ, 2018).

Contudo, a despeito de todas essas limitações, as organizações continuam agindo como se big data fosse a solução para todos os seus problemas, mesmo quando pesquisas apontam que por vezes tais iniciativas são conduzidas sequer sem a clareza de qual questão se deseja ver respondida (FISHER, 2016). Vive-se num estado de constante pressa por chegar em algum lugar, sem saber para onde se deseja ir.

Uma forma de equilibrar tais limitações de big data, seria com uma abordagem integrativa de pesquisa tal qual proposta por WANG (2016), que une “thick data”, definida por ela como “data brought to light using qualitative, ethnographic research methods that uncover people’s emotions, stories, and models of their world.”, e big data.

Integrando-se ambos os tipos de dados, espera-se prover às organizações uma visão mais completa de contexto de todas as situações, fornecendo variados tipos de insights em diferentes escalas e profundidades. “Thick data” revela contexto social de conexões entre pontos, enquanto big data revela insights dentro de um conjunto particular de pontos de dados quantificáveis. Técnicas de “thick data” aceitam complexidade irredutível, enquanto técnicas de big data isolam variáveis e identificam padrões.

A despeito de tais benefícios de uma abordagem integrativa, estas práticas parecem ainda não serem utilizadas na maioria das organizações. De acordo com os números da pesquisa da Mckinsey — “The Business Value of Design” (SHEPPARD et al., 2018):

  • Menos de 5% dos líderes das organizações pesquisadas foram considerados capazes de tomar decisões objetivas de design, tais quais, desenvolver um novo produto ou entrar em um novo setor;
  • 40% das organizações pesquisadas não falam com seus consumidores durante o desenvolvimento de produtos;
  • Apenas 50% das organizações pesquisadas falam com seus consumidores antes de gerar a primeira ideia de design ou especificação de um produto;
  • Empresas com um score MDI (Mckinsey Design Index) no quartil superior apresentaram crescimento superior ao benchmark de mercado em até 2 para um;

Tendo em vista os resultados da pesquisa da Mckinsey acima expostos, conjectura-se que entre os entraves existentes para a ampliação da discussão sobre “thick data” nas organizações tem-se o conflito de interesses entre o que é bom para as organizações no longo prazo versus a tendência de ciclos de curto prazo de permanência de executivos dentro das mesmas, associada à necessidade de construção de currículo.

“Thick data” não possui o enganoso apelo do uso rápido e fácil, com ganhos exponenciais, e em escala. Diz-se enganoso, pois como visto no decorrer deste artigo, iniciativas de big data, AI e machine learning são jornadas de múltiplos anos, cujas quais subestimou-se imensamente a dificuldade não só de implementação como de obtenção de retorno.

Uma vez que o uso eficaz do “thick data” exige um compromisso de longo prazo, as ações nesta direção soam como iniciativas modestas e de pequena escala (WANG, 2016) demandando mais tempo para que seu sponsor colha os seus resultados, podendo inclusive somente gerá-los após a saída da organização dos executivos responsáveis pela implementação. Num cenário de mercado aquecido e concorrido, essa demora na produção de casos e narrativas de sucesso que possam ser incluídos nos currículos dos executivos podem atuar como um desincentivo à construção de uma iniciativa de “thick data” organizacional, o completo oposto do cenário de big data.

Adicionalmente, ao agregar a necessidade de reflexão, e deixar claro os aspectos subjetivos de necessidade de análise e interpretação de resultados tem-se um automático conflito com o atual mundo corporativo obcecado por números e sua respectiva ilusão de controle (MINTZBERG, 1993; ROKKA; SITZ, 2018; WANG, 2016).

CONCLUSÃO

Embora haja uma percepção de mercado de que abordagens de big data possam agregar valor aos negócios, é necessária cautela em relação às possibilidades que a tecnologia tem a oferecer. O uso combinado do big data com o thick data pode ser uma alternativa que permita a extração de mais valor a partir dos dados. No entanto, este tipo de abordagem requer uma visão de longo prazo, que representa um conflito com os interesses de curto prazo de executivos que poderiam implementar tais abordagens.

Compreende-se que se faz necessário mais pesquisas sobre as maiores barreiras de adoção de “thick data” junto a executivos, e por consequências nas organizações, bem como formas de mitigá-las, considerando-se o alto potencial de valor de negócios, para os consumidores, e para a sociedade que tal adoção pode promover.

REFERÊNCIAS BIBLIOGRÁFICAS

10 Stats On The Challenges Of Data Analysis Today. Disponível em: <https://millimetric.ai/blog/10-stats-on-the-challenges-of-data-analysis-today/>. Acesso em: 7 nov. 2022.

BEAN, R. The ‘Failure’ Of Big Data. Disponível em: <https://www.forbes.com/sites/randybean/2020/10/20/the-failure-of-big-data/?sh=221f554aa218>. Acesso em: 7 nov. 2022.

FISHER, A. Why Big Data Isn’t Paying Off for Companies (Yet). Disponível em: <https://fortune.com/2016/02/05/why-big-data-isnt-paying-off-for-companies-yet/>. Acesso em: 7 nov. 2022.

LAWTON, G. Top 10 Big Data Challenges and How to Address Them. Disponível em: <https://www.techtarget.com/searchdatamanagement/tip/10-big-data-challenges-and-how-to-address-them>. Acesso em: 7 nov. 2022.

MANYIKA, J.; CHUI, M.; BROWN, B.; BUGHIN, J.; DOBBS, R.; ROXBURGH, C.; BYERS, A. H. Big data: The next frontier for innovation, competition, and productivity | McKinsey. Disponível em: <https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/big-data-the-next-frontier-for-innovation>. Acesso em: 7 nov. 2022.

MINTZBERG, H. The Pitfalls of Strategic Planning. California Management Review, p. 32–47, 1993.

NEWVANTAGE PARTNERS LLC. Big Data and AI Executive Survey 2021. [s.l: s.n.]. Disponível em: <https://c6abb8db-514c-4f5b-b5a1-fc710f1e464e.filesusr.com/ugd/e5361a_76709448ddc6490981f0cbea42d51508.pdf>. Acesso em: 7 nov. 2022.

PRESS, G. AI Stats News: Only 14.6% Of Firms Have Deployed AI Capabilities In Production. Disponível em: <https://www.forbes.com/sites/gilpress/2020/01/13/ai-stats-news-only-146-of-firms-have-deployed-ai-capabilities-in-production/?sh=7758187e2650>. Acesso em: 7 nov. 2022.

ROKKA, J.; SITZ, L. Why teach ethnography to managers (in the big data era)? Disponível em: <https://theconversation.com/why-teach-ethnography-to-managers-in-the-big-data-era-104669>. Acesso em: 7 nov. 2022.

SHEPPARD, B.; KOUYOUMJIAN, G.; SARRAZIN, H.; DORE, F. The Business Value of Design. [s.l: s.n.]. Disponível em: <https://www.mckinsey.com/~/media/mckinsey/business%20functions/mckinsey%20design/our%20insights/the%20business%20value%20of%20design/mckinsey-bvod-art-digital-rgb.pdf?shouldIndex=false>. Acesso em: 7 nov. 2022.

WANG, T. Why Big Data Needs Thick Data. Disponível em: <https://medium.com/ethnography-matters/why-big-data-needs-thick-data-b4b3e75e3d7>. Acesso em: 7 nov. 2022.

--

--