Aplicações de Big Data em bibliotecas

InFoco
InfocoNaBiblio
Published in
5 min readFeb 23, 2020

Por: Beatriz Somavilla| Traduzido por: Equipe InFoco

Informação é poder. Os dados são o novo petróleo. Falamos de dados como ativos econômicos: dados massivos ou grandes dados que vão desde os raw data ou dados brutos para os smart data ou dados inteligentes : os dados já processados, dotados de valor e significado.

Podemos definir o big data em um duplo sentido:

· Como o termo que descreve o grande volume de dados — estruturados e não estruturados — que inundam nossas vidas.

· Como as técnicas que as empresas e instituições usam para processar todos esses dados e, assim, poder tomar melhores decisões de negócios.

O big data não é uma moda: veio para ficar. E sim, embora existam certos campos que podemos dizer que padronizarão seu uso, como medicina, marketing ou esporte, pode-se dizer que o big data permeia muitas áreas da nossa vida: sem ir além, plataformas como Spotify, Amazon ou Netflix que sabem mais sobre nós, do que nós mesmos e isso é alcançado com ferramentas avançadas, incluindo big data.

No passado, os geradores de dados por excelência eram as grandes empresas e as administrações públicas. Agora, vamos parar para pensar na quantidade de dados que geramos ao longo do dia. Sem ir mais longe, nas redes sociais como instagram ou Twitter, são gerados quase 10 terabytes de dados diários. Uma loucura.

Os 3 V’s

O big data está associada a “norma dos 3vs”: volume, velocidade e variedade (mas pode-se acrescentar mais dois “vs” veracidade e volatilidade quando falamos de smarts data):

o Volume : fala-se de grandes quantidades de dados e, ao contrário do software tradicional (que gerencia dados de tamanho de megabytes e kilobytes), as ferramentas de big data podem processar conjuntos de dados do tamanho de um terabyte ou petabyte

o Velocidade : vamos pensar no tempo que leva para criar um único tweet no Twitter ou na rapidez com que milhares de sensores remotos medem e relatam mudanças nas temperaturas da água do mar.

o Variedade : tradicionalmente, o tipo de dados coletados por empresas e pesquisadores era estritamente controlado e estruturado (como dados inseridos em uma planilha), mas também existem dados não estruturados , como:

e-mails

fotografias

Posts no fórum da Internet

transcrições de telefone

áudio, vídeo

Algumas tecnologias aliadas ao big data são: computação em nuvem, internet das coisas, dados abertos, visualização de dados. Além das diferentes ferramentas baseadas na análise de lotes: Google MapReduce, Apache Hadoop, Microsoft Dryad e Apache Mahout.

Possíveis aplicações de big data em bibliotecas

Aplicando essas ferramentas e técnicas sobre as quais falamos (visualização de dados, computação em nuvem etc.), poderíamos encontrar soluções que beneficiariam nossos usuários:

· Sensores que monitoram as condições ambientais (pressão, temperatura, luz, umidade …) e o estado dos ativos (livros ou obras de arte).

· Uso de prateleiras inteligentes que respondem a pesquisas anteriores na Internet. Isso já é visto, por exemplo, com a localização em tempo real do Google Maps. Nas bibliotecas, os dados podem ser extraídos da rota feita pelos usuários dentro das instalações (em quais seções eles são mais fixos, etc.)

· Alfabetização de dados : oferece aos nossos usuários cursos de treinamento nos quais eles são ensinados a gerenciar todos os tipos de dados (há cada vez mais cursos on-line oferecendo cursos de gerenciamento de dados abertos).

· Bibliominação : a combinação de técnicas de mineração de dados, data warehousing e bibliometria para analisar qualquer serviço de biblioteca.

· Produção científica : saiba quantos documentos foram publicados relacionados a um tópico, em que data, com que frequência o nome de uma pessoa, um local ou um conceito aparece em um determinado corpus. Ferramentas como Dataverse ou Dryad permitem compartilhar, preservar, citar, explorar e analisar dados de pesquisa

· Uso de estatísticas para geração de relatórios na biblioteca:

1. A rede de bibliotecas de Cingapura analisa as estatísticas de empréstimos em relação aos dados bibliográficos e, portanto, propõe recomendações aos seus usuários.

2. gerenciar a política de compras, levando em consideração dados como o perfil sociológico dos leitores que frequentam cada biblioteca da rede, impor restrições e a taxa de rotatividade das coleções

Desafios no gerenciamento de dados em massa

· Tecnológico : velocidade e necessidades de armazenamento impressionantes fazem com que a análise de Big Data exija soluções exigentes de software. Atualmente, o principal aliado tecnológico é o armazenamento em nuvem.

· Ética : o aumento de dados pessoais mantidos por governos e empresas e o cruzamento de informações de várias fontes permite o desenvolvimento de perfis avançados de cada indivíduo, o que coloca em risco sua privacidade.
As boas notícias vêm da mão da Lei 12.527/2011* , sobre o acesso de informações do setor público, uma vez que introduz a obrigação que tanto os órgãos da Administração Pública, como as bibliotecas, museus e arquivos coloquem dados publicamente disponíveis e informações reutilizáveis ​​(ou seja, em formato aberto, legível e tratável).

· Econômico : muitas instituições sofrem com orçamento insuficiente para incorporar a infraestrutura tecnológica necessária.

· Gerenciamento de mudanças : resistência em certos profissionais ao adotar essas novas tecnologias.

Conclusões

Este artigo de Rebiun reúne as principais conclusões tiradas da pesquisa de big data realizada nas universidades espanholas em 2016. E, é claro, as conclusões eram previsíveis e pouco lisonjeiras: a teoria é maravilhosa, mas, no momento da verdade, os principais desafios que as universidades detectaram ao adotar o big data em suas instituições foram: a falta de especialistas em a área e a ausência de investimento econômico. Vamos torcer para que em alguns anos esse cenário seja mais esperançoso.

Enquanto isso, para aproveitar esses dados massivos nas bibliotecas, podemos fazer algumas perguntas que abrem um pouco o caminho: em que estágio minha biblioteca está relacionada ao gerenciamento de dados de massa? Minha biblioteca tem a oportunidade de medir algo novo? , um enorme conjunto de dados que estava anteriormente fora de alcance devido a limitações de software e hardware?

*Adaptado para a lei brasileira (que é conhecida como LAI), sendo que a lei originalmente citada no artigo é a Lei 18/2015, de 9 de julho.

Fontes:

· American Journal of Information Science and Technology (2019). Big Data e seu impacto nas bibliotecas . Disponível em: http://www.ajist.org/article/526/10.11648.j.ajist.20190301.11

Fonte do artigo original: https://www.biblogtecarios.es/beatrizsomavilla/aplicaciones-del-big-data-en-bibliotecas/

--

--

InFoco
InfocoNaBiblio

Um grupo de bibliotecários preocupados com o futuro da profissão e sociedade. Insta @infoconabiblio | fb.me/infoconabiblio | contato@infoconabiblio.com.br