Como os bibliotecários são importantes para o movimento da ciência de dados?

InFoco
InfocoNaBiblio
Published in
10 min readSep 20, 2020

Por: Discover Data Science| Traduzido por: Equipe InFoco

A biblioteca sempre foi um repositório de ferramentas de conhecimento e pesquisa. Nos últimos anos, com o advento do big data e da ciência de dados, a pesquisa se tornou mais poderosa e orientada por dados. No entanto, apesar do crescente tesouro de dados, a pesquisa indica que não existem pessoas suficientes que possam aproveitar o poder do big data. O grupo de consultoria McKinsey estima que os Estados Unidos enfrentam atualmente uma escassez de quase 200.000 pessoas que têm o conhecimento técnico para usar big data para tomar decisões organizacionais eficazes. Essa escassez de especialistas em big data ocorre apesar do fato de que a própria coleta de big data está aumentando em todo o mundo, apoiada por avanços na Internet das Coisas que permitem uma melhor coleta de dados em tempo real.

Os bibliotecários há muito são conhecedores de uma vasta quantidade de conhecimento. É por isso que as bibliotecas podem se beneficiar ao adicionar ciência de dados à sua lista de ofertas. Os aplicativos de big data e ciência de dados servem para tornar as bibliotecas uma fonte ainda mais poderosa de conhecimento para preencher a lacuna e aumentar o conhecimento analítico de big data na sociedade. As bibliotecas estão começando a oferecer recursos para que os usuários aprendam mais sobre big data e seus benefícios.

Faz sentido, praticamente falando, que os bibliotecários adotem e apoiem práticas e recursos de big data. A ciência de dados e o big data se prestam prontamente a aplicativos de pesquisa em uma variedade de campos e podem ser usados ​​em conjunto com técnicas de aprendizado de máquina para aprender como agrupar, fazer recomendações, prever resultados e assim por diante, com base em dados. Os bibliotecários podem apoiar a ciência de dados fornecendo acesso a materiais de treinamento e instrução para ajudar a melhorar a base de conhecimento que cerca o big data. Existem várias maneiras pelas quais as bibliotecas podem ajudar indivíduos e organizações a adotar práticas de ciência de dados e big data: fornecendo acesso a informações, organizando workshops e cursos educacionais e oferecendo serviços de suporte ao gerenciamento de dados de pesquisa.

No mundo da ciência de dados, os dados são a matéria-prima de novos conhecimentos

As bibliotecas são conhecidas por seu papel de guardiãs da informação, enquanto a palavra “dados” na ciência de dados parece estar um passo abaixo da informação. Os dados brutos envolvidos no big data, por exemplo, não têm uso inerente em sua forma não analisada; por outro lado, as informações que você encontra em um livro da biblioteca, por exemplo, oferecem percepções prontamente acessíveis. A Biblioteconomia é frequentemente referida como biblioteconomia e ciência da informação, o que parece deixar os dados fora da equação.

No entanto, é importante reconhecer que os dados brutos usados ​​nas abordagens de big data e ciência de dados são os ingredientes brutos para o conhecimento e as informações acionáveis. É por causa desse fato que os bibliotecários podem desempenhar um papel tão importante no aproveitamento do poder desse campo emergente. O mundo enfrenta atualmente uma escassez de pessoas que possam pegar dados brutos e transformá-los em conhecimento. É aqui que os bibliotecários podem ser extremamente úteis e transformadores para o campo da ciência de dados. A experiência dos bibliotecários em gerenciamento e organização de dados pode servir como a base para o treinamento do próximo quadro de cientistas de dados.

Os bibliotecários podem oferecer serviços de big data como uma ferramenta adicional na caixa de ferramentas de pesquisa para mitigar a escassez de cientistas de dados

Um lugar importante no ciclo de vida dos dados de pesquisa, onde os bibliotecários podem desempenhar um grande papel, é na descoberta, compreensão e limpeza de dados para uso na análise de big data. Antes mesmo do início do processo de análise de dados, os dados devem ser selecionados, limpos e formatados de uma maneira específica para poderem ser analisados. Os bibliotecários podem oferecer recursos sobre maneiras de lidar com big data para prepará-los para análise, da mesma forma que oferecem recursos sobre muitos outros tópicos de pesquisa. Os bibliotecários já oferecem tipos semelhantes de recursos em termos de localização de novas fontes de dados, fornecimento de informações básicas sobre assuntos e aconselhamento sobre como lidar com metadados.

Esses recursos ajudarão a garantir que todos possam ter habilidades em ciência de dados. Como explica Hal Varian “a capacidade de obter dados — ser capaz de entendê-los, processá-los, extrair valor deles, visualizá-los, comunicá-los — será uma habilidade extremamente importante nas próximas duas décadas”. Essas habilidades precisarão ser desenvolvidas não apenas em cientistas de dados, mas também na força de trabalho em geral, a fim de lidar com a escassez de pessoas com essas habilidades.

Não apenas os usuários da biblioteca se beneficiarão com esse conhecimento, mas os bibliotecários também podem se beneficiar ao fornecer esses recursos em seu próprio trabalho. Ter conhecimento de big data está se tornando cada vez mais essencial no mundo de hoje.

Os bibliotecários podem desempenhar um papel na melhoria do acesso a informações de big data

Como pastores de grande quantidade de conhecimento por séculos, os bibliotecários desempenham um papel importante em garantir que as pessoas tenham acesso a informações relacionadas a big data e abordagens de análise de dados. De certa forma, os bibliotecários sempre lidaram com big data. Concentrar o desenvolvimento da coleção em métodos subjacentes à análise de big data seria muito útil para pesquisadores que estão apenas se aprofundando no tópico. A Biblioteca Nacional de Medicina do National Institutes of Health recomenda várias áreas temáticas nas quais as bibliotecas podem oferecer livros e recursos. Esses tópicos incluem: “Tópicos para livros e e-books podem incluir aprendizado de máquina, gerenciamento de dados de pesquisa, visualização de dados, mineração de texto, algoritmos, linguagem de programação R, python, data wrangling etc. Curadoria desses recursos em um LibGuide ou site, junto com links para sites que ajudam as pessoas a aprender sobre ciência de dados e obter suporte (por exemplo, stackoverflow.com) podem ser especialmente úteis”.

As bibliotecas podem organizar workshops e cursos sobre como usar abordagens de big data

Na verdade, as bibliotecas têm notado o potencial crescente da ciência de dados. A Harvard Library e a Harvard-Smithsonian Center for Astrophysics John G. Wolbach Library se uniram para treinar bibliotecários com as crescentes necessidades de dados de suas comunidades com o curso “ Data Scientist Training for Librarians ”. Neste curso, os bibliotecários aprendem as ferramentas que podem ser usadas para “extrair, organizar, armazenar, analisar e visualizar dados” para experimentar o ciclo de vida dos dados em primeira mão. Esse tipo de experiência prática ajuda os bibliotecários a se prepararem melhor para ajudar a melhorar os serviços que oferecem.

A Coalition for Networked Information também tem um curso relacionado, “ Data Science and Visualization Institute for Librarians ”, que oferece aos bibliotecários a oportunidade de aprender sobre data science e visualização. O curso discute exploração e análise de dados, visualização de dados, limpeza e preparação de dados, web scraping, análise de rede bibliométrica e outros tópicos.

A National Library of Medicine (NLM) ofereceu recentemente um curso chamado Big Data em Healthcare: Exploring Emerging Roles, que ajudou bibliotecários da área de saúde a mergulhar no excitante mundo do big data. A aula discutiu exemplos de big data, aplicativos em negócios e comércio e, claro, aplicativos de big data na medicina. O uso de big data em registros eletrônicos de saúde foi discutido, assim como o formato de dados não estruturados de dados hospitalares, o que cria problemas para os cientistas de dados. Construir um esquema de dados é importante em tais contextos, e os bibliotecários de NLM ajudaram os participantes da classe a entender as práticas recomendadas para construir conjuntos de dados estruturados para aplicativos de aprendizado de máquina poderosos.

Embora o big data ainda pareça nebuloso, a experiência dos bibliotecários em gerenciamento de dados pode torná-los excelentes professores de insights de metodologia de ciência de dados por meio de workshops e cursos.

As bibliotecas podem oferecer serviços de apoio ao gerenciamento de dados de pesquisa

Os bibliotecários são únicos, pois possuem uma base de conhecimento especializada em relação à localização, armazenamento e preservação de informações. Esse conjunto de habilidades é de uso particular para cientistas de dados, que podem consultar bibliotecários para ajudá-los a elaborar planos de gerenciamento de dados, por exemplo. Os bibliotecários têm um conjunto de habilidades gerais voltadas para a pesquisa e os dados que os torna excepcionalmente capazes de aconselhar os usuários da biblioteca sobre as melhores práticas para a coleta, gerenciamento e organização de dados.

Embora os bibliotecários não precisem ser especialistas em big data para ajudar a treinar e dar suporte aos cientistas de dados, eles podem apoiar o trabalho de entusiastas da ciência de dados. As bibliotecas podem apoiar cientistas de dados e outros interessados ​​em melhorar suas habilidades analíticas de dados, ajudando-os a conceituar como os dados são coletados, organizados e armazenados. As habilidades de design e desenvolvimento de banco de dados dos bibliotecários podem ser úteis para processos de organização e mineração de dados em Big Data.

Outras maneiras pelas quais as bibliotecas podem apoiar cientistas de dados e outros interessados ​​em expandir seus horizontes de ciência de dados incluem ajudar os usuários de bibliotecas a considerarem como seus dados são documentados e organizados, protegidos, armazenados e compartilhados. Como observa a National Library of Medicine , “o apoio do bibliotecário é fundamental para ajudar os pesquisadores a prosperar, independentemente de seus dados serem grandes ou pequenos e independentemente das metodologias que usam”.

O “Novo Bibliotecário”: Um bibliotecário equipado com conhecimento de ciência de dados

Conforme mencionado acima, os bibliotecários são excelentes no que diz respeito à gestão e organização da informação. Essa habilidade também é crítica para a ciência de dados e é essencial especialmente em termos de curadoria de dados a serem usados ​​em abordagens de big data. Os bibliotecários são adeptos da comunicação de estratégias e recursos que podem ajudar a conduzir a investigação e o aprendizado. É por isso que o “novo bibliotecário” — um bibliotecário que pode oferecer recursos úteis para cientistas de dados — pode ser tão transformador como um elo entre ciência de dados e a biblioteconomia.

Os cientistas de dados devem organizar e transformar grandes quantidades de dados brutos e confusos em insights que podem orientar a tomada de decisões para as organizações. Cientistas bibliotecários (isto é, bibliotecários) devem oferecer recursos para ajudar a impulsionar a criação de novos conhecimentos. A ligação entre a biblioteca e a ciência de dados é óbvia aqui, pois vem da capacidade do bibliotecário de trabalhar com o conhecimento e ajudar os usuários da biblioteca a obter recursos para lidar com o novo conhecimento para obter percepções acionáveis. Jeffrey Stanton, da Syracuse University iSchool, escreve sobre seu conceito de “ novo bibliotecário “ que é treinado em abordagens de ciência de dados:

“Um bibliotecário não precisa se tornar um programador, mas todo bibliotecário interessado na criação de conhecimento deve ter alguma familiaridade essencial de como várias ferramentas de software podem transformar dados. Um bibliotecário não precisa ser um engenheiro de banco de dados, mas todo bibliotecário deve compreender os fundamentos das ferramentas de recuperação de informações. Um bibliotecário não precisa ser estatístico, mas todo bibliotecário deve ter uma compreensão clara de como resumos descritivos e testes básicos de dados numéricos podem ser usados ​​e mal utilizados. Finalmente, um bibliotecário não precisa ser um designer gráfico, mas todo bibliotecário precisa reconhecer os recursos de exibições de dados eficazes. Em suma, para cumprir suas missões, os bibliotecários podem exercitar uma variedade de habilidades sofisticadas que ocupam o terreno central entre o entendimento das necessidades do usuário de um lado e a curadoria de dados do outro. ”

Os bibliotecários são conhecidos há muito tempo como defensores do livre acesso à informação, para servir a comunidade e aumentar o conhecimento e preservar as informações históricas para transmitir às gerações futuras que podem se beneficiar desse acesso irrestrito às informações. As funções do novo bibliotecário se somam a essas funções convencionais — seu conjunto de habilidades é expandido além de simplesmente armazenar e guardar livros.

À medida que a tecnologia avança e o big data se torna mais comum, será mais normal que os cidadãos recorram ao big data para responder a perguntas importantes que não podem ser respondidas por abordagens mais convencionais, como pesquisas e análises de literatura. É por isso, que o novo bibliotecário é tão essencial para ajudar a introduzir uma nova geração de insights baseados em dados que podem ser usados ​​em uma variedade de configurações importantes por cientistas de dados e outros interessados ​​em big data.

Como as bibliotecas podem acompanhar a demanda por ciência de dados?

O projeto Data Science in Libraries da University of Pittsburgh recomenda várias ações para atualizar a biblioteconomia e a ciência da informação com as abordagens da ciência de dados. Isso inclui colaboração com institutos de liderança; utilizar espaços físicos de aprendizagem na biblioteca, como laboratórios de informática, onde as pessoas podem aprender ciência de dados juntas; alavancar os recursos educacionais existentes; e até mesmo reposicionando o Mestrado em Biblioteconomia e Ciência da Informação (MILS) para oferecer um currículo mais amigável para a ciência de dados.

As bibliotecas podem se beneficiar de seus conhecimentos de ciência de dados

A ciência de dados pode ser usada não apenas pelos usuários da biblioteca, mas também nos processos internos da biblioteca. Os insights de negócios obtidos de big data podem ser usados ​​na própria biblioteca. Por exemplo, os bibliotecários podem consultar a ciência de dados e a análise de big data (por exemplo, na verificação de livros da biblioteca e usar registros) para determinar quais livros devem ser adicionados às coleções da biblioteca. Dessa forma, o big data pode tornar as decisões internas da biblioteca, como compras de livros e outras decisões de coleções, mais simplificadas, eficientes e melhores.

Conclusão

Embora a transição para uma nova biblioteca amigável para a ciência de dados pareça complexa, é uma saída natural dos avanços recentes na computação. Bibliotecários, que são treinados em organização e gestão do conhecimento, e que são adeptos em explicar como tirar proveito e organizar fontes de informação, são talvez os melhores candidatos para ajudar a resolver a escassez de cientistas de dados. À medida que a ciência de dados continua a se tornar mais comum em todos os setores, o mundo precisará de cidadãos que possam não apenas conduzir pesquisas de ciência de dados, mas também coletar, organizar, processar e lidar com os dados brutos. Embora os próprios bibliotecários não precisem se tornar proficientes nas complexidades das técnicas de ciência de dados, eles podem servir como administradores dessas informações e promover o aprendizado neste espaço.

Como Chris Erdmann , bibliotecário-chefe do Harvard-Smithsonian Center for Astrophysics, e criador da classe DST4L, observa, esta abordagem é mais sustentável para bibliotecas do que as abordagens atuais: “mais conhecimento técnico e experiência precisam ser transferidos para os bibliotecários, e o resultado é um bibliotecário mais bem treinado e mais experiente em tecnologia que pode assumir um papel ativo nos aspectos técnicos dos projetos de biblioteca”.

Link do artigo original: https://www.discoverdatascience.org/resources/data-science-and-librarians/

--

--

InFoco
InfocoNaBiblio

Um grupo de bibliotecários preocupados com o futuro da profissão e sociedade. Insta @infoconabiblio | fb.me/infoconabiblio | contato@infoconabiblio.com.br