EuropeanaTech Conference 2018 — reflexões do dia 01
Em abril desse ano surgiu a oportunidade e o convite para virmos (José Murilo, Léo Germani e eu) para a EuropeanaTech Conference 2018. Momento mais que oportuno, considerando o tema da conferência — tecnologias para o universo dos acervos digitais em rede — e o fato de que estamos atravessando uma etapa fundamental de refatoração do código do projeto Tainacan e da sua implementação em 05 museus brasileiros para validação do modelo de suporte e migração de dados.
A programação do dia 01, disponível em detalhes no site acima, foi intensa e coordenada a partir de momentos organizados em plenária geral do evento e momentos em 3 trilhas paralelas com apresentações mais curtas e focadas em temas específicos. Acabei escolhendo a trilha "data" para ficar mais perto dos temas relacionados a tratamento de dados, integração em rede, interoperabilidade e um dos maiores temas da conferência até o momento, LOD — Linked Open Data.
Uma das primeiras apresentações do dia, por sinal excelente, foi do Ruben Verborgh, que abre o evento falando de perspectivas de uma web cada vez mais descentralizada entre de informações e aplicações, ampliando a possibilidade de que dados possam ser recombinados de diferentes formas a partir de diferentes aplicações, retirando a força dos algoritmos que impõem formas única de acesso aos dados e valorizando a liberdade de expressão de aplicações que podem atender melhor ao interesse de diferentes comunidades de usuários e suas formas de enxergar o mundo. Um bom post em seu blog explica em mais detalhes a fala que vez hoje, vale olhar com atenção essa imagem.
Uma das questões que tem preocupado uma boa parte do público do evento é como utilizar dados ligados para enriquecer os dados das coleções que já possuem e também para garantir controle de referências, desambiguação e a formação de uma estrutura de dados que permita de fato reduzir a enorme redundância da informação hoje disponível em rede para as coleções de acervos digitais das instituições participantes. Discussão de alto nível, deixando claro a chegada massiva dos dados ligados como forma de interoperabilidade em rede e a necessidade de controle e colaboração em torno de sua produção.
O projeto WikiData foi um dos recursos mais ressaltados em várias apresentações, sendo um projeto utilizado como um caminho possível para enriquecer dados de objetos digitais e também resolver enormes problemas de diferentes identificadores de diferentes bases de dados que referenciam as mesmas entidades, fazendo com que, por exemplo, "Machado de Assis" possa ser reconhecido como única entidade em rede mas que é referenciada por inúmeras chaves primárias de diferentes bases de dados e sistemas de indexação de entidades. Veja aqui o próprio exemplo da página do "Machado de Assis" na WikiData e observe como ali se integram não apenas a descrição em vários sistemas de informação diferentes, como também várias páginas em várias línguas na Wikipedia referenciando ao mesmo autor. A WikiData passa a se tornar um hub (ver imagem abaixo) que agrega e centraliza diferentes sistemas de indexação, facilitando a interoperabilidade entre os sistemas. É um caminho que certamente vamos experimentar e já consideramos possíveis soluções para o Tainacan.
Há várias referências e projetos relacionados a WikiData que valem olhar com mais atenção quando se trata do mundo dos GLAMs.:
- Artigo mencionando as contribuições interessantes do projeto para o patrimônio cultural;
- Excelente estudo de caso e os resultados obtidos de dados de museus holandeses. Veja aqui o whitepaper dessa experiência;
- Ponto de consulta de dados armazenados na Wikidata via SPARQL, servindo como recurso para fazer experiências, testar os dados e analisar o que já existe ali publicado. Veja nesse exemplo o mapa dos museus brasileiros disponíveis na WikiData;
- Um conjunto de ferramentas utilizadas pela Europeana para fazer upload de mais de 1 milhão de imagens de objetos culturais para a WikiMedia Commons
- Projeto Sum of all paintings — que busca evidenciar as coleções de pinturas referenciadas na Wikipedia. Aqui há o que já tem disponível sobre o Brasil;
- Projeto da Wikimedia para apoiar os GLAMs em processos de digitalização e descrição de recursos digitais;
- A GLAM Track na WikiData Conference;
- Projeto de pesquisa para investigar a situação dos GLAMs na WikiData;
- Grupo focal na Wikimedia para estruturação de dados de arquivos ali depositados. Há iniciativas interessantes de apoio a grupos locais.
A conversa sobre dados girou em torno de outros projetos, se relacionando diretamente ou não com a WikiData, mas que apresentam em geral novas formas de trabalhar dados ligados aos acervos e catálogos das instituições. Foi muito interessante perceber a preocupação de importantes bibliotecas em criar pontos de acesso aos seus dados de forma semântica, entendendo que isso não apenas valoriza a informação disponível, mas também se torna uma nova estratégia de descoberta de relações e novas informações somente pesquisáveis dessa maneira sobre os próprios acervos. Ou seja, não se trata aqui apenas de uma nova tecnologia de acesso aos dados, se trata de novas maneiras de enxergar os próprios dados e estabelecer relações entre eles para descoberta de novas informações. Chama a atenção alguns projetos:
- o portal de dados ligados da Biblioteca Nacional da França. Veja aqui um exemplo de como o Machado de Assis aparece e todas as relações possíveis de se estabelecer a partir dos dados ligados. Aqui também o ponto de acesso SPARQL da biblioteca com vários exemplos de consultas, o que facilita compreender as formas de recombinação dos dados;
- o portal de dados ligados da Biblioteca Nacional da Espanha.
Cabe aqui uma breve reflexão sobre o que isso impacta no própria concepção dos serviços prestados por essas instituições e a formação de seus profissionais: elas passam a se tornar cada vez mais curadores desse espaço semântico, valorizando, enriquecendo e facilitando o acesso não apenas aos dados mas às suas possíveis formas de combinação e recombinação, deixando claro o valor de uma perspectiva digital em rede como forma de produção cultural a partir do patrimônio de seus acervos.
Outras ferramentas e exemplos interessantes apareceram ao longo do dia que valem aqui registrar:
- GraFa — uma ferramenta chilena para navegação facetada em dados ligados;
- o grupo de avaliação de tecnologias para recuperação de informação em vídeo;
- TimeMachine: projeto de construção de uma infra-estrutura compartilhada para valorização de dados culturais da Europa;
- OpenLibrary, formas de visualização do acervo da Wellcome Library e do acervo do British Museum;
- Flickr Commons para registro de imagens de várias instituições de memória pelo mundo afora. Especial destaque para o acervo do Senado brasileiro;
- Apresentação do projeto DBpedia para uso de dados estruturados da Wikipedia.