O twitter na #EuropeanaTech (2)

2º Dia — Descentralizar, Centralizar, ou navegar juntos?

Jose Murilo
EcologiaDigital
8 min readMay 25, 2018

--

A manhã do segundo dia do evento no navio foi marcada pela conferência do Ben Vershbow (@subsublibrary) que recentemente se juntou à Wikimedia Foundation, vindo da New York Public Library — NYPL, para trabalhar no reposicionamento da instituição no âmbito do mundo GLAM. Com base no plano estratégico #Wikimedia2030 — que projeta o papel da iniciativa no desenho de um futuro “comum da informação” (information commons) — Ben aponta o objetivo da Fundação Wikimedia na constituição do serviço Wikidata em infraestrutura essencial de interligação para o ecossistema de conhecimentos livres. Ben argumenta que faltou escala à primeira geração de aplicações para Linked Open Data (LOD), as quais não chegaram a demonstrar benefícios para os diversos tipos de usuários — tornando-se exercícios acadêmicos sem maiores consequências práticas.

Ben Vershbow — Wikimedia Foundation (photo: Sebastiaan ter Burg)

“É preciso quebrar os silos corporativos. A wikipedia é o único serviço web não comercial entre os Top5 da rede, o que nos coloca em condições de quebrar os obstáculos sociais, políticos e técnicos que impedem o acesso mais amplo ao conhecimento.”

A iniciativa é arrojada e significativa, e não à toa #wikidata tornou-se a principal hashtag do evento. Mas em meio a reflexões sobre os benefícios da descentralização, como lidar com a proposta de uma infraestrutura (não corporativa) para centralizar dados estruturados do patrimônio cultural global? Me parece óbvia a necessidade de avançarmos na reflexão sobre a governança compartilhada de tal infra-estrutura comum, ou na alternativa de algum modelo federado correspondente.

Concretamente, a proposta do wikidata para as instituições GLAM envolve: (1) avançar na implementação do modelo já testado de residência dos especialistas Wikipedia nas instituições; (2) conectar o wikidata com os vocabulários controlados localmente; (3) utilizar as autoridades wikidata para descrever coleções de conhecimento tradicional e indígena em seus acervos; (4) unir esforços no projeto wiki citation, que vem reunindo volume considerável de dados bibliográficos; além do uso compartilhado de ferramentas e padrões que promovem acesso qualificado aos acervos das instituições, como o Scholia (ferramenta para navegação web), o Rights Statements (internacionalização de declarações de direitos autorais), e o IIIF (protocolo para serviço qualificado de acesso a imagens). Sem dúvida, uma estratégia robusta e interessante.

Como ilustração viva do modelo de “residência de wikimedians” em instituições de memória tivemos a presença de Jason Evans (@WIKI_NLW), o “National Wikimedian” da Nacional Library of Wales. Nos últimos anos Jason trabalhou como residente e gerenciou vários projetos “Edit-a-thon” para qualificar o conteúdo da Wikipédia em galês, e é um colaborador regular de conferências de patrimônio digital com um interesse particular em dados abertos vinculados (LOD). Seu trabalho demonstra como informações relevantes de contexto sobre os acervos, como a identificação das redes de editores, impressores e gravadores, emergem com o enriquecimento dos dados no Wikidata, e experimentações em aplicações como o Crotos tornam possíveis visualizações diversas a partir dos dados estruturados.

Neste ponto vale destacar o marcante keynote de Rob Sanderson (@azaroth42), Arquiteto de Informação (Semântica) do Getty Trust, ainda no 1º dia, onde ele lança o conceito de “LOUD”, ou “LOD Utilizável”. Define usabilidade como “o grau em que (uma coisa) pode ser usada por atores específicos” — ou seja, o grau de usabilidade irá variar de acordo com a audiência a que nos referimos. Portanto, quem define usabilidade é a sua Audiência, que no caso de LOD, são os desenvolvedores.

Quando falamos de APIs de LOD, os desenvolvedores é que são sua Audiência. Os mesmos princípios de design-centrado-no-usuário se aplicam ao desenvolvimento e publicação de APIs — simplicidade, obviedade, adequação à finalidade, etc.”

Para que seu LOD seja LOUD, Sanderson enfatiza a necessidade de fornecer informações úteis para os desenvolvedores, sobre o que um nome identifica quando é pesquisado, e também utilizar padrões abertos como RDF, SPARQL, etc. Não passou desapercebido o comentário de Sanderson sobre “O problema com RDF e energia nuclear” ;)).

“Em LOD, a ontologia determina a API, e portanto existe uma camada a ser trabalhada para que estejamos lidando com esta Audiência em seus próprios termos”. O slide das 5 estrelas de LOD foi objeto de debates nos animados diálogos do coffee-break: a) correta Abstração sobre seu público; b) poucas Barreiras à entrada (JSON-LD); c) Compreensível; d) Documentação com exemplos concretos; e) poucas Exceções, padrões consistentes.

Coffee Break no SS Rotterdam — EuropeanaTech (photo @josemurilo)

Como qualquer evento de tecnologia em 2018, e falando em descentralização, o EuropeanaTech não poderia deixar de mencionar o tema #blockchain. Raivo Ruusalepp (@Raivo_Ruusalepp), da Biblioteca Nacional da Estonia, apresentou cenários possíveis para utilização da tecnologia no âmbito das instituições de patrimônio cultural. Partindo do princípio de que ‘confiança’ (trust) é um valor determinante para o campo, abrem-se oportunidades como, por exemplo: se o intercâmbio de obras entre as instituições puder ser registrado no blockchain, tal garantia poderia levar a uma diminuição do uso de recursos com seguradoras.

Raivo chamou atenção para o grande movimento especulativo no setor, que pode fazer com que surjam propostas comerciais concebidas sem a devida reflexão dos especialistas GLAM. Neste sentido, é importante que as instituições tenham a oportunidade de experimentar e desenvolver seus próprios casos de uso, e assim apontar a direção para a evolução da tecnologia. “Não perdemos o barco ainda, mas é importante que estejamos refletindo sobre estas possibilidades”.

Outra fala de destaque no segundo dia foi de Enno Meijers (@ennomeijers), da Biblioteca Nacional da Holanda, apresentando “uma rede distribuída de informações sobre patrimônio digital”. Criador do projeto mediachain.io, Enno destacou a tendência atual para a infraestrutura de descobrimento (discovery) de conteúdos em migrar do conceito tradicional de agregação para um modelo mais distribuído. A iniciativa de criação da rede é viabilizada pela ‘Digital Heritage Network’, um sonho de consumo para todos que trabalham no setor, que estabelece retaguarda técncia e sustentabilidade institucional para projetos digitais integrados em patrimônio cultural no governo holandês.

“Temos alguns portais muito bons, mas o fato é que cada usuário é um portal”.

Enno apresentou as dificuldades em se construir a rede distribuída, como o uso de diferentes definições, metadados e formas de descrição pelas fontes originais de informação. São na verdade várias camadas de funcionalidades e de papeis (roles) que precisam estar em sintonia, mas segundo Enno tudo leva-nos a considerar que o empoderamento das fontes de dados é o caminho a seguir.

As soluções para a integração, como o backlink para LOD por exemplo, para que atualizações possam ser informadas à todas as instâncias envolvidas, ainda não estão claras: uma “triple store” com toda a informação, ou “triple stores” separadas onde todas as alterações seriam gravadas (Lockss), ou talvez a solução de federação para que não seja necessário ficar criando cópias locais dos dados. Mas todos concordam em um ponto: a experimentação com estas possibilidades apresenta nova e potente relevância neste momento.

Aetapa de encerramento do evento apresentou painel para debater a dialética Descentralização vs Centralização nos projetos digitais do mundo GLAM, reunindo os principais conferencistas do evento. Evidenciar o confronto, a polarização entre as visões, pareceu pertinente como estratégia de ativação do debate. Afinal, a tensão ficou evidente no ambiente do evento que, promovido por uma instituição agregadora (lógica centralizadora), enfatizou em sua programação a emergência da descentralização no campo, e o painel rendeu de fato algumas falas significativas (abaixo). Mas entre os debatedores foi recorrente o comentário de que, conforme o cenário, irão variar os diagnósticos sobre a opção de descentralizar, ou não.

Enno Meijers (@ennomeijers): “a essência da descentralização é a reflexão que cada ator pode fazer em relação ao seu papel no ecossistema que estamos criando.”

Valentine Charles (@valentinec89): “nós (Europeana) somos uma rede, aspiramos pela descentralização, mas por outro lado somos pressionados a entregar serviços qualificados, que dependem de alguma centralização. O que podemos fazer para evoluir?”

Jill Cousins (@JilCos): “A mudança não é fácil. Sim, existem os cronogramas que precisam ser cumpridos, e também a estrutura de aporte de recursos, que deixa poucas opções além de fazer o que é demandado.”

Ruben Verborgh (@RubenVerborgh) “A questão maior é: que objetivos queremos atingir? Para cada caso temos que nos perguntar se precisamos de centralização ou descentralização”.

Herbert van de Sompel (@hvdsomp): “Aquilo que é possível realizar através da descentralização tem evoluído significativamente. As trocas de links com os parceiros, poderíamos fazer decentralizadamente, mas ainda fazemos centralizado, o que acaba por enfraquecer as fontes de informação.

“A comunidade acadêmica ainda baseia seu funcionamento no MPH, e imagina que o Google Scholar irá resolver todos seus problemas. Não vai.”

Uma boa abordagem para compreender a tensão entre centralização e descentralização no campo do patrimônio cultural digital me parece ser a visão de que cada ator do campo irá desempenhar diferentes papéis em diferentes momentos, com diferentes graus na escala que vai de um pólo a outro. A ‘identidade’ dos diversos atores na rede daria espaço para uma ênfase maior ao ‘papel’ que cada um desempenha no ecossistema, em suas diferentes relações com os demais atores. Uma grande vantagem em se debater esta tensão específica no ambiente da EuropeanaTech2018 é o fato de que mesmo quando se contempla a centralização como opção — como no caso do Wikidata da Fundação Wikimedia, e do próprio papel da Europeana como agregador GLAM regional — as referências são iniciativas não-corporativas, que adotam o acesso aberto ao conhecimento como princípio de sua atuação e de seus projetos. Algo bem próximo do espírito cívico que sempre pautou a atuação de arquivos, bibliotecas, museus, e instituições públicas de memória de uma maneira geral.

SS Rotterdam — Local perfeito para a #EuropeanaTech (photo:josemurilo)

No momento do encerramento, alguém comentou sobre a pertinência do EuropeanaTech reunir esta tão específica comunidade GLAM-TECH em um navio, e como dava vontade de “fechar as portas, e sair navegando” (“close the doors and sail away..”), seguir debatendo, colaborando, desenvolvendo este novo ecossistema juntos, agora não só compartilhando projetos, mas trabalhando em ferramentas, métodos e padrões comuns. O que parece unir esse grupo, de fato, é a forte conexão que seus integrantes apresentam em relação aos seus dados, às informações com que trabalham, e à importância de sempre melhorá-los. A experiência que tive na EuropeanaTech2018 sinaliza para mim que a mobilização e intensidade específicas desta comunidade pode contribuir para o desenvolvimento de uma prática social mais contemporânea, especialmente no que se refere à gestão do patrimônio cultural digital na era da informação.

Veja também: O twitter na #EuropeanaTech (1) — 1º Dia — Fontes de informação retomam a centralidade

José Murilo é Coordenador de Arquitetura de Informação Museal do Instituto Brasileiro de Museus — Ibram. Participou do evento EuropeanaTech à convite da Fundação Europeana.

--

--

Jose Murilo
EcologiaDigital

Banda 69 (1980’s) / brasil.gov.br (1997) / GlobalVoices PT Editor (2006-09) / CulturaDigital.br (2009-16) / IBram (2016-) — Tainacan* sKhGZd