O twitter na #EuropeanaTech (1)

Jose Murilo
EcologiaDigital
Published in
6 min readMay 18, 2018

1º Dia — Fontes de informação retomam a centralidade

O twitter tem penetração sedimentada no mundo dos especialistas da ciência da informação (CI) — bibliotecários, arquivistas e museólogos. Apesar da interferência cada vez maior do algoritmo na timeline — o que nos faz pensar que a migração para alternativas não comerciais como o #Mastodon é opção cada vez mais pertinente — um evento como #EuropeanaTech acontece em paralelo no twitter. Segue abaixo uma curadoria experimental dos tweets que registrei durante o evento, como incentivo à exploração do potencial dos microblogs.

A conferência de abertura foi de George Oates (@ukglo), designer responsável pelas memoráveis interfaces originais do serviço Flickr na década passada, e protagonista do Flickr Commons (2008), que atraiu para a plataforma importantes acervos de instituições como a Library of Congress (US), a British Library (UK) e a NASA. Depois, sua passagem pelo Internet Archive é marcada pela busca por novas formas de descoberta de conteúdo, e enfatiza sua inconformidade com a centralidade da busca (search) no âmbito da pesquisa em acervos digitais.

#Spelunking: sem a busca, como podemos fazer a pesquisa?

Facetas, sub-facetas, diagramas (ex.: um gráfico de aquisição), metadados sob o objeto (coisa, lugar, pessoa). Fazendo uma alusão ao universo obscuro da pesquisa em cavernas (espeleologia), George logrou plantar um dos principais memes do evento, fazendo muitos de nós refletir sobre as limitações do omnipresente campo de busca, e vestir a camisa do time dos ’SPELUNKERS’.

O segundo conferencista foi @RubenVerborgh, da Universidade de Ghent, falando sobre o papel da agregação em uma web descentralizada. Ruben chamou a atenção para uma característica importante da comunidade GLAM reunida na #EuropeanaTech: especialistas e profissionais envolvidos com o patrimônio cultural apresentam um forte sentido de propriedade sobre seus dados. Trata-se de um diferencial importante sobre a sociedade em geral, que não parece preocupada em ter seus dados apropriados pelas grandes corporações da Internet.

A fala do Ruben enfatiza a importância dos agregadores em promover os fluxos de rede, e o papel crucial dos ‘nós’ como fontes de autoridade.

“Se o patrimônio cultural nasce descentralizado, porque temos que centraliza-lo via agregação?”.

O desafio de integrar a rede passa pelo modelo de governança, e o desenvolvimento de consensos (protocolos) que devem ser abordados em camadas: “podemos ter até 100% de consenso sobre um pequeno dataset, 80% sobre um dataset maior, 5% sobre vários pequenos datasets, e ainda temos que construir outros consensos em vocabulários, formatos de dados e interfaces”. Ruben enfatiza que neste momento a ‘identidade’ dos diversos atores na rede deveria dar espaço para uma ênfase maior ao ‘papel’ que cada um desempenha no ecossistema. Ou pelo que entendo, o ator não deve se identificar como agregador, que em uma concepção fixa seria o centralizador, mas cumprir o papel de agregação sempre que a situação assim demandar.

Mia Ridge é uma das estrelas do mundo GLAM, e sua intensidade no twitter é por si uma atração. Coordena o setor de curadoria digital da British Library, e coube a ela apresentar o painel das iniciativas em #crowdsourcing, conteúdos gerados por usuários e transcrição institucional de dados, lembrando que:

“contar com o público nestes processos [crowdsourcing] não significa dispensar o trabalho das equipes de digitalização” (e documentação).

Paul McCann, Gerente de Projetos de Pesquisa Digital da Biblioteca Nacional do País de Gales, apresentou sua 'CrowdSourcing Platform’, originalmente implementada como um conjunto de módulos para o sistema de gestão de coleções Omeka S. A solução permite a criação de projetos customizados de crowdsourcing a partir de qualquer material original em #IIIF — International Image Interoperability Framework~conjunto de APIs para que imagens e metadados sejam solicitados de forma padronizada, outra hashtag importante do evento — , permitindo que sejam definidas as informações que os colaboradores deverão capturar desse material e salvando os resultados como anotações W3C (Web Annotation).

A Europeana já trabalha há algum tempo com crowdsourcing, e têm experimentado algumas ferramentas. Tentaram o ‘Omeka’, mas optaram por seguir outro caminho. Frank Drauschke é sócio e co-fundador da Facts & Files (@FFHistorians), um instituto de pesquisa histórico privado baseado em Berlim, parceiro da Europeana desde 2011 em projetos de crowdsourcing de história pública como Europeana 1914–1918 e Europeana 1989. Apresentou o ‘Europeana Transcribe’, competição online gamificada — transcribathon.eu — que tem nesse momento um processo em andamento na Grécia, onde 29 estudantes estão transcrevendo documentos antigos em grego.

Günter Mühlberger, do Departamento de Língua e Literatura Alemã da Universidade de Innsbruck, apresentou a plataforma Transkribus, que visa fornecer um conjunto abrangente de serviços para acadêmicos, arquivos, bibliotecas e historiadores de família para a transcrição, reconhecimento e pesquisa de documentos históricos. Dentre as iniciativas apresentadas, esta representa o apoio da inteligência artificial (#AI) no processo colaborativo de qualificação da documentação, mas Günter apresenta como qualidade específica da ferramenta a possibilidade de realizar os processos em um ambiente de colaboração mais privado.

O Transkribus é produzido e suportado como parte do projeto READ (Recognition and Enrichment of Archival Documents). Nesta ferramenta, os usuários carregam imagens e, em seguida, identificam áreas de escrita (regiões de texto) e linhas nessas regiões. Depois que uma página é segmentada dessa maneira, os usuários transcrevem o texto para produzir uma versão de “verdade básica” — uma representação precisa do texto na página. Os textos e imagens da verdade são então usados para treinar uma rede neural recorrente com o objetivo de produzir uma ferramenta para transcrever textos de imagens: um modelo de Reconhecimento de Texto Escrito à Mão (HTR — Handwritten Text Recognition).

Mia Ridge apresentou sua iniciativa na British Library — the Playbills Collection. O projeto pede aos voluntários que identifiquem e transcrevam informações sobre os 'playbills' (230 mil cartazes de divulgação teatral do final do século 18 e todo o século 19) para melhorar os registros de catálogo de cada item e tornar essa coleção histórica mais acessível a todos. A ideia é "redescobrir o entretenimento popular dos últimos 300 anos, identificando nomes e performances nos cartazes dos antigos teatros da Grã-Bretanha", explorando IIIF e Anotações Web (Web Annotation).

A plataforma utilizada no projeto foi o LibCrowds — iniciativa muito bem documentada pelo Alex Mendes, que trabalha na equipe da Mia na British Library — para hospedar projetos experimentais de crowdsourcing. Foi desenvolvido o LibCrowds Viewer, que aproveita a flexibilidade permitida pelas APIs do IIIF. Imagens e metadados já mantidos pela British Library podem ser solicitados, combinados com alguns detalhes adicionais de configuração, e usados para gerar conjuntos de tarefas de crowdsourcing. Isso significa que não precisamos de dados adicionais nem estamos vinculados a estruturas de metadados específicas da instituição. Na verdade, o sistema poderia ser usado para gerar anotações de crowdsourced para qualquer conteúdo compatível com IIIF.

Foi interessante observar que boa parte da conversa neste painel girou em torno das plataformas desenvolvidas para o processo de participação / colaboração. Sabemos que tais funcionalidades não são nativas nos softwares clássicos para repositórios digitais, e é interessante ver como projetos específicos estão viabilizando a emergência deste potencial em desenvolvimentos específicos. Seria este o momento para uma maior articulação entre os desenvolvedores em torno do tema? As diferentes institucionalidades (academia, biblioteca pública, iniciativa privada, instituição agregadora) interferem na colaboração destes atores? Seria possível estabelecer colaborações no desenvolvimento em software livre em sintonia com as colaborações em torno de padrões abertos e protocolos?

O primeiro dia de evento encerrou com conferência intensa do Prof. Herbert van de Sompel (@hvdsomp), de Los Alamos (EUA), sobre a “perseverança na persistência” de URLs e URIs no registro da memória digital.

Foi apresentada a ideia do “memento tracer”, que tem como objetivo garantir que seja possível a navegação na web do passado. Sompel descreve os dois obstáculos principais a este objetivo: (1) links podres: links que simplesmente param de funcionar; e (2) conteúdo à deriva: o conteúdo linkado muda com o tempo e pode, eventualmente, não ser mais representativo do conteúdo originalmente linkado.

Sompel explica que a inicativa busca um equilíbrio entre escala e qualidade dos dados no processo de arquivamento da web. A ferramenta apresenta-se como um plugin de browser que ‘escuta’ o usuário, agindo como o curador que irá clicar em tudo que precisa ser arquivado. O usuário não registra uma publicação web específica, mas sim um modelo heurístico que se aplica a uma classe de publicações web. Sompel busca um equilíbrio entre os diversos nós da rede no que diz respeito à divisão de trabalho necessária para garantir a persistência. A ideia parece fazer bastante sentido, mas fica a impressão de que a implementação concreta não é nada simples, exigindo um sofisticado arranjo de colaboração e governança.

O primeiro dia se encerra com a sensação de que ocorreu uma significativa transformação nos temas abordados, em relação à edição anterior da #EuropeanaTech. Como disse Antoine Isaac, gerente de P&D da Europeana, "é impressionante como estamos falando muito menos sobre modelagem de dados". É boa notícia o fortalecimento do papel das fontes de informação, das instituições, dos projetos e especialistas do campo. Da mesma forma, a grande menção a iniciativas de re-descentralização da web envolvendo o desenvolvimento de novas soluções e aplicações livres é sinal de movimento sintonizado entre os diferentes setores. Mas isto é assunto para o próximo post, que relata o 2º dia de twitter na EuropeanaTech.

Veja também: O twitter na #EuropeanaTech (2): 2º Dia — Descentralizar, Centralizar, ou navegar juntos?

José Murilo é Coordenador de Arquitetura de Informação Museal do Instituto Brasileiro de Museus — Ibram. Participou do evento EuropeanaTech à convite da Fundação Europeana.

###

--

--

Jose Murilo
EcologiaDigital

Banda 69 (1980’s) / brasil.gov.br (1997) / GlobalVoices PT Editor (2006-09) / CulturaDigital.br (2009-16) / IBram (2016-) — Tainacan* sKhGZd