Metadata på Deichman — ett år etter

Da Deichman for et år siden byttet biblioteksystem, byttet vi også ut den gamle katalogiseringspraksisen. I stedet for å katalogisere i MARC, har vi tatt i bruk en arbeidsflyt basert på en FRBR-inspirert modell bygd rundt nivåene verk og utgivelse, og et metadataformat basert på lenkede RDF-data.

Noen viktige endringer:

  • To nivåer av bibliografiske beskrivelser, verk og utgivelse, der data som beskriver verket er felles for alle verkets utgivelser
  • Langt mindre registrering av tekst. Flere opplysninger framkommer ved bruk av autoriserte verdier, og bruken av tekstlige noter er begrenset.
  • Det er i større grad lagt opp til at data skal være maskinlesbare og -tolkbare, ved at metadata kan eksporteres i formater som json og xml, og at verdier lagres med egnete datatyper, som heltall, dato, varighet osv.

Nytt innslag i katalogen: Verk

Med egne instanser for verk og utgivelser, kan vi gi brukerne kortere og mer oversiktlige trefflister. I tillegg kan vi samle informasjon om verket på én instans i stedet for at den er fordelt på en rekke ulike poster. Slik får vi en mer fullstendig og konsekvent beskrivelse av verk. Før kunne vi for eksempel oppleve at ulike utgivelser av ett og samme verk var beskrevet med helt forskjellige emneopplysninger, slik at de ikke ble funnet av samme søk.

Biblioteket har åtte utgivelser av «Gutten som ville være en av gutta», men det vises som ett treff i trefflista

På denne måten blir det også lettere for lånere å finne ledige eksemplarer av verk med flere utgivelser. Vi har foreløpig ikke fått lagt til en funksjon der man kan legge reserveringer på verksnivå og få første ledige eksemplar, uavhengig av utgivelse, men det kommer. I tillegg er det nå mulig å koble verk til hverandre på ulike måter og for eksempel uttrykke at et spillefilm er en filmatisering av et litterært verk, eller at en roman er en fortsettelse av en annen.

Når utgivelser av samme verk presenteres samlet, kan lånere lettere orientere seg og finne ledige eksemplarer

Lenkede data som metadataformat

Katalogisering i bibliotekene har tradisjonelt for en stor del handlet om å registrere tekstlige beskrivelser av dokumentene i samlinga. Lenkede data handler om å koble sammen informasjonsressurser i en grafstruktur, på en slik måte at informasjonen framgår av selve strukturen i grafen. I vår datamodell er informasjonsressursene verk, utgivelser og ulike typer autoriteter (personer, korporasjoner, emner, steder, hendelser osv.) Alle informasjonsressurser har en unik http-identifikator (URI), på samme måte som nettsider på web har en unik adresse (URL). Og på samme måte som nettsider på web kan lenke til hverandre, finnes det også lenker mellom informasjonsressursene i lenkede data. Men man kan bruke mange forskjellige lenker til å koble ressursene sammen, og hver lenke uttrykker en spesiell betydning.

Opplysningen om at ei bok er skrevet av en bestemt person, for eksempel, vil i lenkede data kunne framkomme ved at man har én ressurs for boka, én ressurs for personen og en lenke med betydningen «har forfatter», som peker fra boka til personen. Både boka, personen og lenka som forbinder dem har unike identifikatorer som ikke bare identifiserer dem lokalt i datasettet, men også globalt, slik at betydningen av dem og koblingen mellom dem er éntydig. Slik legges det opp til at eiere av andre datasett kan bruke og lenke til våre ressurser, og på samme måte kan vi lenke våre ressurser til andre datasett og nyttiggjøre oss informasjon som finnes der og som vi ikke har i vår egen katalog. I en MARC-katalog vil tilsvarende opplysning framkomme ved at den bibliografiske posten for boka inneholder en innførsel på personens navn og en funksjonsbetegnelse som uttrykker at personen er forfatter, der både navnet og funksjonsbetegnelsen er rene tekstverdier som ikke kan bære med seg annen informasjon.

Vi hadde jobbet med RDF som rammeverk for bibliografiske katalogdata i flere år før vi byttet biblioteksystem, og erfaringen var at slike data er godt egnet som grunnlag for tjenesteutvikling, at formatet er uttrykksfullt og fleksibelt, at det gir gode muligheter til å endre store datamengder og konstruere nytt innhold med enkle operasjoner, og at det åpner muligheter for å dra nytte av informasjon fra andre kilder.

Men siden vi i hele denne tiden genererte RDF-data ved å konvertere MARC-poster, var vi alltid underlagt begrensningene som lå i MARC-formatet. Etter bytte av biblioteksystem og utviklingen av nytt katalogiseringsgrensesnitt, har vi kunnet snu på dette. Der vi før produserte MARC-poster i katalogisering og genererte RDF-data på grunnlag av disse, produserer vi nå RDF-data i selve katalogiseringen.

For å kunne produsere data av denne typen, har vi fått utviklet et eget katalogiseringsverktøy, kalt Catalinker. Arbeidsflyten i Catalinker er orientert rundt nivåene verk og utgivelse, der verket bærer den informasjonen som er felles for alle utgivelser av det.

Erfaringer etter det første året

  • Migrering og konvertering av data: Det er begrenset hvor mye informasjon man kan trekke ut av MARC-poster; særlig inneholdt de eldste postene lite informasjon. Forskjell på katalogiseringspraksis til ulike tider gjør det vanskelig å finne dekkende regler for konvertering og verksgenerering, og vi opplever at det er helt nødvendig med rydding og datavask i ettertid. Heldigvis gir det nye metadataformatet oss muligheter til å enkelt og effektivt gjøre masseendringer i data.
  • Selv om verkstankegangen ikke er ny i katalogiseringen, må vi nå forholde oss langt mer aktivt til den. Det kan være utfordrende å ta stilling til om noe er et nytt verk eller ikke. Samtidig letter en slik modell registrering av nye utgivelser av allerede kjente verk, og den sikrer likere og mer fullstendige gjenfinningsmuligheter for utgivelser av samme verk.
  • Ting kommer seg. Vi byttet system og katalogiseringspraksis på et tidspunkt da mye ennå ikke var klart, og biblioteksystemet har vært under utvikling kontinuerlig i hele bruksperioden. Etter hvert som katalogiseringsverktøyet og de andre komponentene i systemet har blitt utviklet, har mulighetene har blitt flere og arbeidsflyten bedre.
  • Potensialet er stort. Mye har så langt dreid seg om utvikle et system som fungerer godt nok i det daglige og på å løse problemer som har dukket opp. Etter hvert kan vi i større grad begynne å utforske mulighetene det nye systemet og det nye metadataformatet gir oss. Med lenkede data får vi unike muligheter til å dra nytte av andres data i våre egne tjenester. Det er et naturlig neste steg.
Like what you read? Give Asgeir Rekkavik a round of applause.

From a quick cheer to a standing ovation, clap to show how much you enjoyed this story.