lobid –

offene, webbasierte Infrastruktur für Titel- und Normdaten

Adrian Pohl / @acka47
Linked Open Data, Hochschulbibliothekszentrum NRW (hbz)


Köln, 2019-02-21

Diese Präsentation:
http://slides.lobid.org/hbz-info-2019/
Creative Commons License

Linked Open Data im hbz

"Im LOD-Programmbereich unterstützen wir die Etablierung und Pflege einer zukunftssicheren bibliothekarischen Dateninfrastruktur im regionalen, überregionalen und internationalen Raum. Die Kernpunkte der LOD-Arbeit sind: 1.) Nutzung, Pflege und Unterstützung offener Infrastruktur, 2.) Forschung und Entwicklung sowie 3.) Wissens- und Technologietransfer."

Agenda

  1. lobid
  2. lobid-resources
    1. Oberfläche
    2. Daten
    3. API
  3. 3. lobid-gnd & lobid-organisations
  4. Anwendungsbeispiele
  5. Ausblick

1. lobid

Linking open (bibliographic) data

lobid.org

Das Zentrum der im LOD-Programmbereich bereitgestellten Dienste

Dateninfrastruktur für Bibliotheken, Archive, Museen

Das hbz entwickelt seit 2009 Software im Bereich Linked Open Data (LOD)

Leitlinien

1. Publikation offen lizenzierter Daten zur freien Nutzung

2. Nutzung domänenübergreifender Web-Standards

3. Bereitstellung von Web-APIs plus Rechercheoberflächen

lobid-Dienste

Mittlerweile sind alle Dienste in der zweiten Version

lobid-resources: Daten des hbz-Verbundkatalogs

lobid-organisations: Daten des deutschsprachigen Sigelverzeichnisses und DBS-Stammdaten

lobid-gnd: Gemeinsame Normdatei

Datenquellen und -formate

lobid-organisations

Dokumentation der lobid-organisations-API: https://lobid.org/organisations/api

lobid-gnd

Dokumentation der lobid-gnd-API: https://lobid.org/gnd/api

lobid-resources

Dokumentation der lobid-resources-API: https://lobid.org/resources/api

Schauen wir uns das doch mal genauer an

2. lobid-resources

a. Die Oberfläche

Demo

https://lobid.org/resources

b. Die Daten

Datenherkunft & -generierung

Tägl. Bezug der XML-Daten über den Aleph-Publishing-Mechanismus

Konversion nach N-Triples mittels mit Metafacture (Morph)

Dabei finden verschiedene Normalisierungsarbeiten statt

Labels für verlinkte Ressourcen ergänzen

Et voilà: Linked Open Usable Data (LOUD) -> siehe Rob Sanderson's Europeanatech 2018 Keynote (Slides, Aufzeichnung)

Verbesserung der Daten: Generelles

Von relativ unstrukturiertem und flachem XML zu wohlstrukturiertem und geschachtelten JSON-LD

Explikation bisher impliziter Informationen bei der Transformation von Key-Value zu Graph

From strings to things: URIs statt IDs oder Strings

Verbesserung der Daten: Spezielles

MARC-Relator-Codes werden aus RAK-Nebeneintragungen generiert (Morph für Personennebeneintragungen)

Normalisierung von Jahresangaben

Mapping von Informationen aus 050, 057, 058, 334, 652a, 9--, 400/403 etc. auf eine Liste von Publikations- und Medientypen (Morph)

c. Web-API

Abfrage-Möglichkeiten

JSON-LD-Daten in Elasticsearch-Index

Elasticsearch bzw. Lucene Suchsyntax

Abfrage nach gelöschten Titeln (ab 2018-04-04)

Parameter für Auto Suggest

Parameter für Bulk Downloads

Für Einzeltreffer andere RDF-Serialisierungen per Content Negotiation

Beispiel-Abfragen

Ermitteln eines hbz-Titels anhand der OCLC-Nummer

oclcNumber:601339369

RDA-Titel in der hbz-Dienstbibliothek


title:RDA
AND hasItem.heldBy.id:
"http://lobid.org/organisations/DE-605#!"
				

Online-Medien mit Bestand


medium.id:
"http://rdaregistry.info/termList/ RDACarrierType/1018"
AND _exists_:hasItem
				

ZDB-Titel, die mit einer NWBib-Systematik erschlossen sind aber nicht der NWBib zugerechnet werden und von der ULB Bonn erstellt wurden


subject.source.id:
  ("http://purl.org/lobid/nwbib" OR
   "http://purl.org/lobid/nwbib-spatial")
AND inCollection.id:
  "http://lobid.org/resources/HT014846970#!"
AND NOT inCollection.id:
  "http://lobid.org/resources/HT014176012#!"
AND describedBy.sourceOrganization.id:
  "http://lobid.org/organisations/DE-5#!"
				

ZDB-Titel, die mit einer NWBib-Systematik erschlossen sind aber nicht der NWBib zugerechnet werden und von der ULB Bonn erstellt wurden


subject.source.id:
  ("http://purl.org/lobid/nwbib" OR
   "http://purl.org/lobid/nwbib-spatial")
AND inCollection.id:
  "http://lobid.org/resources/HT014846970#!"
AND NOT inCollection.id:
  "http://lobid.org/resources/HT014176012#!"
AND describedBy.sourceOrganization.id:
  "http://lobid.org/organisations/DE-5#!"
				

Deletions Endpoint: Vom bis 14. bis 23.2. gelöschte Titel


describedBy.deleted:[20190214 TO 2019023]
				

Kibana-Visualisierungen

http://kibana.lobid.org/app/kibana#/visualize

3. lobid-gnd & lobid-organisations

Unterschiede zu lobid-resources-API

Normdaten statt Titeldaten

Ausgangsdaten: bei lobid-gnd RDF/XML, bei lobid-organisations Pica-Plus-XML und CSV

Bereitstellung einer OpenRefine Reconciliation API, siehe z.B. http://lobid.org/gnd/api#openrefine

4. Anwendungs-
beispiele

Verbundbibliotheken auf hbz-Website

Basiert auf lobid-organisations

Edoweb und Fachrepositorium Lebenswisschenschaften (FRL)

https://www.edoweb-rlp.de/ & https://repository.publisso.de/

Betrieben von Jan Schnasse in der Gruppe Publikationssysteme

Nutzt lobid-resources Daten

Im FRL-Erfassungsformular Nutzung des GND-ID-Lookups von lobid-gnd

NWBib

NWBib

Basiert vollständig auf der lobid-API

Nutzt das NWBib-Subset von lobid-resources

Informationen zu besitzenden Bibliotheken von lobid-organisations

Themenvorschläge auf Basis von lobid-gnd

NWBib-Suchergebnisliste

Anfrage gegen das NWBib-Subset in lobid-resources

Informationen zu besitzenden Bibliotheken (Name, URL, Standort) werden aus lobid-organisations geladen

Suche in den Verweisungsformen der GND und Anzeige von bis zu drei Vorschlägen, die am meisten Treffer in der NWBib bringen

GND-Lookup im CMIF Creator 2

Der CMIF Creator ermöglicht das bequeme, formularbasierte Erstellen von digitalen Briefverzeichnissen gedruckter Editionen im "Corresponence Metadata Interchange Format" (CMIF) – auch ohne technische Kenntnisse. (...) [Es ist] nun möglich, direkt im Formular die zu einer Person oder Körperschaft passende ID aus der Gemeinsamen Normdatei auszuwählen. Hierbei greift der CMIF Creator 2 auf die von lobid.org bereitgestellte GND-API zurück.

Quelle: Stefan Dumont, "correspSearch: Neue Tools, neue Daten – und eine Auszeichnung"

Virtuelle Deutsche Landesbibliographie

Seit April 2018 ist nwbib.de in die VDL integriert.

Reconciliation mit OpenRefine

Matchen auf GND-Ressourcen in OpenRefine

Übernahme von Daten aus spezifischen Feldern mittels Data Extension API

lobid-gnd ist der zweite Dienst nach Wikidata, der die Data Extension API unterstützt

Große Resonanz auf das Angebot, insbesondere aus den Digital Humanities

Kalliope

Anzeige von externen Links (z.B. Wikipedia) aus lobid-gnd auf Personenseiten

Biographisches Portal NRW

Literaturlisten auf Basis von und Links zu lobid-resources

Bibliothekskatalog des Juristischen Seminars der ULB Bonn

Bulk Download der Daten mit Bestand in DE-5-34

Discovery-Index der UB Dortmund

Daten zu den Beständen der UB & einiger umliegender Bibliotheken werden täglich von lobid geholt, transformiert und in den Index geladen

5. Ausblick

Was kommt?

lobid-gnd: Mitarbeit des hbz an der Entwicklung der GND, z.B. eines zentralen Angebots als Einstieg in das GND-Netzwerk

lobid-resources-API für hbz01-Abfrage im KVK

Ersetzung von Ortsstrings in hbz01 mit kontrollierten Werten aus Wikidata

Metafacture-Workshop (wer hat hier Interesse?)

Ein Folgetreffen für konkrete lobid-Nutzungsszenarien im Haus?

Weiterführende Informationen