Adrian Pohl /
@acka47
Linked
Open Data, Hochschulbibliothekszentrum NRW (hbz)
Köln, 2019-02-21
Diese Präsentation:
http://slides.lobid.org/hbz-info-2019/
"Im LOD-Programmbereich unterstützen wir die Etablierung und Pflege einer zukunftssicheren bibliothekarischen Dateninfrastruktur im regionalen, überregionalen und internationalen Raum. Die Kernpunkte der LOD-Arbeit sind: 1.) Nutzung, Pflege und Unterstützung offener Infrastruktur, 2.) Forschung und Entwicklung sowie 3.) Wissens- und Technologietransfer."
Das Zentrum der im LOD-Programmbereich bereitgestellten Dienste
Dateninfrastruktur für Bibliotheken, Archive, Museen
Das hbz entwickelt seit 2009 Software im Bereich Linked Open Data (LOD)
1. Publikation offen lizenzierter Daten zur freien Nutzung
2. Nutzung domänenübergreifender Web-Standards
3. Bereitstellung von Web-APIs plus Rechercheoberflächen
Mittlerweile sind alle Dienste in der zweiten Version
lobid-resources: Daten des hbz-Verbundkatalogs
lobid-organisations: Daten des deutschsprachigen Sigelverzeichnisses und DBS-Stammdaten
lobid-gnd: Gemeinsame Normdatei
Dokumentation der lobid-organisations-API: https://lobid.org/organisations/api
Dokumentation der lobid-gnd-API: https://lobid.org/gnd/api
Dokumentation der lobid-resources-API: https://lobid.org/resources/api
Tägl. Bezug der XML-Daten über den Aleph-Publishing-Mechanismus
Konversion nach N-Triples mittels mit Metafacture (Morph)
Dabei finden verschiedene Normalisierungsarbeiten statt
Labels für verlinkte Ressourcen ergänzen
Et voilà: Linked Open Usable Data (LOUD) -> siehe Rob Sanderson's Europeanatech 2018 Keynote (Slides, Aufzeichnung)
Von relativ unstrukturiertem und flachem XML zu wohlstrukturiertem und geschachtelten JSON-LD
Explikation bisher impliziter Informationen bei der Transformation von Key-Value zu Graph
From strings to things: URIs statt IDs oder Strings
MARC-Relator-Codes werden aus RAK-Nebeneintragungen generiert (Morph für Personennebeneintragungen)
Normalisierung von Jahresangaben
Mapping von Informationen aus 050, 057, 058, 334, 652a, 9--, 400/403 etc. auf eine Liste von Publikations- und Medientypen (Morph)
JSON-LD-Daten in Elasticsearch-Index
Elasticsearch bzw. Lucene Suchsyntax
Abfrage nach gelöschten Titeln (ab 2018-04-04)
Für Einzeltreffer andere RDF-Serialisierungen per Content Negotiation
oclcNumber:601339369
title:RDA
AND hasItem.heldBy.id:
"http://lobid.org/organisations/DE-605#!"
medium.id:
"http://rdaregistry.info/termList/ RDACarrierType/1018"
AND _exists_:hasItem
subject.source.id:
("http://purl.org/lobid/nwbib" OR
"http://purl.org/lobid/nwbib-spatial")
AND inCollection.id:
"http://lobid.org/resources/HT014846970#!"
AND NOT inCollection.id:
"http://lobid.org/resources/HT014176012#!"
AND describedBy.sourceOrganization.id:
"http://lobid.org/organisations/DE-5#!"
subject.source.id:
("http://purl.org/lobid/nwbib" OR
"http://purl.org/lobid/nwbib-spatial")
AND inCollection.id:
"http://lobid.org/resources/HT014846970#!"
AND NOT inCollection.id:
"http://lobid.org/resources/HT014176012#!"
AND describedBy.sourceOrganization.id:
"http://lobid.org/organisations/DE-5#!"
describedBy.deleted:[20190214 TO 2019023]
Normdaten statt Titeldaten
Ausgangsdaten: bei lobid-gnd RDF/XML, bei lobid-organisations Pica-Plus-XML und CSV
Bereitstellung einer OpenRefine Reconciliation API, siehe z.B. http://lobid.org/gnd/api#openrefine
Basiert auf lobid-organisations
https://www.edoweb-rlp.de/ & https://repository.publisso.de/
Betrieben von Jan Schnasse in der Gruppe Publikationssysteme
Nutzt lobid-resources Daten
Im FRL-Erfassungsformular Nutzung des GND-ID-Lookups von lobid-gnd
Basiert vollständig auf der lobid-API
Nutzt das NWBib-Subset von lobid-resources
Informationen zu besitzenden Bibliotheken von lobid-organisations
Themenvorschläge auf Basis von lobid-gnd
Anfrage gegen das NWBib-Subset in lobid-resources
Informationen zu besitzenden Bibliotheken (Name, URL, Standort) werden aus lobid-organisations geladen
Suche in den Verweisungsformen der GND und Anzeige von bis zu drei Vorschlägen, die am meisten Treffer in der NWBib bringen
Der CMIF Creator ermöglicht das bequeme, formularbasierte Erstellen von digitalen Briefverzeichnissen gedruckter Editionen im "Corresponence Metadata Interchange Format" (CMIF) – auch ohne technische Kenntnisse. (...) [Es ist] nun möglich, direkt im Formular die zu einer Person oder Körperschaft passende ID aus der Gemeinsamen Normdatei auszuwählen. Hierbei greift der CMIF Creator 2 auf die von lobid.org bereitgestellte GND-API zurück.
Quelle: Stefan Dumont, "correspSearch: Neue Tools, neue Daten – und eine Auszeichnung"
Seit April 2018 ist nwbib.de in die VDL integriert.
Matchen auf GND-Ressourcen in OpenRefine
Übernahme von Daten aus spezifischen Feldern mittels Data Extension API
lobid-gnd ist der zweite Dienst nach Wikidata, der die Data Extension API unterstützt
Große Resonanz auf das Angebot, insbesondere aus den Digital Humanities
Anzeige von externen Links (z.B. Wikipedia) aus lobid-gnd auf Personenseiten
Literaturlisten auf Basis von und Links zu lobid-resources
Bulk Download der Daten mit Bestand in DE-5-34
Daten zu den Beständen der UB & einiger umliegender Bibliotheken werden täglich von lobid geholt, transformiert und in den Index geladen
lobid-gnd: Mitarbeit des hbz an der Entwicklung der GND, z.B. eines zentralen Angebots als Einstieg in das GND-Netzwerk
lobid-resources-API für hbz01-Abfrage im KVK
Ersetzung von Ortsstrings in hbz01 mit kontrollierten Werten aus Wikidata
Metafacture-Workshop (wer hat hier Interesse?)
Ein Folgetreffen für konkrete lobid-Nutzungsszenarien im Haus?