Elasticsearch-Konkordanz von Katalogs-IDs zu RVK auf Grundlage der Culturegraph Aggregatdaten

Pascal Christoph (dr0i)
Offene Infrastruktur, Hochschulbibliothekszentrum NRW (hbz)


KIM-Workshop, WWW, 05.05.2020

Diese Präsentation:
http://slides.lobid.org/kim-ws-2020-lightning-talk/

Creative Commons License

Was ist RVK?

Die Regensburger Verbundklassifikation (RVK, auch Regensburger Systematik) ist eine Klassifikation

Gegliedert in Hauptgruppen und thematische Klassen, die durch eine Notation identifiziert sind (ähnlich Dewey Decimal Classification)

Z.B.: "CI 5310" für "Abhandlungen im Kontext französischsprachiger Literatur der Philosophie"

CC0 lizensiert

Wozu RVK Anreicherung ?

Inhaltserschließung, z. B. virtuelle Aufstellungssystematik

Wie

Culturegraph stellt geclusterte Bestände der Verbünde (u.a. mit RVK) bereit

Dieses MARC21-XML filtern mit dieser Metafacture-Morph:


 <combine name="@rvk" value="${a}" sameEntity="true" >
         <data source="084??.a" name="a"/>
         <data source="084??.2">
                 <regexp match="rvk" />
         </data>
 </combine>
 <combine name="@id" value="${a}">
         <data source="035??.a" name="a">
                 <regexp match="^\(DE-605\)(.*)" format="${1}"/>
         </data>
 </combine>
 <combine name="rvk" value="${a}" >
         <data source="@id"/>
         <data source="@rvk" name="a"/>
 </combine>
 <combine name="id" value="${a}">
         <concat delimiter=", " name="a" >
                 <data source="@id"/>
         </concat>
                 <data source="@rvk" />
 </combine>
				

Wie

=> der Output als Elasticsearch JSON bulk:


{"index":{"_index":"cgrvk","_type":"rvk"}}
{"rvk":["CI 1125","CI 5604","CI 5603","IH 34381","CI 1100","CI 5310",
"EC 2430"],"id":"HT013166356, HT018625006, TT000577460"}
...
				

... das per curl nach Elasticsearch indexieren

... Elasticsearch verwenden als Lookuptabelle

Links