Forscherprofile in EconBiz: Halbautomatische Generierung mit Linked Open Data

von Arben Hajra, Marie Machel und Tamara Pianos

Die EconBiz-Autorenprofile bieten dank der Verwendung von persistenten Identifiern und Linked-Data-Ansätzen und der Verknüpfung mit weiteren Informationen umfassende Informationen zu wirtschaftswissenschaftlichen Autorinnen und Autoren. Die Profile zeigen die wichtigsten Forschungsgebiete einer Autorin beziehungsweise eines Autors in einer Tag-Cloud. Die zugehörigen Persistent Identifier (PIDs) und zusätzliche Informationen zu den Autorinnen und Autoren machen es leicht, die richtige Person zu finden. Umfassende Autoreninformationen – wie Zugehörigkeiten, Auszeichnungen, Zitierinformationen oder Twitter-Profile – werden auf einer Seite bereitgestellt. Die Profile werden unter Verwendung vorhandener Daten, Dienste und Identifikatoren erstellt. Es ist also keine manuelle Eingabe durch die Autorinnen und Autoren selbst und nur wenig Aufwand von Bibliotheksseite erforderlich, um die Profile zu erstellen – sofern die richtigen Identifier vorhanden sind.

Verknüpfung von Informationen mit verknüpften Datendiensten

Identifier wie die deutsche Gemeinsame Normdatei (GND) werden verwendet, um sicherzustellen, dass der Wirtschaftswissenschaftler John Smith leicht zu identifizieren ist, und die anderen John Smiths (zum Beispiel der Architekt oder der Geologe) ignoriert werden. Wenn man andererseits alle Publikationen des Nobelpreisträgers 2019, Abhijit V. Banerjee, finden möchte, sollte man auch die Veröffentlichungen finden, die Bannerjee oder Vinayak-Banerjee zugeschrieben werden.

Die LOBID-Suche des Hochschulbibliothekszentrums (hbz) ermöglicht die Suche nach Namen, die mit einer GND-ID verbunden sind. Entity Facts, ein Dienst der Deutschen Nationalbibliothek (DNB), bietet zusätzliche Informationen wie Berufe, Zugehörigkeiten oder biographische Daten zu GND-Entitäten. Darüber hinaus wird Wikidata als Datenhub genutzt, um weitere Informationen wie andere Autorenprofile, IDs, Bilder oder Preise in den Wirtschaftswissenschaften zu verknüpfen. Eine kurze Zusammenfassung zu den Autorinnen und Autoren wird von DBPedia abgerufen. Diese Dienste werden mit einer Suche nach Autorenpublikationen über die EconBiz API kombiniert. Informationen von RePEc und CitEc werden genutzt, um eine Auswahl von TOP-Autoren sowie Zitierinformationen bereitzustellen.

Autoreninformation und Themen-Tag-Cloud

Die Autorenprofile können über das Suchfeld gefunden werden, das den LOBID-Suchdienst integriert.

Es gibt auch ein Pulldown-Menü, über das Nobelpreisträgerinnen und -träger ausgewählt werden können. Ein weiteres Pulldown-Menü umfasst die TOP 1.000 RePEc-Autorinnen und -Autoren.

Sobald ein bestimmter Autor oder eine Autorin (zum Beispiel Prof. Esther Duflo) ausgewählt wurde, zeigt das Autorenprofil alle verfügbaren Informationen an.

Die Tag-Cloud bietet einen einfachen Überblick über die Hauptinteressengebiete der Autorin oder des Autors. Darüber hinaus dienen die Tag-Labels als Filter, um die Publikationsliste des jeweiligen Autors aufzugliedern. Ko-Autorinnen und -Autoren können über einen Reiter oberhalb der Tag-Cloud ausgewählt werden, sodass auch die Navigation zu den Seiten der Ko-Autorinnen und -Autoren leicht möglich ist. Der Dienst wurde kürzlich um eine neue Funktion zur Suche nach “verwandten Autorinnen und Autoren” erweitert.

Die Anzeige verwandter Autorinnen und Autoren ermöglicht es, Forschende zu finden, die an ähnlichen Themen arbeiten, indem die gesamte EconBiz-Sammlung analysiert wird. Ein Schieberegler ermöglicht es, mit der Anzeige von mehr oder weniger ähnlichen Wissenschaftlerinnen und Wissenschaftlern zu spielen.

Vorteile der EconBiz-Autorenprofile

Die Autorenprofile bieten eine Reihe von innovativen Möglichkeiten, die wissenschaftliche Arbeit einzelner Autorinnen und Autoren zu untersuchen. Sie ermöglichen einen schnellen Überblick über die Forschungsinteressen einer Wissenschaftlerin oder eines Wissenschaftlers. Die Verlinkung zu weiteren Informationen wie Ko-Autorinnen oder verwandten Autoren ermöglicht auch Zufallsfunde. Funktionen, wie die Suche nach ähnlichen Autoren, ermöglichen auch die gezielte Identifizierung von Forschenden, die auf einem ähnlichen Gebiet arbeiten, oder das Auffinden von Publikationen, die für das eigene Interessengebiet relevant sind.

Im Gegensatz zu anderen Profildiensten, die Wissenschaftlerinnen und Wissenschaftler zur Eingabe und Überprüfung ihrer Informationen auffordern, werden die EconBiz-Autorenprofile meist automatisch aus bereits vorhandenen IDs und Informationen erstellt und verlinkt.

Auch professionell bearbeitete Dienste wie die GND enthalten manchmal Fehler oder Dubletten. Einige der Funktionen der Autorenprofile können zur Qualitätskontrolle genutzt werden, da sie es leicht machen, mögliche Fehler zu erkennen.

Beschränkungen des aktuellen Dienstes

Derzeit ist das volle Potenzial des Dienstes dadurch begrenzt, dass nicht alle Publikationen in der EconBiz-Sammlung mit einer GND-ID verbunden sind. Das bedeutet, dass Publikationen ohne Verbindung zur GND nicht für die Erstellung der Tag-Cloud verwendet werden können. Auch die Standardanzeige der Suchergebnisse von EconBiz basiert derzeit nicht auf einer GND-Suche, sondern auf einer String-Suche, da viele relevante Publikationen sonst nicht gefunden werden könnten. Dies kann zu einer gewissen Verwirrung bei gängigen Autorennamen führen. In diesem Fall muss die Anzeige der Ergebnisse manuell auf „Author GND“ umgestellt werden.

Da die GND zudem als Arbeitsinstrument eingeführt wurde, können einige Labels wie “Dozentin” intern nützlich, aber für andere Menschen irritierend sein. Auch führt die Regel, eine GND-ID zu erstellen, wenn eine Person mit dem gleichen Namen bereits eine GND-ID hat, dazu, dass es GNDs für eine Reihe weniger bekannter Personen geben kann. Das bedeutet, dass Autorinnen und Autoren, die viel veröffentlicht haben, möglicherweise noch keine GND haben, wenn ihre Namen nicht unter die Katalogisierungsregeln für die GND fallen. Wenn keine GND für eine Autorin oder einen Autor existiert, kann kein Autorenprofil angezeigt werden. In diesem Fall ist eine manuelle Erstellung einer neuen GND erforderlich.

Außerdem kann der thematische Schwerpunkt einer Forscherin oder eines Forschers in Jahren mit einer hohen Anzahl von Publikationen verzerrt sein. Insbesondere bei Wissenschaftlerinnen und Wissenschaftlern mit einer langen Publikationsgeschichte und einem Themenwechsel im Laufe der Jahre kann dies zu einer stärkeren Betonung älterer im Vergleich zu aktuellen Interessengebieten führen.

Darüber hinaus liegt der Schwerpunkt des Dienstes auf Autorinnen und Autoren aus dem Bereich der Wirtschaftswissenschaften. Wenn Autorinnen und Autoren aus einem anderen Fachgebiet wie Psychologie, Soziologie oder Informatik nur eine geringe Anzahl ihrer Publikationen in EconBiz gelistet haben, kann die Tag-Cloud den Schwerpunkt ihrer Arbeit verfälschen.

Zukunftsperspektiven

Viele der oben genannten Einschränkungen könnten vermieden werden, wenn alle relevanten Publikationen eine Kennung hätten. In Zukunft müssen weitere Identifikatoren hinzugefügt werden, entweder durch halbautomatische Dienste, die auf einer Ko-Autorenanalyse basieren, oder durch Crowdsourcing-Lösungen, die Wikidata als zentralen Knotenpunkt nutzen – oder beides. Alle Lösungen werden jedoch weiterhin eine menschliche Qualitätskontrolle benötigen.

  • Die Tag-Cloud könnte in Zukunft an die Auswahl der Publikationsjahre angepasst werden.
  • Wenn mehr Fachportale ähnliche Dienste zu Autorinnen und Autoren in anderen Bereichen anbieten würden, gäbe es eventuell Möglichkeiten, auch die Anzeige von interdisziplinären Autorinnen und Autoren zu optimieren.
  • Auch eine bessere Integration der Suchoptionen im Portal und die Anzeige zusätzlicher Autoreninformationen wird die Auswahl des richtigen Autors oder die Bewertung der Expertise einer bestimmten Autorin in einem bestimmten Fachgebiet erleichtern.

Weitere Informationen

Joachim Neubert: “Wikidata as a linking hub for knowledge organization systems? Integrating an authority mapping into Wikidata and learning lessons for KOS mappings” (PDF) Beitrag im NKOS Workshop von TPDL, 2017, Thessaloniki, Griechenland.

Autor:innen: Arben Hajra, Marie Machel, Tamara Pianos

Arben Hajra ist Doktorand an der Technischen Fakultät der Christian-Albrechts-Universität zu Kiel (CAU). Er hat sein Studium der Informatik an der South East European University, Nordmazedonien, abgeschlossen und ist seit 2005 als Dozent an der gleichen Fakultät tätig. Seit 2018 arbeitet er als wissenschaftlicher Mitarbeiter an der ZBW – Leibniz-Informationszentrum Wirtschaft.

Marie Machel studierte Bibliotheks- und Informationsmanagement an der Hochschule für Angewandte Wissenschaften Hamburg und arbeitet als wissenschaftliche Bibliothekarin mit Schwerpunkt Normdaten in der ZBW – Leibniz-Informationszentrum Wirtschaft.

Dr. Tamara Pianos studierte Geographie und Anglistik. Nach ihrer Promotion in Kanadastudien und einem Referendariat als wissenschaftliche Bibliothekarin arbeitete sie an der TIB in Hannover. Seit 2005 ist sie an der ZBW – Leibniz-Informationszentrum Wirtschaft tätig, wo sie heute die Abteilung Informationsversorgung und -zugang leitet. Sie ist Produktmanagerin des EconBiz-Portals und verantwortlich für Informationskompetenzthemen.

Diesen Blogpost teilen:

Fehlende deutsche Übersetzung

Der ZBW RechercheGuide deutschlandweit: QR-Codes im Bildungseinsatz European Open Science Cloud: von Einzelprojekten, großen Plänen und 1 Milliarde Euro Warum ein "Wir sind auch auf Facebook" nicht ausreicht

View Comments

Perspektiven zu Open Science und Ungerechtigkeit: Wer wird zurückgelassen?
Nächster Blogpost