Jubiläum re3data: 10 Jahre aktiv für die Öffnung von Forschungsdaten und eine Kultur des Teilens

Ein Interview mit Nina Weisweiler und Heinz Pampel vom Helmholtz Open Science Office

Vor zehn Jahren startete das Registry of Research Data Repositories (re3data). Die Plattform ist die umfangreichste Informationsquelle über Forschungsdatenrepositorien – global und disziplinübergreifend – und wird weltweit von Forschenden, Forschungsorganisationen sowie Verlagen genutzt. Nina Weisweiler und Heinz Pampel vom Helmholtz Open Science Office berichten im Interview aus der Entstehungsgeschichte und über Zukunftspläne.

Was waren die Meilensteine in zehn Jahren re3data?

Heinz Pampel: Die Idee, ein Verzeichnis von Forschungsdatenrepositorien aufzubauen, habe ich in der AG Elektronisches Publizieren der Deutschen Initiative für Netzwerkinformation (DINI) im Jahr 2010 erstmals vorgestellt. Es hat sich dann rasch ein Konsortium von Einrichtungen gebildet, das im April 2011 einen Antrag zum Aufbau des “re3data – Registry of Research Data Repositories” bei der DFG gestellt hat. Beteiligt waren das Karlsruher Institut für Technologie (KIT), die Humboldt-Universität zu Berlin und das Helmholtz Open Science Office am Deutschen GeoForschungsZentrum – GFZ. Der Antrag wurde im September 2011 bewilligt. Im selben Jahr haben wir damit begonnen, das Verzeichnis aufzubauen. Als erster Schritt wurde ein Metadatenschema zur Beschreibung von digitalen Repositorien für Forschungsdaten entwickelt. Im Laufe des Frühjahrs 2012 kamen wir mit einer ähnlichen Initiative namens Databib an der Purdue University in den USA in Kontakt.

Abb. 1. Anzahl der pro Jahr in re3data indexierten Forschungsdatenrepositorien [CC BY 2.0 DE]

Im Dialog mit Databib entstand dann die Idee, beide Vorhaben zusammenzuführen. Nach der Konzeptions- und Implementierungsphase war diese Kooperation und Internationalisierung für re3data entscheidend und wurde von vielen Akteur:innen auf internationaler Ebene unterstützt. Nach dem Zusammenschluss von Databib und re3data folgte die Fortführung des Dienstes als Partner von DataCite. Die Weiterentwicklung wird bis heute durch verschiedene Drittmittelprojekte unterstützt. Aktuell unter anderem durch das Projekt re3data COREF, das von Nina Weisweiler bei uns im Helmholtz Open Science Office betreut wird.

Was macht re3data für euch so einzigartig?

Nina Weisweiler: re3data ist das größte Verzeichnis für Forschungsdatenrepositorien und wird weltweit von Forscher:innen, Förderorganisationen, Verlagen, wissenschaftlichen Institutionen sowie anderen Infrastrukturen genutzt und empfohlen. Es deckt nicht nur einzelne Forschungsbereiche oder Regionen ab, sondern zielt auf die ganzheitliche Kartierung der Repositorienlandschaft für Forschungsdaten.

Mit re3data unterstützen wir aktiv eine Kultur des Teilens und einen offenen Umgang mit Forschungsdaten und fördern so auf internationaler Ebene die Realisierung von Open Science. re3data sorgt dafür, dass das Teilen von Daten und die infrastrukturelle Arbeit im Bereich des Forschungsdatenmanagements mehr Sichtbarkeit und Anerkennung erhält.

Warum ist re3data im Hinblick auf Open Science so wichtig?

Heinz Pampel: Die Kernidee von re3data war immer, Wissenschaftler:innen im Umgang mit Forschungsdaten zu unterstützen. re3data hilft Wissenschaftler:innen bei der Suche und Identifikation von geeigneten Infrastrukturen zur Speicherung und Zugänglichmachung von digitalen Forschungsdaten. Aus diesem Grund haben viele wissenschaftliche Einrichtungen und Förderorganisationen, aber auch Verlage und wissenschaftliche Zeitschriften, re3data in ihren Policies verankert. Darüber hinaus nutzen diverse Akteur:innen Daten aus re3data für ihre Community-Dienste nach, zum Beispiel rund um die European Open Science Cloud (EOSC) und die Nationale Forschungsdateninfrastruktur (NFDI). Auch werden die Daten verstärkt zum Monitoring der Landschaft der digitalen Informationsinfrastrukturen verwendet. Gerade in der Informationswissenschaft verwenden Forscher:innen re3data für Analysen rund um die Entwicklung von Open Science.

In eurem Geburtstagsartikel im DataCite Blog schreibt ihr, dass Inklusivität eines eurer Ziele sei. Wie wollt ihr sie erreichen? Wie schafft ihr es zum Beispiel, auch Repositorien aus anderen Regionen der Welt zu erfassen? Ist die Sprachbarriere da nicht hinderlich?

Nina Weisweiler: Ja, natürlich ist die Sprachbarriere eine Herausforderung. Wir haben früh begonnen, dieser Herausforderung mit einem international besetzten Editorial Board zu begegnen. In diesem Board sitzen Expert:innen, die Einträge in re3data prüfen, den Dienst dankenswerterweise unterstützen und in ihrer Region fördern. Darüber hinaus arbeitet re3data mit zahlreichen Akteur:innen zusammen, um die Indexierung von Repositorien jenseits von Europa und den USA zu verbessern.

Happy 10th Anniversary, re3data! Witt, M., Weisweiler, N. L., & Ulrich, R. (2022). DataCite, [CC BY 4.0]

Wir engagieren uns in der international aufgestellten Research Data Alliance (RDA) und tauschen uns regelmäßig mit nationalen Initiativen sowie anderen Services und Stakeholder aus, mit denen wir Kooperationen entwickeln und vertiefen. Aktuell arbeiten wir beispielsweise mit der Digital Research Alliance of Canada zusammen, um die Qualität der Einträge kanadischer Repositorien zu verbessern.

Plant ihr, re3data auch in anderen Sprachen als Englisch bereitzustellen?

Nina Weisweiler: Das umfangreiche Metadatenschema, welches für die Beschreibung von Forschungsdaten-Repositorien in re3data zur Anwendung kommt, erlaubt das Hinzufügen von Namen und Beschreibungen in jeglichen Sprachen. Grundsätzlich wird das Thema Mehrsprachigkeit im Team viel diskutiert. Wir versuchen, den Service so offen und international wie möglich zu gestalten. Dabei sind wir aber davon abhängig, welche Sprachen unsere Editor:innen beherrschen, um die Qualität der Datensätze gewährleisten zu können. Dank unseres international aufgestellten Teams konnten wir zum Beispiel viele Infrastrukturen aufnehmen, die in China und Indien betrieben werden.

Wie lässt sich der Erfolg von re3data messen?

Nina Weisweiler: Zentrale Messfaktoren für den Erfolg von re3data sind für uns die zahlreichen Empfehlungen und die breite Nachnutzung unseres Dienstes. Wichtige Förderorganisationen empfehlen Forscher:innen die Nutzung des Dienstes zur Umsetzung ihrer Open-Science-Bedingungen, etwa die Europäische Kommission (PDF), die National Science Foundation (NSF) oder die Deutsche Forschungsgemeinschaft (DFG). Auch stellt re3data Informationen für den Open Science Monitor der Europäischen Kommission sowie für OpenAIREs Open Science Observatory bereit. Auch der European Research Council (ERC) verweist in seinen Empfehlungen für Open Science auf re3data.

Darüber hinaus dokumentieren wir Referenzen, die den Service erwähnen beziehungsweise empfehlen, auf der re3data-Website. Basierend auf dieser Sammlung hat unsere Kollegin Dorothea Strecker von der Humboldt-Universität zu Berlin eine spannende Analyse verfasst, die wir im re3data COREF Projekt-Blog veröffentlicht haben.

Wird re3data auch von Unternehmen wie Verlagen als Basis für kostenpflichtige Dienste genutzt?

Heinz Pampel: Ja. Wir haben uns zu Beginn des Dienstes für eine Open Data Policy entschieden. re3data-Metadaten stehen unter CC Zero als Gemeingut zur Nachnutzung bereit. Über die API können sie von allen Interessierten genutzt werden. Diverse Verlage und Unternehmen im Bereich der wissenschaftlichen Information nutzen die Daten bereits für ihre Dienste. Ohne die offenen re3data-Metadaten wären einige kommerzielle Dienste in diesem Feld sicher noch nicht so weit. Wir sind uns sicher, dass der Vorteil offener Daten am Ende überwiegt.

re3data hat viele Filter und Funktionen. Welche gefallen euch persönlich am besten?

Nina Weisweiler: Ich mag die vielfältigen Browsing-Optionen – insbesondere die Kartenansicht, die visualisiert, in welchen Ländern Institutionen sitzen, die am Betrieb der Repositorien beteiligt sind. Zu diesem Thema haben wir einen weiteren lesenswerten Blog-Post veröffentlicht.

Ich bin zudem ein großer Fan der facettierten Filtersuche, die das gezielte Suchen in den fast 3.000 Repositorien-Einträgen ermöglicht. Auf den ersten Blick wirkt dies sehr detailliert und auf manch eine:n vielleicht überfordernd, aber durch die exakte Abbildung unseres umfangreichen Metadatenschemas in den Filterfacetten können Nutzer:innen ganz gezielt nach ihren individuellen Kriterien und Bedürfnissen ein passendes Repositorium suchen und finden.

Für alle technisch Versierten, die unsere Daten nachnutzen und eigene Analysen anfertigen wollen, haben wir im Rahmen von COREF ein besonderes “Schmankerl” entwickelt. Die Kolleg:innen der Humboldt-Universität und vom KIT haben inspirierende Beispiele für die Nutzung der re3data API entworfen, welche in unserem GitHub Repository als Jupyter Notebooks veröffentlicht sind. Bei Rückfragen zu den Beispielen helfen wir gerne!

Übrigens kann man sich in re3data auch Metriken anzeigen lassen und so einen guten Überblick über die aktuelle Landschaft der Forschungsdatenrepositorien gewinnen.

In einer perfekten Welt, wo steht re3data im Jahr 2032?

Nina Weisweiler: Ich habe folgende Vision: re3data ist ein qualitativ hochwertiges und vollständiges globales Verzeichnis für Forschungsdatenrepositorien aus allen wissenschaftlichen Disziplinen. Die Zusammensetzung unseres Teams und unserer Partner:innen reflektiert diese Internationalität. So schaffen wir es, die Abdeckung in Regionen weiter zu erhöhen, für die bisher wenige Infrastrukturen verzeichnet wurden.

Forscher:innen, Fördereinrichtungen, Verlage und wissenschaftliche Institutionen nutzen das Verzeichnis, um zuverlässig die passenden Repositorien und Portale für ihre individuellen Anforderungen zu finden. re3data ist eng vernetzt mit weiteren Infrastrukturen für Forschungsdaten und unterstützt auf diese Weise ein weltweit verflochtenes System FAIRer Forschungsdaten. Wissenschaftliche Communities nutzen re3data aktiv und tragen dazu bei, dass die Einträge aktuell und vollständig sind.

Durch ein höheres Bewusstsein für die Bedeutung offener Forschungsdaten und eine entsprechende Honorierung von Aktivitäten im Bereich des Forschungsdatenmanagements werden mehr Wissenschaftler:innen motiviert, in Übereinstimmung mit Open-Science-Prinzipien zu forschen und zu publizieren.

Übrigens: Datensätze in re3data können ganz einfach über den Link “Submit a change request” unter einem Repository-Eintrag aktualisiert werden. Auch freuen wir uns immer über Hinweise auf neue Repositorien. Dazu kann gerne das “Suggest”-Formular auf unserer Website verwendet werden.

Das könnte Sie auch interessieren:

Wir sprachen mit:
Nina Weisweiler ist Referentin im Helmholtz Open Science Office. Dort arbeitet sie im re3data COREF Project. Sie ist auf Twitter, ORCID und Linkedin zu finden.
Porträt: Nina Weisweiler©

Dr. Heinz Pampel ist Referent und stellvertretender Leiter im Helmholtz Open Science Office. Er ist auf Twitter, ORCID und Linkedin zu finden.
Porträt: Heinz Pampel©

Diesen Blogpost teilen:

Fehlende deutsche Übersetzung

Data Stewards: zentrale Anlaufstelle für Forschungsdaten und Open Data Open Science als Wicked Problem: Wie Bibliotheken die Transformation beschleunigen können Open Access goes Barcamp, Teil 1: Ein neuer Vernetzungspunkt der Open-Access-Community

View Comments

Open Science in den Wirtschaftswissenschaften: Ausgewählte Ergebnisse der ZBW-Bekanntheitsanalyse 2022
Nächster Blogpost