Forschungsdatenmanagement: Abhängigkeit von der Lebenszyklusmetapher – und Alternativen

von Andrew Cox

Wenn wir vor einigen Jahren gebeten worden wären, Daten darzustellen, hätten wir wahrscheinlich sofort an das Pyramidenmodell gedacht: mit Daten, die am Boden der Pyramide liegen, und darüber liegenden Informationen, Wissen und Weisheiten.

Diese Visualisierung basiert auf der Idee, dass eine Masse von “Rohdaten” die Grundlage ist, auf der verschiedene Ebenen des Verständnisses sukzessive verfeinert werden.

Eine weitere wichtige Metapher und Visualisierung ist der Speicher oder das Repositorium. Dies stellt Daten dar, die erfasst, gespeichert, verwendet, verwaltet und aufbewahrt werden. Es basiert auf der Idee, Daten als statische Daten zu betrachten und darauf aufbauend oder darum herum Dienstleistungen anzubieten. Es konzentriert sich auf die Aufrechterhaltung der Integrität der Daten, vorausgesetzt, dass im Zusammenhang mit dem Wandel der Technologien die Aufrechterhaltung der Integrität selbst einige Veränderungen mit sich bringt.

Das OAIS-Modell ist die klassische Version dieses Modells im Kontext der Forschungsdaten, Seite 4-1).

Die Metapher des Lebenszyklusses

In den letzten Jahren scheint das Denken über Forschung und Forschungsdaten aber von der Metapher des Lebenszyklusses dominiert worden zu sein. Tatsächlich scheinen Modelle der Forschung, Forschungsdaten, Datenkuratierung, Unterstützungsdienste alle in dieser Form dargestellt zu sein.

Hier sind nur einige nennenswerte Beispiele:

  • Bibliotheken der University of Central Florida: Overview Research Lifecycle
  • UK Data Service: Research Data Lifecycle: Publishing and sharing data
  • Digital Curation Centre: DCC Curation Lebenszyklusmodell
  • Forschungslebenszyklus verbessert durch einen “Open Science by Default”-Workflow
  • Berkeley Bibliothek der University of California: UC Berkeley Publishing Lebenszyklus
  •  
    Es gibt einige gute Gründe für die Popularität der Lebenszyklusmetapher. Sie ist einfach und sofort verständlich.

    Kritisch im Fokus steht der Prozess. Diese Metapher hilft, zentrale Bewegungen und Änderungen der Daten zu identifizieren und ebenso Punkte, an denen wir mit Diensten und neuen Systemen eingreifen können. Angesichts der Komplexität von Forschungsabläufen ist diese Prozessorientierung von zentraler Bedeutung. Insbesondere da ein Lebenszykluskonzept eine Wiedergeburt oder Wiederverwendung impliziert: mit unserem Schwerpunkt auf dem Potenzial der Wiederverwendung. Das Lebenszykluskonzept war schon immer eine Schlüsselmetapher in der Archivierungstheorie.

    Sich auf nur eine Metapher zu verlassen, ist gefährlich

    Es gibt jedoch einige Nachteile der Lebenszyklusmetapher. Erstens ist es nicht eindeutig, ob es sich um einen Lebenszyklus von der Geburt bis zum Tod oder um einen Zyklus der Erneuerung handelt. Oftmals implizieren kreisförmige Darstellungen letzteres, auch wenn es keine Identifizierung eines Prozesses gibt, durch den dies geschehen könnte. Noch wichtiger ist, dass das Vertrauen in nur eine Metapher immer gefährlich ist, besonders wenn wir anfangen zu vergessen, dass es sich nur um eine Metapher handelt.

    Es lohnt sich also, über andere Metaphern und Visualisierungen nachzudenken, die neue Perspektiven auf Forschungsdaten eröffnen könnten. Hier sind einige Gedanken über Alternativen:

    1. Die Aufwärtsspirale: Dies bedeutet, dass das Verständnis auf der Grundlage der Analyse von Daten auf verschiedene Weise aufgebaut wird und die Daten auf neue Weise kombiniert werden. In gewisser Weise ist es eine dynamischere Version der Pyramide und mit dem Lebenszyklus kombiniert.
    2. Die fallende Kurve: Die fallende Kurve. Dies stellt die abnehmende Nutzung, den abnehmenden Wert oder sogar die abnehmende Bedeutung von Daten im Laufe der Zeit dar. Diese Visualisierung veranlasst uns, darüber nachzudenken, inwieweit der Datenwert erhalten werden kann, oder ob Investitionen in die Langzeitarchivierung kosteneffizient sind, wenn ihr Wert sinkt. Ein gutes Beispiel dafür findet sich in dem Paper: Michener, W.K., Brunt, J.W., Helly, J.J., Kirchner, T.B., & Stafford, S.G. (1997). Nongeospatial metadata for the ecological sciences. Ecological Applications, 7(1), 330-342.
    3. Das Netzwerk: Darin wird die Beziehung zwischen Datenquellen und Publikationen und/oder Autorinnen und Autoren dargestellt. Dies würde uns helfen, Datensätze zu identifizieren, die besonders zukunftsträchtig oder ungenutzt sind, sowie die Zusammenhänge und Lücken zwischen den Nutzerinnen und Nutzern von Daten in verschiedenen Studienbereichen aufzuzeigen. Durch die Rekonstruktion eines Zeitraffers des Netzwerks können wir beobachten, wie Verbindungen aufgebaut werden. Diese Art der Visualisierung macht uns bewusst, welche Datenquellen am häufigsten verwendet werden und welche nicht ausreichend genutzt zu werden scheinen. Es veranlasst uns zu überlegen, wie solche Lücken entstehen (sind sie weniger sichtbar?) und wie sie angegangen werden können.
    4. Die Datenreise: Sie veranlasst uns, über die “Bewegungen” einer Datenerhebung über verschiedene Bereiche ihrer Entstehung, Verwendung und Erhaltung nachzudenken. Dazu gehören verschiedene Organisationsformen wie Forschungseinrichtungen, Fachgemeinschaften, Rechenzentren, Geldgeber, kommerzielle Nutzerinnen und Nutzer von Daten und Öffentlichkeiten, die den Datenverkehr oder den Datenaustausch zwischen ihnen erfassen. Sie erinnert uns an die Prozesse der Neuinterpretation und des Wandels von Daten, während sie sich über die Grenzen zwischen den Domänen hinweg “bewegen”. Sie kann uns helfen, Knotenpunkte für die Nutzung und grenzüberschreitende Mediatoren zu identifizieren. Diese Art der Darstellung richtet unsere Aufmerksamkeit auf die sich ändernde Bedeutung von Daten, die sich über verschiedene Tätigkeitsbereiche hinweg bewegen. Welche Art von Gerüst muss geschaffen werden, damit Nutzerinnen und Nutzer in verschiedenen Bereichen die Interpretationen der anderen verstehen können? (Siehe Bates, J., Lin, Y. W., & Goodale, P. (2016). Data journeys: Capturing the socio-material constitution of data objects and flows. Big Data & Society, 3(2), 2053951716654502).
    5. Das Rich Picture: Dieses würde noch mehr Einheiten, einschließlich Daten, Veröffentlichungen, Autoren und Organisationen, aufzeigen, könnte aber auch jede andere relevante Einheit umfassen. Es würde auch verschiedene Formen von Prozessen abbilden, die diese Einheiten verbinden, Grenzen identifizieren und Konfliktpunkte markieren. Dieses reiche Bild veranschaulicht die Komplexität des Datenlebens in einer bestimmten sozialen Welt. Diese Art der Darstellung macht deutlich, wie wichtig es ist, die ganze Breite der sozialen Welt zu verstehen, in der Daten verwendet werden.
    6. Diese Auflistung ist sicherlich nicht vollständig. Es gibt viele andere Visualisierungen, die uns helfen könnten, Daten auf unterschiedliche Weise zu betrachten. Hybridmodelle, die auf mehr als einer Art von Visualisierung aufbauen, könnten sicherlich auch nützlich sein.

      Ich hoffe, dass dieser Blogpost sie als Leserin oder Leser dazu anregt, unsere übermäßige Abhängigkeit vom Lebenszyklusmodell zu überdenken. Und wenn Sie darüber nachdenken wollen, lesen Sie vielleicht unser Paper: Cox, AM und Tam, WWT (2018) “A critical analysis of lifecycle models of the research process and research data management”, Aslib Journal of Information Management, 70 (2), 142-157, https://doi.org/10.1108/AJIM-11-2017-0251 .

      Autor: Andrew Cox ist Senior Lecturer an der Information School der University of Sheffield. Zu seinen Forschungsinteressen gehört RDM. Er ist Mitautor des kürzlich erschienenen Buches “Exploring Research Data Management”.
      Diesen Blogpost teilen:

    Fehlende deutsche Übersetzung

    Open-Access-Zeitschriften: Wer hat Angst vor 404? Wikidata und Open Science: ein Modell für offene Datenarbeit Digitale Trends 2020: Von Citizen Scientists auf Expedition bis Peer-to-Peer Networks

    View Comments

    IFLA Global Vision Report: Zentrale Werte von Bibliotheken fördern Open Science
    Nächster Blogpost