nav-image-narrow

Forschungsdaten in den asienbezogenen Wissenschaften

Forschungsdaten sind ein hochaktuelles Thema. Wir – der Fachinformationsdienst Asien (FID Asien) – möchten Sie gerne bei Fragen zum Umgang mit Forschungsdaten in den Wissenschaften aus und über Asien unterstützen.

Auf dieser Seite finden Sie einige einführende Informationen zum Themenkomplex Forschungsdaten sowie weiterführende Links.

Sie können sich gerne mit allen Ihren Fragen an uns wenden:
x-asia(at)sbb.spk-berlin.de

Der Begriff "Forschungsdaten" meint alle Daten, die im Verlauf eines wissenschaftlichen Vorhabens und Forschungsprozesses verwendet werden, um die jeweilige Fragestellung zu bearbeiten. Wenn hier von Forschungsdaten gesprochen wird, bezieht sich dies zunächst auf digital vorliegende Daten.

Aufgrund der Vielfalt der Forschungsfelder und –methoden in den asienbezogenen Geistes- und Sozialwissenschaften sind entsprechend auch die Forschungsdaten sehr heterogen. Diese können u.a. Textdaten, bibliographische Daten, Geodaten, Audio-, Bild- und Videodaten, numerische oder statistische Daten, aber auch digitale 3D Modelle und Programmcodes wie für relationale Datenbanken, digitale Tools und Analyseskripte etc. umfassen. Die Daten entstehen im Forschungsprozess bei der Quellenforschung, bei der Auswertung und Annotation von Texten, bei der Arbeit mit Objekten aus Sammlungen, durch Digitalisierung, durch Aufzeichnungen und Beobachtungen, bei Experimenten und Simulationen, bei qualitativen und quantitativen Befragungen und Erhebungen, etc. Die Daten entstehen, indem sie durch den Forschenden/die Forschende selbst erhoben bzw. erstellt werden oder sie entstehen, wenn (eigene oder nachgenutzte) Daten weiterentwickelt bzw. ausgewertet werden.

Einschlägige Definitionen des Begriffs "Forschungsdaten" finden Sie beim Rat für Informationsinfrastrukturen und in den Richtlinien der DFG zum Umgang mit Forschungsdaten.

Gute wissenschaftliche Praxis: Forschungsdaten sind ein wichtiger Bestandteil des Forschungsprozesses, daher ist ihre Sicherung und Erhalt von enormer Bedeutung, nicht zuletzt um den Forschungsprozess transparent zu gestalten und eine Reproduzierbarkeit und Nachvollziehbarkeit von Forschungsergebnissen zu gewährleisten (siehe die DFG Leitlinien zur Sicherung guter wissenschaftlicher Praxis).

Nachnutzung von Forschungsdaten: Forschungsdaten haben häufig auch über den ursprünglichen Erzeugungs- und Forschungskontext hinaus einen bleibenden Wert und können die Grundlage für andere Forschungsfragen und -vorhaben bilden. Dies gilt insbesondere dann, wenn die Daten nicht reproduzierbar sind. Dazu ist es wichtig, die Zugänglichkeit zu den Daten zu gewährleisten und darüber hinaus diese zu kuratieren, die reinen Daten also durch beschreibende Daten und kontextualisierende Angaben anzureichern, sodass die wissenschaftliche Aussagekraft der Daten erhalten bleibt. Auch kann es sinnvoll sein, beim Erstellen der Daten sich an bestehenden Standards (Datenformate, Metadaten etc.) zu orientieren, um die Verständlichkeit und Nachvollziehbarkeit der Daten zu gewährleisten. Nicht zuletzt sollte die Rechtefrage dabei nicht vergessen werden (siehe unten).

Eröffnung neuer Forschungsmethoden: Das Bereitstellen von digitalen Datensets ermöglicht es zunehmend, diese mittels einer stetig wachsenden Anzahl von digitalen Werkzeugen zu bearbeiten. Dies eröffnet im Bereich der digitalen Geisteswissenschaften ganz neue Wege der Forschung (Forschungsfragen, -methoden, etc.).

Sinnvoll ist es, sich schon bei der Planung des Forschungsprojekts mit dem Thema Forschungsdatenmanagement zu befassen und ggf. einen Datenmanagementplan (DMP) zu erstellen. Ziel des Forschungsdatenmanagements ist es, die Daten langfristig zugänglich zu machen, und zwar unabhängig vom Datenerzeuger sowie dass sie möglichst strukturiert, nachnutzbar und nachprüfbar sind. Die FAIR Data Prinzipien können dabei helfen: Die Daten sollten Findable, Accessible, Interoperable, und Reusable sein. Entsprechend sollte beim Projektdesign bereits berücksichtigt bzw. geplant werden, welche Daten wie erhoben, bearbeitet, ausgewertet und beschrieben werden sollen und welche Schritte für die Transformation, Selektion und Speicherung der Forschungsdaten notwendig sind.

Hilfreich ist es bereits bei der Projektplanung auch die verschiedenen Stadien des Lebenszyklus von Forschungsdaten zu berücksichtigen, um die wissenschaftliche Aussagekraft der Daten und damit die Möglichkeit zur Nachnutzung zu erhalten:

  • Planung
  • Daten erstellen und sammeln
  • Daten verarbeiten und analysieren
  • Daten veröffentlichen und teilen
  • Daten archivieren und zugänglich machen
  • Daten nachnutzen
    (Phasen nach: UK Data Service)

Forschungsdatenmanagement finden Sie bspw. auf forschungsdaten.info zu verschiedenen Themen wie Planen und Strukturieren des Umgangs mit Forschungsdaten inklusive der Erstellung eines Datenmanagementplans (DMP), Organisieren und Arbeiten mit Forschungsdaten, Aufbereiten und Veröffentlichen von Forschungsdaten inklusive Informationen zu Metadatenstandards, Bewahren und Nachnutzen von Forschungsdaten sowie Rechte und Pflichten, die beim Umgang mit Forschungsdaten berücksichtigt werden sollten.   

Einige Empfehlungen für Daten- und Metadatenformate spezifisch für geisteswissenschaftliche Forschungsdaten inklusive solcher, die disziplinübergreifende Objekte betreffen, finden sich bei DARIAH: „Fachspezifische Empfehlungen für Daten und Metadaten“. Eine kuratierte Liste fachspezifischer Daten- und Metadatenstandards findet sich bei Fairsharing.org (sowie vorgefiltert für Geistes- und Sozialwissenschaften). Grundsätzlich gilt bei der Beschreibung der Daten und der Auswahl der (Meta-) Datenformate zu bedenken, dass die Daten sowohl von Mensch als auch Maschine lesbar, verstehbar und verarbeitbar sein sollten, heute sowie idealerweise auch in der Zukunft.

Neben allgemeinen Informationen zum Forschungsdatenmanagement gibt es einige fachspezifische Empfehlungen und Handreichungen zum Umgang mit Forschungsdaten, z.B. von den DFG Fachkollegien und verschiedenen Fachgesellschaften. Für die Asienwissenschaften siehe bspw. die Handreichung des Fachkollegiums 106 „Sozial- und Kulturanthropologie, Außereuropäische Kulturen, Judaistik und Religionswissenschaft“. Je nach fachlicher Ausrichtung der Forschungsfrage sind auch andere Handreichungen relevant, wie für die Soziologie und Wirtschaftswissenschaften sowie des Rats für Sozial- und Wirtschaftsdaten, für wissenschaftliche Editionen in der Literaturwissenschaft, für die Erhebung von Sprachkorpora sowie rechtliche Aspekten bei der Handhabung solcher in der Linguistik.

Immer mehr Forschungsförderer erwarten, dass bereits bei der Antragstellung zu einem Projekt Überlegungen zum Umgang mit den Forschungsdaten, die im Projekt erstellt, ausgewertet und entwickelt werden sollen, angestellt werden. Die DFG hat Leitlinien zum Umgang mit Forschungsdaten erstellt und die Europäische Kommission Guidelines on FAIR Data Management in Horizon 2020. Forschungsdaten.info hat eine Übersicht wichtiger Anforderungen von Forschungsförderern erstellt. Solche Anforderungen der Forschungsförderer beinhalten häufig einen Datenmanagementplan.

Ein Datenmanagementplan hilft dabei, den Umgang mit Forschungsdaten in einem Forschungsprojekt zu planen und zu strukturieren. Es wird beschrieben, wie während der Laufzeit des Projekts sowie nach dessen Beendigung mit den Daten, die erhoben, bearbeitet, ausgewertet und beschrieben werden, umgegangen werden soll. Siehe auch den Beitrag zu Datenmanagementplänen bei forschungsdaten.info.

Viele Forschungsförderer erwarten bei der Antragstellung für ein Projekt einen solchen Datenmanagementplan. Muster-DMPs für verschiedene Drittmittelgeber finden Sie auf den Seiten der Humboldt-Universität zu Berlin. Darüber hinaus gibt es einige Tools zur Erstellung von DMPs, wie DMPonline u.a. mit einem Template für H2020 Projektanträge bei der Europäischen Kommission oder RDMO, das eher auf den deutschsprachigen Raum ausgerichtet ist und u.a. bei DMPs für DFG und BMBF Projektanträgen unterstützt.

Forschungsdaten sind entweder in den institutionellen Repositorien der Forschungseinrichtungen, an denen die jeweiligen Wissenschaftler*innen angesiedelt sind, zu finden, oder in disziplin- bzw. themenspezifischen Repositorien.

Verzeichnisse von Repositorien:

  • Re3Data – Registry of Research Data Repositories, ein Portal für die Recherche nach Repositorien, die Forschungsdaten bereitstellen. Ein Filtern der Ergebnisse nach Fachdisziplinen ist möglich: Geistes- und Sozialwissenschaften 
  • Repository Finder – von DataCite bereitgestellter Dienst zum Finden von Repositorien in Re3Data, die den vom Enabling FAIR Data Project empfohlenden Kriterien entsprechen
  • OpenDOAR – Verzeichnis von Repositorien mit verschiedenen Inhaltstypen, darunter auch Forschungsdaten

Metasuchen für Forschungsdaten:

  • Base – Suchmaschine für wissenschaftliche Web-Dokumente
  • DataCite – Suche über verschiedene, teilnehmende Datenzentren
  • Linghub – Suche nach Sprachressourcen in den Datenbeständen von CLARIN, LRE-Map, META-SHARE und datahub
  • RatSWD – Suche in den Forschungsdaten durch den Rat für Sozial- und Wirtschaftsdaten akkreditierter Zentren

Fachübergreifende (Forschungsdaten-) Repositorien und Metasuchen:

  • OpenAIRE – frei zugängliche Forschungsergebnisse, d.h. Publikationen und Datensets, aus EU-geförderten Projekten (Stichwort: Open Science).
  • Zenodo – Forschungsergebnisse aller Disziplinen, d.h. Publikationen, Datensets, Präsentationen etc.
  • GitHub – Software-Entwicklungsprojekte

Fachspezifische/thematische Repositorien und Datenkollektionen:

  • CBETA – Chinese Buddhist Electronic Text Association
  • Chinese Text Project – Vormoderne chinesische Texte
  • CLARIN-D – Virtual Language Observatory (VLO) für wissenschaftliche Sprachdaten aus dem CLARIN Kontext und Federated Context Search (FCS) für die Suche in zugänglichen Ressourcen
  • CrossAsia N-gramm Service – Datensets zum freien Download und zur Analyse, die aus den im Integrierten Textrepositorium CrossAsia gespeicherten Texten entstanden sind
  • CrossAsia Volltextsuche – Suche über die Volltexte, die im Integrierten Textrepositorium CrossAsia gespeichert sind
  • DataHub – Sozialwissenschaftliche und wirtschaftswissenschaftliche Datensets
  • ICPSR – Sozialwissenschaftliche Daten des Inter-University Consortium for Political and Social Research
  • Kanseki Repository – Vormoderne chinesische Texte inkl. buddhistischer und daoistischer Texte
  • National Bureau of Statistics of China – Statistische Daten der Volksrepublik China
  • OPEN CONTEXT – Archäologische Forschungsdaten (einige Projekte zu Asien)
  • SAT Daizōkyō Text Database – Korpus buddhistischer Texte auf Chinesisch mit japanischer (und englischer) Übersetzung
  • SowiDataNet | datorium – Sozialwissenschaftlichen Forschungsdaten in GESIS (bisher sehr wenig zu Asien)

Darüber hinaus planen wir, bei uns gespeicherte Forschungsdaten sowie solche mit Relevanz für die Asienwissenschaften, die in anderen Repositorien abgelegt sind, in einer gemeinsamen Suche anzuzeigen.

Der FID Asien berät Sie gerne, wenn Sie Daten veröffentlichen möchten. Wenn Sie Daten bei CrossAsia veröffentlichen möchten, setzen Sie sich bitte mit uns in Kontakt.

Bei der Auswahl eines Repositoriums sollten Sie berücksichtigen, dass Nicht-Lateinische Schriften und ggf. solche, die nicht Unicode kompatibel sind, auch in den Metadaten und beschreibenden Materialien zu den Forschungsdaten verwendet werden können, und dass diese korrekt dargestellt werden und auch in dem Repositorium suchbar sind. 

  • CLARIN-D – Forschungsdatenservices und –zentren für linguistische Daten und Sprachkorpora
  • DARIAH-DE – Forschungsdatenrepositorium für die Geistes- und Kulturwissenschaften
  • Fachspezifisches Repositorium, Suche bspw. über Re3Data
  • GitHub – Repositorium für Software-Entwicklungen
  • Institutionelles, universitäres Repositorium der eigenen Institution
  • TextGrid – Langzeitarchiv für geisteswissenschaftliche Forschungsdaten (bisher existieren keine Erfahrungsberichte mit Texten in asiatischen Sprachen)
  • Zenodo – Fachübergreifendes Repositorium für wissenschaftliche Datensätze, Zugangsbeschränkung möglich  

Um Daten (frei zugänglich) veröffentlichen zu dürfen ist es wichtig, im Vorfeld einige rechtliche Fragen zu klären. Diese betreffen insbesondere urheberrechtsbelastete, sensible und/oder personenbezogene Daten.

Bei personenbezogenen Daten ist zum einen für eine Veröffentlichung immer die Einwilligung der Betroffenen notwendig, zum anderen muss geklärt werden, ob die Daten vollständig anonymisiert werden können.

Wenn das Urheberrecht anderer betroffen ist, bspw. wenn es sich um größere Teile eines (Datenbank-)Werks handelt, sollten unbedingt vorher die Urheber kontaktiert werden.

Forschungsdaten.info hat eine Entscheidungshilfe zum Veröffentlichen von Forschungsdaten erstellt, die die wichtigsten rechtlichen Aspekte thematisiert.

Im Rahmen des Projekts „FID Asien“ planen wir, einen zentralen Zugriff auf und Suche nach asienbezogenen Forschungsdaten zu entwickeln. Wir halten Sie in unserem Blog auf dem Laufenden.


Wir freuen uns über Ihre Mitarbeit:

  • Nennen Sie uns weitere wichtige Quellen und Repositorien für asienbezogene Forschungsdaten.
  • Teilen Sie uns mit, wo Sie Ihre Daten publiziert haben.
  • Sagen Sie uns, welche Services und Unterstützung Sie sich zum Thema Forschungsdaten wünschen.
  • Fragen Sie uns, wenn Sie Unterstützung brauchen, z.B. beim Erstellen eines Datenmanagementplans, beim Planen und Beschreiben von Forschungsdaten, oder beim Archivieren dieser.

Mit diesen und allen weiteren Fragen können Sie sich gerne jederzeit an uns wenden:
x-asia(at)sbb.spk-berlin.de

Kontakt Ost-, Südost- und Zentralasien

Staatsbibliothek zu Berlin - PK
Ostasien-Abteilung
Tel.: +49 30 266-436001
E-Mail: x-asia(at)sbb.spk-berlin.de

Kontakt Südasien

CATS Bibliothek / Abt. Südasien
Voßstrasse 2, Gebäude 4110
D-69115 Heidelberg
Tel.: +49 (0)6221 54 15047
E-Mail: merkel(at)ub.uni-heidelberg.de