nav-image-narrow

Forschungsdaten in den asienbezogenen Wissenschaften

Forschungsdaten sind ein hochaktuelles Thema. Wir – der Fachinformationsdienst Asien (FID Asien) – möchten Sie gerne bei Fragen zum Umgang mit Forschungsdaten in den Wissenschaften aus und über Asien unterstützen.

Auf dieser Seite finden Sie einige einführende Informationen zum Themenkomplex Forschungsdaten sowie weiterführende Links.

Sie können sich gerne mit allen Ihren Fragen an uns wenden:
x-asia(at)sbb.spk-berlin.de

Der Begriff "Forschungsdaten" meint alle Daten, die im Verlauf eines wissenschaftlichen Vorhabens und Forschungsprozesses verwendet werden, um die jeweilige Fragestellung zu bearbeiten. Wenn hier von Forschungsdaten gesprochen wird, bezieht sich dies zunächst auf digital vorliegende Daten.

Aufgrund der Vielfalt der Forschungsfelder und –methoden in den asienbezogenen Geistes- und Sozialwissenschaften sind entsprechend auch die Forschungsdaten sehr heterogen. Diese können u.a. Textdaten, bibliographische Daten, Geodaten, Audio-, Bild- und Videodaten, numerische oder statistische Daten, aber auch digitale 3D Modelle und Programmcodes wie für relationale Datenbanken, digitale Tools und Analyseskripte etc. umfassen. Die Daten entstehen im Forschungsprozess bei der Quellenforschung, bei der Auswertung und Annotation von Texten, bei der Arbeit mit Objekten aus Sammlungen, durch Digitalisierung, durch Aufzeichnungen und Beobachtungen, bei Experimenten und Simulationen, bei qualitativen und quantitativen Befragungen und Erhebungen, etc. Die Daten entstehen, indem sie durch den Forschenden/die Forschende selbst erhoben bzw. erstellt werden oder sie entstehen, wenn (eigene oder nachgenutzte) Daten weiterentwickelt bzw. ausgewertet werden.

Einschlägige Definitionen des Begriffs "Forschungsdaten" finden Sie beim Rat für Informationsinfrastrukturen und in den Richtlinien der DFG zum Umgang mit Forschungsdaten.

Gute wissenschaftliche Praxis: Forschungsdaten sind ein wichtiger Bestandteil des Forschungsprozesses, daher ist ihre Sicherung und Erhalt von enormer Bedeutung, nicht zuletzt um den Forschungsprozess transparent zu gestalten und eine Reproduzierbarkeit und Nachvollziehbarkeit von Forschungsergebnissen zu gewährleisten (siehe die DFG Leitlinien zur Sicherung guter wissenschaftlicher Praxis).

Nachnutzung von Forschungsdaten: Forschungsdaten haben häufig auch über den ursprünglichen Erzeugungs- und Forschungskontext hinaus einen bleibenden Wert und können die Grundlage für andere Forschungsfragen und -vorhaben bilden. Dies gilt insbesondere dann, wenn die Daten nicht reproduzierbar sind. Dazu ist es wichtig, die Zugänglichkeit zu den Daten zu gewährleisten und darüber hinaus diese zu kuratieren, die reinen Daten also durch beschreibende Daten und kontextualisierende Angaben anzureichern, sodass die wissenschaftliche Aussagekraft der Daten erhalten bleibt. Auch kann es sinnvoll sein, beim Erstellen der Daten sich an bestehenden Standards (Datenformate, Metadaten etc.) zu orientieren, um die Verständlichkeit und Nachvollziehbarkeit der Daten zu gewährleisten. Nicht zuletzt sollte die Rechtefrage dabei nicht vergessen werden (siehe unten).

Eröffnung neuer Forschungsmethoden: Das Bereitstellen von digitalen Datensets ermöglicht es zunehmend, diese mittels einer stetig wachsenden Anzahl von digitalen Werkzeugen zu bearbeiten. Dies eröffnet im Bereich der digitalen Geisteswissenschaften ganz neue Wege der Forschung (Forschungsfragen, -methoden, etc.).

Sinnvoll ist es, sich schon bei der Planung des Forschungsprojekts mit dem Thema Forschungsdatenmanagement zu befassen und ggf. einen Datenmanagementplan (DMP) zu erstellen. Ziel des Forschungsdatenmanagements ist es, die Daten langfristig zugänglich zu machen, und zwar unabhängig vom Datenerzeuger sowie dass sie möglichst strukturiert, nachnutzbar und nachprüfbar sind. Die FAIR Data Prinzipien können dabei helfen: Die Daten sollten Findable, Accessible, Interoperable, und Reusable sein. Entsprechend sollte beim Projektdesign bereits berücksichtigt bzw. geplant werden, welche Daten wie erhoben, bearbeitet, ausgewertet und beschrieben werden sollen und welche Schritte für die Transformation, Selektion und Speicherung der Forschungsdaten notwendig sind.

Hilfreich ist es bereits bei der Projektplanung auch die verschiedenen Stadien des Lebenszyklus von Forschungsdaten zu berücksichtigen, um die wissenschaftliche Aussagekraft der Daten und damit die Möglichkeit zur Nachnutzung zu erhalten:

  • Planung
  • Daten erstellen und sammeln
  • Daten verarbeiten und analysieren
  • Daten veröffentlichen und teilen
  • Daten archivieren und zugänglich machen
  • Daten nachnutzen
    (Phasen nach: UK Data Service)

Weitere Informationen zum Forschungsdatenmanagement finden Sie bspw. auf forschungsdaten.info, zu verschiedenen Themen wie Planen und Strukturieren des Umgangs mit Forschungsdaten inklusive der Erstellung eines Datenmanagementplans (DMP), Organisieren und Arbeiten mit Forschungsdaten, Aufbereiten und Veröffentlichen von Forschungsdaten inklusive Informationen zu Metadatenstandards, Bewahren und Nachnutzen von Forschungsdaten sowie Rechte und Pflichten, die beim Umgang mit Forschungsdaten berücksichtigt werden sollten.   

Einige Empfehlungen für Daten- und Metadatenformate spezifisch für geisteswissenschaftliche Forschungsdaten inklusive solcher, die disziplinübergreifende Objekte betreffen, finden sich bei DARIAH: „Fachspezifische Empfehlungen für Daten und Metadaten“. Eine kuratierte Liste fachspezifischer Daten- und Metadatenstandards findet sich bei Fairsharing.org (sowie vorgefiltert für Geistes- und Sozialwissenschaften). Grundsätzlich gilt bei der Beschreibung der Daten und der Auswahl der (Meta-) Datenformate zu bedenken, dass die Daten sowohl von Mensch als auch Maschine lesbar, verstehbar und verarbeitbar sein sollten, heute sowie idealerweise auch in der Zukunft.

Neben allgemeinen Informationen zum Forschungsdatenmanagement gibt es einige fachspezifische Empfehlungen und Handreichungen zum Umgang mit Forschungsdaten, z.B. von den DFG Fachkollegien und verschiedenen Fachgesellschaften. Für die Asienwissenschaften siehe bspw. die Handreichung des Fachkollegiums 106 „Sozial- und Kulturanthropologie, Außereuropäische Kulturen, Judaistik und Religionswissenschaft“. Je nach fachlicher Ausrichtung der Forschungsfrage sind auch andere Handreichungen relevant, wie für die Soziologie und Wirtschaftswissenschaften sowie des Rats für Sozial- und Wirtschaftsdaten, für wissenschaftliche Editionen in der Literaturwissenschaft, für die Erhebung von Sprachkorpora sowie rechtliche Aspekten bei der Handhabung solcher in der Linguistik.

Immer mehr Forschungsförderer erwarten, dass bereits bei der Antragstellung zu einem Projekt Überlegungen zum Umgang mit den Forschungsdaten, die im Projekt erstellt, ausgewertet und entwickelt werden sollen, angestellt werden. Die DFG hat Leitlinien zum Umgang mit Forschungsdaten erstellt und die Europäische Kommission Guidelines on FAIR Data Management in Horizon 2020. Forschungsdaten.info hat eine Übersicht wichtiger Anforderungen von Forschungsförderern erstellt. Solche Anforderungen der Forschungsförderer beinhalten häufig einen Datenmanagementplan.

Ein Datenmanagementplan hilft dabei, den Umgang mit Forschungsdaten in einem Forschungsprojekt zu planen und zu strukturieren. Es wird beschrieben, wie während der Laufzeit des Projekts sowie nach dessen Beendigung mit den Daten, die erhoben, bearbeitet, ausgewertet und beschrieben werden, umgegangen werden soll. Siehe auch den Beitrag zu Datenmanagementplänen bei forschungsdaten.info.

Viele Forschungsförderer erwarten bei der Antragstellung für ein Projekt einen solchen Datenmanagementplan. Muster-DMPs für verschiedene Drittmittelgeber finden Sie auf den Seiten der Humboldt-Universität zu Berlin. Darüber hinaus gibt es einige Tools zur Erstellung von DMPs, wie DMPonline u.a. mit einem Template für H2020 Projektanträge bei der Europäischen Kommission oder RDMO, das eher auf den deutschsprachigen Raum ausgerichtet ist und u.a. bei DMPs für DFG und BMBF Projektanträgen unterstützt.

Forschungsdaten sind entweder in den institutionellen Repositorien der Forschungseinrichtungen, an denen die jeweiligen Wissenschaftler:innen angesiedelt sind, zu finden, oder in disziplin- bzw. themenspezifischen Repositorien. Bitte beachten Sie die jeweiligen Nutzungs- und Zugangsbedingungen.

Verzeichnisse von Repositorien:

  • OpenDOAR – Verzeichnis von Repositorien mit verschiedenen Inhaltstypen, darunter auch Forschungsdaten
  • Re3Data – Registry of Research Data Repositories, ein Portal für die Recherche nach Repositorien, die Forschungsdaten bereitstellen. Ein Filtern der Ergebnisse nach Fachdisziplinen ist möglich: Geistes- und Sozialwissenschaften 
  • Repository Finder – von DataCite bereitgestellter Dienst zum Finden von Repositorien in Re3Data, die den vom Enabling FAIR Data Project empfohlenden Kriterien entsprechen

Metasuchen für Forschungsdaten:

  • Base – Suchmaschine für wissenschaftliche Web-Dokumente
  • Cinii Research – Cross-search, Discoverysuche für akademischen Output, inklusive Forschungsdaten, bereitgestellt vom National Institute of Informatics (NII), Research Center for Open Science and Data Platform (RCOS)
  • DataCite – Suche über verschiedene, teilnehmende Datenzentren
  • dataOn – Korean National Research Data Platform Service
  • IRBD Institutional Repository Database 学術機関リポジトリデータベース – NII National Institute of Informatics
  • Linghub – Suche nach Sprachressourcen in den Datenbeständen von CLARIN, LRE-Map, META-SHARE und datahub
  • RatSWD – Suche in den Forschungsdaten durch den Rat für Sozial- und Wirtschaftsdaten akkreditierter Zentren

Fachübergreifende (Forschungsdaten-) Repositorien:

  • GitHub – Software-Entwicklungsprojekte
  • Peking University Open Research Data 北京大学开放研究数据平台
  • OpenAIRE – frei zugängliche Forschungsergebnisse, d.h. Publikationen und Datensets, aus EU-geförderten Projekten (Stichwort: Open Science).
  • Zenodo – Forschungsergebnisse aller Disziplinen, d.h. Publikationen, Datensets, Präsentationen etc.

Fachspezifische Datenrepositorien und -sammlungen:

Geisteswissenschaftliche Daten:

Sozialwissenschaftliche Daten:

  • Barometer on China's Development 中国发展数据库 – Universities Service Centre for China Studies, CUHK
  • Beijing City Lab 北京城市实验室
  • Chinese Social Quality Data Archive 中国社会质量基础数据库 – Chinese Academy of Social Sciences
  • CNSDA Chinese National Survey Data Archive 中国学术调查数据资料库 – National Survey Research Center (NSRC), Renmin University of China, und National Natural Science Foundation of China
  • DataHub – Sozialwissenschaftliche und wirtschaftswissenschaftliche Datensets
  • Fudan University Social Science Data Repository 复旦大学社会科学数据平台
  • ICPSR – Sozialwissenschaftliche Daten des Inter-University Consortium for Political and Social Research
  • KOSSDA Korea Social Science Data Archive 한국사회과학자료원
  • PORI Hong Kong Public Opinion Research Institute 香港民意研究所
  • SowiDataNet | datorium – Sozialwissenschaftlichen Forschungsdaten in GESIS (bisher sehr wenig zu Asien)
  • SRDA Survey Research Data Archive 學術調查研究資料庫 – Center for Survey Research, Research Center for Humanities and Social Sciences, Academia Sinica
  • SSJDA Social Science Japan Data Archive SSJデータアーカイブ – Center for Social Research and Data Archives, Institute of Social Science, The University of Tokyo
  • sowie in den zahlreichen Portalen für amtliche Statistikdaten der einzelnen Länder und Regionen

Darüber hinaus planen wir, bei uns gespeicherte Forschungsdaten sowie solche mit Relevanz für die Asienwissenschaften, die in anderen Repositorien abgelegt sind, in einer gemeinsamen Suche anzuzeigen.

Bei der Planung und Konzeptionalisierung des eigenen Forschungsprojekts ist es sinnvoll, bereits existierende (und veröffentlichte) Datenquellen zu berücksichtigen. Dies ist u.a. auch sinnvoll für Meta-Analysen, zur Erweiterung des wissenschaftlichen Schwerpunkts oder zur Optimierung des eigenen Studiendesigns. Forschungsdaten enthalten häufig Material, das noch nicht umfassend erforscht wurde. Relevant können beispielsweise Daten aus inhaltlich und/oder methodisch ähnlich gelagerten oder Vorläuferprojekten sein. Schließlich schont die Nachnutzung existierender Daten Ressourcen. 

Bei der Nachnutzung von Daten, die in anderen Forschungskontexten entstanden sind, ist es jedoch wichtig, einige Aspekte zu berücksichtigen:

  • Datenqualität und Vollständigkeit: In welchem Kontext sind die Daten entstanden? Gibt es Informationen zur Methodik, Qualitätskontrolle, Vollständigkeit? Wurden die Forschungsergebnisse, in derem Kontext die Daten entstanden sind, bereits veröffentlicht (mit Peer-Review-Verfahren)?
  • Datenquelle und Verlässlichkeit: Wo wurden sie publiziert? Welche Institution steht hinter dem Repositorium? Werden Informationen zur Langzeitverfügbarkeit angegeben? Werden persitente Indentifkatoren (DOI etc.) verwendet?
  • Beschreibung und Metadaten: Welche Datenformate finden Verwendung? Werden die Daten mit standardisierten, im jeweiligen Fach akzeptierten Metadatenformaten ausreichend beschrieben? Werden Projektdesign und Methodik, die Entstehung und Weiterverarbeitung der Daten beschrieben? Werden Datentypen, Variablen etc. in sogenannten Data Dictionaries definiert?
  • Zugänglichkeit und Nutzungsbedingungen: Werden Informationen zur Zugänglichkeit und Bedingungen für die Nachnutzung definiert, beispielsweise mittels offener Lizenzen?

Wenn Sie Daten nachnutzen: Zitieren Sie die Quelle der Daten, so wie Sie auch andere Publikationen im Sinne des guten wissenschaftlichen Arbeitens zitieren.

Der FID Asien berät Sie gerne, wenn Sie Daten veröffentlichen möchten. Wenn Sie Daten bei CrossAsia veröffentlichen möchten, setzen Sie sich bitte mit uns in Kontakt.

Bei der Auswahl eines Repositoriums sollten Sie berücksichtigen, dass Nicht-Lateinische Schriften und ggf. solche, die nicht Unicode kompatibel sind, auch in den Metadaten und beschreibenden Materialien zu den Forschungsdaten verwendet werden können, und dass diese korrekt dargestellt werden und auch in dem Repositorium suchbar sind. 

  • CLARIN-D – Forschungsdatenservices und –zentren für linguistische Daten und Sprachkorpora
  • CrossAsia Open Access Repository – Open Access Repositorium für Asienwissenschaften
  • DARIAH-DE – Forschungsdatenrepositorium für die Geistes- und Kulturwissenschaften
  • Fachspezifisches Repositorium, Suche bspw. über Re3Data
  • GitHub – Repositorium für Software-Entwicklungen
  • Institutionelles, universitäres Repositorium der eigenen Institution
  • TextGrid – Langzeitarchiv für geisteswissenschaftliche Forschungsdaten (bisher existieren keine Erfahrungsberichte mit Texten in asiatischen Sprachen)
  • Zenodo – Fachübergreifendes Repositorium für wissenschaftliche Datensätze, Zugangsbeschränkung möglich  

Um Daten (frei zugänglich) veröffentlichen zu dürfen ist es wichtig, im Vorfeld einige rechtliche Fragen zu klären. Diese betreffen insbesondere urheberrechtsbelastete, sensible und/oder personenbezogene Daten.

Bei personenbezogenen Daten ist zum einen für eine Veröffentlichung immer die Einwilligung der Betroffenen notwendig, zum anderen muss geklärt werden, ob die Daten vollständig anonymisiert werden können.

Wenn das Urheberrecht anderer betroffen ist, bspw. wenn es sich um größere Teile eines (Datenbank-)Werks handelt, sollten unbedingt vorher die Urheber kontaktiert werden.

Forschungsdaten.info hat eine Entscheidungshilfe zum Veröffentlichen von Forschungsdaten erstellt, die die wichtigsten rechtlichen Aspekte thematisiert.

Im Rahmen des Projekts „FID Asien“ planen wir, einen zentralen Zugriff auf und Suche nach asienbezogenen Forschungsdaten zu entwickeln. Wir halten Sie in unserem Blog auf dem Laufenden.


Wir freuen uns über Ihre Mitarbeit:

  • Nennen Sie uns weitere wichtige Quellen und Repositorien für asienbezogene Forschungsdaten.
  • Teilen Sie uns mit, wo Sie Ihre Daten publiziert haben.
  • Sagen Sie uns, welche Services und Unterstützung Sie sich zum Thema Forschungsdaten wünschen.
  • Fragen Sie uns, wenn Sie Unterstützung brauchen, z.B. beim Erstellen eines Datenmanagementplans, beim Planen und Beschreiben von Forschungsdaten, oder beim Archivieren dieser.

Mit diesen und allen weiteren Fragen können Sie sich gerne jederzeit an uns wenden:
x-asia(at)sbb.spk-berlin.de