Forschungsdaten sind ein hochaktuelles Thema. Wir – der Fachinformationsdienst Asien (FID Asien) – möchten Sie gerne bei Fragen zum Umgang mit Forschungsdaten in den Wissenschaften aus und über Asien unterstützen.
Auf dieser Seite finden Sie einige einführende Informationen zum Themenkomplex Forschungsdaten sowie weiterführende Links.
Sie können sich gerne mit allen Ihren Fragen an uns wenden:
x-asia(at)sbb.spk-berlin.de
Der Begriff "Forschungsdaten" meint alle Daten, die im Verlauf eines wissenschaftlichen Vorhabens und Forschungsprozesses verwendet werden, um die jeweilige Fragestellung zu bearbeiten. Wenn hier von Forschungsdaten gesprochen wird, bezieht sich dies zunächst auf digital vorliegende Daten.
Aufgrund der Vielfalt der Forschungsfelder und –methoden in den asienbezogenen Geistes- und Sozialwissenschaften sind entsprechend auch die Forschungsdaten sehr heterogen. Diese können u.a. Textdaten, bibliographische Daten, Geodaten, Audio-, Bild- und Videodaten, numerische oder statistische Daten, aber auch digitale 3D Modelle und Programmcodes wie für relationale Datenbanken, digitale Tools und Analyseskripte etc. umfassen. Die Daten entstehen im Forschungsprozess bei der Quellenforschung, bei der Auswertung und Annotation von Texten, bei der Arbeit mit Objekten aus Sammlungen, durch Digitalisierung, durch Aufzeichnungen und Beobachtungen, bei Experimenten und Simulationen, bei qualitativen und quantitativen Befragungen und Erhebungen, etc. Die Daten entstehen, indem sie durch den Forschenden/die Forschende selbst erhoben bzw. erstellt werden oder sie entstehen, wenn (eigene oder nachgenutzte) Daten weiterentwickelt bzw. ausgewertet werden.
Einschlägige Definitionen des Begriffs "Forschungsdaten" finden Sie beim Rat für Informationsinfrastrukturen und in den Richtlinien der DFG zum Umgang mit Forschungsdaten.
Gute wissenschaftliche Praxis: Forschungsdaten sind ein wichtiger Bestandteil des Forschungsprozesses, daher ist ihre Sicherung und Erhalt von enormer Bedeutung, nicht zuletzt um den Forschungsprozess transparent zu gestalten und eine Reproduzierbarkeit und Nachvollziehbarkeit von Forschungsergebnissen zu gewährleisten (siehe die DFG Leitlinien zur Sicherung guter wissenschaftlicher Praxis).
Nachnutzung von Forschungsdaten: Forschungsdaten haben häufig auch über den ursprünglichen Erzeugungs- und Forschungskontext hinaus einen bleibenden Wert und können die Grundlage für andere Forschungsfragen und -vorhaben bilden. Dies gilt insbesondere dann, wenn die Daten nicht reproduzierbar sind. Dazu ist es wichtig, die Zugänglichkeit zu den Daten zu gewährleisten und darüber hinaus diese zu kuratieren, die reinen Daten also durch beschreibende Daten und kontextualisierende Angaben anzureichern, sodass die wissenschaftliche Aussagekraft der Daten erhalten bleibt. Auch kann es sinnvoll sein, beim Erstellen der Daten sich an bestehenden Standards (Datenformate, Metadaten etc.) zu orientieren, um die Verständlichkeit und Nachvollziehbarkeit der Daten zu gewährleisten. Nicht zuletzt sollte die Rechtefrage dabei nicht vergessen werden (siehe unten).
Eröffnung neuer Forschungsmethoden: Das Bereitstellen von digitalen Datensets ermöglicht es zunehmend, diese mittels einer stetig wachsenden Anzahl von digitalen Werkzeugen zu bearbeiten. Dies eröffnet im Bereich der digitalen Geisteswissenschaften ganz neue Wege der Forschung (Forschungsfragen, -methoden, etc.).
Sinnvoll ist es, sich schon bei der Planung des Forschungsprojekts mit dem Thema Forschungsdatenmanagement zu befassen und ggf. einen Datenmanagementplan (DMP) zu erstellen. Ziel des Forschungsdatenmanagements ist es, die Daten langfristig zugänglich zu machen, und zwar unabhängig vom Datenerzeuger sowie dass sie möglichst strukturiert, nachnutzbar und nachprüfbar sind. Die FAIR Data Prinzipien können dabei helfen: Die Daten sollten Findable, Accessible, Interoperable, und Reusable sein. Entsprechend sollte beim Projektdesign bereits berücksichtigt bzw. geplant werden, welche Daten wie erhoben, bearbeitet, ausgewertet und beschrieben werden sollen und welche Schritte für die Transformation, Selektion und Speicherung der Forschungsdaten notwendig sind.
Hilfreich ist es bereits bei der Projektplanung auch die verschiedenen Stadien des Lebenszyklus von Forschungsdaten zu berücksichtigen, um die wissenschaftliche Aussagekraft der Daten und damit die Möglichkeit zur Nachnutzung zu erhalten:
Weitere Informationen zum Forschungsdatenmanagement finden Sie bspw. auf forschungsdaten.info, zu verschiedenen Themen wie Planen und Strukturieren des Umgangs mit Forschungsdaten inklusive der Erstellung eines Datenmanagementplans (DMP), Organisieren und Arbeiten mit Forschungsdaten, Aufbereiten und Veröffentlichen von Forschungsdaten inklusive Informationen zu Metadatenstandards, Bewahren und Nachnutzen von Forschungsdaten sowie Rechte und Pflichten, die beim Umgang mit Forschungsdaten berücksichtigt werden sollten.
Einige Empfehlungen für Daten- und Metadatenformate spezifisch für geisteswissenschaftliche Forschungsdaten inklusive solcher, die disziplinübergreifende Objekte betreffen, finden sich bei DARIAH: „Fachspezifische Empfehlungen für Daten und Metadaten“. Eine kuratierte Liste fachspezifischer Daten- und Metadatenstandards findet sich bei Fairsharing.org (sowie vorgefiltert für Geistes- und Sozialwissenschaften). Grundsätzlich gilt bei der Beschreibung der Daten und der Auswahl der (Meta-) Datenformate zu bedenken, dass die Daten sowohl von Mensch als auch Maschine lesbar, verstehbar und verarbeitbar sein sollten, heute sowie idealerweise auch in der Zukunft.
Neben allgemeinen Informationen zum Forschungsdatenmanagement gibt es einige fachspezifische Empfehlungen und Handreichungen zum Umgang mit Forschungsdaten, z.B. von den DFG Fachkollegien und verschiedenen Fachgesellschaften. Für die Asienwissenschaften siehe bspw. die Handreichung des Fachkollegiums 106 „Sozial- und Kulturanthropologie, Außereuropäische Kulturen, Judaistik und Religionswissenschaft“. Je nach fachlicher Ausrichtung der Forschungsfrage sind auch andere Handreichungen relevant, wie für die Soziologie und Wirtschaftswissenschaften sowie des Rats für Sozial- und Wirtschaftsdaten, für wissenschaftliche Editionen in der Literaturwissenschaft, für die Erhebung von Sprachkorpora sowie rechtliche Aspekten bei der Handhabung solcher in der Linguistik.
Immer mehr Forschungsförderer erwarten, dass bereits bei der Antragstellung zu einem Projekt Überlegungen zum Umgang mit den Forschungsdaten, die im Projekt erstellt, ausgewertet und entwickelt werden sollen, angestellt werden. Die DFG hat Leitlinien zum Umgang mit Forschungsdaten erstellt und die Europäische Kommission Guidelines on FAIR Data Management in Horizon 2020. Forschungsdaten.info hat eine Übersicht wichtiger Anforderungen von Forschungsförderern erstellt. Solche Anforderungen der Forschungsförderer beinhalten häufig einen Datenmanagementplan.
Ein Datenmanagementplan hilft dabei, den Umgang mit Forschungsdaten in einem Forschungsprojekt zu planen und zu strukturieren. Es wird beschrieben, wie während der Laufzeit des Projekts sowie nach dessen Beendigung mit den Daten, die erhoben, bearbeitet, ausgewertet und beschrieben werden, umgegangen werden soll. Siehe auch den Beitrag zu Datenmanagementplänen bei forschungsdaten.info.
Viele Forschungsförderer erwarten bei der Antragstellung für ein Projekt einen solchen Datenmanagementplan. Muster-DMPs für verschiedene Drittmittelgeber finden Sie auf den Seiten der Humboldt-Universität zu Berlin. Darüber hinaus gibt es einige Tools zur Erstellung von DMPs, wie DMPonline u.a. mit einem Template für H2020 Projektanträge bei der Europäischen Kommission oder RDMO, das eher auf den deutschsprachigen Raum ausgerichtet ist und u.a. bei DMPs für DFG und BMBF Projektanträgen unterstützt.
Forschungsdaten sind entweder in den institutionellen Repositorien der Forschungseinrichtungen, an denen die jeweiligen Wissenschaftler:innen angesiedelt sind, zu finden, oder in disziplin- bzw. themenspezifischen Repositorien. Bitte beachten Sie die jeweiligen Nutzungs- und Zugangsbedingungen.
Verzeichnisse von Repositorien:
Metasuchen für Forschungsdaten:
Fachübergreifende (Forschungsdaten-) Repositorien:
Fachspezifische Datenrepositorien und -sammlungen:
Geisteswissenschaftliche Daten:
Sozialwissenschaftliche Daten:
Darüber hinaus planen wir, bei uns gespeicherte Forschungsdaten sowie solche mit Relevanz für die Asienwissenschaften, die in anderen Repositorien abgelegt sind, in einer gemeinsamen Suche anzuzeigen.
Bei der Planung und Konzeptionalisierung des eigenen Forschungsprojekts ist es sinnvoll, bereits existierende (und veröffentlichte) Datenquellen zu berücksichtigen. Dies ist u.a. auch sinnvoll für Meta-Analysen, zur Erweiterung des wissenschaftlichen Schwerpunkts oder zur Optimierung des eigenen Studiendesigns. Forschungsdaten enthalten häufig Material, das noch nicht umfassend erforscht wurde. Relevant können beispielsweise Daten aus inhaltlich und/oder methodisch ähnlich gelagerten oder Vorläuferprojekten sein. Schließlich schont die Nachnutzung existierender Daten Ressourcen.
Bei der Nachnutzung von Daten, die in anderen Forschungskontexten entstanden sind, ist es jedoch wichtig, einige Aspekte zu berücksichtigen:
Wenn Sie Daten nachnutzen: Zitieren Sie die Quelle der Daten, so wie Sie auch andere Publikationen im Sinne des guten wissenschaftlichen Arbeitens zitieren.
Der FID Asien berät Sie gerne, wenn Sie Daten veröffentlichen möchten. Wenn Sie Daten bei CrossAsia veröffentlichen möchten, setzen Sie sich bitte mit uns in Kontakt.
Bei der Auswahl eines Repositoriums sollten Sie berücksichtigen, dass Nicht-Lateinische Schriften und ggf. solche, die nicht Unicode kompatibel sind, auch in den Metadaten und beschreibenden Materialien zu den Forschungsdaten verwendet werden können, und dass diese korrekt dargestellt werden und auch in dem Repositorium suchbar sind.
Um Daten (frei zugänglich) veröffentlichen zu dürfen ist es wichtig, im Vorfeld einige rechtliche Fragen zu klären. Diese betreffen insbesondere urheberrechtsbelastete, sensible und/oder personenbezogene Daten.
Bei personenbezogenen Daten ist zum einen für eine Veröffentlichung immer die Einwilligung der Betroffenen notwendig, zum anderen muss geklärt werden, ob die Daten vollständig anonymisiert werden können.
Wenn das Urheberrecht anderer betroffen ist, bspw. wenn es sich um größere Teile eines (Datenbank-)Werks handelt, sollten unbedingt vorher die Urheber kontaktiert werden.
Forschungsdaten.info hat eine Entscheidungshilfe zum Veröffentlichen von Forschungsdaten erstellt, die die wichtigsten rechtlichen Aspekte thematisiert.
Mit diesen und allen weiteren Fragen können Sie sich gerne jederzeit an uns wenden:
x-asia(at)sbb.spk-berlin.de
FAIR Data Prinzipien
Entscheidungshilfe: Forschungsdaten veröffentlichen
Forschungsdaten.info
Forschungsdaten.org
DFG Leitlinien zum Umgang mit Forschungsdaten
DFG Leitlinien zur Sicherung guter wissenschaftlicher Praxis
DFG Fachkollegium 106: Handreichung zum Umgang mit Forschungsdaten
Staatsbibliothek zu Berlin - PK
Ostasien-Abteilung
Tel.: +49 30 266-436001
E-Mail: x-asia(at)sbb.spk-berlin.de