Wir bieten Ihnen eine umfassende Beratung und informieren Sie zu allen Aspekten des
Forschungsdatenmanagements: Sei es der Support beim Datenmanagementplan, die Antragsunterstützung oder das Mentorierung in Sachen Datenpublikation — Wir sind für Sie da!
Schreiben Sie uns gerne: x-asia(at)sbb.spk-berlin.de
Forschungsdaten sind alle Daten, welche im Verlauf eines wissenschaftlichen Vorhabens und
Forschungsprozesses verwendet werden, um die jeweilige Fragestellung zu bearbeiten. Lassen
Sie sich zum Management Ihrer Forschungsdaten beraten.
Der Umgang mit Forschungsdaten will geplant und strukturiert sein. Kontaktieren Sie uns, wir
bieten Ihnen maßgeschneiderte Unterstützung für Ihren Datenmanagementplan (DMP).
CrossAsia Open Access Repository ist die zentrale Publikationsplattform des Fachportals CrossAsia
und steht als Serviceangebot allen Forschenden und Forschungseinrichtungen der asienbezogenen
Wissenschaften für das wissenschaftliche Open-Access-Publizieren offen.
Im CrossAsia-ITR wird für die Wissenschaft (u.a. zwecks Text-/Datamining) eine Vielzahl seitens der Ostasienabteilung der Staatsbibliothek zu Berlin lizenzierter elektronischer Ressourcen aus und über Asien (ca. 70 Mio. Dokumente) datenbankunabhängig bereitgestellt.
Einschlägige Definitionversuche in Sachen Forschungsdaten finden sich im Bericht (2016)
an den Rat für Informationsinfrastrukturen, in den Richtlinien (2015) sowie in der Checkliste
(2021) der DFG zum Umgang mit Forschungsdaten. Mit Blick auf die große Vielfalt der
Forschungsfelder und -methoden in den asienbezogenen Geistes- und Sozialwissenschaften
sind die Forschungsdaten erwartungsgemäß sehr heterogen, und das diesbezügliche Begriffsverständnis
ist häufig fach- und/oder projektspezifisch. Ebendiese können u.a. Texte, bibliographische
Daten, Korpora, Geodaten, Audio-, Bild- und Videodaten, numerische oder statistische
Daten, Surveydaten oder Beobachtungsdaten, methodische Testverfahren sowie Fragebögen,
aber auch digitale 3D-Modelle und Programmcodes wie für relationale Datenbanken, digitale
Tools und Analyseskripte etc. umfassen. Die Daten werden im Forschungsprozess bei der Quellenforschung, bei der Auswertung und Annotation von Texten, bei der Arbeit mit Objekten aus
Sammlungen, durch Digitalisierung, durch Aufzeichnungen und Beobachtungen, bei Experimenten
und Simulationen, bei qualitativen und quantitativen Befragungen und Erhebungen,
etc. generiert und entstehen, indem sie durch die jeweiligen Forscher:innen selbst erhoben
bzw. erstellt, oder wenn (eigene oder nachgenutzte) Daten weiterentwickelt bzw. ausgewertet
werden.
Gute wissenschaftlichen Praxis: Forschungsdaten sind ein wesentlicher Teil des Forschungsprozesses, daher ist deren Sicherung und Erhalt von enormer Bedeutung, nicht zuletzt um
den Forschungsprozess transparent zu gestalten und eine Reproduzierbarkeit und Nachvollziehbarkeit
von Forschungsergebnissen zu gewährleisten, siehe dazu die entsprechenden DFG Leitlinien (2019).
Nachnutzung von Forschungsdaten: Forschungsdaten haben häufig auch über den ursprünglichen
Erzeugungs- und Forschungskontext hinaus einen bleibenden Wert und können die Grundlage
für andere Forschungsfragen und -vorhaben bilden. Dies gilt insbesondere bei nicht reproduzierbaren
Daten. Demgemäß ist es wichtig, die Zugänglichkeit zu den Daten zu gewähr- leisten
und darüber hinaus diese zu kuratieren, die reinen Daten also durch beschreibende Daten
und kontextualisierende Angaben anzureichern, sodass die wissenschaftliche Aussagekraft der
Daten erhalten bleibt. Auch kann es sinnvoll sein, beim Erstellen der Daten sich an bestehenden
Standards (Datenformate, Metadaten etc.) zu orientieren, um die Verständlichkeit und
Nachvollziehbarkeit der Daten zu gewährleisten. Nicht zuletzt sollte die Rechtefrage dabei
nicht vergessen werden (siehe unten).
Eröffnung neuer Forschungsmethoden: Das Bereitstellen von digitalen Datensets ermöglicht
es zunehmend, diese mittels einer stetig wachsenden Anzahl von digitalen Werkzeugen zu
bearbeiten. Dies eröffnet im Bereich der digitalen Geisteswissenschaften ganz neue Wege der
Forschung (Forschungsfragen, -methoden, etc.).
Bei Interesse dafür, weshalb Beratungen im Bereich Forschungsdaten bereits im Frühstadium
der Forschung hilfreich sein können, empfiehlt sich der folgende rund 30-minütige Podcast:
“Kurios oder dumm gelaufen? Geschichten aus dem Forschungsdatenmanagement” (Anja
Herwig, Data Librarian, UB der HU Berlin, 2022).
Sinnvoll ist es, sich schon bei der Planung des Forschungsprojekts mit dem Thema Forschungsdatenmanagement zu befassen und ggf. einen Datenmanagementplan (DMP) zu erstellen.
Das Forschungsdatenmanagement zielt darauf ab, die Daten unabhängig vom Datenerzeuger
langfristig zugänglich zu machen sowie dass sie möglichst strukturiert, nachnutzbar und nachprüfbar
sind. Als hilfreich erweisen sich dabei die FAIR-Prinzipien (2016), welche den Datenaustausch
erleichtern sollen und als De-Facto-Standard (von Forschungsförderern) zunehmend
erwartet werden (siehe auch die Initiative How to FAIR): Die Daten sollten Findable (auffindbar),
Accessible (zugänglich), Interoperable (austauschbar), und Reusable (nachnutzbar) sein.
Entsprechend sollte bereits beim Projektdesign die technische Umsetzung (z.B. die Annotation
von Metadaten, die Suchbarkeit von Daten) geplant bzw. berücksichtigt werden, welche
Daten wie erhoben, bearbeitet, ausgewertet und beschrieben werden sollen und welche Schritte
für die Transformation, Selektion und Speicherung der Forschungsdaten notwendig sind.
Es ist nützlich, bereits bei der Projektplanung auch die verschiedenen Stadien des Lebenszyklus von Forschungsdaten zu berücksichtigen, um die wissenschaftliche Aussagekraft der Daten und damit die Möglichkeit zur Nachnutzung zu erhalten:
• Planung
• Daten erstellen und sammeln
• Daten verarbeiten und analysieren
• Daten veröffentlichen und teilen
• Daten archivieren und zugänglich machen
• Daten nachnutzen
(Phasen nach: UK Data Service)
Weitere Informationen zum Forschungsdatenmanagement finden Sie bspw. auf forschungsdaten.info, zu verschiedenen Themen wie Planen und Strukturieren des Umgangs mit Forschungsdaten inklusive der Erstellung eines Datenmanagementplans (DMP), Organisieren und Arbeiten
mit Forschungsdaten, Aufbereiten und Veröffentlichen von Forschungsdaten inklusive Informationen zu Metadatenstandards, Bewahren und Nachnutzen von Forschungsdaten sowie Rechte und Pflichten, die beim Umgang mit Forschungsdaten berücksichtigt werden sollten. Einige Empfehlungen für Daten- und Metadatenformate spezifisch für geisteswissenschaftliche Forschungsdaten inklusive solcher, die disziplinübergreifende Objekte betreffen, finden sich bei DARIAH: “Fachspezifische Empfehlungen für Daten und Metadaten” (2016). Eine kuratierte Liste fachspezifischer Daten- und Metadatenstandards findet sich bei Fairsharing.org (sowie vorgefiltert für Geistes- und Sozialwissenschaften). Grundsätzlich gilt bei der Beschreibung der Daten und der Auswahl der (Meta-)Datenformate zu bedenken, dass die Daten sowohl von Mensch als auch Maschine lesbar, verstehbar und verarbeitbar sein sollten, heute sowie idealerweise auch in der Zukunft.
Neben allgemeinen Informationen zum Forschungsdatenmanagement gibt es einige fachspezifische
Empfehlungen und Handreichungen zum Umgang mit Forschungsdaten, z.B. von den
DFG Fachkollegien (2023) und verschiedenen Fachgesellschaften. Für die Asienwissenschaften
siehe bspw. die Handreichung des Fachkollegiums 106 “Sozial- und Kulturanthropologie, Außereuropäische Kulturen, Judaistik und Religionswissenschaft”. Je nach fachlicher Ausrichtung der Forschungsfrage sind auch andere Handreichungen relevant, wie für die Soziologie (2019) und
Wirtschaftswissenschaften (2018) sowie des Rats für Sozial- und Wirtschaftsdaten, für wissenschaftliche
Editionen (2015) in der Literaturwissenschaft, für die Erhebung von Sprachkorpora (2019) sowie rechtlichen Aspekte bei der Handhabung solcher (2015) in der Linguistik.
Immer mehr Forschungsförderer erwarten, dass bereits bei der Antragstellung zu einem Projekt
Überlegungen zum Umgang mit den Forschungsdaten, die im Projekt erstellt, ausgewertet
und entwickelt werden sollen, angestellt werden. Die DFG hat Leitlinien (2015) und
konkretisierte Anforderungen (2022) zum Umgang mit Forschungsdaten erstellt und die Europäische
Kommission Guidelines on FAIR Data Management in Horizon 2020 (2016) herausgegeben.
Bei Forschungsdaten.info gibt es eine Übersicht wichtiger Anforderungen von
Forschungsförderern. Solche Anforderungen der Forschungsförderer beinhalten häufig einen Datenmanagementplan.
Ein Datenmanagementplan hilft dabei, den Umgang mit Forschungsdaten in einem Forschungsprojekt
zu planen und zu strukturieren. Es wird beschrieben, wie während der Laufzeit des Projekts
sowie nach dessen Beendigung mit den Daten, die erhoben, bearbeitet, ausgewertet und
beschrieben werden, umgegangen werden soll. Siehe auch den Beitrag zu Datenmanagementplänen
bei forschungsdaten.info.
Viele Forschungsförderer erwarten bei der Antragstellung für ein Projekt einen solchen Datenmanagementplan. Muster-DMPs für verschiedene Drittmittelgeber finden Sie auf den Seiten
der Humboldt-Universität zu Berlin. Darüber hinaus gibt es einige Tools zur Erstellung von
DMPs, wie DMPonline u.a. mit einem Template für H2020 Projektanträge bei der Europäischen
Kommission oder RDMO, das eher auf den deutschsprachigen Raum ausgerichtet ist und
u.a. bei DMPs für DFG und BMBF Projektanträgen unterstützt.
Forschungsdaten sind entweder in den institutionellen Repositorien der Forschungseinrichtungen, an denen die jeweiligen Wissenschaftler:innen angesiedelt sind, zu finden, oder in disziplin- bzw. themenspezifischen Repositorien. Bitte beachten Sie die jeweiligen Nutzungs- und Zugangsbedingungen.
Verzeichnisse von Repositorien:
Metasuchen für Forschungsdaten:
Fachübergreifende (Forschungsdaten-) Repositorien:
Fachspezifische Datenrepositorien und -sammlungen:
Geisteswissenschaftliche Daten:
Sozialwissenschaftliche Daten:
Darüber hinaus planen wir, bei uns gespeicherte Forschungsdaten sowie solche mit Relevanz für die Asienwissenschaften, die in anderen Repositorien abgelegt sind, in einer gemeinsamen Suche anzuzeigen.
Bei der Planung und Konzeptionalisierung des eigenen Forschungsprojekts ist es sinnvoll, bereits
existierende (und veröffentlichte) Datenquellen zu berücksichtigen. Dies ist u.a. auch sinnvoll
für Meta-Analysen, zur Erweiterung des wissenschaftlichen Schwerpunkts oder zur Optimierung
des eigenen Studiendesigns. Forschungsdaten enthalten häufig Material, das noch
nicht umfassend erforscht wurde. Relevant können beispielsweise Daten aus inhaltlich und /
oder methodisch ähnlich gelagerten Projekten oder Vorläuferprojekten sein. Schließlich schont
die Nachnutzung existierender Daten Ressourcen.
Bei der Nachnutzung von Daten, die in anderen Forschungskontexten entstanden sind, ist es
jedoch wichtig, einige Aspekte zu berücksichtigen:
Wenn Sie Daten nachnutzen: Zitieren Sie die Quelle der Daten, so wie Sie auch andere Publikationen
im Sinne des guten wissenschaftlichen Arbeitens zitieren. Legen Sie außerdem u.a.
zwecks Wahrung der Interessen indigener Gemeinschaften Wert auf einen adäquaten Umgang
mit Daten. Die CARE-Prinzipien: Collective Benefit, Authority to Control, Responsibility,
Ethics (2019) können dabei helfen.
Der FID Asien berät Sie gerne in Sachen Datenveröffentlichung. Wenn Sie Daten bei CrossAsia
veröffentlichen möchten, setzen Sie sich bitte mit uns in Kontakt.
Bei der Auswahl eines Repositoriums sollten Sie berücksichtigen, dass Nicht-Lateinische Schriften und ggf. solche, die nicht Unicode kompatibel sind, auch in den Metadaten und beschreibenden Materialien zu den Forschungsdaten verwendet werden können, und dass diese korrekt dargestellt werden und auch in dem Repositorium suchbar sind.
Um Daten (frei zugänglich) veröffentlichen zu dürfen ist es wichtig, im Vorfeld einige rechtliche Fragen zu klären. Diese betreffen insbesondere urheberrechtsbelastete, sensible und/oder personenbezogene Daten.
Bei personenbezogenen Daten ist zum einen für eine Veröffentlichung immer die Einwilligung der Betroffenen notwendig, zum anderen muss geklärt werden, ob die Daten vollständig anonymisiert werden können.
Wenn das Urheberrecht anderer betroffen ist, bspw. wenn es sich um größere Teile eines (Datenbank-)Werks handelt, sollten unbedingt vorher die Urheber kontaktiert werden.
Forschungsdaten.info hat eine Entscheidungshilfe zum Veröffentlichen von Forschungsdaten (2019) erstellt, die die wichtigsten rechtlichen Aspekte thematisiert.
Mit diesen und allen weiteren Fragen können Sie sich gerne jederzeit an uns wenden:
x-asia(at)sbb.spk-berlin.de
FAIR Data Prinzipien
Entscheidungshilfe: Forschungsdaten veröffentlichen
Forschungsdaten.info
Forschungsdaten.org
DFG Leitlinien zum Umgang mit Forschungsdaten
DFG Leitlinien zur Sicherung guter wissenschaftlicher Praxis
DFG Fachkollegium 106: Handreichung zum Umgang mit Forschungsdaten
Staatsbibliothek zu Berlin - PK
Ostasien-Abteilung
Tel.: +49 30 266-436001
E-Mail: x-asia(at)sbb.spk-berlin.de