nav-image-narrow

Forschungsdaten in den asienbezogenen Wissenschaften

Wir bieten Ihnen eine umfassende Beratung und informieren Sie zu allen Aspekten des
Forschungsdatenmanagements: Sei es der Support beim Datenmanagementplan, die Antragsunterstützung oder das Mentorierung in Sachen Datenpublikation — Wir sind für Sie da!

Schreiben Sie uns gerne: x-asia(at)sbb.spk-berlin.de

Beratungsservices

Forschungsdaten

Forschungsdaten sind alle Daten, welche im Verlauf eines wissenschaftlichen Vorhabens und
Forschungsprozesses verwendet werden, um die jeweilige Fragestellung zu bearbeiten. Lassen
Sie sich zum Management Ihrer Forschungsdaten beraten.

Datenmanagementplan

Der Umgang mit Forschungsdaten will geplant und strukturiert sein. Kontaktieren Sie uns, wir
bieten Ihnen maßgeschneiderte Unterstützung für Ihren Datenmanagementplan (DMP).

 

Publikationsplattformen

CrossAsia Open Access Repository

CrossAsia Open Access Repository ist die zentrale Publikationsplattform des Fachportals CrossAsia
und steht als Serviceangebot allen Forschenden und Forschungseinrichtungen der asienbezogenen
Wissenschaften für das wissenschaftliche Open-Access-Publizieren offen.

CrossAsia Integriertes Textrepositorium (ITR)

Im CrossAsia-ITR wird für die Wissenschaft (u.a. zwecks Text-/Datamining) eine Vielzahl seitens der Ostasienabteilung der Staatsbibliothek zu Berlin lizenzierter elektronischer Ressourcen aus und über Asien (ca. 70 Mio. Dokumente) datenbankunabhängig bereitgestellt.

Einschlägige Definitionversuche in Sachen Forschungsdaten finden sich im Bericht (2016)
an den Rat für Informationsinfrastrukturen, in den Richtlinien (2015) sowie in der Checkliste
(2021)
der DFG zum Umgang mit Forschungsdaten. Mit Blick auf die große Vielfalt der
Forschungsfelder und -methoden in den asienbezogenen Geistes- und Sozialwissenschaften
sind die Forschungsdaten erwartungsgemäß sehr heterogen, und das diesbezügliche Begriffsverständnis
ist häufig fach- und/oder projektspezifisch. Ebendiese können u.a. Texte, bibliographische
Daten, Korpora, Geodaten, Audio-, Bild- und Videodaten, numerische oder statistische
Daten, Surveydaten oder Beobachtungsdaten, methodische Testverfahren sowie Fragebögen,
aber auch digitale 3D-Modelle und Programmcodes wie für relationale Datenbanken, digitale
Tools und Analyseskripte etc. umfassen. Die Daten werden im Forschungsprozess bei der Quellenforschung, bei der Auswertung und Annotation von Texten, bei der Arbeit mit Objekten aus
Sammlungen, durch Digitalisierung, durch Aufzeichnungen und Beobachtungen, bei Experimenten
und Simulationen, bei qualitativen und quantitativen Befragungen und Erhebungen,
etc. generiert und entstehen, indem sie durch die jeweiligen Forscher:innen selbst erhoben
bzw. erstellt, oder wenn (eigene oder nachgenutzte) Daten weiterentwickelt bzw. ausgewertet
werden.

Gute wissenschaftlichen Praxis: Forschungsdaten sind ein wesentlicher Teil des Forschungsprozesses, daher ist deren Sicherung und Erhalt von enormer Bedeutung, nicht zuletzt um
den Forschungsprozess transparent zu gestalten und eine Reproduzierbarkeit und Nachvollziehbarkeit
von Forschungsergebnissen zu gewährleisten, siehe dazu die entsprechenden DFG Leitlinien (2019).

Nachnutzung von Forschungsdaten: Forschungsdaten haben häufig auch über den ursprünglichen
Erzeugungs- und Forschungskontext hinaus einen bleibenden Wert und können die Grundlage
für andere Forschungsfragen und -vorhaben bilden. Dies gilt insbesondere bei nicht reproduzierbaren
Daten. Demgemäß ist es wichtig, die Zugänglichkeit zu den Daten zu gewähr- leisten
und darüber hinaus diese zu kuratieren, die reinen Daten also durch beschreibende Daten
und kontextualisierende Angaben anzureichern, sodass die wissenschaftliche Aussagekraft der
Daten erhalten bleibt. Auch kann es sinnvoll sein, beim Erstellen der Daten sich an bestehenden
Standards (Datenformate, Metadaten etc.) zu orientieren, um die Verständlichkeit und
Nachvollziehbarkeit der Daten zu gewährleisten. Nicht zuletzt sollte die Rechtefrage dabei
nicht vergessen werden (siehe unten).


Eröffnung neuer Forschungsmethoden: Das Bereitstellen von digitalen Datensets ermöglicht
es zunehmend, diese mittels einer stetig wachsenden Anzahl von digitalen Werkzeugen zu
bearbeiten. Dies eröffnet im Bereich der digitalen Geisteswissenschaften ganz neue Wege der
Forschung (Forschungsfragen, -methoden, etc.).

Bei Interesse dafür, weshalb Beratungen im Bereich Forschungsdaten bereits im Frühstadium
der Forschung hilfreich sein können, empfiehlt sich der folgende rund 30-minütige Podcast:
“Kurios oder dumm gelaufen? Geschichten aus dem Forschungsdatenmanagement” (Anja
Herwig, Data Librarian, UB der HU Berlin, 2022).

Sinnvoll ist es, sich schon bei der Planung des Forschungsprojekts mit dem Thema Forschungsdatenmanagement zu befassen und ggf. einen Datenmanagementplan (DMP) zu erstellen.
Das Forschungsdatenmanagement zielt darauf ab, die Daten unabhängig vom Datenerzeuger
langfristig zugänglich zu machen sowie dass sie möglichst strukturiert, nachnutzbar und nachprüfbar
sind. Als hilfreich erweisen sich dabei die FAIR-Prinzipien (2016), welche den Datenaustausch
erleichtern sollen und als De-Facto-Standard (von Forschungsförderern) zunehmend
erwartet werden (siehe auch die Initiative How to FAIR): Die Daten sollten Findable (auffindbar),
Accessible (zugänglich), Interoperable (austauschbar), und Reusable (nachnutzbar) sein.
Entsprechend sollte bereits beim Projektdesign die technische Umsetzung (z.B. die Annotation
von Metadaten, die Suchbarkeit von Daten) geplant bzw. berücksichtigt werden, welche
Daten wie erhoben, bearbeitet, ausgewertet und beschrieben werden sollen und welche Schritte
für die Transformation, Selektion und Speicherung der Forschungsdaten notwendig sind.

Es ist nützlich, bereits bei der Projektplanung auch die verschiedenen Stadien des Lebenszyklus von Forschungsdaten zu berücksichtigen, um die wissenschaftliche Aussagekraft der Daten und damit die Möglichkeit zur Nachnutzung zu erhalten:


• Planung
• Daten erstellen und sammeln
• Daten verarbeiten und analysieren
• Daten veröffentlichen und teilen
• Daten archivieren und zugänglich machen
• Daten nachnutzen
(Phasen nach: UK Data Service)


Weitere Informationen zum Forschungsdatenmanagement finden Sie bspw. auf forschungsdaten.info, zu verschiedenen Themen wie Planen und Strukturieren des Umgangs mit Forschungsdaten inklusive der Erstellung eines Datenmanagementplans (DMP), Organisieren und Arbeiten
mit Forschungsdaten, Aufbereiten und Veröffentlichen von Forschungsdaten inklusive Informationen zu Metadatenstandards, Bewahren und Nachnutzen von Forschungsdaten sowie Rechte und Pflichten, die beim Umgang mit Forschungsdaten berücksichtigt werden sollten. Einige Empfehlungen für Daten- und Metadatenformate spezifisch für geisteswissenschaftliche Forschungsdaten inklusive solcher, die disziplinübergreifende Objekte betreffen, finden sich bei DARIAH: “Fachspezifische Empfehlungen für Daten und Metadaten” (2016). Eine kuratierte Liste fachspezifischer Daten- und Metadatenstandards findet sich bei Fairsharing.org (sowie vorgefiltert für Geistes- und Sozialwissenschaften). Grundsätzlich gilt bei der Beschreibung der Daten und der Auswahl der (Meta-)Datenformate zu bedenken, dass die Daten sowohl von Mensch als auch Maschine lesbar, verstehbar und verarbeitbar sein sollten, heute sowie idealerweise auch in der Zukunft.

Neben allgemeinen Informationen zum Forschungsdatenmanagement gibt es einige fachspezifische
Empfehlungen und Handreichungen zum Umgang mit Forschungsdaten, z.B. von den
DFG Fachkollegien (2023) und verschiedenen Fachgesellschaften. Für die Asienwissenschaften
siehe bspw. die Handreichung des Fachkollegiums 106 “Sozial- und Kulturanthropologie, Außereuropäische Kulturen, Judaistik und Religionswissenschaft”. Je nach fachlicher Ausrichtung der Forschungsfrage sind auch andere Handreichungen relevant, wie für die Soziologie (2019) und
Wirtschaftswissenschaften (2018) sowie des Rats für Sozial- und Wirtschaftsdaten, für wissenschaftliche
Editionen (2015)
in der Literaturwissenschaft, für die Erhebung von Sprachkorpora (2019) sowie rechtlichen Aspekte bei der Handhabung solcher (2015) in der Linguistik.

Immer mehr Forschungsförderer erwarten, dass bereits bei der Antragstellung zu einem Projekt
Überlegungen zum Umgang mit den Forschungsdaten, die im Projekt erstellt, ausgewertet
und entwickelt werden sollen, angestellt werden. Die DFG hat Leitlinien (2015) und
konkretisierte Anforderungen (2022) zum Umgang mit Forschungsdaten erstellt und die Europäische
Kommission Guidelines on FAIR Data Management in Horizon 2020 (2016) herausgegeben.
Bei Forschungsdaten.info gibt es eine Übersicht wichtiger Anforderungen von
Forschungsförderern
. Solche Anforderungen der Forschungsförderer beinhalten häufig einen Datenmanagementplan.

Ein Datenmanagementplan hilft dabei, den Umgang mit Forschungsdaten in einem Forschungsprojekt
zu planen und zu strukturieren. Es wird beschrieben, wie während der Laufzeit des Projekts
sowie nach dessen Beendigung mit den Daten, die erhoben, bearbeitet, ausgewertet und
beschrieben werden, umgegangen werden soll. Siehe auch den Beitrag zu Datenmanagementplänen
bei forschungsdaten.info.
Viele Forschungsförderer erwarten bei der Antragstellung für ein Projekt einen solchen Datenmanagementplan. Muster-DMPs für verschiedene Drittmittelgeber finden Sie auf den Seiten
der Humboldt-Universität zu Berlin. Darüber hinaus gibt es einige Tools zur Erstellung von
DMPs, wie DMPonline u.a. mit einem Template für H2020 Projektanträge bei der Europäischen
Kommission oder RDMO, das eher auf den deutschsprachigen Raum ausgerichtet ist und
u.a. bei DMPs für DFG und BMBF Projektanträgen unterstützt.

Forschungsdaten sind entweder in den institutionellen Repositorien der Forschungseinrichtungen, an denen die jeweiligen Wissenschaftler:innen angesiedelt sind, zu finden, oder in disziplin- bzw. themenspezifischen Repositorien. Bitte beachten Sie die jeweiligen Nutzungs- und Zugangsbedingungen.

Verzeichnisse von Repositorien:

  • OpenDOAR – Verzeichnis von Repositorien mit verschiedenen Inhaltstypen, darunter auch Forschungsdaten
  • Re3Data – Registry of Research Data Repositories, ein Portal für die Recherche nach Repositorien, die Forschungsdaten bereitstellen. Ein Filtern der Ergebnisse nach Fachdisziplinen ist möglich: Geistes- und Sozialwissenschaften 
  • Repository Finder – von DataCite bereitgestellter Dienst zum Finden von Repositorien in Re3Data, die den vom Enabling FAIR Data Project empfohlenden Kriterien entsprechen

Metasuchen für Forschungsdaten:

  • Base – Suchmaschine für wissenschaftliche Web-Dokumente
  • Cinii Research – Cross-search, Discoverysuche für akademischen Output, inklusive Forschungsdaten, bereitgestellt vom National Institute of Informatics (NII), Research Center for Open Science and Data Platform (RCOS)
  • DataCite – Suche über verschiedene, teilnehmende Datenzentren
  • dataOn – Korean National Research Data Platform Service
  • IRBD Institutional Repository Database 学術機関リポジトリデータベース – NII National Institute of Informatics
  • RatSWD – Suche in den Forschungsdaten durch den Rat für Sozial- und Wirtschaftsdaten akkreditierter Zentren

Fachübergreifende (Forschungsdaten-) Repositorien:

  • GitHub – Software-Entwicklungsprojekte
  • Peking University Open Research Data 北京大学开放研究数据平台
  • OpenAIRE – frei zugängliche Forschungsergebnisse, d.h. Publikationen und Datensets, aus EU-geförderten Projekten (Stichwort: Open Science).
  • Zenodo – Forschungsergebnisse aller Disziplinen, d.h. Publikationen, Datensets, Präsentationen etc.

Fachspezifische Datenrepositorien und -sammlungen:

Geisteswissenschaftliche Daten:

Sozialwissenschaftliche Daten:

  • Barometer on China's Development 中国发展数据库 – Universities Service Centre for China Studies, CUHK
  • Beijing City Lab 北京城市实验室
  • Chinese Social Quality Data Archive 中国社会质量基础数据库 – Chinese Academy of Social Sciences
  • CNSDA Chinese National Survey Data Archive 中国学术调查数据资料库 – National Survey Research Center (NSRC), Renmin University of China, und National Natural Science Foundation of China
  • DataHub – Sozialwissenschaftliche und wirtschaftswissenschaftliche Datensets
  • Fudan University Social Science Data Repository 复旦大学社会科学数据平台
  • ICPSR – Sozialwissenschaftliche Daten des Inter-University Consortium for Political and Social Research
  • KOSSDA Korea Social Science Data Archive 한국사회과학자료원
  • PORI Hong Kong Public Opinion Research Institute 香港民意研究所
  • SowiDataNet | datorium – Sozialwissenschaftlichen Forschungsdaten in GESIS (bisher sehr wenig zu Asien)
  • SRDA Survey Research Data Archive 學術調查研究資料庫 – Center for Survey Research, Research Center for Humanities and Social Sciences, Academia Sinica
  • SSJDA Social Science Japan Data Archive SSJデータアーカイブ – Center for Social Research and Data Archives, Institute of Social Science, The University of Tokyo
  • sowie in den zahlreichen Portalen für amtliche Statistikdaten der einzelnen Länder und Regionen

Darüber hinaus planen wir, bei uns gespeicherte Forschungsdaten sowie solche mit Relevanz für die Asienwissenschaften, die in anderen Repositorien abgelegt sind, in einer gemeinsamen Suche anzuzeigen.

Bei der Planung und Konzeptionalisierung des eigenen Forschungsprojekts ist es sinnvoll, bereits
existierende (und veröffentlichte) Datenquellen zu berücksichtigen. Dies ist u.a. auch sinnvoll
für Meta-Analysen, zur Erweiterung des wissenschaftlichen Schwerpunkts oder zur Optimierung
des eigenen Studiendesigns. Forschungsdaten enthalten häufig Material, das noch
nicht umfassend erforscht wurde. Relevant können beispielsweise Daten aus inhaltlich und /
oder methodisch ähnlich gelagerten Projekten oder Vorläuferprojekten sein. Schließlich schont
die Nachnutzung existierender Daten Ressourcen.
Bei der Nachnutzung von Daten, die in anderen Forschungskontexten entstanden sind, ist es
jedoch wichtig, einige Aspekte zu berücksichtigen:

  • Datenqualität und Vollständigkeit: In welchem Kontext sind die Daten entstanden? Gibt es Informationen zur Methodik, Qualitätskontrolle, Vollständigkeit? Wurden die Forschungsergebnisse, in derem Kontext die Daten entstanden sind, bereits veröffentlicht (mit Peer-Review-Verfahren)?
  • Datenquelle und Verlässlichkeit: Wo wurden sie publiziert? Welche Institution steht hinter dem Repositorium? Werden Informationen zur Langzeitverfügbarkeit angegeben? Werden persitente Indentifkatoren (DOI etc.) verwendet?
  • Beschreibung und Metadaten: Welche Datenformate finden Verwendung? Werden die Daten mit standardisierten, im jeweiligen Fach akzeptierten Metadatenformaten ausreichend beschrieben? Werden Projektdesign und Methodik, die Entstehung und Weiterverarbeitung der Daten beschrieben? Werden Datentypen, Variablen etc. in sogenannten Data Dictionaries definiert?
  • Zugänglichkeit und Nutzungsbedingungen: Werden Informationen zur Zugänglichkeit und Bedingungen für die Nachnutzung definiert, beispielsweise mittels offener Lizenzen?

Wenn Sie Daten nachnutzen: Zitieren Sie die Quelle der Daten, so wie Sie auch andere Publikationen
im Sinne des guten wissenschaftlichen Arbeitens zitieren. Legen Sie außerdem u.a.
zwecks Wahrung der Interessen indigener Gemeinschaften Wert auf einen adäquaten Umgang
mit Daten. Die CARE-Prinzipien: Collective Benefit, Authority to Control, Responsibility,
Ethics (2019) können dabei helfen.

Der FID Asien berät Sie gerne in Sachen Datenveröffentlichung. Wenn Sie Daten bei CrossAsia
veröffentlichen möchten, setzen Sie sich bitte mit uns in Kontakt.

Bei der Auswahl eines Repositoriums sollten Sie berücksichtigen, dass Nicht-Lateinische Schriften und ggf. solche, die nicht Unicode kompatibel sind, auch in den Metadaten und beschreibenden Materialien zu den Forschungsdaten verwendet werden können, und dass diese korrekt dargestellt werden und auch in dem Repositorium suchbar sind. 

  • CLARIN-D – Forschungsdatenservices und –zentren für linguistische Daten und Sprachkorpora
  • CrossAsia Open Access Repository – Open Access Repositorium für Asienwissenschaften
  • DARIAH-DE – Forschungsdatenrepositorium für die Geistes- und Kulturwissenschaften
  • Fachspezifisches Repositorium, Suche bspw. über Re3Data
  • GitHub – Repositorium für Software-Entwicklungen
  • Institutionelles, universitäres Repositorium der eigenen Institution
  • TextGrid – Langzeitarchiv für geisteswissenschaftliche Forschungsdaten (bisher existieren keine Erfahrungsberichte mit Texten in asiatischen Sprachen)
  • Zenodo – Fachübergreifendes Repositorium für wissenschaftliche Datensätze, Zugangsbeschränkung möglich  

Um Daten (frei zugänglich) veröffentlichen zu dürfen ist es wichtig, im Vorfeld einige rechtliche Fragen zu klären. Diese betreffen insbesondere urheberrechtsbelastete, sensible und/oder personenbezogene Daten.

Bei personenbezogenen Daten ist zum einen für eine Veröffentlichung immer die Einwilligung der Betroffenen notwendig, zum anderen muss geklärt werden, ob die Daten vollständig anonymisiert werden können.

Wenn das Urheberrecht anderer betroffen ist, bspw. wenn es sich um größere Teile eines (Datenbank-)Werks handelt, sollten unbedingt vorher die Urheber kontaktiert werden.

Forschungsdaten.info hat eine Entscheidungshilfe zum Veröffentlichen von Forschungsdaten (2019) erstellt, die die wichtigsten rechtlichen Aspekte thematisiert.

Im Rahmen des Projekts „FID Asien“ planen wir, einen zentralen Zugriff auf und Suche nach asienbezogenen Forschungsdaten zu entwickeln. Bleiben Sie über unseren Blog auf dem Laufenden.


Wir freuen uns über Ihre Mitarbeit:

  • Nennen Sie uns weitere wichtige Quellen und Repositorien für asienbezogene Forschungsdaten.
  • Teilen Sie uns mit, wo Sie Ihre Daten publiziert haben.
  • Sagen Sie uns, welche Services und Unterstützung Sie sich zum Thema Forschungsdaten wünschen.
  • Fragen Sie uns, wenn Sie Unterstützung brauchen, z.B. beim Erstellen eines Datenmanagementplans, beim Planen und Beschreiben von Forschungsdaten, oder beim Archivieren dieser.

Mit diesen und allen weiteren Fragen können Sie sich gerne jederzeit an uns wenden:
x-asia(at)sbb.spk-berlin.de