[FAIRification of real world data for health research]
- PMID: 40479265
- PMCID: PMC9516507
- DOI: 10.1007/s11553-022-00973-x
[FAIRification of real world data for health research]
Abstract
Background: The provision of real-world data according to the FAIR principles is prerequisite for an efficient exploitation of the potential of health data for prevention and care.
Objectives: To discuss the opportunities and limitations of reuse and record linkage of health data in Germany.
Materials and methods: Initiatives to establish an improved research data infrastructure are presented and the limitations that hinder record linkage of personal health data are illustrated using an example.
Results: In general, health data in Germany do not meet the requirements of the FAIR principles. Their findability already fails because either no metadata are available or they are not posted in searchable repositories in a standardized way. Record linkage of personal health data is extremely limited by restrictive data protection regulations and the lack of a so-called unique identifier. Privacy-compliant solutions for linking health data, which are successfully practiced in neighboring European countries, could serve as a model here.
Conclusions: The establishment of a National Research Data Infrastructure (NFDI), especially for personal health data (NFDI4Health), can only be realized with considerable efforts and legislative changes. Already existing structures and standards that have been for instance developed by the Medical Informatics Initiative and the Netzwerk Universitätsmedizin (English: University Medicine Network), and international initiatives such as the European Open Science Cloud should be taken into consideration.
Hintergrund: Die Bereitstellung von Real-World-Daten im Sinne der FAIR-Prinzipien ist die Voraussetzung einer effizienten Ausschöpfung des Potenzials von Gesundheitsdaten für Prävention und Versorgung.
Ziel der Arbeit: Möglichkeiten und Limitationen der Nachnutzung und Verknüpfung von Gesundheitsdaten in Deutschland werden dargestellt.
Material und Methoden: Es werden Initiativen zur Schaffung einer verbesserten Forschungsdateninfrastruktur vorgestellt und an einem Beispiel die Einschränkungen illustriert, die das Record Linkage personenbezogener Gesundheitsdaten behindern.
Ergebnisse: In der Regel erfüllen Gesundheitsdaten in Deutschland nicht die Anforderungen der FAIR-Prinzipien. Ihre Auffindbarkeit scheitert bereits daran, dass entweder keine Metadaten zur Verfügung stehen oder diese nicht standardisiert in suchbare Repositorien eingestellt werden. Die Verknüpfung von personenbezogenen Gesundheitsdaten ist durch restriktive Datenschutzbestimmungen und das Fehlen eines sog. Unique Identifiers extrem eingeschränkt. Datenschutzkonforme Lösungen für die Verknüpfung von Gesundheitsdaten, die in europäischen Nachbarländern erfolgreich praktiziert werden, könnten hier als Vorbild dienen.
Schlussfolgerung: Die Schaffung einer Nationalen Forschungsdateninfrastruktur (NFDI), insbesondere für personenbezogene Gesundheitsdaten (NFDI4Health), ist nur mit erheblichen Anstrengungen und Gesetzesänderungen realisierbar. Bereits vorliegende Strukturen und Standards, wie sie z. B. durch die Medizininformatik-Initiative und das Netzwerk Universitätsmedizin geschaffen wurden, sowie internationale Initiativen wie z. B. die European Open Science Cloud müssen dabei berücksichtigt werden.
Keywords: Data protection; FAIR principles; Linkage of person-related health data; National Research Data Infrastructure; Unique identifier.
© The Author(s) 2022.
Figures

Similar articles
-
[FAIR health data in the national and international data space].Bundesgesundheitsblatt Gesundheitsforschung Gesundheitsschutz. 2024 Jun;67(6):710-720. doi: 10.1007/s00103-024-03884-8. Epub 2024 May 15. Bundesgesundheitsblatt Gesundheitsforschung Gesundheitsschutz. 2024. PMID: 38750239 Free PMC article. German.
-
Toward a Domain-Overarching Metadata Schema for Making Health Research Studies FAIR (Findable, Accessible, Interoperable, and Reusable): Development of the NFDI4Health Metadata Schema.JMIR Med Inform. 2025 May 21;13:e63906. doi: 10.2196/63906. JMIR Med Inform. 2025. PMID: 40397930 Free PMC article.
-
From Raw Data to FAIR Data: The FAIRification Workflow for Health Research.Methods Inf Med. 2020 Jun;59(S 01):e21-e32. doi: 10.1055/s-0040-1713684. Epub 2020 Jul 3. Methods Inf Med. 2020. PMID: 32620019
-
Initiatives, Concepts, and Implementation Practices of the Findable, Accessible, Interoperable, and Reusable Data Principles in Health Data Stewardship: Scoping Review.J Med Internet Res. 2023 Aug 28;25:e45013. doi: 10.2196/45013. J Med Internet Res. 2023. PMID: 37639292 Free PMC article.
-
Position paper on management of personal data in environment and health research in Europe.Environ Int. 2022 Jul;165:107334. doi: 10.1016/j.envint.2022.107334. Epub 2022 Jun 6. Environ Int. 2022. PMID: 35696847 Review.
References
-
- Ammon D, Bietenbeck A, Boeker M, Ganslandt T, Heckmann S, Heitmann K, Sax U, Schepers J, Semler SC, Thun S, Zautke A (2019) Der Kerndatensatz der Medizininformatik-Initiative – Interoperable Spezifikation am Beispiel der Laborbefunde mittels LOINC und FHIR. Forum Med Dokumentation Med Inform 21:113–117
-
- Bundesgesetzblatt (2021) Gesetz zur Zusammenführung von Krebsregisterdaten. http://www.bgbl.de/xaver/bgbl/start.xav?startbk=Bundesanzeiger_BGBl&jump.... Zugegriffen: 22. Juni 2022
-
- Bundesministerium des Inneren und für Heimat (2020) eID-Server. https://www.personalausweisportal.de/Webs/PA/DE/wirtschaft/technik/eID-s.... Zugegriffen: 20. Apr. 2022
-
- Bundesministerium für Bildung und Forschung (2021) CODEX bündelt Daten für die Covid-19-Forschung. https://www.gesundheitsforschung-bmbf.de/de/codex-bundelt-daten-fur-die-.... Zugegriffen: 23. Nov. 2021
-
- DataCite (2022) https://datacite.org/. Zugegriffen: 9. Mai 2022
Publication types
LinkOut - more resources
Full Text Sources