[Comparison of Hungarian Central Statistical Office's causes of death data with the database of the Hungarian National Cancer Registry]
- PMID: 36088625
- DOI: 10.1556/650.2022.32573
[Comparison of Hungarian Central Statistical Office's causes of death data with the database of the Hungarian National Cancer Registry]
Abstract
Introduction: In international comparison, Hungary is in the forefront of cancer incidence and mortality statistics. Based on paper-based death certificates, mortality statistics are compiled by the Hungarian Central Statistical Office, while population-based measures of cancer incidences are performed by the Hungarian National Cancer Registry. Objective: Linking the records of these two independent databases can highlight their weaknesses and provide an opportunity to reconcile and verify collected data, which may emphasize the need to expand current data exchange protocols. Method: Based on the Hungarian unique health care insurance ID, the mortality database of the Hungarian Central Statistical Office between 2012 and 2020 was compared with the data of the Hungarian National Cancer Registry from 2001 to 2020. Deaths in 2018, in particular those related to lung cancer, were examined in more depth to demonstrate the biases resulting from erroneous data collection. Results: The mortality database of the Hungarian Central Statistical Office contained 32 586 cases with an underlying cause of death of malignant neoplasm for 2018, of which 29 970 were identified in the Hungarian National Cancer Registry. Out of the 8716 deaths coded to lung cancer, 7957 corresponding individuals were also found in the Registry. From the matches, 7381 cases were marked with lung cancer in the Hungarian National Cancer Registry. For the remaining 576 cases, the Registry recorded different types of cancers, of which in 69 cases with lung metastasis. Discussion: The differences between the two databases may be caused by methodological differences in data collection, incomplete, inaccurate reporting and differences in processing algorithms. Nevertheless, the majority of the data in the examined databases were found to be appropriate for epidemiological studies. Conclusion: Based on the outcomes of the present analysis, a revision of the data transfer between the two institutions is in order. The introduction of electronic Death certificate recording and validity checks are expected to improve the reliability of ID numbers and may shorten data processing times.
Bevezetés: Nemzetközi összehasonlításban a rosszindulatú daganatos incidencia és mortalitás tekintetében Magyarország az élvonalba tartozik. A halálozási statisztikát a Központi Statisztikai Hivatal a hatpéldányos Halottvizsgálati bizonyítványok feldolgozása alapján készíti el, míg az új daganatos betegségek előfordulásának populációalapú mérését a Nemzeti Rákregiszter végzi. Célkitűzés: A Központi Statisztikai Hivatal és a Nemzeti Rákregiszter független adatbázisainak összekapcsolása rávilágíthat egymás gyengeségeire, emellett lehetőséget teremt az adatok verifikációjára, pontosítására, kiegészítésére, valamint a jelenlegi adatcsere bővítésének szükségességére. Módszer: A Központi Statisztikai Hivatal 2012 és 2020 közötti halálozási adatait a társadalombiztosítási azonosító jel alapján kötöttük össze a Nemzeti Rákregiszter 2001 és 2020 közötti adatbázisával. A 2018-ra vonatkozó – főképpen tüdőrákos – haláleseteket mélyebb vizsgálatnak vetettük alá, mellyel az adatbevitel hiányosságai mellett a két állomány közötti eltéréseket is demonstráltuk. Eredmények: A Központi Statisztikai Hivatal 2018-ra vonatkozó halálozási adatbázisában 32 586 esetben rosszindulatú daganat volt a statisztikai közlésre kiválasztott elsődleges halálok, melyből a Nemzeti Rákregiszterben 29 970-et azonosítottunk. A Központi Statisztikai Hivatal adatai között 8716, statisztikai közlésre kiválasztott tüdőrákos halálesetből 7957 személyt találtunk meg a Regiszterben. A 7957 egyezésből a Nemzeti Rákregiszterben 7381-hez tartozott tüdőrákos diagnózis. A fennmaradó 576 esetet a Regiszter más daganattal rögzítette, a leggyakrabban, 69 esetben tüdőáttét szerepelt. Megbeszélés: A két adatbázis közötti eltérés adódhat az adatfelvételek metodikai különbségeiből, a jelentési fegyelem problémáiból, a hiányos, pontatlan kitöltésből és a feldolgozási algoritmusok különbözőségéből. Mindazonáltal a vizsgált adatbázisok tartalmának döntő hányada értékes információt tartalmaz, ezért alkalmasak adattudományi vizsgálatokra. Következtetés: A jelen elemzés tapasztalatai alapján a két intézmény közötti adatátadás felülvizsgálata várható. Emellett az elektronikus Halottvizsgálati bizonyítvány bevezetése vélhetően javítani fogja a társadalombiztosítási azonosító jel kitöltöttség megbízhatóságát, ráadásul a rendszerbe épített ellenőrzéseknek köszönhetően a kitöltés minősége javulhat, a feldolgozás ideje lerövidülhet. Orv Hetil. 2022; 163(37): 1481–1489.
Keywords: adatbázis-összekapcsolás; big data; cancer incidence; daganatos incidencia; halandóság; mortality; record linkage; ’big data’.
MeSH terms
Grants and funding
LinkOut - more resources
Full Text Sources
Medical
