Auswirkungen des „dunklen Rand-Artefakts“ in dermatoskopischen Bildern auf die diagnostische Leistungsfähigkeit eines deep learning neuronalen Netzwerkes mit Marktzulassung
- PMID: 34139087
- DOI: 10.1111/ddg.14384_g
Auswirkungen des „dunklen Rand-Artefakts“ in dermatoskopischen Bildern auf die diagnostische Leistungsfähigkeit eines deep learning neuronalen Netzwerkes mit Marktzulassung
Abstract
Hintergrund und ziele: Systeme künstlicher Intelligenz (durch "deep learning" faltende neuronale Netzwerke; engl. convolutional neural networks, CNN) erreichen inzwischen bei der Klassifikation von Hautläsionen vergleichbar gute Ergebnisse wie Dermatologen. Allerdings müssen die Limitationen solcher Systeme vor flächendeckendem klinischem Einsatz bekannt sein. Daher haben wir den Einfluss des "dunklen Rand-Artefakts" (engl. dark corner artefact; DCA) in dermatoskopischen Bildern auf die diagnostische Leistung eines CNN mit Marktzulassung zur Klassifikation von Hautläsionen untersucht.
Patienten und methoden: Ein Datensatz aus 233 Bildern von Hautläsionen (60 maligne und 173 benigne) ohne DCA (Kontrolle) wurde digital so modifiziert, dass kleine, mittlere oder große DCA zu sehen waren. Alle 932 Bilder wurden dann mittels CNN mit Marktzulassung (Moleanalyzer-Pro® , FotoFinder Systems) auf Malignitätsscores hin analysiert. Das Spektrum reichte von 0-1; ein Score von > 0,5 wurde als maligne klassifiziert.
Ergebnisse: In der Kontrollserie ohne DCA erreichte das CNN eine Sensitivität von 90,0 % (79,9 %-95,3 %), eine Spezifität von 96,5 % (92,6 %-98,4 %) sowie eine Fläche unter der Kurve (AUC, area under the curve) der "receiver operating characteristic" (ROC) von 0,961 (0,932-0,989). In den Datensätzen mit kleinen beziehungsweise mittleren DCA war die diagnostische Leistung vergleichbar. In den Bildersätzen mit großen DCA wurden allerdings signifikant höhere Malignitätsscores erzielt. Dies führte zu einer signifikant verminderten Spezifität (87,9 % [82,2 %-91,9 %], P < 0,001) sowie einer nicht signifikant erhöhten Sensitivität (96,7 % [88,6 %-99,1 %]). Die ROC-AUC blieb mit 0,962 (0,935-0,989) unverändert.
Schlussfolgerungen: Die Klassifizierung mittels des CNN war bei dermatoskopischen Bildern mit kleinen oder mittleren DCA nicht beeinträchtigt, das System zeigte jedoch Schwächen bei großen DCA. Wenn Ärzte solche Bilder zur Klassifikation mittels CNN einreichen, sollten sie sich dieser Grenzen der Technologie bewusst sein.
© 2021 The Authors. Journal der Deutschen Dermatologischen Gesellschaft published by John Wiley & Sons Ltd on behalf of Deutsche Dermatologische Gesellschaft.
References
Literatur
-
- Arnold M, Holterhues C, Hollestein LM et al. Trends in incidence and predictions of cutaneous melanoma across Europe up to 2015. J Eur Acad Dermatol Venereol 2014; 28: 1170-8.
-
- Lomas A, Leonardi-Bee J, Bath-Hextall F. A systematic review of worldwide incidence of nonmelanoma skin cancer. Br J Dermatol 2012; 166: 1069-80.
-
- Karimkhani C, Green AC, Nijsten T et al. The global burden of melanoma: results from the Global Burden of Disease Study 2015. Br J Dermatol 2017; 177: 134-40.
-
- Breslow A. Thickness, cross-sectional areas and depth of invasion in the prognosis of cutaneous melanoma. Ann Surg 1970; 172: 902-8.
-
- Hoorens I, Vossaert K, Ongenae K, Brochez L. Is early detection of basal cell carcinoma worthwhile? Systematic review based on the WHO criteria for screening. Br J Dermatol 2016; 174: 1258-65.
Publication types
LinkOut - more resources
Full Text Sources
Miscellaneous
