Improving prediction of COVID-19 mortality using machine learning in the Spanish SEMI-COVID-19 registry

José-Manuel Casas-Rojo^#¹, Paula Sol Ventura^#², Juan Miguel Antón Santos³, Aitor Ortiz de Latierro⁴, José Carlos Arévalo-Lorido⁵, Marc Mauri⁴, Manuel Rubio-Rivas⁶, Rocío González-Vega⁷, Vicente Giner-Galvañ⁸, Bárbara Otero Perpiñá⁹, Eva Fonseca-Aizpuru¹⁰, Antonio Muiño¹¹, Esther Del Corral-Beamonte¹², Ricardo Gómez-Huelgas¹³, Francisco Arnalich-Fernández¹⁴, Mónica Llorente Barrio¹⁵, Aresio Sancha-Lloret¹⁶, Isabel Rábago Lorite¹⁷, José Loureiro-Amigo¹⁸, Santiago Pintos-Martínez¹⁹, Eva García-Sardón²⁰, Adrián Montaño-Martínez²¹, María Gloria Rojano-Rivero²², José-Manuel Ramos-Rincón²³, Alejandro López-Escobar²⁴; SEMI-COVID-19 Network

Affiliations

¹ Internal Medicine Department, Infanta Cristina University Hospital, Parla, 28981, Madrid, Spain.
² Department of Pediatric Endocrinology, Hospital HM Nens, HM Hospitales, 08009, Barcelona, Spain.
³ Internal Medicine Department, Hospital Universitario Infanta Cristina. Parla, Madrid, Spain.
⁴ Data Scientist, Kaizen AI, Barcelona, Spain.
⁵ Internal Medicine Department, Complejo Hospitalario Universitario, Badajoz, Spain.
⁶ Internal Medicine Department, Bellvitge University Hospital, Hospitalet de Llobregat, Barcelona, Spain.
⁷ Internal Medicine Department, Hospital Costa del Sol, Marbella, Málaga, Spain.
⁸ Internal Medicine Department, Hospital Universitario San Juan. San Juan de Alicante, Alicante, Spain.
⁹ Internal Medicine Department, Hospital Universitario 12 de Octubre, Madrid, Spain.
¹⁰ Internal Medicine Department, Hospital Universitario de Cabueñes, Gijón, Asturias, Spain.
¹¹ Internal Medicine Department, Hospital Universitario Gregorio Marañón, Madrid, Spain.
¹² Clinical Medicine Department, Hospital Royo Villanova, Saragossa, Spain.
¹³ Internal Medicine Department, Regional University Hospital of Málaga, Biomedical Research Institute of Málaga (IBIMA), University of Málaga (UMA), Málaga, Spain.
¹⁴ Internal Medicine Department, Hospital Universitario La Paz- Cantoblanco, Madrid, Spain.
¹⁵ Internal Medicine Department, Hospital Universitario Miguel Servet, Saragossa, Spain.
¹⁶ Internal Medicine Department, Hospital Universitario La Princesa, Madrid, Spain.
¹⁷ Internal Medicine Department, Hospital Universitario Infanta Sofía. San Sebastián de los Reyes, Madrid, Spain.
¹⁸ Internal Medicine Department, Hospital Moisès Broggi, Sant Joan Despí, Barcelona, Spain.
¹⁹ Internal Medicine Department, Hospital Universitario de Sagunto, Puerto de Sagunto, Valencia, Spain.
²⁰ Internal Medicine Department, Hospital Universitario de Cáceres, Cáceres, Spain.
²¹ Internal Medicine Department, Hospital de Montilla, Córdoba, Spain.
²² Internal Medicine Department, Hospital Infanta Elena, Huelva, Spain.
²³ Clinical Medicine Department, Miguel Hernandez University of Elche, 03550, Alicante, Spain. jramosrincon@gmail.com.
²⁴ Pediatrics Department, Clinical Research Unit, Hospital Universitario Vithas Madrid La Milagrosa, Fundación Vithas, Madrid, Spain. lopezea@vithas.es.

^# Contributed equally.

PMID: 37349618
DOI: 10.1007/s11739-023-03338-0

Improving prediction of COVID-19 mortality using machine learning in the Spanish SEMI-COVID-19 registry

José-Manuel Casas-Rojo et al. Intern Emerg Med. 2023 Sep.

. 2023 Sep;18(6):1711-1722.

doi: 10.1007/s11739-023-03338-0. Epub 2023 Jun 22.

Authors

Affiliations

¹ Internal Medicine Department, Infanta Cristina University Hospital, Parla, 28981, Madrid, Spain.
² Department of Pediatric Endocrinology, Hospital HM Nens, HM Hospitales, 08009, Barcelona, Spain.
³ Internal Medicine Department, Hospital Universitario Infanta Cristina. Parla, Madrid, Spain.
⁴ Data Scientist, Kaizen AI, Barcelona, Spain.
⁵ Internal Medicine Department, Complejo Hospitalario Universitario, Badajoz, Spain.
⁶ Internal Medicine Department, Bellvitge University Hospital, Hospitalet de Llobregat, Barcelona, Spain.
⁷ Internal Medicine Department, Hospital Costa del Sol, Marbella, Málaga, Spain.
⁸ Internal Medicine Department, Hospital Universitario San Juan. San Juan de Alicante, Alicante, Spain.
⁹ Internal Medicine Department, Hospital Universitario 12 de Octubre, Madrid, Spain.
¹⁰ Internal Medicine Department, Hospital Universitario de Cabueñes, Gijón, Asturias, Spain.
¹¹ Internal Medicine Department, Hospital Universitario Gregorio Marañón, Madrid, Spain.
¹² Clinical Medicine Department, Hospital Royo Villanova, Saragossa, Spain.
¹³ Internal Medicine Department, Regional University Hospital of Málaga, Biomedical Research Institute of Málaga (IBIMA), University of Málaga (UMA), Málaga, Spain.
¹⁴ Internal Medicine Department, Hospital Universitario La Paz- Cantoblanco, Madrid, Spain.
¹⁵ Internal Medicine Department, Hospital Universitario Miguel Servet, Saragossa, Spain.
¹⁶ Internal Medicine Department, Hospital Universitario La Princesa, Madrid, Spain.
¹⁷ Internal Medicine Department, Hospital Universitario Infanta Sofía. San Sebastián de los Reyes, Madrid, Spain.
¹⁸ Internal Medicine Department, Hospital Moisès Broggi, Sant Joan Despí, Barcelona, Spain.
¹⁹ Internal Medicine Department, Hospital Universitario de Sagunto, Puerto de Sagunto, Valencia, Spain.
²⁰ Internal Medicine Department, Hospital Universitario de Cáceres, Cáceres, Spain.
²¹ Internal Medicine Department, Hospital de Montilla, Córdoba, Spain.
²² Internal Medicine Department, Hospital Infanta Elena, Huelva, Spain.
²³ Clinical Medicine Department, Miguel Hernandez University of Elche, 03550, Alicante, Spain. jramosrincon@gmail.com.
²⁴ Pediatrics Department, Clinical Research Unit, Hospital Universitario Vithas Madrid La Milagrosa, Fundación Vithas, Madrid, Spain. lopezea@vithas.es.

^# Contributed equally.

PMID: 37349618
DOI: 10.1007/s11739-023-03338-0

Abstract

COVID-19 is responsible for high mortality, but robust machine learning-based predictors of mortality are lacking. To generate a model for predicting mortality in patients hospitalized with COVID-19 using Gradient Boosting Decision Trees (GBDT). The Spanish SEMI-COVID-19 registry includes 24,514 pseudo-anonymized cases of patients hospitalized with COVID-19 from 1 February 2020 to 5 December 2021. This registry was used as a GBDT machine learning model, employing the CatBoost and BorutaShap classifier to select the most relevant indicators and generate a mortality prediction model by risk level, ranging from 0 to 1. The model was validated by separating patients according to admission date, using the period 1 February to 31 December 2020 (first and second waves, pre-vaccination period) for training, and 1 January to 30 November 2021 (vaccination period) for the test group. An ensemble of ten models with different random seeds was constructed, separating 80% of the patients for training and 20% from the end of the training period for cross-validation. The area under the receiver operating characteristics curve (AUC) was used as a performance metric. Clinical and laboratory data from 23,983 patients were analyzed. CatBoost mortality prediction models achieved an AUC performance of 84.76 (standard deviation 0.45) for patients in the test group (potentially vaccinated patients not included in model training) using 16 features. The performance of the 16-parameter GBDT model for predicting COVID-19 hospital mortality, although requiring a relatively large number of predictors, shows a high predictive capacity.

Keywords: COVID-19; Deep learning; Machine learning; Mortality; Spain.

PubMed Disclaimer

Comment in

Artificial intelligence for COVID-19 mortality prediction: improvement of risk stratification and clinical decision-making.
Riela PM. Riela PM. Intern Emerg Med. 2023 Sep;18(6):1617-1618. doi: 10.1007/s11739-023-03358-w. Epub 2023 Jul 14. Intern Emerg Med. 2023. PMID: 37452261 No abstract available.

References

1. Zhang R, Li Y, Zhang AL et al (2020) Identifying airborne transmission as the dominant route for the spread of COVID-19. Proc Natl Acad Sci U S A 117:14857–14863. https://doi.org/10.1073/PNAS.2009637117 - DOI - PubMed - PMC
1. Driggin E, Madhavan MV, Bikdeli B et al (2020) Cardiovascular considerations for patients, health care workers, and health systems during the COVID-19 pandemic. J Am Coll Cardiol 75:2352–2371. https://doi.org/10.1016/J.JACC.2020.03.031 - DOI - PubMed - PMC
1. COVID-19 Map - Johns hopkins coronavirus resource center. https://coronavirus.jhu.edu/map.html . Accessed 12 Mar 2023
1. Casas-Rojo JM, Antón-Santos JM, Millán-Núñez-Cortés J et al (2020) Clinical characteristics of patients hospitalized with COVID-19 in Spain: results from the SEMI-COVID-19 registry. Rev Clin Esp 220:480–494. https://doi.org/10.1016/j.rce.2020.07.003 - DOI - PubMed - PMC
1. Richardson S, Hirsch JS, Narasimhan M et al (2020) Presenting characteristics, comorbidities, and outcomes among 5700 patients hospitalized with COVID-19 in the New York City area. JAMA 323:2052–2059. https://doi.org/10.1001/JAMA.2020.6775 - DOI - PubMed - PMC

MeSH terms

Actions
Actions
Actions
Actions
Actions

LinkOut - more resources

Full Text Sources
- Springer
Medical
- MedlinePlus Health Information

Save citation to file

Email citation

Add to Collections

Add to My Bibliography

Your saved search

Create a file for external citation management software

Your RSS Feed

Improving prediction of COVID-19 mortality using machine learning in the Spanish SEMI-COVID-19 registry

Affiliations

Improving prediction of COVID-19 mortality using machine learning in the Spanish SEMI-COVID-19 registry

Authors

Affiliations

Abstract

Comment in

References

MeSH terms

LinkOut - more resources

Full Text Sources

Medical