. 2023 Oct;42(5):101248.

doi: 10.1016/j.accpm.2023.101248. Epub 2023 May 20.

Availability of information needed to evaluate algorithmic fairness - A systematic review of publicly accessible critical care databases

Nicholas Fong¹, Erica Langnas², Tyler Law³, Mallika Reddy⁴, Michael Lipnick³, Romain Pirracchio⁵

Affiliations

¹ Department of Anesthesia and Perioperative Medicine, Zuckerberg San Francisco General Hospital and Trauma Center, University of California San Francisco, San Francisco, CA, United States; School of Medicine, University of California San Francisco, San Francisco, CA, United States.
² Department of Anesthesia and Perioperative Medicine, Zuckerberg San Francisco General Hospital and Trauma Center, University of California San Francisco, San Francisco, CA, United States; Philip R. Lee Institute for Health Policy Studies at UCSF, San Francisco, CA, United States; Center for Health Equity in Surgery and Anesthesia University of California San Francisco, San Francisco, CA, United States.
³ Department of Anesthesia and Perioperative Medicine, Zuckerberg San Francisco General Hospital and Trauma Center, University of California San Francisco, San Francisco, CA, United States; Center for Health Equity in Surgery and Anesthesia University of California San Francisco, San Francisco, CA, United States.
⁴ Division of Biostatistics, School of Public Health, University of California Berkeley, Berkeley, CA, United States.
⁵ Department of Anesthesia and Perioperative Medicine, Zuckerberg San Francisco General Hospital and Trauma Center, University of California San Francisco, San Francisco, CA, United States; Division of Biostatistics, School of Public Health, University of California Berkeley, Berkeley, CA, United States. Electronic address: Romain.Pirracchio@ucsf.edu.

PMID: 37211215
DOI: 10.1016/j.accpm.2023.101248

Availability of information needed to evaluate algorithmic fairness - A systematic review of publicly accessible critical care databases

Nicholas Fong et al. Anaesth Crit Care Pain Med. 2023 Oct.

. 2023 Oct;42(5):101248.

doi: 10.1016/j.accpm.2023.101248. Epub 2023 May 20.

Authors

Nicholas Fong¹, Erica Langnas², Tyler Law³, Mallika Reddy⁴, Michael Lipnick³, Romain Pirracchio⁵

Affiliations

¹ Department of Anesthesia and Perioperative Medicine, Zuckerberg San Francisco General Hospital and Trauma Center, University of California San Francisco, San Francisco, CA, United States; School of Medicine, University of California San Francisco, San Francisco, CA, United States.
² Department of Anesthesia and Perioperative Medicine, Zuckerberg San Francisco General Hospital and Trauma Center, University of California San Francisco, San Francisco, CA, United States; Philip R. Lee Institute for Health Policy Studies at UCSF, San Francisco, CA, United States; Center for Health Equity in Surgery and Anesthesia University of California San Francisco, San Francisco, CA, United States.
³ Department of Anesthesia and Perioperative Medicine, Zuckerberg San Francisco General Hospital and Trauma Center, University of California San Francisco, San Francisco, CA, United States; Center for Health Equity in Surgery and Anesthesia University of California San Francisco, San Francisco, CA, United States.
⁴ Division of Biostatistics, School of Public Health, University of California Berkeley, Berkeley, CA, United States.
⁵ Department of Anesthesia and Perioperative Medicine, Zuckerberg San Francisco General Hospital and Trauma Center, University of California San Francisco, San Francisco, CA, United States; Division of Biostatistics, School of Public Health, University of California Berkeley, Berkeley, CA, United States. Electronic address: Romain.Pirracchio@ucsf.edu.

PMID: 37211215
DOI: 10.1016/j.accpm.2023.101248

Abstract

Background: Machine learning (ML) may improve clinical decision-making in critical care settings, but intrinsic biases in datasets can introduce bias into predictive models. This study aims to determine if publicly available critical care datasets provide relevant information to identify historically marginalized populations.

Method: We conducted a review to identify the manuscripts that report the training/validation of ML algorithms using publicly accessible critical care electronic medical record (EMR) datasets. The datasets were reviewed to determine if the following 12 variables were available: age, sex, gender identity, race and/or ethnicity, self-identification as an indigenous person, payor, primary language, religion, place of residence, education, occupation, and income.

Results: 7 publicly available databases were identified. Medical Information Mart for Intensive Care (MIMIC) reports information on 7 of the 12 variables of interest, Sistema de Informação de Vigilância Epidemiológica da Gripe (SIVEP-Gripe) on 7, COVID-19 Mexican Open Repository on 4, and eICU on 4. Other datasets report information on 2 or fewer variables. All 7 databases included information about sex and age. Four databases (57%) included information about whether a patient identified as native or indigenous. Only 3 (43%) included data about race and/or ethnicity. Two databases (29%) included information about residence, and one (14%) included information about payor, language, and religion. One database (14%) included information about education and patient occupation. No databases included information on gender identity and income.

Conclusion: This review demonstrates that critical care publicly available data used to train AI algorithms do not include enough information to properly look for intrinsic bias and fairness issues towards historically marginalized populations.

Keywords: Artificial Intelligence; Bias; Dataset; Fairness; Machine learning; Publicly available.

PubMed Disclaimer

Cited by

Fairness of machine learning readmission predictions following open ventral hernia repair.
Zander T, Kendall MA, Wolansky RL, Grimsley EA, Parikh R, Sujka J, Kuo PC. Zander T, et al. Surg Endosc. 2025 Aug;39(8):5035-5045. doi: 10.1007/s00464-025-11927-7. Epub 2025 Jul 7. Surg Endosc. 2025. PMID: 40624414 Free PMC article.
Trash in/trash out? Using routinely collected clinical data for data science in the ICU: Con.
Pörteners B, Jung C, Meyfroidt G. Pörteners B, et al. Intensive Care Med. 2025 Feb;51(2):382-384. doi: 10.1007/s00134-024-07739-3. Epub 2024 Dec 23. Intensive Care Med. 2025. PMID: 39714609 No abstract available.
Examining inclusivity: the use of AI and diverse populations in health and social care: a systematic review.
Marko JGO, Neagu CD, Anand PB. Marko JGO, et al. BMC Med Inform Decis Mak. 2025 Feb 5;25(1):57. doi: 10.1186/s12911-025-02884-1. BMC Med Inform Decis Mak. 2025. PMID: 39910518 Free PMC article.
Implicit bias in ICU electronic health record data: measurement frequencies and missing data rates of clinical variables.
Shi J, Hubbard AE, Fong N, Pirracchio R. Shi J, et al. BMC Med Inform Decis Mak. 2025 Jul 1;25(1):241. doi: 10.1186/s12911-025-03058-9. BMC Med Inform Decis Mak. 2025. PMID: 40598240 Free PMC article.

Publication types

Actions

MeSH terms

Actions
Actions
Actions
Actions
Actions
Actions
Actions
Actions

LinkOut - more resources

Full Text Sources
- ClinicalKey
- Elsevier Science
Medical
- MedlinePlus Health Information

Save citation to file

Email citation

Add to Collections

Add to My Bibliography

Your saved search

Create a file for external citation management software

Your RSS Feed

Availability of information needed to evaluate algorithmic fairness - A systematic review of publicly accessible critical care databases

Affiliations

Availability of information needed to evaluate algorithmic fairness - A systematic review of publicly accessible critical care databases

Authors

Affiliations

Abstract

Similar articles

Cited by

Publication types

MeSH terms

LinkOut - more resources

Full Text Sources

Medical

Abstract

Similar articles

Cited by

Publication types

MeSH terms

Related information

LinkOut - more resources

Full Text Sources

Medical