Skip to main page content
U.S. flag

An official website of the United States government

Dot gov

The .gov means it’s official.
Federal government websites often end in .gov or .mil. Before sharing sensitive information, make sure you’re on a federal government site.

Https

The site is secure.
The https:// ensures that you are connecting to the official website and that any information you provide is encrypted and transmitted securely.

Access keys NCBI Homepage MyNCBI Homepage Main Content Main Navigation
. 2023 Oct 2;61(Suppl 3):S503-S509.
doi: 10.5281/zenodo.8319834.

[Numerical expression of the clinical course of the disease. Data management]

[Article in Spanish]
Affiliations

[Numerical expression of the clinical course of the disease. Data management]

[Article in Spanish]
Juan Osvaldo Talavera et al. Rev Med Inst Mex Seguro Soc. .

Abstract

Data management "behind the scenes" refers to collection, cleaning, imputation, and demarcation; and despite of being indispensable processes, they are usually neglected and thus, generate erroneous information. During the collection are errors: omission of covariates, deviation from the objective, and insufficient quality. The omission of covariates distorts the result attributed to the main manoeuvre. Deviation from the primary objective commonly occurs when the outcome is rare, delayed, or subjective and promotes substitution by non-equivalent surrogate variables. Moreover, insufficient quality occurs due to inadequate instruments, omission of the measurement procedure, or measurements out of context, such as attribution at the wrong time or equivalent. Furthermore, cleaning implies identifying erroneous, extreme, and missing values, which may or may not be imputed, depending on the percentage. The values of the manoeuvre or the outcome are never imputed, nor are patients eliminated due to a lack of values. Finally, the demarcation of each variable seeks to give it a clinical meaning about the outcome, for which a hierarchical sequence of criteria is followed: 1) previous clinical study, 2) expert agreement, 3) clinical judgment of the investigator/investigators, and 4) statistics. Acting without quality controls in data management frequently causes involuntary lies and confuses instead of clarifying.

El manejo de datos “tras bambalinas” se refiere a los procesos de recopilación, limpieza, imputación y demarcación; los cuales, aun siendo indispensables, usualmente suelen ser descuidados, por lo que generan información errónea. Durante la recopilación son errores: omisión de covariables, desvío del objetivo, y calidad insuficiente. La omisión de covariables distorsiona el resultado atribuido a la maniobra principal. El desvío del objetivo primario es común cuando el desenlace es raro, tardado o subjetivo y promueve la sustitución por variables subrogadas no equivalentes. Además, la calidad insuficiente, sucede por instrumentos inadecuados, omisión del procedimiento de medición, o medición fuera de contexto -como atribución a destiempo o equivalente-. Por otro lado, la limpieza implica identificar valores erróneos, extremos y faltantes, que podrán ser o no imputados, dependiendo del porcentaje se imputará comúnmente por la medida de resumen. Nunca se imputan los valores de la maniobra ni del desenlace, ni se eliminan pacientes por falta de valores. Finalmente, la demarcación de cada variable busca un significado clínico en referencia al desenlace, para ello se sigue una secuencia jerárquica de criterios: 1) estudio clínico previo, 2) acuerdo de expertos, 3) juicio clínico del investigador/investigadores y 4) estadística. Actuar sin controles de calidad en el manejo de datos provoca frecuentemente mentiras involuntarias y confunde en lugar de esclarecer.

Keywords: Clinical Epidemiology; Data Collection; Data Management; Statistics.

PubMed Disclaimer

Conflict of interest statement

los autores han completado y enviado la forma traducida al español de la declaración de conflictos potenciales de interés del Comité Internacional de Editores de Revistas Médicas, y no fue reportado alguno que tuviera relación con este artículo.

Figures

Cuadro I
Cuadro I. Manejo de datos.

References

    1. Talavera JO, Roy-García IA, Pérez-Rodríguez M, Palacios-Cruz L, Rivas-Ruíz R. De vuelta a la clínica. Métodos II. Arquitectura de la investigación clínica. Interacción sujeto, maniobras y enfermedad a través del tiempo. Gac Med Mex. 2020;156(5):438–446. doi: 10.24875/GMM.20000159. - DOI - PubMed
    1. Talavera J. Juicio Clínico: el método científico aplicado a la clínica. Rev Med Inst Mex Seguro Soc. 2019;57(5):267–268. - PubMed
    1. Rothman KJ, Greenland S. Causation and causal inference in epidemiology. Am J Public Health. 2005;95(SUPPL. 1):S144–S150. - PubMed
    1. Evans AS, Henle W, Huebner R, Johnson R, Lilienfeld A. Causation and Disease: The Henle-Koch Postulates Revisited. Yale J Biol Med. 1976;49:175–195. - PMC - PubMed
    1. Yekushalmu J, Palmer CE. On the methodology of investigations of etiologic factors un chronic diseases. Journal of Chronic Disease. 1959:27–40. - PubMed

Publication types