Big data e intervalos de referencia: motivación, prácticas actuales, prerrequisitos de armonización y estandarización y futuras perspectivas en el cálculo de intervalos de referencia mediante métodos indirectos
-
Luisa Martínez-Sánchez
, Fernando Marques-García
Resumen
Los intervalos de referencia son habitualmente empleados como herramienta de apoyo a las decisiones clínicas. En esta revisión se resumen los aspectos relacionados con el big data y los intervalos de referencia, las prácticas actuales, incluyendo los métodos estadísticos, los requisitos de calidad de los datos, incluyendo la armonización y la normalización, y las perspectivas de futuro para la determinación indirecta de intervalos de referencia mediante datos de laboratorio de rutina.
Introducción
Los intervalos de referencia se suelen emplear como herramienta de apoyo a las decisiones clínicas [1]. Una de las principales funciones de los especialistas en laboratorio clínico y medicina de laboratorio es ayudar a los facultativos en la interpretación de los resultados analíticos. Habitualmente los intervalos de referencia hacen referencia al 95% de los resultados de la población de referencia, se suele definir como la media ± 2 veces la desviación estándar (SD) o como los percentiles 0.025 y 0.975 de la población sana [2], [3]. Como resultado, por definición, el 5% de los resultados de individuos sanos quedarán fuera del intervalo de referencia.
Por diferentes razones, existen variaciones intraindividuales e interindividuales de los resultados analíticos por diferentes razones como procesos fisiológicos, diferencias genéticas, factores ambientales o patologías [4]. A la hora de calcular, interpretar y comunicar intervalos de referencia, es importante tener en cuenta dichos factores. La calidad de los intervalos de referencia es tan relevante a la hora de interpretar los resultados como los propios resultados [5]. De este modo, es necesario que los especialistas en laboratorio clínico estén muy familiarizados con los intervalos de referencia, sepan cómo obtener intervalos fiables, y conozcan la evolución de estas estrategias. La cuestión principal es, como expertos, cómo podemos mejorar esta herramienta para permitir una interpretación más sencilla y exacta los resultados analíticos.
Las primeras recomendaciones oficiales sobre la teoría y generación de valores de referencia fueron publicadas por la Federación Internacional de Química Clínica y Medicina de Laboratorio (IFCC) en 1978 [6]. Algunos años antes, en 1969, se formó un panel de expertos con el fin de establecer la primera recomendación en la que, por primera vez, se definió y empleó el término “intervalo de referencia”, en contraposición al ambiguo concepto de “normal” [7]. Tras 1978, basándose en las recomendaciones internacionales, otras sociedades científicas publicaron sus propias recomendaciones [francesa (Société Française de Biologie Clinique, SFBC) [8], española (Sociedad Española de Medicina de Laboratorio, SEQCML) [9], escandinava (Scandinavian Society for Clinical Chemistry) [10], etc]. En 2005, bajo el auspicio de la IFCC, se creó el Comité de Intervalos de Referencia y Valores de Decisión Clínica (C-RIDL). Así mismo, en 2010, el Instituto de Estándares de Laboratorio Clínico (CLSI) publicó una Guía definitiva para la definición, establecimiento y verificación de intervalos de referencia basados en las recomendaciones originales [2], [3]. Este documento ha sido ampliamente utilizado para obtener intervalos de referencia mediante lo que conocemos como "método directo".
Según la recomendación del CLSI [2], [11], los intervalos de referencia se deben calcular seleccionando un mínimo de 120 sujetos sanos para poder calcular intervalos de confianza al 90% [12]. Estos se deben seleccionar una vez conocidas las características de la población sana de referencia. Tras seleccionarlos y verificar que su salud es buena mediante cuestionarios y pruebas médicas y/o físicas, se realiza la extracción de sangre, normalmente en el laboratorio. A continuación, se analizan las muestras y, cuando se dispone de todos los resultados, se calculan los intervalos de referencia mediante un análisis estadístico. Las ventajas de este método son las siguientes: (1) el grupo de referencia está adecuadamente caracterizado y controlado; (2) se pueden emplear métodos estadísticos sencillos para calcular los intervalos de referencia directos (por ejemplo, un método no paramétrico); (3) la definición de valores de referencia y el protocolo están estandarizados. Como posibles desventajas: (1) se puede producir un sesgo de selección, debido a la complejidad que entraña seleccionar 120 sujetos sanos de manera aleatoria, contactarlos y reclutarlos (sesgo muestral). Esto significa que, a la hora de contactar con 120 sujetos de forma aleatoria, inevitablemente se incurrirá en un sesgo al decidir cómo seleccionarlos (por ejemplo seleccionando más individuos en algunos barrios en los que se espera una mejor respuesta), la forma de contactar con ellos (por ejemplo por teléfono, mensaje de texto, redes sociales …) y sobre el tipo de personas que se incluirá en un estudio (por ejemplo el horario en el que deben acudir al hospital puede favorecer a algunos grupos frente a otros); (2) las condiciones preanalíticas pueden no reflejar las de la práctica habitual, ya que las muestras extraídas en atención primaria son sometidas a transporte; (3) no es viable determinar intervalos de referencia por grupos de edad/sexo para aquellas pruebas que varían en función de éstos, como la creatinina sérica, que aumenta rápidamente con la edad y difiere entre hombres y mujeres; (4) términos como “población de referencia” y “salud” son subjetivos, y resulta difícil definir las características de un sujeto sano; (5) es un proceso complejo que conlleva más tiempo, recursos y costes; (7) no es viable para algunas pruebas en determinadas matrices, como el líquido cefalorraquídeo, pleural, peritoneal o sinovial, que son difíciles de obtener en individuos sanos, o en algunas poblaciones como la pediátrica.
La progresiva automatización de los laboratorios clínicos ha proporcionado una mayor capacidad de procesamiento, permitiendo así a laboratorios pequeños fusionarse en un único laboratorio con sistemas altamente automatizados. Esto ha resultado en la centralización de los resultados analíticos de extensas áreas geográficas en un solo sistema de información de laboratorio, con una misma estructura de datos fácilmente exportables. Los métodos indirectos se postulan como una alternativa adecuada al cálculo de intervalos de referencia, ya que resuelve muchos de los inconvenientes de los métodos directos [13]. No obstante, los métodos indirectos presentan algunas limitaciones que debemos considerar: (1) el posible efecto de subgrupos no sanos de población en los intervalos de referencia; (2) aún no existe un método para comprobar si los intervalos de referencia obtenidos son correctos y válidos; (3) se pueden producir errores derivados de variación preanalítica o analítica (por ejemplo, cambios metodológicos, cambio de lote de calibradores o reactivos, problemas con el control de calidad); (4) aunque se han propuesto varios métodos estadísticos, aún no existen recomendaciones oficiales sobre qué método utilizar y cuándo utilizarlos.
Otro aspecto a tener en cuenta es la transferencia de los intervalos de referencia. Según el CLSI EP28-A3c [2], para aplicar unos intervalos de referencia a una población diferente a la población para la cual fueron calculados, es necesario verificar que dichos intervalos son extrapolables a otras poblaciones. Esto significa que el laboratorio deberá determinar si la población con la que se calcularon los intervalos es suficientemente representativa de la población en la que estos se quieren utilizar. Estas consideraciones pueden ser relevantes para las magnitudes en las que existen diferencias significativas entre poblaciones, aunque no deben ser nunca un falso argumento para elegir intervalos locales calculados con poca rigurosidad, en lugar de intervalos obtenidos con un método indirecto sólido en una población con diferencias mínimas o potenciales con respecto a la población original. La aplicación del método indirecto podría resolver este aspecto, permitiendo a cada laboratorio calcular sus propios intervalos de referencia basándose en su propia población.
En esta revisión se resumen aspectos relacionados con el big data y los intervalos de referencia, describiendo las prácticas actuales, requisitos y perspectivas de la determinación indirecta de los intervalos de referencia mediante datos del laboratorio de rutina.
Cómo utilizar el big data para calcular intervalos de referencia
Los métodos indirectos han ganado popularidad en los últimos años, ya que los datos analíticos masivos son más accesibles actualmente. La definición de análisis de big data se basa en el volumen y tamaño del conjunto de datos [14]. Según los MeSH (Medical Subject Headings), desde 2019 se define “big data” como “cantidades extremadamente grandes de datos que requieren un análisis automatizado rápido y a menudo complejo para obtener patrones, tendencias y asociaciones, relacionados con distintos aspectos de entidades humanas y no humanas”. En especialidades médicas, los artículos sobre big data suelen emplear una enorme cantidad de individuos y un gran número de variables [14]. Las principales características del big data se resumen en las tres uves: volumen (tamaño), variedad (diversidad) y velocidad (frecuencia de actualización) [15]. Algunos autores incluyen una cuarta y quinta uve: veracidad [16] y valorización [17]. Por lo tanto, el conjunto de datos analíticos generados por los laboratorios clínicos podría considerarse big data [18]. Además, el uso de la ciencia de datos, definida por MeSH como “un campo interdisciplinar que implica procesos, teorías, conceptos, herramientas y tecnologías y permite revisar, analizar y extraer un conocimiento y una información valiosa, a partir de datos estructurados y no estructurados” está ganando terreno en el campo clínico y se espera que lo siga haciendo en los próximos años [19]. Teniendo en cuenta la cantidad de datos sobre sujetos sanos generados en un laboratorio clínico cada día, junto con el desarrollo de nuevas herramientas de ciencia de datos para distinguir a los individuos sanos de los que no lo son, el potencial de estas tecnologías para conseguir unos intervalos de referencia personalizados queda evidenciado. La extrapolación de datos sobre una pequeña muestra de individuos mediante el método directo se transforma en el uso de datos de población real para definir las características de toda la población mediante el método indirecto [20].
No obstante, aún quedan por resolver algunos inconvenientes relacionados con el uso de big data:
La armonización y normalización de las historias clínicas electrónicas: A pesar de esfuerzos internacionales [21], aún quedan por resolver la falta de normalización no solo entre países, sino en los propios países y entre comunidades autónomas o regiones. La armonización de las historias clínicas en un formato común supondría una importante mejora, no solo para la práctica clínica, sino también para estudios retrospectivos y en la calidad de los datos.
Breve descripción de los métodos estadísticos: diferencias y similitudes
Mientras que en los métodos directos para establecer valores de referencia la clave es la definición adecuada de la población “normal”, en los métodos indirectos el manejo estadístico de los datos es la parte del proceso más importante a la hora de obtener la mejor información posible a partir del conjunto de datos del que se dispone. En los métodos directos, una vez definida la población “normal” a priori, el manejo estadístico de los datos está orientado a decidir qué prueba estadística es la más adecuada. Para ello, se analizan los posibles valores atípicos u outliers (por ejemplo, mediante el método de Tukey) y la normalidad de la distribución para seleccionar el método paramétrico (media ±2 desviaciones estándar) o el no paramétrico (percentiles). Existen varios métodos para comprobar la normalidad de la distribución. Debido al pequeño tamaño muestral de los métodos directos (120 sujetos), la opción preferible es la prueba de Shapiro-Wilk, ya que tiene más poder estadístico que la prueba de Kolmogorov-Smirnov [23].
En los métodos indirectos, los datos generados para el diagnóstico y seguimiento clínico de individuos se utilizan (reutilizan) para identificar nueva información (en este caso, para obtener intervalos de referencia poblacionales). Contar con un método estadístico adecuado es esencial en este caso. Para calcular intervalos de referencia mediante el método indirecto, se deben considerar dos aspectos fundamentales: la selección de la población y el manejo estadísticos de los datos.
Selección de la población
Los aspectos a tener en cuenta son los siguientes [13]:
Fuente de los datos: Se recomienda emplear datos de pacientes de atención primaria y/o pacientes ambulatorios. Los pacientes hospitalizados padecen patologías, se someten a tratamientos de choque con uso intensivo de soluciones intravenosas, etc. lo cual puede introducir ruido en los datos [13]. Sin embargo, algunos de los métodos nuevos permiten emplear datos de pacientes hospitalizados ya que se pueden detectar y eliminar (automáticamente) los resultados patológicos [24].
Tamaño de la población: En el método indirecto, esto no supone una limitación, dado el enorme volumen de datos del que se dispone. A pesar de ello, es preferible definir unos mínimos que garanticen la robustez estadística. De acuerdo con el C-RIDL de la IFCC [13], se recomienda emplear al menos 1.000 datos, con al menos 750 datos por categoría (normalmente por sexo y edad) [25].
Periodo de recopilación de datos: Se recomienda recopilar datos durante al menos un año. De esta forma, se podrá evaluar cualquier posible efecto circadiano o estacional. Además, es importante controlar y monitorizar la estabilidad en el tiempo de los métodos analíticos mediante controles internos y externos (preferiblemente mediante programas externos de garantía de calidad con material conmutable y valores asignados, si los hay) para así reducir la variabilidad causada por cambios en los lotes de reactivos o en los materiales de calibración. Si no se dispone de materiales conmutables externos de calidad, un buen método para comprobar la estabilidad puede ser comparar las medias o medianas diarias, semanales y/o mensuales [26].
Partición de los datos: Diferentes variables pueden ser consideradas para dividir a la población, como edad, sexo, raza o índice de masa corporal. La edad y el sexo son los elementos de partición más habituales. Es necesario verificar que no existen diferencias entre hombres y mujeres o entre grupos de edad del mismo sexo. En caso de existir diferencias estadística o clínicamente relevantes, se deben establecer intervalos de referencia basados en estos grupos, debido a las implicaciones que estos pueden tener para el manejo clínico de los pacientes. Para determinar si es necesaria la partición de datos, se puede realizar la inspección visual de los diagramas de cajas o aplicar pruebas estadísticas como el análisis de varianza (ANOVA) para la comparación de grupos [27], [28]. Las técnicas de regresión e interpolación cúbica (tal como se describen a continuación) permiten la presentación de intervalos de referencia continuos en lugar de categorías por intervalos de 5 o 10 años de edad.
Criterios de exclusión (limpieza previa/filtrado de datos): Dependiendo del contexto del laboratorio, puede ser importante eliminar datos de pacientes con alguna patología concreta, algún subgrupo concreto de enfermedades, en tratamiento con algunos fármacos o cuando la extracción de sangre se ha realizado en casa (por ejemplo, cuando los pacientes no pueden acudir al centro de atención primaria debido a su enfermedad). Si se dispone de información sobre el estado fisiopatológico del paciente, ésta será la mejor manera de establecer los criterios de inclusión y exclusión. Sin embargo, cuando no se dispone de dicha información en el sistema de información del laboratorio, se puede emplear otra información presente en la petición analítica (por ejemplo, especialista que solicita la prueba, combinación de pruebas solicitadas mediante protocolos concretos, etc.). Por ejemplo, a la hora de establecer los intervalos de referencia para la creatinina, se podría excluir a los pacientes derivados por el nefrólogo o urólogo, ya que estos pacientes pueden tener alguna patología renal. Como alternativa, en algunos estudios también se excluyen datos de sujetos que tienen múltiples resultados analíticos [29], ya que ello podría indicar la existencia de alguna patología que requiere seguimiento, pudiendo así introducir algún sesgo en los intervalos de referencia calculados.
Antes de describir la aplicación de métodos estadísticos en este contexto, hay que tener en cuenta dos aspectos:
En lo relativo a los datos de atención primaria (o ambulatorios), un número significativo de estos individuos estarán sanos. Muchas de las determinaciones analíticas se realizan como parte de un chequeo rutinario o para descartar la presencia de una patología (y, en general, pocos resultados serán indicativos de una patología).
Como normal general, la mayor parte de la población del conjunto total de datos mostrará una distribución normal o casi normal. Este aspecto tendrá que evaluarse según el parámetro estudiado, ya que puede producirse alguna desviación dependiente del parámetro.
Análisis estadísticos
Este es un factor crucial de los métodos indirectos. En los diferentes estudios descritos en la literatura [24], [29], [30], [31], [32], [33], [34], [35], [36], [37], [38] los métodos estadísticos empleados se pueden agrupar en dos estrategias:
Grupo A: Basándonos en el conjunto de datos, se aplican técnicas estadísticas para eliminar datos extremos o atípicos (outliers), antes de emplear otros métodos estadísticos para calcular los intervalos de referencia.
Grupo B: Se aplica directamente un método estadístico a todo el conjunto de datos sin eliminar ninguno previamente para calcular los intervalos de referencia.
Grupo A
Cuando se emplea una base de datos global de rutina, existen valores analíticos de individuos sanos y enfermos. Los valores patológicos que se encuentran en los extremos de la distribución de los datos influirán en los intervalos de referencia calculados mediante métodos estadísticos estándar. En la literatura se han descrito diferentes estrategias para eliminar los valores atípicos. Zellner et al. compararon recientemente los diferentes métodos para la eliminación de valores atípicos y concluyeron que el test de Tukey es el más apropiado en la determinación de intervalos de referencia [39].
Esta metodología del grupo A se basa en la premisa de que los datos atípicos eliminados corresponden a individuos no sanos, mientras que los datos restantes corresponden mayoritariamente a individuos sanos. Esta situación es muy común en las bases de datos de rutina, dado que normalmente los valores de los individuos sanos y no sanos se suelen solapar [24] aunque dependiendo de la magnitud, esta premisa puede llevar a errores. Así, para los test con un índice bajo de individualidad (división entre variabilidad interindividual, CVI y variabilidad intraindividual, CVG), existe un alto grado de solapamiento entre los individuos sanos y no sanos, no pudiendo eliminar adecuadamente a las dos poblaciones mediante los métodos de eliminación de outliers. De este modo, los datos de la población no sana que no han sido eliminados pueden influir en los valores de la población sana, afectando a los intervalos de referencia obtenidos. Los autores del proyecto NUMBER emplearon el método de Tukey para eliminar los valores atípicos haciendo uso de magnitudes bioquímicas relacionadas [34], tratando de excluir los datos de poblaciones potencialmente enfermas. Futuros estudios podrían establecer la influencia real de las poblaciones con patologías en los resultados de intervalos de referencia.
Grupo B
Los datos de individuos sanos y no sanos muestran cierto grado de solapamiento, lo cual depende del tipo de test. Basado en esta premisa, se han aplicado métodos estadísticos a las bases de datos de laboratorio, que permiten separar estas dos poblaciones adecuadamente. Para tal fin, existen dos métodos tradicionales basados en estrategias gráficas: el método Hoffmann y el método Bhattacharya [13]. En ambos métodos se trata de identificar a una población normal en el total de la población identificándola como población sana. El objetivo es caracterizar a la mayor parte de la distribución central de todos los datos, representando a la población sana. En estos métodos, la parte central se define mediante puntos de truncamiento. En las bases de datos en las que, además de la población de sujetos sanos, la otra población de individuos (normalmente con patologías) es de un tamaño significativo, la segunda influirá de manera negativa en la determinación de intervalos de referencia cuando se aplica el método Hoffmann. Sin embargo, esta población de pacientes influye menos en el método Bhattacharya [13]. Una limitación importante del método Bhattacharya es la influencia subjetiva del resultado obtenido, ya que es necesario definir el tamaño de los intervalos (bin size data), la localización y el número de intervalos empleados en cada conjunto de datos. En estos dos métodos, la representación gráfica de los datos juega un papel fundamental a la hora de estimar los intervalos de referencia, aunque esta no es necesaria con el método Bhattacharya. En un estudio comparativo entre el método indirecto de Bhattacharya y método directo recomendado por la IFCC, publicado en 1990 [40] se mostraron importantes diferencias en los intervalos de referencia obtenidos. El estudio reveló que las diferencias halladas se debían a los métodos estadísticos empleado y no solo a la población de referencia, y que dichas diferencias dependen además de la forma de la distribución.
Arzideh et al. [33] propusieron un método alternativo (Truncated Maximum Likelihood) a los tradicionales métodos de Hoffmann y Bhattacharya, en el que se considera que la población sana muestra una distribución normal, mientras que la población no sana muestra otro tipo de distribución. Se estiman las funciones de densidad no paramétricas para analizar la distribución de todos los grupos de la muestra (población sana y no sana combinada) mediante la estimación de densidad suavizada de Kernel. A continuación, se obtienen dos funciones de densidad: una para la población sana y otra para lo población no sana. La desviación con respecto a la distribución normal se detecta mediante un test de bondad de ajuste, identificando así a la población no sana. Finalmente, los puntos de intersección entre la función de densidad (sanos y no sanos) muestran el valor de los intervalos de referencia (Zierk et al. [23]) emplearon esta técnica para obtener intervalos de referencia para cada grupo de edad y los combinaron mediante la técnica de splines (cubic smoothing spline, spline cúbico suavizado) para generar intervalos de referencia continuos.
Recientemente, Wosniok y Haeckel propusieron un método alternativo: el chi-cuadrado mínimo truncado (TMC). Para este método, los parámetros de la hipotética distribución normal se calculan de forma preliminar representando los datos en un gráfico Q-Q. El método TMC presupone que los datos de los sujetos sanos sigue una distribución normal y, empleando el chi-cuadrado mínimo, se calcula la media (μ), la desviación típica (σ), la varianza (λ) y la bondad de ajuste de esta distribución para cada intervalo truncado definido por el modelo. Los valores μ, σ, λ del intervalo con la mejor bondad de ajuste se emplean para calcular los intervalos de referencia (al 95%). Antes de calcular los intervalos de referencia, la población se estratifica en grupos de edad y, una vez calculados, se combinan empleando la técnica de splines descrita anteriormente.
Las técnicas de este grupo permiten separar las poblaciones sanas de las no sanas de forma fiable, aunque sean más difíciles de aplicar e interpretar.
Requisitos previos
Para mejorar la interpretación de los informes analíticos en todo el mundo, es necesario que la información sea comparable [41], por tanto, se recomienda la armonización de los informes emitidos por los laboratorios clínicos. Para tal fin, es importante tener en cuenta todos los aspectos del proceso, no solo los aspectos preanalíticos y analíticos, sino también la nomenclatura, terminología, unidades, formato, intervalos de referencia y valores de decisión clínica [41], [42].
Las variaciones en los intervalos de referencia entre laboratorios clínicos afecta directamente a los pacientes, llevando a la disparidad en las interpretaciones clínicas de los mismos resultados, o a la repetición innecesaria de las pruebas analíticas [43], [44]. Esta realidad ha adquirido mayor importancia en la actualidad, dada la creciente movilidad de la población (dentro del país) y las múltiples consultas a diferentes médicos en contextos clínicos variados. Los sistemas nacionales o autonómicos de historias clínicas electrónicas de atención primaria reciben resultados de diferentes laboratorios [45]. La armonización de los intervalos de referencia, obtenidos mediante métodos indirectos de data-mining facilitará el intercambio de datos estandarizados entre los sistemas de salud, contribuyendo así a reducir la repetición innecesaria de pruebas analíticas por parte de diferentes facultativos en contextos clínicos diferentes.
La estandarización de las unidades en las que se expresan los resultados es un requisito importante para una aplicación segura de dicha armonización. El empleo de un sistema internacional de unidades es un requisito obvio, aunque parece representar un gran obstáculo en países como EE.UU, Alemania y España. Además, el empleo de un sistema internacional de unidades por sí solo no garantiza la armonización de las mismas. La interpretación errónea de resultados y la mala aplicación de las guías analíticas es un riesgo importante derivado del uso de diferentes unidades entre laboratorios [46], especialmente en entornos geográficamente cerrados.
La armonización/estandarización de las pruebas diagnósticas in vitro (IVD, por sus siglas en inglés) y la validez de los resultados de las pruebas son requisitos imprescindibles antes de poder extraer datos de un sistema de información del laboratorio, para establecer intervalos de referencia. La regulación europea de IVD exige la trazabilidad de los controles y calibradores a métodos de referencia de orden superior y materiales de referencia, cuando sea posible [44] y, por encima de estas, la ISO 17511:2020 [47] exige la trazabilidad de los resultados de las pruebas a sistemas de medición de referencia de orden superior. De este modo, es importante: (1) que las pruebas de laboratorio utilizadas se encuentren estandarizadas por la industria de IVD y cumplan las especificaciones; (2) que los especialistas de laboratorio conozcan dichas regulaciones e implementen dichas pruebas normalizadas [48]; y (3) que se empleen materiales conmutables específicos para la verificación de la veracidad. En Holanda, en el programa “Calibration 2000”, el desarrollo de materiales conmutables específicos fueron considerados el “santo Grial” [49]. La implementación del programa de evaluación de calidad externa holandés “SKML Combi New Style” de 2005, demostró que el uso de suero conmutable valorado es muy eficaz a la hora de reducir la mediana de los coeficientes de variación entre laboratorios en la determinación de electrolitos, sustratos y enzimas [50]. Un estudio de comparabilidad entre métodos analíticos llevado a cabo en España empleando los mismos materiales conmutables del SKML ha demostrado que aún no existe una armonización entre laboratorios [51], [52]. Ricos et al. ya recomendaron cambiar a los métodos con piridoxal fosfatopara la determinación de alanina aminotransferasa (ALT) y aspartato aminotransferasa (AST), el uso del método enzimático para la medición de creatinina, cambiar a los métodos de piruvato a lactato para determinación de lactato deshidrogenasa (LDH) y emplear calibradores conmutables para los electrolitos [51]. Es importante recordar estas recomendaciones.
De este modo, los laboratorios clínicos debería cambiar a los métodos recomendados por la IFCC y emplear materiales de calibración conmutables y materiales EQA con valor asignado para: (1) reducir la variabilidad intra e interlaboratorio y mejorar la equivalencia entre métodos [49]; (2) permitir el cálculo y la comparación de intervalos de referencia entre laboratorios empleando el método directo o indirecto; (3) permitir la implementación de intervalos de referencia nacionales o incluso internacionales normalizados; y (4) implementar un sistema de monitorización para los intervalos de referencia comunes establecidos.
Conclusiones
Los métodos indirectos son una herramienta prometedora para determinar intervalos de referencia específicos, asequibles y actualizados en los laboratorios. Dada la existencia de múltiples métodos estadísticos, recomendamos realizar un estudio comparativo internacional de dichos métodos, con el fin de alcanzar un consenso sobre los criterios a aplicar (selección de la población, limpieza previa de los datos, …) a la hora de determinar qué procedimiento y método estadístico se debe emplear para cada prueba. Para tal fin, recomendamos la realización de una revisión sistemática de la literatura para comparar los resultados obtenidos en los diferentes estudios empleando el método directo e indirecto en la misma población, y poder comparar los resultados de los estudios indirectos aplicando métodos similares. El objetivo último es establecer unos protocolos consenso en los que se recomiende qué método utilizar para cada prueba, cómo comparar los intervalos de referencia obtenidos mediante métodos indirectos y cómo investigar la transferencia entre poblaciones.
Un requisito esencial para el éxito de los métodos indirectos para la determinación de intervalos de referencia y para poder comparar los resultados obtenidos en diferentes laboratorios o diferentes países es adoptar una actitud común hacia el uso únicamente de métodos analíticos estandarizados o armonizados. Los especialistas de laboratorio son agentes clave a la hora de facilitar el empleo de estas estrategias de big data, ya que son expertos en determinar qué pruebas analíticas estandarizadas o armonizadas (recomendadas por la IFCC) y qué resultados se pueden utilizar para calcular intervalos de referencia de un laboratorio o combinar los resultados analíticos de varios laboratorios para obtener intervalos de referencia regionales o nacionales.
A pesar de que la guía EP28-A3c del CLSI recomienda el método directo para el cálculo de intervalos de referencia, se debe considerar el método indirecto como un método alternativo no solo para la obtención de intervalos de referencia en los laboratorios locales, sino también para la verificación de los intervalos de referencia utilizados y obtenidos por los métodos directo o los intervalos descritos en los inserts. Para armonizar los intervalos de referencia globalmente, los intervalos obtenidos mediante el método directo e indirecto se deben evaluar empleando una metodología basada en la evidencia.
-
Financiación de la investigación: No declarada.
-
Contribución de los autores: Todos los autores han aceptado la responsabilidad del contenido completo del manuscrito ya prueban su envío.
-
Conflicto de intereses: Los autores declaran no tener ningún conflicto de intereses.
-
Nota del artículo: El artículo original puede encontrarse aquí: https://doi.org/10.1515/almed-2020-0034.
Referencias
1. Koerbin, G, Sikaris, KA, Jones, GRD, Ryan, J, Reed, M, Tate, J. Evidence-based approach to harmonised reference intervals. Clin Chim Acta 2014;432:99–107. https://doi.org/10.1016/j.cca.2013.10.021.Search in Google Scholar PubMed
2. Gary, LH, Sousan, A, James, CBM, Ceriotti, F, Garg, U, Horn, P, et al. EP28-A3c: defining, establishing, and verifying reference intervals in the clinical laboratory; approved guideline – third edition. Clin Lab Stand Inst 2010;28:30.Search in Google Scholar
3. Ozarda, Y, Ichihara, K, Barth, JH, Klee, G. Protocol and standard operating procedures for common use in a worldwide multicenter study on reference values. Clin Chem Lab Med 2013;51:1027–40. https://doi.org/10.1515/cclm-2013-0249.Search in Google Scholar PubMed
4. Fraser, CG. Biological variation: from principles to practice. Washington, DC: AACC Press; 2001.Search in Google Scholar
5. Klee, GG, Ichihara, K, Ozarda, Y, Baumann, NA, Straseski, J, Bryant, SC, et al. Reference Intervals: comparison of calculation methods and evaluation of procedures for merging reference measurements from two US medical centers. Am J Clin Pathol 2018;150:545–54. https://doi.org/10.1093/ajcp/aqy082.Search in Google Scholar PubMed
6. Expert Panel in the Theory of Reference Values International Federation of Clinical Chemistry Committee on Standards, Gräsbeck, R, Siest, G, Wilding, P, Williams, GZ, Whitehead, TP. Expert panel in the theory of reference valuesprovisional recommendation on the theory of reference values. Clin Chem 1979;25:1506–8. https://doi.org/10.1093/clinchem/25.8.1506.Search in Google Scholar
7. Gräsbeck, R. The evolution of the reference value concept. Clin Chem Lab Med 2004;42:692–7. https://doi.org/10.1515/cclm.2004.118.Search in Google Scholar
8. Aellig, A, Albert, A, Blin, G, Buret, J, Daubrosse, E, Drosdowsky, M, et al. Société Française de Biologie Clinique. Section of physiopathology. Commission “reference values”. Utilisation of reference values. (Document J, stage 3, version 1). Ann Biol Clin 1982;40:697–708.Search in Google Scholar
9. Queralto, JM, Ribo, A, Cortes, M, Domenech, MV, Ferrer, P, Fuentes, J, et al. Documento D: produccion y utilizacion de valores de referencia. Quím Clín 1987;6:49–68.Search in Google Scholar
10. Alström, T, Gräsbeck, R, Lindblad, B, Solberg, HE, Winkel, P, Viinikka, L. Establishing reference values from adults: recommendation on procedures for the preparation of individuals, collection of blood, and handling and storage of specimens. Committee on Reference Values of the Scandinavian Society for Clinical Chemistry. Scand J Clin Lab Invest 1993;53:649–52. https://doi.org/10.3109/00365519309092566.Search in Google Scholar
11. Henny, J, Vassault, A, Boursier, G, Vukasovic, I, Mesko Brguljan, P, Lohmander, M, et al. Recommendation for the review of biological reference intervals in medical laboratories. Clin Chem Lab Med 2016;54:1893–900. https://doi.org/10.1515/cclm-2016-0793.Search in Google Scholar PubMed
12. Horowitz, GL. Reference intervals: practical aspects. EJIFCC 2008;19:95–105.Search in Google Scholar
13. Jones, GRD, Haeckel, R, Loh, TP, Sikaris, K, Streichert, T, Katayev, A, et al. Indirect methods for reference interval determination – review and recommendations. Clin Chem Lab Med 2019;57:20–9.10.1515/cclm-2018-0073Search in Google Scholar PubMed
14. Baro, E, Degoul, S, Beuscart, R, Chazard, E. Toward a literature-driven definition of big data in healthcare. BioMed Res Int 2015;2015:639021. https://doi.org/10.1155/2015/639021.Search in Google Scholar PubMed PubMed Central
15. Berger, ML, Doban, V. Big data, advanced analytics and the future of comparative effectiveness research. J Comp Eff Res 2014;3:167–76. https://doi.org/10.2217/cer.14.2.Search in Google Scholar PubMed
16. Lupşe, OS, Crişan-Vida, M, Stoicu-Tivadar, L, Bernard, E. Supporting diagnosis and treatment in medical care based on big data processing. Stud Health Technol Inf 2014;197:65–9.Search in Google Scholar
17. Dereli, T, Coşkun, Y, Kolker, E, Güner, Ö, Aǧirbaşli, M, Özdemir, V. Big data and ethics review for health systems research in LMICs: understanding risk, uncertainty and ignorance-and catching the black swans?. Am J Bioeth 2014;14:48–50. https://doi.org/10.1080/15265161.2013.868955.Search in Google Scholar PubMed
18. Tolan, NV, Parnas, ML, Baudhuin, LM, Cervinski, MA, Chan, AS, Holmes, DT, et al. “Big data” in laboratory medicine. Clin Chem 2015;61:1433–40. https://doi.org/10.1373/clinchem.2015.248591.Search in Google Scholar PubMed
19. Gruson, D, Helleputte, T, Rousseau, P, Gruson, D. Data science, artificial intelligence, and machine learning: opportunities for laboratory medicine and the value of positive regulation. Clin Biochem 2019;69:1–7. https://doi.org/10.1016/j.clinbiochem.2019.04.013.Search in Google Scholar PubMed
20. Ngiam, KY, Khor, IW. Big data and machine learning algorithms for health-care delivery. Lancet Oncol 2019;20:e262–73. https://doi.org/10.1016/s1470-2045(19)30149-4.Search in Google Scholar
21. Kim, M, Shin, SY, Kang, M, Yi, BK, Chang, DK. Developing a standardization algorithm for categorical laboratory tests for clinical big data research: retrospective study. JMIR Med Inform 2019;7:e14083. https://doi.org/10.2196/14083.Search in Google Scholar PubMed PubMed Central
22. Shine, B, Barth, JH. Big data in clinical biochemistry. Ann Clin Biochem 2019;56:308–9. https://doi.org/10.1177/0004563218800735.Search in Google Scholar PubMed
23. Ghasemi, A, Zahedias, S. Normallity tests for statistical analysis: a guide for non-statistician. Int J Endocrinol Metabol 2012;10:486–9. https://doi.org/10.5812/ijem.3505.Search in Google Scholar PubMed PubMed Central
24. Wosniok, W, Haeckel, R. A new indirect estimation of reference intervals: truncated minimum chi-square (TMC) approach. Clin Chem Lab Med 2019;57:1933–47. https://doi.org/10.1515/cclm-2018-1341.Search in Google Scholar PubMed
25. Zierk, J, Arzideh, F, Haeckel, R, Rascher, W, Rauh, M, Metzler, M. Indirect determination of pediatric blood count reference intervals. Clin Chem Lab Med 2013;51:863–72. https://doi.org/10.1515/cclm-2012-0684.Search in Google Scholar PubMed
26. Lott, JA, Smith, DA, Mitchell, LC, Moeschberger, ML. Use of medians and “average of normal” of patients’ data for assessment of long-term analytical stability. Clin Chem 1996;42:888–92. https://doi.org/10.1093/clinchem/42.6.888.Search in Google Scholar
27. Peng, X, Lv, Y, Feng, G, Peng, Y, Li, Q, Song, W, et al. Algorithm on age partitioning for estimation of reference intervals using clinical laboratory database exemplified with plasma creatinine. Clin Chem Lab Med 2018;56:1514–23. https://doi.org/10.1515/cclm-2017-1095.Search in Google Scholar PubMed
28. Ichihara, BJC. IFCC Committee on Reference Intervals and Decision Limits (C-RIDL). An appraisal of statistical procedures used in derivation of reference intervals. Clin Chem Lab Med 2010;48:1537–51. https://doi.org/10.1515/cclm.2010.319.Search in Google Scholar PubMed
29. Grossi, E, Colombo, R, Cavuto, S, Franzini, C. The REALAB project: a new method for the formulation of reference intervals based on current data. Clin Chem 2005;51:1232–40. https://doi.org/10.1373/clinchem.2005.047787.Search in Google Scholar PubMed
30. Katayev, A, Fleming, JK, Luo, D, Fisher, AH, Sharp, TM. Reference intervals data mining: no longer a probability paper method. Am J Clin Pathol 2015;143:134–42. https://doi.org/10.1309/ajcpqprnib54wfkj.Search in Google Scholar
31. Baadenhuijsen, H, Smit, JC. Indirect estimation of clinical chemical reference intervals from total hospital patient data: application of a modified Bhattacharya procedure. J Clin Chem Clin Biochem 1985;23:829–39. https://doi.org/10.1515/cclm.1985.23.12.829.Search in Google Scholar PubMed
32. Haeckel, R, Wosniok, W, Arzideh, F. A plea for intra-laboratory reference limits. Part 1. General considerations and concepts for determination. Clin Chem Lab Med 2007;45:1033–42. https://doi.org/10.1515/cclm.2007.249.Search in Google Scholar
33. Arzideh, F, Wosniok, W, Gurr, E, Hinsch, W, Schumann, G, Weinstock, N, et al. A plea for intra-laboratory reference limits. Part 2. A bimodal retrospective concept for determining reference limits from intra-laboratory databases demonstrated by catalytic activity concentrations of enzymes. Clin Chem Lab Med 2007;45:1043–57. https://doi.org/10.1515/cclm.2007.250.Search in Google Scholar PubMed
34. Den Elzen WPJ, Brouwer, N, Thelen, MH, Le Cessie, S, Haagen, IA, Cobbaert, CM. NUMBER: standardized reference intervals in the Netherlands using a “big data” approach. Clin Chem Lab Med 2019;57:42–56. https://doi.org/10.1515/cclm-2018-0462.Search in Google Scholar PubMed
35. Inal, TC, Serteser, M, Coskun, A, Ozpinar, A, Unsal, I. Indirect reference intervals estimated from hospitalized population for thyrotropin and free thyroxine. Croat Med J 2010;51:124–30. https://doi.org/10.3325/cmj.2010.51.124.Search in Google Scholar PubMed PubMed Central
36. Lo Sasso, B, Vidali, M, Scazzone, C, Agnello, L, Ciaccio, M. Reference interval by the indirect approach of serum thyrotropin (TSH) in a Mediterranean adult population and the association with age and gender. Clin Chem Lab Med 2019;25:1587–94. https://doi.org/10.1515/cclm-2018-0957.Search in Google Scholar PubMed
37. Iicol, YO, Aslan, D. Use of total patient data for indirect estimation of reference intervals for 40 clinical chemical analytes in Turkey. Clin Chem Lab Med 2006;44:867–76.10.1515/CCLM.2006.139Search in Google Scholar PubMed
38. Shine, B. Use of routine clinical laboratory data to define reference intervals. Ann Clin Biochem 2008;45:467–75. https://doi.org/10.1258/acb.2008.008028.Search in Google Scholar PubMed
39. Zellner, A, Richardson, AM, Lidbury, BA, Hobson, P, Badrick, T. An investigation into outlier elimination and calculation methods in the determination of reference intervals using serum immunoglobulin A as a model data collection. New York: Cornell University; 2019. arXiv:1907.Search in Google Scholar
40. Oosterhuis, WP, Modderman, TA, Pronk, C. Reference values: Bhattacharya or the method proposed by the IFCC?. Ann Clin Biochem 1990;27:359–65. https://doi.org/10.1177/000456329002700413.Search in Google Scholar PubMed
41. Plebani, M. Harmonization of clinical laboratory information – current and future strategies. EJIFCC 2016;27:15–22.Search in Google Scholar
42. Plebani, M. Harmonization in laboratory medicine: the complete picture. Clin Chem Lab Med 2013;51:741–51. https://doi.org/10.1515/cclm-2013-0075.Search in Google Scholar PubMed
43. Tate, JR, Johnson, R, Sikaris, K. Harmonisation of laboratory testing. Clin Biochem Rev 2012;33:121–2.Search in Google Scholar
44. Zardo, L, Secchiero, S, Sciacovelli, L, Bonvicini, P, Plebani, M. Reference intervals: are interlaboratory differences appropriate?. Clin Chem Lab Med 1999;37:1131–3. https://doi.org/10.1515/cclm.1999.165.Search in Google Scholar
45. Jones, GR, Barker, A, Tate, J, Lim, CF, Robertson, K. The case for common reference intervals. Clin Biochem Rev 2004;25:99–104.Search in Google Scholar
46. De la Salle, B, Pathology Harmony Haematology Sub-Group. Pathology harmony moves on: progress on implementation in haematology. Br J Haematol 2012;158:804–5. https://doi.org/10.1111/j.1365-2141.2012.09229.x.Search in Google Scholar PubMed
47. International Organization for Standardization (ISO). ISO 17511:2020 in vitro diagnostic medical devices – requirements for establishing metrological traceability of values assigned to calibrators, trueness control materials and human samples. London: ISO; 2020.Search in Google Scholar
48. Cobbaert, C. Time for a holistic approach and standardization education in laboratory medicine. Clin Chem Lab Med 2017;55:311–3. https://doi.org/10.1515/cclm-2016-0952.Search in Google Scholar PubMed
49. Jansen, RTP, Cobbaert, CM, Weykamp, C, Thelen, M. The quest for equivalence of test results: the pilgrimage of the Dutch Calibration 2.000 program for metrological traceability. Clin Chem Lab Med 2018;56:1673–84. https://doi.org/10.1515/cclm-2017-0796.Search in Google Scholar PubMed
50. Cobbaert, C, Weykamp, C, Franck, P, de Jonge, R, Kuypers, A, Steigstra, H, et al. Systematic monitoring of standardization and harmonization status with commutable EQA-samples – five year experience from the Netherlands. Clin Chim Acta 2012;414:234–40. https://doi.org/10.1016/j.cca.2012.09.027.Search in Google Scholar PubMed
51. Ricós, C, Perich, C, Boned, B, González-Lao, E, Diaz-Garzón, J, Ventura, M, et al. Standardization in laboratory medicine: two years’ experience from category 1 EQA programs in Spain. Biochem Med 2019;29:010701. https://doi.org/10.11613/bm.2019.010701.Search in Google Scholar
52. Ricós, C, Fernández-Calle, P, Marqués, F, Minchinela, J, Salas, A, Cecília, M-B, et al. Impact of implementing a category 1 external quality assurance scheme for monitoring harmonization of clinical laboratories in Spain. Adv Lab Med 2020;1:20200008. https://doi.org/10.1515/almed-2020-0008.Search in Google Scholar
© 2020 Luisa Martínez-Sánchez et al., published by De Gruyter, Berlin/Boston
This work is licensed under the Creative Commons Attribution 4.0 International License.
Articles in the same Issue
- Frontmatter
- Editorial
- Big Data, artificial intelligence and laboratory medicine: time for integration
- Big Data, inteligencia artificial y medicina de laboratorio: la hora de la integración
- Review / Artículo de Revisión
- Big data and reference intervals: rationale, current practices, harmonization and standardization prerequisites and future perspectives of indirect determination of reference intervals using routine data
- Big data e intervalos de referencia: motivación, prácticas actuales, prerrequisitos de armonización y estandarización y futuras perspectivas en el cálculo de intervalos de referencia mediante métodos indirectos
- Biomarkers in Alzheimer’s disease
- Biomarcadores en la enfermedad de Alzheimer
- Guidelines and Recommendations / Guias y Recomendaciones
- Management of postanalytical processes in the clinical laboratory according to ISO 15189:2012 Standard requirements: considerations on the review, reporting and release of results
- Gestión del proceso posanalítico en los laboratorios clínicos según los requisitos de la norma ISO 15189:2012. Consideraciones sobre la revisión, notificación y comunicación de los resultados
- Original Article / Artículo Original
- Diagnostic accuracy of Schistoso ma ICT Ig G - IgM and comparison to other used techniques screening urinary schistosomiasis in Nigeria
- Exactitud diagnóstica de la técnica Schistosoma ICT IgG-IgM frente a otras técnicas de detección de esquistosomiasis urinaria en Nigeria
- Improved gestational diabetes screening protocol
- Mejora del protocolo de cribado de diabetes gestacional: estudio de validación diagnóstica
- A study of crystalluria: effectiveness of including hygienic-dietary recommendations in laboratory reports
- Estudio de la cristaluria: efectividad de la incorporación de medidas higiénico-dietéticas en los informes de laboratorio
- Case Report / Caso Clínico
- False hyperthyroidism caused by interference in immunoassays
- Falso hipertiroidismo por interferencia en inmunoanálisis
- Fluctuating neurological symptoms: should I call the neurologist or the hematologist?
- Clínica neurológica fluctuante: ¿Llamo al neurólogo o al hematólogo?
- Letter to the Editor / Carta al Editor
- Alliance of IVD manufacturer and medical laboratory for quality control of results
- La alianza entre el fabricante de IVD y el laboratorio clínico en el control de calidad de los resultados
Articles in the same Issue
- Frontmatter
- Editorial
- Big Data, artificial intelligence and laboratory medicine: time for integration
- Big Data, inteligencia artificial y medicina de laboratorio: la hora de la integración
- Review / Artículo de Revisión
- Big data and reference intervals: rationale, current practices, harmonization and standardization prerequisites and future perspectives of indirect determination of reference intervals using routine data
- Big data e intervalos de referencia: motivación, prácticas actuales, prerrequisitos de armonización y estandarización y futuras perspectivas en el cálculo de intervalos de referencia mediante métodos indirectos
- Biomarkers in Alzheimer’s disease
- Biomarcadores en la enfermedad de Alzheimer
- Guidelines and Recommendations / Guias y Recomendaciones
- Management of postanalytical processes in the clinical laboratory according to ISO 15189:2012 Standard requirements: considerations on the review, reporting and release of results
- Gestión del proceso posanalítico en los laboratorios clínicos según los requisitos de la norma ISO 15189:2012. Consideraciones sobre la revisión, notificación y comunicación de los resultados
- Original Article / Artículo Original
- Diagnostic accuracy of Schistoso ma ICT Ig G - IgM and comparison to other used techniques screening urinary schistosomiasis in Nigeria
- Exactitud diagnóstica de la técnica Schistosoma ICT IgG-IgM frente a otras técnicas de detección de esquistosomiasis urinaria en Nigeria
- Improved gestational diabetes screening protocol
- Mejora del protocolo de cribado de diabetes gestacional: estudio de validación diagnóstica
- A study of crystalluria: effectiveness of including hygienic-dietary recommendations in laboratory reports
- Estudio de la cristaluria: efectividad de la incorporación de medidas higiénico-dietéticas en los informes de laboratorio
- Case Report / Caso Clínico
- False hyperthyroidism caused by interference in immunoassays
- Falso hipertiroidismo por interferencia en inmunoanálisis
- Fluctuating neurological symptoms: should I call the neurologist or the hematologist?
- Clínica neurológica fluctuante: ¿Llamo al neurólogo o al hematólogo?
- Letter to the Editor / Carta al Editor
- Alliance of IVD manufacturer and medical laboratory for quality control of results
- La alianza entre el fabricante de IVD y el laboratorio clínico en el control de calidad de los resultados