Comparados con computadoras los médicos tienen mejor desempeño en precisión diagnóstica | Por: @linternista
En una comparación de precisión diagnóstica entre médicos humanos y computadoras, publicada como carta de investigación el 10 de octubre en JAMA Internal Medicine los médicos hábilmente vencieron a los algoritmos concebidos para diagnosticar trastornos con base en viñetas de antecedentes de pacientes. Específicamente, los médicos identificaron con exactitud el diagnóstico en viñetas clínicas de antecedentes de salud de pacientes con una frecuencia de cerca del doble que los verificadores de síntomas basados en computadora.
«Creo que los médicos se sentirán cómodos al saber que una computadora no les va a quitar su trabajo», dijo el Dr. Steve Kassakian, profesor asistente de medicina informática y director médico de Informática Clínica en la Universidad de Salud y Ciencias de Portland, acerca de los hallazgos del estudio. «Sin embargo, hemos sabido esto durante décadas», añadió el Dr. Kassakian, quien no intervino en el estudio.
«La verdad es que los generadores de diagnósticos diferenciales y la idea del diagnóstico con asistencia por computadora en realidad han existido durante varios decenios», explicó, y los nuevos hallazgos son congruentes con lo que han revelado estudios previos.
La Academia Nacional de Ciencias de Ingeniería y Medicina de Estados Unidos destacó recientemente que los errores en el diagnóstico médico es común y que las tecnologías de la información pueden ser parte de la solución. Según ellos, dados los avances en la informática, las computadoras pueden ser capaces de hacer independientemente diagnósticos clínicos precisos. Mientras que han habido estudios que han comparado las computadoras contra los médicos en la lectura de electrocardiogramas, se desconoce la precisión diagnóstica de las computadoras contra los médicos humanos.
Para llenar este vacío en el conocimiento, se comparó la precisión diagnóstica de los médicos con los algoritmos de computadora llamados chequeadores de síntomas, los cuales son sitios web y aplicaciones que ayudan a los pacientes con su autodiagnóstico. Después de contestar una serie de preguntas, el usuario recibe una lista de potenciales diagnósticos ordenada generada por un algoritmo de computadora. En el presente estudio, Hannah L. Semigran, de la Escuela Médica Harvard en Boston, Massachusetts, y sus colaboradores midieron la precisión diagnóstica de 23 chequeadores de síntomas en internet o basados en aplicaciones, utilizando 45 viñetas clínicas.
Las viñetas abarcaban 19 trastornos infrecuentes y 26 trastornos frecuentes, y cada una incluía la historia clínica del paciente y los antecedentes personales patológicos pero no evaluaban los hallazgos de la exploración física. Un tercio de las viñetas tenían gran agudeza, un tercio tenían baja agudeza y un tercio tenían mediana agudeza. En este estudio se comparó el rendimiento diagnóstico de los médicos con los chequeadores de síntomas utilizando las mismas viñetas con una plataforma en línea llamada Dx humano.
Los investigadores proporcionaron estas viñetas a 234 médicos que participaron en una plataforma en internet llamada Human Dx. Un poco más de la mitad (52%) de los participantes eran médicos especialistas o residentes y 90% de ellos estaban especializados en medicina interna. Cada médico resolvió al menos una viñeta redactando un diagnóstico de texto libre y cada viñeta fue evaluada al menos por 20 médicos.
La precisión diagnóstica de los médicos fue más del doble que las de los verificadores de síntomas: 72,1% de los médicos enunciaron primero el diagnóstico correcto en comparación con solo 34,0% de los chequeadores de síntomas, con una p <0,001, así como en los 3 primeros diagnósticos mencionados (84,3% vs 51,2%, p <0,001) [Tabla 2].
Aproximadamente la mitad de las veces (51,2%), los chequeadores de síntomas incluyeron correctamente el trastorno de la viñeta entre los primeros tres diagnósticos que se enumeraban, pero los médicos aquí también tuvieron mejor desempeño que los algoritmos y su precisión fue de 84,3% entre los tres diagnósticos principales.
Mientras los médicos tuvieron más probabilidades de incluir el diagnóstico correcto por primera vez para viñetas de alta precisión (vs viñetas de baja precisión) y de viñetas poco comunes (vs viñetas comunes), por el contrario, los chequeadores de síntomas tuvieron más probabilidad de listar el diagnóstico correcto para las viñetas de baja precisión agudeza y viñetas comunes (Tabla 2).
A pesar de un rendimiento superior de los médicos, estos dieron diagnósticos incorrectos en cerca de 15% de los casos, lo cual corresponde a 10%-15% de imprecisión diagnóstica identificada en investigaciones previas. Si bien en este proyecto hemos comparado el rendimiento de diagnóstico, el trabajo futuro debería probar si algoritmos informáticos pueden aumentar la precisión diagnóstica del médico
«No contamos con un buen método para establecer un diagnóstico correcto con base en los registros electrónicos médicos», explicó el Dr. Kassakian, puntualizando que los antecedentes del paciente en los registros electrónicos médicos son simplemente una recolección de códigos de la «Clasificación Estadística Internacional de Enfermedades y Problemas Relacionados con la Salud»(CIE). «Los códigos de la CIE son notoriamente imprecisos para captar el diagnóstico clínico de un paciente, de manera que están plagados de problemas que muchas personas ya han definido».
Sin embargo, en este estudio no se utilizó una lista de códigos de la CIE de manera que las viñetas pueden no representar con precisión la información que los médicos podrían tener si solo se basaran en los registros electrónicos médicos, y las viñetas carecían de algún resultado de la exploración física o de pruebas, una limitante importante del estudio. Otras limitaciones fueron la imposibilidad de generalizar los hallazgos dado que los médicos que participaron en el estudio pueden no ser representativos de la comunidad médica en general, y el hecho de que existen otras herramientas de diagnóstico mediante computadora además de los verificadores de síntomas, mismas que no se evaluaron en este estudio.
Sin embargo, el Dr. Kassakian también reveló que el hacer frente a dilemas diagnósticos difíciles representa una proporción muy pequeña del trabajo cotidiano de la mayoría de los médicos, otro motivo por el cual los algoritmos no fueron muy útiles o aplicables al ejercicio clínico cotidiano.
«Gran parte de la atención médica no tiene que ver con un diagnóstico difícil,» dijo el Dr. Kassakian. «Tomar decisiones diagnósticas difíciles no es una parte considerable del ejercicio clínico de la mayoría de los médicos, ya que la mayor parte de ello representa el tratamiento de enfermedades crónicas, el seguimiento o los cuidados preventivos.»
Fuentes: jamanetwork.com / espanol.medscape.com