Me pongo en modo reivindicativa
El otro día leía un post que decía como la inteligencia artificial (IA) el chat GPT y otras tecnologías emergentes estaban empezando a impactar ya en la salud de la población.
Siempre que leo u oigo conversaciones que hablan de como la IA se puede utilizar para analizar grandes bases de datos en salud, no puedo evitar que me suba el cortisol 😊
Hemos de tener en cuenta que cuando hablamos de grandes bases de datos en salud estamos hablando de datos observacionales, Big Data, Real World Data (RWD), datos del mundo real, todos estos nombres hacen referencia a lo mismo, a los datos recopilados durante años y años en la práctica clínica habitual y que no están recogidos expresamente para hacer investigación.
Por este motivo, porque no están recogidos para hacer investigación, hay que tener en cuenta que una cosa es utilizar la IA para hacer predicciones con grandes bases de datos, es decir, que los algoritmos automáticos relacionen largas listas de variables sin seguir una estrategia previa para identificar asociaciones, que cabe decir que en la mayoría de los casos no tendrán una mínima plausibilidad biológica, y otra muy diferente es intentar mediante IA inferir causalidad con estas grandes bases de datos del mundo real en salud.
Es en esta segunda acción, intentar mediante IA inferir causalidad con grandes bases de datos del mundo real, donde a mí me sube el cortisol.
¡Esto es un error!
Hemos dicho que estos datos no están recogidos para hacer investigación, por lo tanto, es imprescindible un trabajo previo muy importante entre el profesional de la salud, el estadístico y el profesional que conozca bien las diferentes fuentes de información, para definir un protocolo de investigación en el que se defina con todo detalle la metodología para analizar este tipo de datos, y eso, por ahora, solo se puede hacer con personas.
No estoy diciendo que la IA no se pueda utilizar en este tipo de datos, estas técnicas dan resultados útiles y muy espectaculares cuando se trabaja, por ejemplo, con análisis de imágenes en los que hay millones y millones de datos.
Estas técnicas pueden ayudar a hacer predicciones muy buenas, con muchos datos, pero eso nunca será causalidad.
Las bases de datos que tenemos en salud no son lo suficientemente grandes, aún, como para que estas técnicas tengan una ventaja y marquen la diferencia respecto a ir introduciendo las variables en un modelo de regresión clásico.
El otro día revisé un protocolo en el que querían utilizar estas técnicas con 2000 pacientes y 13 variables 😱
¡No tiene ningún sentido!
La IA podría ser útil para ayudarnos a ajustar por confusores, ayudarnos a decidir cuales son los importantes, cuando tenemos cientos, miles de ellos, ¿pero 13?
Una cosa es utilizar las App para recoger grandes cantidades de datos con mucha facilidad o para ayudar a los pacientes a controlar su medicación, que se está demostrando día a día que puede llegar a ser muy útil. Y otra muy diferente es utilizar la IA, los algoritmos automatizados, el aprendizaje automático, para analizar datos e intentar inferir causalidad.
Esto, hoy, aun no se puede hacer. Tal vez en un futuro llegue, pero ahora aun es necesario el conocimiento del profesional de la salud, del estadístico y del profesional que conoce las fuentes de información.
¡Un abrazo!
Laura