Introdúcete en la asistencia sanitaria del futuro de la mano de Google y los avances más punteros de inteligencia artificial aplicada a la sanidad.
Índice
¿Cómo que médico?
Med-PaLM es un gran modelo de lenguaje (LLM) diseñado y entrenado por Google, para proporcionar respuestas de alta calidad a preguntas médicas. Aprovecha la potencia de los grandes modelos de lenguaje de Google, como PaLM-2, con la diferencia de haber sido re-entrenado con datos del dominio de la medicina.
Según la compañía, la primera versión de Med-PaLM, a finales de 2022, fue el primer sistema de IA en superar la nota de aprobado en preguntas del estilo del examen US Medical License Exam (USMLE). Med-PaLM también genera respuestas precisas y útiles a preguntas de salud de los usuarios.
PaLM
Son las siglas del modelo fundacional de Google, Pathways Language Model (PaLM). Se basa en la arquitectura de tipo Transformer, también desarrollada por Google en 2017, como la mayoría de Large Language Models (LLMs) actuales. Solo que, en este caso, enfocado en una nueva forma de entrenar el modelo. Lo que han llamado arquitectura Pathways. El primer modelo lanzado al público, PaLM, se entrenó con 540 millones de parámetros, con el objetivo de competir con otros modelos de lenguaje como GPT, el modelo de lenguaje detrás de ChatGPT de OpenAI.
Pathways
La principal novedad que aporta este modelo al estado del arte de los LLMs es la arquitectura Pathways. Un nuevo sistema de entrenamiento de modelos basados en Transformers de forma más eficiente. Según Google, es una nueva arquitectura de IA que manejará muchas tareas a la vez, aprenderá nuevas tareas rápidamente y reflejará una mejor comprensión del mundo.
Argumentan que el motivo por el que nace este nuevo sistema es que los modelos de aprendizaje automático actuales tienden a especializarse demasiado en tareas individuales cuando podrían sobresalir en muchas. Con demasiada frecuencia recurren a la fuerza bruta cuando la destreza y la especialización de la experiencia serían suficientes.
Según ellos, por eso han desarrollado Pathways. Lo que permitirá que un solo sistema de IA generalice a través de miles o millones de tareas, comprenda diferentes tipos de datos y lo haga con una eficiencia notable. Los sistemas inteligentes de propósito general reflejan una comprensión más profunda de nuestro mundo y pueden adaptarse a nuevas necesidades.
PaLM-2
La versión mejorada del modelo primigenio, PaLM. Ha sido entrenado con texto multilingüe en paralelo y en un corpus mucho más grande de diferentes idiomas que su predecesor. Si GPT-4, a Julio de 2023, es el modelo más avanzado detrás de ChatGPT, PaLM-2 es el modelo más avanzado detrás de Bard, el chatbot conversacional de Google.
La compañía asegura que mejora al anterior modelo (PaLM) puesto que durante su entrenamiento se han unificado tres avances de investigación:
- Uso del escalado óptimo de cómputo: Esto es escalar el tamaño del modelo y el tamaño del conjunto de datos de entrenamiento en proporción entre sí. Esta nueva técnica hace que PaLM 2 sea más pequeño que PaLM, pero más eficiente, con un mejor rendimiento y menor coste.
- Combinación mejorada de conjuntos de datos: PaLM-2 mejora su corpus con una mezcla de pre-entrenamiento más multilingüe y diversa, que incluye cientos de lenguajes humanos y de programación, ecuaciones matemáticas, artículos científicos y páginas web.
- Arquitectura del modelo y objetivo actualizados: PaLM 2 tiene una arquitectura mejorada y se entrenó en una variedad de tareas diferentes.
Una de los ejemplos es que comprende bien las frases hechas y ofrece recomendaciones, puedes probarlo en aquí:
Med-PaLM 2
Es el Large Language Model de Google adaptado al dominio de la medicina. Como su nombre indica, usa PaLM-2 para resolver tareas habituales de la práctica clínica. Busca ser un asistente médico que resuelva las dudas de los usuarios con alta precisión y confianza en las respuestas.
Google asegura que el desarrollo de una IA capaz de responder con precisión a preguntas médicas es un reto que viene de lejos y que ha dado lugar a varios avances de investigación en las últimas décadas. Aunque el tema es amplio y extremadamente complejo, la respuesta a preguntas del tipo USMLE (United States Medical Licensing Examination, el examen en tres etapas para obtener la licencia médica en EE.UU) se ha convertido recientemente en una referencia popular para evaluar el rendimiento de la respuesta a preguntas médicas.
Responder a este tipo de preguntas médicas requiere de gran capacidad y contexto. Es necesario comprender y conocer los síntomas, examinar pruebas médicas y realizar razonamientos complejos sobre el diagnóstico de la enfermedad. Para llevar a cabo este proceso, los profesionales sanitarios necesitan años de formación para responder correctamente con precisión y coherencia. Por ello, aplicar técnicas de IA, en este caso de procesamiento de lenguaje natural (NLP), ha sido tan complicado históricamente.
Hasta que llegó Med-PaLM. Según datos de Google, Med-PaLM fue el primer sistema de IA que obtuvo una puntuación de aprobado en preguntas de estilo USMLE del conjunto de datos MedQA (Medical multiple choice Question and Answers), con una precisión del 67,4%. Med-PaLM 2 mejora este resultado con un rendimiento de vanguardia del 86,5 %.
Multi-modalidad (PaLM-E)
La medicina y la práctica clínica habitual en su naturaleza son diversas y utilizan una variedad de fuentes de información como imágenes, historias clínicas electrónicas (HCE), sensores, dispositivos portátiles, genómica y muchos otros.
La filosofía de Google, en este campo, se basa en que los sistemas de inteligencia artificial que aprovechen estos datos a gran escala, empleando el aprendizaje auto-supervisado y teniendo en cuenta cuidadosamente la privacidad, la seguridad y la igualdad en el ámbito de la atención médica, serán la base de la siguiente generación de sistemas de IA médica. Estos sistemas permitirán ampliar la disponibilidad de atención médica de alta calidad a nivel global.
Tomando como referencia el modelo de lenguaje visual «PaLM-E«, Google ha desarrollado una versión multimodal de Med-PaLM, esto es que admite varias formas de entrada, texto e imágenes por ejemplo. Este sistema tiene la capacidad de sintetizar información proveniente de imágenes como radiografías de tórax o mamografías, entre otras, con el objetivo de ayudar a los médicos a brindar una atención más precisa a sus pacientes.
Además del lenguaje, esta versión incorpora diversas modalidades como dermatología, retina, radiología en 3D y 2D, patología, historiales médicos y genómica. Todavía es un trabajo futuro y está en sus primeras versiones, pero sin duda abren la puerta a mejorar mucho la labor de los profesionales y la calidad de la atención que ofrecen a los pacientes.
CDSS
El objetivo final de aplicar este tipo de técnicas de inteligencia artificial al ámbito de la práctica clínica y la medicina en general, es desarrollar CDSSs (Clinical Decision Support Systems) o sistemas de apoyo a la toma de decisión clínica. Todo ello está englobado en una corriente médica conocida como medicina de precisión o medicina personalizada. Cuyo objetivo se centra en personalizar cada vez más los diagnósticos y los tratamientos que se ofrecen a los pacientes para mitigar los posibles efectos secundarios de un tratamiento más generalista.
Estos CDSS son sistemas de información sanitaria que proporcionan a los médicos, pacientes y otro personal sanitario conocimientos e información específica de la persona y el ámbito clínico para ayudar a mejorar la salud y la calidad asistencial de los pacientes.
Por todo ello, estas técnicas no buscan en absoluto reemplazar a los profesionales sanitarios, más bien buscan poner al alcance de este personal toda la potencia y beneficios que la inteligencia artificial, el machine learning y las técnicas de procesamiento de lenguaje natural pueden aportar a este dominio. Por tanto, se busca que se apliquen como una herramienta de apoyo a los profesionales para mejorar la calidad que pueden ofrecer a los pacientes.
Aquí podéis ver un vídeo resumen:
Referencias
- AI ACROSS GOOGLE: PaLM 2
- Med-PaLM: A large language model from Google Research, designed for the medical domain.
- A responsible path to generative AI in healthcare
- Transformer: A Novel Neural Network Architecture for Language Understanding
- Partnering with iCAD to improve breast cancer screening
- Attention Is All You Need
Excelente artículo.