Una nueva investigación analiza cómo los modelos de lenguaje de gran tamaño se desempeñan en un contexto médico diverso, incluyendo casos reales en salas de emergencia, donde al menos uno de los modelos parece ser más preciso que los médicos humanos. Este estudio, publicado recientemente en la revista Science, proviene de un equipo de investigación liderado por médicos y científicos informáticos de la Escuela de Medicina de Harvard y el Centro Médico Beth Israel Deaconess.
Detalles del Estudio
Experimentos realizados
Los investigadores llevaron a cabo diferentes experimentos para evaluar cómo se comparaban los modelos de OpenAI con los médicos humanos. En uno de los experimentos, se centraron en 76 pacientes que acudieron a la sala de emergencias de Beth Israel. Compararon los diagnósticos realizados por dos médicos presentes con aquellos generados por los modelos o1 y 4o de OpenAI. Estos diagnósticos fueron posteriormente evaluados por dos médicos adicionales que no sabían cuáles eran de AI y cuáles eran humanos.
Resultados destacados
El estudio señala que, en cada punto de diagnóstico, el modelo o1 mostró un rendimiento igual o superior al de los médicos atendiendo. Las diferencias fueron especialmente notables en el primer punto de diagnóstico (la tríage inicial en la sala de emergencias), donde hay menos información disponible sobre el paciente y una gran urgencia para tomar decisiones correctas. Con la información disponible, el modelo o1 logró ofrecer un diagnóstico exacto o muy cercano en el 67% de los casos de triaje, en comparación con uno de los médicos, que tuvo un diagnóstico exacto o cercano en el 55% de las ocasiones, y el otro que acertó en el 50% de las veces.
Los investigadores subrayan que no se preprocesó la información de ninguna manera, ya que los modelos de IA recibieron la misma información que estaba disponible en los registros médicos electrónicos al momento de cada diagnóstico.
Importancia de la Investigación
Los autores del estudio afirmaron que han evaluado el modelo de IA con prácticamente todos los parámetros existentes, y que este ha superado tanto a modelos anteriores como a las referencias de los médicos. Sin embargo, es importante aclarar que el estudio no afirma que la IA esté lista para tomar decisiones críticas en situaciones de emergencia. En cambio, destaca la necesidad urgente de llevar a cabo ensayos prospectivos para evaluar estas tecnologías en entornos de atención médica real.
Limitaciones del estudio
Los investigadores han indicado que únicamente estudiaron cómo se desempeñaron los modelos con información textual, y añadieron que estudios existentes sugieren que los modelos actuales son más limitados en su razonamiento sobre entradas no textuales.
Un médico de Beth Israel que también figura como uno de los autores principales del estudio, expresó que actualmente no hay un marco formal para la responsabilidad en torno a los diagnósticos realizados por IA, y que los pacientes aún desean que sean humanos quienes los guíen en decisiones críticas relacionadas con la vida o la muerte, así como en decisiones de tratamiento desafiantes.
Consejos para Emprendedores y Negocios
-
Integración de IA: Considera implementar modelos de IA en tu negocio para mejorar la eficiencia en áreas como el servicio al cliente o el análisis de datos. Aprender sobre modelos de lenguaje puede ayudarte a anticipar problemas y ofrecer soluciones más rápidas.
-
Capacitación y Formación: Invierte en la formación de tu equipo en tecnologías emergentes. Comprender el funcionamiento de la IA y sus aplicaciones puede dar a tu negocio una ventaja competitiva.
-
Ética en el Uso de IA: Desarrolla un código de ética que guíe el uso de IA en tu empresa. La responsabilidad en la toma de decisiones puede ser clave para mantener la confianza de tus clientes.
- Evaluación Continua: Realiza evaluaciones continuas sobre cómo las tecnologías de IA impactan en tu negocio. Hay que estar dispuestos a adaptarse y cambiar las estrategias según los resultados obtenidos.
Conclusiones
La investigación reciente sobre la capacidad de los modelos de IA para diagnosticar en un entorno médico demuestra que hay un potencial considerable para su uso. Sin embargo, la responsabilidad, la ética y el deseo de un toque humano en decisiones críticas son aspectos que aún deben ser considerados seriamente. A medida que la tecnología avanza, será crucial encontrar un equilibrio entre la innovación y la atención al bienestar del paciente. Emprendedores y empresas deben mantenerse al tanto de estos desarrollos y considerar cómo pueden integrarlos de manera efectiva en sus operaciones.