X

Noticias IA

¿Están los agentes de IA listos para el lugar de trabajo? Un nuevo estándar genera dudas.

Ha pasado casi dos años desde que el CEO de Microsoft, Satya Nadella, predijo que la inteligencia artificial (IA) reemplazaría los trabajos de conocimiento, aquellos que suelen desempeñar abogados, banqueros de inversión, bibliotecarios, contables y profesionales de la tecnología, entre otros. Sin embargo, a pesar de los avances significativos en los modelos de IA, el cambio en este tipo de trabajo ha sido lento y difícil de observar.

Avances y desafíos de la IA en el trabajo de conocimiento

A pesar de que los modelos de IA han demostrado habilidades avanzadas en investigación profunda y planificación, la mayoría de los trabajos de oficina siguen relativamente intactos. Esto plantea un interrogante sobre el impacto real de la IA en el mundo laboral, uno de los más grandes misterios en este ámbito. Gracias a una nueva investigación de Mercor, especializada en datos de entrenamiento, se están empezando a desvelar algunas respuestas.

Benchmark Apex-Agents

La investigación se centra en cómo los modelos de IA líderes funcionan en tareas de trabajo de oficina reales, basadas en consultoría, banca de inversión y derecho. El resultado ha sido el desarrollo de un nuevo benchmark denominado Apex-Agents, que ha dejado a todos los laboratorios de IA con un suspenso. Ante preguntas formuladas por profesionales reales, incluso los mejores modelos no lograron responder correctamente más de una cuarta parte de las cuestiones planteadas, y en muchos casos, regresaron con respuestas incorrectas o sin respuesta.

Primeros hallazgos de la investigación

Según Brendan Foody, investigador que participó en el estudio, el principal obstáculo para los modelos de IA ha sido localizar información a través de múltiples dominios, un aspecto crítico en la mayor parte del trabajo de conocimiento humano. “Uno de los grandes cambios en este benchmark es que construimos todo el entorno, modelando cómo son realmente los servicios profesionales”, explicó Foody.

La complejidad de las tareas

Las situaciones planteadas en el estudio se originaron de algunas consultas realizadas por profesionales reales en el mercado de expertos de Mercor, quienes definieron los criterios para determinar una respuesta exitosa. Esto proporciona una visión de la complejidad de las tareas que se llevan a cabo en los entornos laborales.

Desafíos específicos en el ámbito legal

Un ejemplo de las preguntas planteadas en la sección de Derecho es el siguiente:

“Durante los primeros 48 minutos de la interrupción de producción de la UE, el equipo de ingeniería de Northstar exportó uno o dos conjuntos agrupados de registros de eventos de producción de la UE que contenían datos personales al proveedor de análisis de EE. UU… Bajo las propias políticas de Northstar, ¿puede tratar razonablemente las exportaciones de registro como consistentes con el Artículo 49?”

La respuesta correcta es , pero llegar a ello exige una evaluación profunda de las políticas de la empresa y de las leyes de privacidad de la UE, lo que puede resultar complicado incluso para un ser humano bien informado.

Comparativa con otros benchmarks

OpenAI también intentó evaluar habilidades profesionales con su benchmark GDPVal, pero el test de Apex Agents presenta diferencias significativas. Mientras que GDPVal mide el conocimiento general en una amplia variedad de profesiones, el benchmark Apex Agents se centra en la capacidad del sistema para realizar tareas sostenidas en un conjunto reducido de profesiones de alto valor, lo que sucede que resulta más difícil para los modelos y está más vinculado a la posibilidad de automatizar esos trabajos.

Resultados y proyecciones futuras

Si bien ninguno de los modelos probados ha mostrado estar listo para reemplazar a banqueros de inversión, algunos han tenido un rendimiento más cercano a la meta. Por ejemplo, Gemini 3 Flash ha obtenido una precisión de 24%, seguido de cerca por GPT-5.2 con un 23%, y otros como Opus 4.5 y Gemini 3 Pro han presentado resultados alrededor del 18%.

Aunque los resultados iniciales no son los esperados, el ámbito de la IA tiene un historial de superar desafíos difíciles. Dado que la prueba Apex se ha hecho pública, representa un desafío abierto para los laboratorios de IA que creen que pueden lograr mejores resultados.

Reflexiones sobre la evolución de la IA

Foody destacó que la IA está mejorando muy rápidamente, señalando que es justo decir que en la actualidad es como un interno que acierta una de cada cuatro veces, mientras que el año pasado acertaba entre un cinco y un diez por ciento de las ocasiones. Este tipo de mejora constante puede tener un impacto significativo en el futuro cercano.

Consejos para emprendedores y negocios

  1. Adopta la tecnología de manera gradual: Antes de implementar IA en tu negocio, es esencial evaluar primero las capacidades y limitaciones. Comienza por experimentar en áreas donde la IA puede complementar el trabajo humano.

  2. Formación continua en habilidades digitales: A medida que la IA evoluciona, los empleados deben actualizar sus habilidades para trabajar junto con la tecnología. La formación en herramientas de colaboración en línea y IA puede ser invaluable.

  3. Analiza los datos: Utiliza la IA para extraer valor de los datos disponibles en tu negocio. La toma de decisiones basada en datos informados puede marcar la diferencia.

  4. Mantente al día con las tendencias: El sector de la IA está en constante evolución. Estar informado sobre los avances puede darte una ventaja competitiva.

  5. Fomenta la creatividad y la innovación: La IA puede llevar a cabo tareas repetitivas y analíticas, lo que permite a los empleados centrarse en el pensamiento creativo y la innovación. Fomenta un entorno donde se valoren estas habilidades.

Conclusiones

La búsqueda por integrar inteligencia artificial en los trabajos de conocimiento ha arrojado hallazgos interesantes, pero también revela los retos que aún persisten en este campo. Aunque los modelos actuales no están listos para reemplazar a los profesionales en muchos sectores, la continua evolución de la tecnología promete un futuro intrigante. La colaboración entre humanos e IA podría redefinir la naturaleza del trabajo, y es crucial que emprendedores y negocios se adapten a estos cambios para prosperar.

Compartir noticia

Publicado

en

por

Newsletter Negocios con IA

¿Quieres Mejorar tu Negocio?