A medida que los Modelos de Lenguaje Grande (LLMs, por sus siglas en inglés) han ido creciendo en potencia, la problemática de las alucinaciones se ha demostrado ser notablemente difícil de evitar. A pesar de los avances, los errores continúan surgiendo incluso en los modelos más avanzados. Actualmente, la industria está en proceso de encontrar las mejores soluciones para mitigar estos problemas. En este contexto, la empresa Probably ha recaudado 9 millones de dólares en financiamiento semilla de Andreessen Horowitz y está trabajando en una forma más rigurosa para identificar estos errores.
Objetivos de Probably
Según el fundador Peter Elias, la meta de la empresa es prevenir que las alucinaciones y errores factuales simples lleguen a los usuarios, buscando alcanzar una precisión del 99,99% común en sistemas determinísticos, aunque mucho más complicada con la inteligencia artificial. Para lograr este nivel de precisión, es necesario replantear muchas de las suposiciones básicas de la ingeniería de inteligencia artificial.
Herramienta de Ciencia de Datos
El primer producto lanzado por Probably es una herramienta de ciencia de datos que proporciona respuestas rápidas a partir de conjuntos de datos complejos. Cada resultado cuenta con una cita y una traza de auditoría que explica cómo se desarrolló, una práctica cada vez más común entre las herramientas de IA.
Sistema de Validación
Para evitar que los errores se cuelen en estos resúmenes, se ha implantado un elaborado sistema de arneses, que Elias describe como un “traje mecánico de ciencia de datos”. Las primeras respuestas del LLM son verificadas contra un sistema de validación determinista, que rechaza cualquier resultado que no coincida con el conjunto de datos. Es crucial que el LLM haya sido entrenado con este validador, y que todo el sistema esté optimizado para obtener respuestas rápidas y correctas, según asegura la empresa.
Reducción de Ambigüedad
Elias comenta: “Lo que aprendimos al construir esto es que cuanto mejor sea tu ingeniería de arneses, más débil puede ser el modelo”. Si se puede refinar suficientemente el contexto, el modelo no tiene que esforzarse demasiado para hacer lo correcto. En esencia, se trata de un ejercicio para reducir la ambigüedad.
Ventajas para Emprendedores y Negocios
Costos de Uso de IA
La herramienta de Probably permite trabajar con modelos de IA significativamente más pequeños. Elias afirma que la versión actual opera con un modelo que es “cuatro clases más débil que los modelos de frontera”, lo que significa que puede ejecutarse en hardware local, como un ordenador personal en lugar de en un centro de datos, lo que reduce enormemente los costos de tokens asociados con el uso de IA. Esta es una propuesta valiosa en un momento en que los costos están en aumento y muchos clientes están reexaminando sus presupuestos de IA.
Aplicaciones Diversas
La idea de Elias no se limita a la ciencia de datos; el mismo motor puede ampliarse para cubrir casos de uso en contabilidad o servicios médicos —en palabras de Elias, “cualquier caso de uso sensible a la precisión”.
Conclusiones
La innovación propuesta por Probably podría cambiar las reglas del juego en el uso de la inteligencia artificial, especialmente en sectores donde la precisión es crucial. Al ofrecer una herramienta que no solo promete minimizar errores, sino que también permite operar con costos reducidos, abren la puerta a una mayor accesibilidad del uso de IA para emprendedores y pequeñas empresas. En un entorno competitivo, esto podría marcar la diferencia, facilitando a más negocios la adopción de tecnologías avanzadas sin comprometer la calidad ni la precisión.
Consejos para emprendedores:
- Explora nuevas herramientas que prioricen la precisión y la transparencia.
- Considera modelos de IA más pequeños y accesibles para reducir costos operativos.
- Mantente al tanto de las innovaciones en el campo de la IA para aprovechar las mejores prácticas y técnicas.
Este progreso no solo tiene implicaciones para Probably, sino para toda la industria de la inteligencia artificial, donde la búsqueda de soluciones que minimizan los errores es cada vez más crucial.