X

Noticias IA

El nuevo modelo del laboratorio de IA indio Sarvam es una apuesta importante por la viabilidad de la IA de código abierto.

El laboratorio indio de inteligencia artificial Sarvam ha presentado una nueva generación de modelos de lenguaje de gran tamaño, confiando en que modelos de IA más pequeños y eficientes puedan captar parte del mercado que actualmente dominan sistemas más costosos ofrecidos por grandes competidores de EE.UU. y China. Este lanzamiento, realizado en la Cumbre de Impacto de IA en India en Nueva Delhi, se alinea con el esfuerzo del gobierno indio por reducir la dependencia de plataformas extranjeras de IA y personalizar los modelos a idiomas locales y casos de uso específicos.

Novedades en los Modelos de IA de Sarvam

Sarvam ha introducido una serie de nuevos modelos que incluyen configuraciones con 30 mil millones y 105 mil millones de parámetros, así como modelos de texto a voz, de voz a texto y un modelo de visión para hacer análisis de documentos. Esta actualización representa una evolución significativa respecto al modelo anterior de 2 mil millones de parámetros que se lanzó en octubre de 2024.

Estructura de los Nuevos Modelos

Los modelos de 30B y 105B utilizan una arquitectura de mezcla de expertos, activando solo una fracción de sus parámetros en un momento dado, lo que reduce considerablemente los costos de computación. El modelo de 30 mil millones proporciona un contexto de 32,000 tokens para uso conversacional en tiempo real, mientras que el modelo más grande ofrece una ventana de 128,000 tokens para tareas de razonamiento más complejas.

Sarvam también ha destacado que estos modelos fueron entrenados desde cero y no simplemente ajustados sobre sistemas existentes de código abierto. El modelo de 30B fue preentrenado con aproximadamente 16 billones de tokens de texto, mientras que el modelo de 105B abarcó trillones de tokens en múltiples idiomas indios.

Aplicaciones Prácticas y Soporte Técnico

Los modelos están diseñados para soportar aplicaciones en tiempo real, que incluyen asistentes de voz y sistemas de chat en idiomas indios. Sarvam ha contado con recursos computacionales proporcionados por la Misión IndiaAI impulsada por el gobierno, así como con apoyo técnico de Nvidia y respaldo de Yotta, un operador de centros de datos.

Estrategia de Escalado

Los ejecutivos de Sarvam han manifestado que la empresa adoptará un enfoque medido para escalar sus modelos, priorizando las aplicaciones del mundo real por encima del tamaño bruto de sus modelos. Pratyush Kumar, cofundador de Sarvam, enfatizó en la necesidad de entender las tareas que realmente importan a gran escala para orientar el desarrollo.

Sarvam tiene la intención de abrir el código de los modelos de 30B y 105B, aunque aún no ha especificado si también se publicarán los datos de entrenamiento o el código completo del entrenamiento.

Planes Futuros y Propuestas de Valor

Además de sus modelos de lenguaje, Sarvam planea desarrollar sistemas de IA especializados, que incluirán modelos orientados a la programación y herramientas empresariales bajo un producto denominado Sarvam for Work, así como una plataforma de agente conversacional llamada Samvaad.

Fundada en 2023, Sarvam ha recaudado más de 50 millones de dólares y cuenta entre sus inversores con Lightspeed Venture Partners, Khosla Ventures y Peak XV Partners (anteriormente Sequoia Capital India).

Consejos para Emprendedores y Negocios

  • Innova en el Uso de IA: Aprovecha la capacidad de modelos de IA más pequeños y personalizados que se adapten a tu mercado local. Estos modelos pueden ser competitivos y más accesibles.

  • Apóyate en el Código Abierto: Considera utilizar y contribuir a modelos de IA de código abierto. Esto puede fomentar la colaboración y mejorar la innovación en tu sector.

  • Focalízate en Aplicaciones Prácticas: No te concentres únicamente en el tamaño de tus sistemas de IA, sino en su utilidad práctica. Busca identificar casos de uso específicos que sean relevantes para los usuarios.

  • Colabora con el Ecosistema Local: Establece alianzas con instituciones tecnológicas y gubernamentales que puedan proporcionar el apoyo necesario para el desarrollo de proyectos de IA, como lo está haciendo Sarvam con la Misión IndiaAI.

Conclusiones

La presentación de los nuevos modelos de Sarvam refuerza la tendencia hacia el desarrollo de IA local que no solo es más asequible, sino que también se adapta a contextos culturales y lingüísticos específicos. El enfoque en la creación de modelos más eficientes y su disposición a abrir su tecnología al público son pasos que pueden inspirar a otros en el ecosistema de IA. Los emprendedores deben observar estas tendencias y considerar cómo pueden aplicar estas lecciones a sus propios negocios para mantenerse competitivos en un mercado en rápida evolución.

Compartir noticia

Publicado

en

por

Newsletter Negocios con IA

¿Quieres Mejorar tu Negocio?