IA generativa: Databricks presenta un modelo de lenguaje grande de código abierto

La empresa de datos e inteligencia artificial (IA) Databricks ha presentado DBRX, un modelo de lenguaje grande (LLM) de propósito general que, según afirma, puede superar a otros modelos de código abierto.

La compañía dijo que DBRX supera a los LLM de código abierto existentes, como Llama 2 70B y Mixtral-8x7B, en puntos de referencia de la industria que incluyen comprensión de lenguajes, programación, matemáticas y lógica.

“DBRX democratiza la capacitación y el ajuste de LLM personalizados y de alto rendimiento para cada empresa, de modo que ya no necesiten depender de un pequeño puñado de modelos cerrados”, dijo la compañía.

Ali Ghodsi, cofundador y director ejecutivo de Databricks, dijo que DBRX permite a las empresas crear “capacidades de razonamiento personalizadas basadas en sus propios datos”. Debido a que DBRX supera a GPT-3.5 en la mayoría de los puntos de referencia, dijo que debería acelerar la tendencia que Databricks está viendo entre sus clientes: organizaciones que reemplazan modelos propietarios con modelos de código abierto.

DBRX supera a GPT-3.5 en comprensión de lenguajes (MMLU), programación (HumanEval) y matemáticas (GSM8K), dijo Databricks.

DBRX fue desarrollado por Mosaic AI y entrenado en Nvidia DGX Cloud. Databricks optimizó DBRX para lograr eficiencia con una arquitectura de combinación de expertos (MoE), basada en el proyecto de código abierto MegaBlocks. El modelo resultante es hasta dos veces más eficiente en computación que otros LLM líderes disponibles, dijo la compañía.

DBRX está disponible en GitHub y Hugging Face para uso comercial y de investigación. En la plataforma Databricks, las empresas pueden interactuar con DBRX y crear modelos DBRX personalizados a partir de sus propios datos únicos. DBRX también está disponible en Amazon Web Services (AWS) y Google Cloud, así como directamente en Microsoft Azure a través de Azure Databricks. También se espera que DBRX esté disponible a través de la API del catálogo de Nvidia y sea compatible con el microservicio de inferencia NIM de Nvidia.

Si bien el modelo es de código abierto, Databricks también ofrece servicios relacionados para ayudar a las empresas a crear e implementar aplicaciones de IA generativa (GenAI) con calidad de producción.

“Este será, con diferencia, el mejor modelo de código abierto que existe: supera a GPT-3.5 en calidad y es completamente de código abierto”.

Naveen Rao, ladrillos de datos