Entrevista ejecutiva: Agregar sentido común a la creatividad generativa de la IA

Según Jim Webber, científico jefe de Neo4j, existe una relación saludable entre los modelos de lenguaje grande (LLM) y las bases de datos de gráficos, que se utilizan para extraer información a través de diferentes redes de datos.

Computer Weekly habló con Webber luego de la ratificación del estándar GQL ISO, que proporciona una forma estándar de realizar búsquedas en bases de datos de gráficos y es análogo al estándar ISO SQL-86 para sistemas de gestión de bases de datos relacionales.

Las bases de datos gráficas adoptan un enfoque muy diferente a las consultas de datos que las bases de datos relacionales. Webber ha trabajado con bases de datos de gráficos durante aproximadamente 16 años, 14 de los cuales han sido con Neo4j. Si bien ve un papel para las bases de datos relacionales, el punto principal de Webber es que el rendimiento del tiempo de ejecución en una base de datos relacional se deteriora.

La idea básica detrás de un sistema de base de datos relacional es que organiza los datos de forma orientada a filas y vincula los activos de datos mediante “uniones” para vincular filas en una tabla de base de datos con filas en otra para formar una relación entre las dos. Un ejemplo simple es una fila que identifica una referencia de cliente única en una tabla que vincula a los detalles de contacto del cliente que se encuentran en otra tabla.

“Irónicamente, las bases de datos relacionales son terribles a la hora de unir”, afirma. “Esto es lo único que no desea hacer en una base de datos relacional porque lo hace en tiempo de ejecución en la parte costosa del sistema”, dice Webber.

Esto, señala, se debe a que las uniones se ejecutan efectivamente en la memoria y ocurren cuando una aplicación o un usuario ejecuta una consulta que requiere interrogar varias tablas de bases de datos.

Sin embargo, a pesar de esta aparente ineficiencia, las bases de datos relacionales son la plataforma de datos central para muchas aplicaciones empresariales.

“Las redes de gráficos te permiten modelar [messy data] de forma de alta fidelidad sin sufrir el dolor y la complejidad de tener que crear tablas y esquemas complejos y realizar uniones en tiempo de ejecución”.

Jim Webber, Neo4j

“Antes tenía sentido utilizar bases de datos relacionales, porque todos los datos eran idénticos”, añade. Webber se refiere al hecho de que algo así como un sistema de nómina contiene miles de instancias de datos con formato idéntico para miles de empleados.

Dice: “El mundo en el que vivíamos en los años 1980 era uniforme, y el mundo en el que vivíamos en los años 1990 era mayoritariamente uniforme, por lo que tenía mucho sentido utilizar una base de datos relacional”.

Pero con la explosión de sistemas que ha ocurrido más recientemente, Webber dice que los datos se han vuelto más confusos. “Las redes de gráficos le permiten modelar ese desorden en una forma de alta fidelidad sin sufrir el dolor de la ‘bomba de unión’ y la complejidad de tener que construir tablas y esquemas complejos y realizar uniones en tiempo de ejecución”, afirma.

Confianza en GQL

Sentido común de la IA