Comprender la arquitectura del trapo y sus fundamentos

Todos los editores y proveedores del modelo de lenguaje grande (LLM) se están centrando en el advenimiento de los agentes de inteligencia artificial (IA) y la IA agente. Estos términos son confusos. Más aún, ya que los jugadores aún no están de acuerdo en cómo desarrollarlos e implementarlos.

Esto es mucho menos cierto para las arquitecturas de generación aumentada de recuperación (RAG) donde, desde 2023, ha habido un consenso generalizado en la industria de TI.

La generación aumentada a través de la recuperación permite que los resultados de un modelo de IA generativo se anclen en la verdad. Si bien no previene las alucinaciones, el método tiene como objetivo obtener respuestas relevantes, basadas en los datos internos de una empresa o en la información de una base de conocimiento verificada.

Podría resumirse como la intersección de la IA generativa y un motor de búsqueda empresarial.

¿Qué es la arquitectura de trapo?

Preparación de datos, una necesidad incluso con trapo

Chunking y sus estrategias

Vectorización e incrustación de modelos

La base de datos de vector y su algoritmo de recuperación

Búsqueda híbrida y rerantos

Evaluar y observar