¿Qué pasó cuando un periodista tecnológico experimentó con IA en una PC?

En los últimos meses, el equipo editorial del título hermano francés de Computer Weekly, Lemagit, ha estado evaluando diferentes versiones de varios modelos de idiomas grandes descargables gratuitos (LLMS) en máquinas personales. Estas LLM actualmente incluyen Gemma 3 de Google, Meta’s Llama 3.3, Claude 3.7 Sonnet de Anthrope, varias versiones de Mistral (Mistral, Mistral Small 3.1, Mistral Nemo, Mixtral), IBM’s Granite 3.2, Qwen 2.5 de Alibaba y Deepseek R1, que es un razonamiento primario de Over Llama.

El protocolo de prueba consiste en tratar de transformar entrevistas grabadas por periodistas durante sus informes en artículos que pueden publicarse directamente en Lemagit. Lo que sigue son las experiencias del equipo de Lemagit:

Estamos evaluando la viabilidad técnica de hacerlo en una máquina personal y la calidad de la salida con los recursos disponibles. Dejemos en claro desde el principio que nunca hemos logrado que una IA funcione correctamente para nosotros. El único punto de este ejercicio es comprender las posibilidades reales de la IA basada en un caso concreto.

Nuestro protocolo de prueba es un aviso que incluye 1,500 tokens (6,000 caracteres, o dos páginas de revistas) para explicar a la IA cómo escribir un artículo, más un promedio de 11,000 tokens para la transcripción de una entrevista que dura alrededor de 45 minutos. Tal aviso generalmente es demasiado pesado para caber en la ventana gratuita de una IA en línea. Es por eso que es una buena idea descargar una IA en una máquina personal, ya que el procesamiento sigue siendo gratuito, sea cual sea su tamaño.

El protocolo se lanza desde el software LM Studio Community, que imita la interfaz de chatbot en línea en la computadora personal. LM Studio tiene una función para descargar LLM directamente. Sin embargo, todos los LLM que se pueden descargar de forma gratuita están disponibles en el sitio web de Hugging Face.

¿Cuáles son las limitaciones técnicas?

¿Qué calidad podemos esperar?

¿Cuáles son las posibles optimizaciones de hardware?

¿Cómo se escribe un buen mensaje?

La utilidad de la IA debe ponerse en perspectiva