No se puede confiar en que las empresas de IA compartan voluntariamente información sobre riesgos

No se puede confiar en que las empresas de inteligencia artificial (IA) compartan voluntariamente información sobre las capacidades y los riesgos del sistema, dicen empleados actuales y anteriores en un llamado abierto para una mayor protección de los denunciantes.

Durante la segunda Cumbre mundial de IA en Seúl, 16 empresas firmaron los Compromisos de Seguridad de la IA de Frontier, que es un conjunto voluntario de medidas sobre cómo desarrollarán la tecnología de forma segura, por ejemplo, evaluando los riesgos que plantean sus modelos en cada etapa del proceso. todo el ciclo de vida de la IA, estableciendo umbrales de riesgo inaceptables para hacer frente a las amenazas más graves y proporcionando transparencia pública sobre todo el proceso de evaluación de riesgos.

Según uno de los compromisos voluntarios clave, las empresas dijeron que tampoco desarrollarán ni implementarán sistemas de inteligencia artificial si los riesgos no pueden mitigarse lo suficiente.

Sin embargo, menos de dos semanas después de la cumbre, un grupo de trabajadores actuales y anteriores de OpenAI, Anthropic y DeepMind (los dos primeros firmaron los compromisos de seguridad en Seúl) han dicho que los acuerdos voluntarios actuales no serán suficientes para garantizar una supervisión efectiva. de empresas que desarrollan IA.

Agregaron que si bien las propias empresas, junto con los gobiernos y otros expertos en IA, han reconocido los riesgos claros que plantea la tecnología, que “van desde un mayor afianzamiento de las desigualdades existentes, hasta la manipulación y la desinformación, y la pérdida de control de la IA autónoma”, sistemas que potencialmente resultan en la extinción humana” – las empresas tienen “fuertes incentivos financieros” para evitar una supervisión efectiva.

“No creemos que las estructuras personalizadas de gobierno corporativo sean suficientes para cambiar esto”, escribieron en una carta abierta del 4 de junio de 2024.

“Las empresas de IA poseen sustancial información no pública sobre las capacidades y limitaciones de sus sistemas, la idoneidad de sus medidas de protección y los niveles de riesgo de diferentes tipos de daños. Sin embargo, actualmente sólo tienen obligaciones débiles de compartir parte de esta información con los gobiernos, y ninguna con la sociedad civil. No creemos que se pueda confiar en que todos lo compartirán voluntariamente”.

Acuerdos de confidencialidad