Guía de CANIA para el Despliegue Seguro de Modelos

La Guía de CANIA para el Despliegue Seguro de Modelos Fundamentales es un marco para que los proveedores de modelos desarrollen y desplieguen de manera responsable una variedad de modelos de IA, promuevan la seguridad para la sociedad y se adapten a las capacidades y usos en evolución.

Por Qué Es Importante

En los últimos años, se han producido avances rápidos en la IA impulsados por modelos fundamentales, a veces conocidos como modelos de lenguaje grande o IA de propósito general. Estos son sistemas de IA transformadores entrenados en grandes conjuntos de datos que alimentan una variedad de aplicaciones, desde la generación de contenido hasta interfaces conversacionales interactivas. Ya se reconoce ampliamente el potencial de esta tecnología tanto para el beneficio social como para el daño. El uso de modelos fundamentales podría permitir nuevas formas de expresión creativa, aumentar la productividad y acelerar el descubrimiento científico. También podría aumentar la desinformación, impactar negativamente a los trabajadores y automatizar actividades delictivas.

Riesgos Emergentes de la IA Falta de Orientación Práctica Necesidad de Acción Colectiva

Dado el potencial impacto de gran alcance de los modelos fundamentales, los principios de seguridad compartidos deben traducirse en orientaciones prácticas para los proveedores de modelos. Esto requiere una acción colectiva. Para establecer prácticas efectivas y acordadas colectivamente para el desarrollo y despliegue responsable de modelos, diversas voces de la industria, la sociedad civil, la academia y el gobierno deben trabajar juntas.

CANIA ha publicado la Guía para el Despliegue Seguro de Modelos Fundamentales, que continuará evolucionando en colaboración con nuestra comunidad global de organizaciones de la sociedad civil, la industria y la academia. Este es un marco para que los proveedores de modelos desarrollen y desplieguen de manera responsable los modelos fundamentales a través de un espectro de capacidades actuales y emergentes, ayudando a anticipar y abordar riesgos. La Guía de Despliegue de Modelos ofrece a los desarrolladores de IA recomendaciones prácticas para operacionalizar los principios de seguridad de la IA. Invitamos a más partes interesadas a involucrarse y ayudar a dar forma a este esfuerzo verdaderamente colectivo.

Orientación Práctica para la Seguridad de Modelos Fundamentales Creado a través de Colaboración Multisectorial Continua Personalizable para Tipos Específicos de Modelos y Lanzamientos Diseñado para Evolucionar a Medida que Surjan Nuevas Capacidades y Riesgos

Utilizando el sitio web de la Guía de Despliegue de Modelos de CANIA, los proveedores de modelos pueden recibir un conjunto de prácticas recomendadas a seguir a lo largo del proceso de despliegue, adaptadas a las capacidades de su modelo específico y cómo se está lanzando. Diseñado para ser un documento vivo que pueda responder adecuadamente a nuevas capacidades a medida que las tecnologías de IA continúen evolucionando, la Guía de Despliegue de Modelos de CANIA tiene como objetivo complementar los enfoques regulatorios más amplios.

Pasos para construir un modelo a tu medida

1. Elige el fundamento del modelo

En casos donde los modelos no encajen en una sola categoría, se seleccionará el tipo de modelo con una capacidad superior.

Propósito Especializado y Específico
DESCRIPCIÓN
Modelos diseñados para tareas o propósitos estrechamente definidos con capacidades generales limitadas, para los cuales hay un menor potencial de daño en diferentes contextos.
CONSIDERACIONES CLAVE
¿Alguna de las siguientes condiciones se aplica al modelo, incluso si no cumple todos los criterios? ¿El modelo está diseñado para un dominio o tarea estrecha y bien definida?
¿Sus capacidades son menos aplicables en diferentes contextos?
¿El modelo presenta un menor riesgo de uso indebido en diferentes contextos?
La diferencia clave con los modelos de Estrechos Avanzados y Propósito General es que estos tienen capacidades muy limitadas en términos de entrada, dominio, complejidad de salida y generalización potencial.
EJEMPLOS
Modelos de generación de música
Propósito Avanzado Específico y General
DESCRIPCIÓN
Modelos con capacidades generativas para contenido sintético como texto, imagen, audio, video. Pueden estar enfocados en un propósito estrecho para tareas o modalidades específicas o ser de propósito general. También cubre algunos modelos de propósito estrecho enfocados en dominios científicos, biológicos u otros de alta consecuencia.
Incluye modelos de propósito general capaces en diversos contextos, como chatbots/LLMs (modelos de lenguaje grande) y modelos multimodales.
CONSIDERACIONES CLAVE
¿Alguna de las siguientes condiciones se aplica al modelo, incluso si no cumple todos los criterios?
¿El modelo puede generar contenido sintético difícil de distinguir de la realidad (texto, audio, video), incluso si es de propósito estrecho?
¿Podría el modelo facilitar la suplantación de identidad, desinformación u otros ataques sociales, químicos, biológicos o cibernéticos si se utiliza de manera indebida, incluso si se enfoca en una tarea específica?
¿O es el modelo más aplicable en general a través de contextos en lugar de estar estrechamente enfocado?
¿El modelo implica múltiples modalidades como texto, imagen, audio, video?
EJEMPLOS
Text-to-speech (Texto a voz)
Suplantación de voz
Texto a imagen/video
Generación de código (por ejemplo, GitHub Copilot)
Modelos científicos
Modelos multimodales (por ejemplo, GPT-4)
Chatbots (por ejemplo, Geminis, ChatGPT, Bard)
Paradigma Transformador o de Frontera
DESCRIPCIÓN
Modelos de propósito general de vanguardia que avanzan significativamente en capacidades a través de modalidades en comparación con el estado del arte actual.
CONSIDERACIONES CLAVE
¿Alguna de las siguientes condiciones se aplica al modelo, incluso si no cumple todos los criterios? ¿El modelo permite capacidades significativamente más avanzadas en comparación con el estado del arte actual?
¿El modelo utiliza parámetros o recursos computacionales que superan ampliamente los estándares actuales, demostrando un avance en el entrenamiento escalable?
¿El modelo muestra evidencia de capacidades de autoaprendizaje que superan el actual de la IA?
¿El proveedor del modelo permite la ejecución de comandos o acciones directamente en el mundo real a través de interfaces o aplicaciones lanzadas, más allá del procesamiento pasivo de información?
EJEMPLOS
Modelos multimodales extremadamente grandes

2. Tipo de despliegue

Selecciona el método de lanzamiento inicial previsto. Para implementaciones por fases, elige la etapa actual y revisa esta guía a medida que avancen los planes de lanzamiento.

Acceso Abierto
DESCRIPCIÓN
Modelos lanzados públicamente con acceso completo a componentes clave, especialmente los pesos del modelo. También puede incluir acceso al código y los datos. Puede ser gratuito o con licencia comercial. El acceso puede ser descargable o a través de APIs en la nube y otros servicios alojados.
CONSIDERACIONES CLAVE
¿La publicación incluye al menos los pesos del modelo y posiblemente otros componentes como código, datos de entrenamiento y arquitectura?
Acceso restringido a través de API y alojamiento controlado
DESCRIPCIÓN
Modelos disponibles solo a través de una API controlada, plataforma en la nube o alojados a través de una interfaz propietaria, con limitaciones de uso. No proporciona posesión directa del modelo. Permite restringir el acceso y monitorear el uso para reducir posibles daños.
CONSIDERACIONES CLAVE
¿El lanzamiento del modelo solo es accesible a través de medios controlados como APIs propietarias, plataformas o interfaces?
Desarrollo Cerrado
DESCRIPCIÓN
Modelos desarrollados de manera confidencial dentro de una organización primero, con lanzamientos altamente limitados para evaluación interna o pruebas externas restringidas, antes de cualquier posible disponibilidad pública.
CONSIDERACIONES CLAVE
¿El acceso al modelo está restringido solo al personal interno y a terceros externos limitados para pruebas, y no al público en general?
Lanzamiento de Investigación
DESCRIPCIÓN
Modelos lanzados de manera restringida para demostrar conceptos de investigación, técnicas, demos, versiones ajustadas de modelos existentes. El lanzamiento tiene como objetivo compartir conocimientos y permitir que otros construyan sobre él, excluyendo proyectos individuales a pequeña escala.
CONSIDERACIONES CLAVE
¿Alguna de las siguientes condiciones se aplica al modelo, incluso si no cumple todos los criterios? ¿El lanzamiento está destinado a mostrar artefactos de investigación como ingredientes de publicación, demos, versiones ajustadas de modelos existentes?
¿Cualquier uso comercial posterior requeriría un trabajo adicional significativo antes de la implementación en el mundo real?
¿El modelo tiene funcionalidad, rendimiento y robustez limitados en comparación con equivalentes comerciales?
Esta categoría representa la utilidad restringida de los artefactos y experimentos de investigación, mientras que las otras categorías comprenden modelos de producción completos destinados para la implementación en el mundo real.

3. Actualización

Lanzamiento de Modelo Significativamente Mejorado
DESCRIPCIÓN
Modelos que continúan su desarrollo importante después de su implementación mediante una expansión significativa de capacidades, lo que requiere una renovación en los procesos de gobierno.
CONSIDERACIONES CLAVE
¿Alguna de las siguientes condiciones se aplica al modelo, incluso si no cumple todos los criterios?
¿La actualización mejora drásticamente la arquitectura del modelo, el alcance del conocimiento, las modalidades o las capacidades más allá del lanzamiento inicial?
¿La actualización presenta riesgos novedosos que requieren una evaluación adicional?
¿La actualización expande significativamente las posibles aplicaciones beneficiosas y perjudiciales?
EJEMPLOS
Agregar modalidades completamente nuevas como texto+video después de inicialmente solo texto.
Permitir conexiones a bases de datos en tiempo real que amplían enormemente el alcance del conocimiento.

Dadas las capacidades expandidas introducidas en esta actualización, recomendamos revisar las pautas a continuación, según corresponda, para garantizar una innovación responsable en el futuro.

Para recibir actualizaciones sobre este programa, incluyendo correos electrónicos trimestrales de actualización, subscríbete aquí.