Editores establecen protocolo para cobrar por el uso de sus obras en el entrenamiento de la IA

Un nuevo estándar se presenta como solución a las inquietudes de los propietarios de obras protegidas por derechos de autor, quienes han denunciado el uso no autorizado de sus contenidos para entrenar y operar diversos modelos de inteligencia artificial (IA). Esta propuesta, conocida como Really Simple Licensing (RSL), tiene como objetivo ofrecer una compensación justa y estandarizada a los creadores, al mismo tiempo que facilita a las empresas tecnológicas el acceso legal a datos de entrenamiento.

El protocolo ha sido desarrollado por el Colectivo RSL, una organización de derechos de autor recientemente establecida por Eckart Walther, co-creador del estándar Really Simple Syndication (RSS), y Doug Leeds, exdirector ejecutivo de IAC Publishing.


\"Persona
Anthropic deberá pagar 1,500 millones de dólares a estos escritores por entrenar la IA con sus obras
Anthropic pagará al menos 3,000 dólares por cada obra que haya pirateado. La empresa descargó copias no autorizadas de libros en sus primeros esfuerzos por recopilar datos de entrenamiento para sus herramientas de IA.


Según sus promotores, RSL es un modelo abierto y descentralizado de licencias que permitirá a los propietarios de contenidos definir cómo deben pagar los desarrolladores de IA por extraer información desde sus sitios web. Su estructura se inspira en el RSS, una tecnología que popularizó la sindicación de contenidos online, permitiendo a los usuarios suscribirse a actualizaciones de portales de su interés y recibir un resumen de noticias o información en agregadores.

Tim O\’Reilly, director ejecutivo de O\’Reilly Media, explicó que el RSS permitió a los primeros editores en línea distribuir masivamente su contenido, lo que fue crucial para la evolución de internet como ecosistema informativo. “Sin embargo, hoy en día, a medida que los sistemas de IA absorben y reutilizan ese mismo contenido sin permiso ni compensación, las normas deben evolucionar. RSL proporciona la capa de licencias que faltaba y asegura que los creadores que impulsan la innovación en IA no solo participen en la conversación, sino que también reciban una retribución justa por el valor que generan”, afirmó.

Cómo funciona el estándar que pretende regular el “raspado” de la IA

Desde hace años, la mayoría de los sitios web utiliza el archivo robots.txt para indicar a los rastreadores —como los de los motores de búsqueda— a qué secciones pueden acceder y cuáles están restringidas. A diferencia de este protocolo, RSL no solo regula el acceso de los bots, sino que permite añadir términos de licencias y regalías dentro del robots.txt.

El estándar contempla distintos modelos de uso y pago, entre ellos: gratuidad, atribución, suscripción, pago por rastreo (compensación cada vez que una aplicación de IA rastrea contenido) y pago por inferencia (compensación cuando el material se utiliza para generar una respuesta).

Varias compañías ya respaldan la iniciativa. Entre ellas se encuentran Reddit, People Inc., Yahoo, Internet Brands, Ziff Davis, wikiHow, O\’Reilly Media, Medium, The Daily Beast, Miso.AI, Raptive, Ranker y Evolve Media. Asimismo, firmas como Fastly, Quora