Los acuerdos con los medios de comunicación de OpenAI alcanzan los 5 millones de dólares anuales

|

Los recientes acuerdos entre editores de noticias y empresas de IA han revelado el coste que OpenAI y empresas similares están dispuestas a pagar por el uso de material protegido por derechos de autor en sus modelos.

Al parecer, OpenAI está ofreciendo a los editores entre 1 y 5 millones de dólares anuales por proporcionar artículos periodísticos protegidos por derechos de autor que se utilizarán en el entrenamiento de la IA, según indica The Information.

En esta guía gratuita encontrarás todo lo necesario para dar los primeros pasos con Stable Diffusion y ChatGPT

Guía Gratuita Stable Diffusion + ChatGPT

Las cifras observadas en los recientes acuerdos de licencia de IA son similares a las de anteriores acuerdos no relacionados con la IA. Por ejemplo, cuando Meta lanzó la pestaña de noticias de Facebook, que ya no existe en Europa, se informó de que se podrían haber ofrecido hasta 3 millones de dólares al año por la licencia de noticias, titulares y avances. Sin embargo, no es seguro que esta cantidad sea equivalente a las cantidades mayores que se han visto en otros casos. Google declaró en 2020 que invertiría 1.000 millones de dólares en total para colaborar con organizaciones de noticias. Además, Google también aceptó recientemente pagar a los editores canadienses una suma de 100 millones de dólares al año debido a la aplicación de una nueva ley.

Los modelos lingüísticos modernos que se utilizan hoy en día suelen extraer sus datos de entrenamiento de Internet. Aunque hay modelos de IA que mantienen confidenciales sus fuentes de datos, puede encontrarse información sobre los conjuntos de datos o los rastreadores web utilizados. El coste de los conjuntos de datos de entrenamiento viene determinado por el proveedor, el tamaño y el contenido. Los conjuntos de datos de código abierto, como LAION, que son gratuitos, son utilizados por modelos como Stable Diffusion. Los desarrolladores de IA también utilizan rastreadores web para recoger datos de la red y entrenar sus modelos. Sin embargo, deben pagar a personas para que revisen, etiqueten y, en algunos casos, limpien los datos, lo que aumenta sus costes operativos.

Sin embargo, este enfoque se enfrenta actualmente a importantes obstáculos. Para empezar, se ha impedido que el robot GPT de OpenAI obtenga datos de varias empresas, como The New York Times o Vox Media. Además, muchas entidades argumentan que entrenarse con sus datos es una forma de violación de los derechos de autor. Posteriormente, The New York Times y otras entidades han interpuesto una demanda contra OpenAI y Microsoft, alegando que ChatGPT y Copilot de Microsoft pueden crear contenidos casi idénticos a los suyos.

Para esquivar estos problemas, las organizaciones de IA han estado formando alianzas con más frecuencia en los últimos doce meses. OpenAI ha acordado alianzas con Axel Springer (matriz de Politico y Business Insider) y The Associated Press para utilizar historias para enseñar a modelos como GPT-4 y fabricar tecnología para recopilar noticias.

OpenAI y Apple no son los únicos que quieren colaborar con los medios de comunicación. Recientemente, Google mostró un sistema de IA llamado Génesis a ejecutivos de The New York Times, The Wall Street Journal, y The Washington Post. Esta herramienta es capaz de tomar datos y convertirlos en historias. Aunque algunas organizaciones de prensa han empleado herramientas de IA en sus redacciones, la acogida ha sido desigual.

NeuronWriter: Asistente SEO con IA

Optimiza tu contenido para SEO fácil, rápido y con datos

Más información: The information

Más novedades IA