El juicio entre el New York Times y OpenAI ha puesto sobre la mesa más dudas respecto al poder de la inteligencia artificial... y la disputa va más allá de los derechos de autor
El New York Times contra la IA


Por: Miguel Ángel Romero
La conversación pública sobre inteligencia artificial lleva tres años concentrada en la misma serie de preguntas: qué tan potentes son los modelos, cuánto cómputo consumen, cuánto dinero se está invirtiendo. Son preguntas legítimas, pero también hay otros enfoques y uno de ellos es posible revisarlo a partir de lo que está en juego en el juicio entre el New York Times y OpenAI.
La pregunta en este caso es cómo se entrenan estos modelos que están cada vez más omnipresentes, ¿en dónde se nutre la inteligencia que estos sistemas exhiben? Ese es, en el fondo, el cuestionamiento que el Times está obligando a responder ante un tribunal.
La demanda -es su versión actualizada- hace una acusación que va más allá de la disputa habitual sobre copyright. No se limita a decir que OpenAI usó artículos del Times sin permiso, sino pone énfasis en que Microsoft financió, de manera deliberada, la construcción de una de las supercomputadoras más grandes del mundo con un propósito específico: absorber cantidades masivas de contenido protegido -incluido el periodismo del Times- y convertirlo en un producto comercial.
Se trata de una afirmación que los especialistas están observando con mucho cuidado. Y es que una industria pasa décadas produciendo conocimiento, reporteo, verificación, edición y otra invierte miles de millones de dólares en construir la máquina capaz de consumir ese trabajo a una escala y velocidad que ninguna redacción podría replicar.
¿Es eso aprendizaje? ¿O es extracción? Por qué esto no es lo mismo que hace Google. Durante dos décadas, los buscadores operaron bajo un pacto implícito con los medios: podían indexar el contenido, mostrar fragmentos, incluso lucrar con publicidad alrededor de los resultados, pero al final tenían que enviar al usuario hacia el sitio original.
El tráfico funcionaba como moneda de cambio. Imperfecta, insuficiente, pero real.
La inteligencia artificial generativa no necesita preservar ese pacto ya que puede responder la pregunta directamente, sin enviar a nadie a ningún lado. El usuario pregunta, el modelo contesta, y el clic -ese clic del que dependía todo un ecosistema de negocio- deja de existir.
Cuando dicho clic desaparece, también se esfuma la publicidad que dependía de él. Desaparece la suscripción que podría haber nacido de esa visita. Se borra, en el sentido más literal, la relación económica entre quien produce información y quien la consume.
Ese cambio es brutal para la industria de los medios de comunicación porque no se trata de que la IA copie contenido -internet lleva copiando contenido desde que existe internet-, se trata de que la IA puede eliminar la necesidad de visitar la fuente.
Entre las pruebas presentadas hay capturas de pantalla que muestran a GPT reproduciendo fragmentos extensos de artículos del Times, incluyendo, en algunos casos, contenido protegido detrás del muro de pago, reconstruido simplemente al solicitar "el siguiente párrafo".
La batalla legal será librada alrededor del concepto de fair use: doctrina del derecho estadounidense que permite usar material protegido sin permiso bajo ciertas condiciones. La lógica detrás es simple: una sociedad que protege demasiado rígidamente la propiedad intelectual termina sofocando la cultura que intenta proteger.
Así que la ley abre una válvula en la que el crítico puede citar el libro que reseña, el académico puede reproducir el poema que analiza, el artista puede samplear la canción que resignifica. Lo que hace que ese uso sea legítimo es que transforma el material original -lo usa para producir algo con una función distinta- y que, al hacerlo, no destruye el mercado de la obra original.
Esa segunda condición es la que convierte este juicio en algo más que un debate técnico. OpenAI sostendrá que entrenar un modelo sobre millones de artículos es un acto transformador: el sistema aprende patrones del lenguaje, construye capacidades generales, produce algo cualitativamente distinto a cualquier artículo individual.
Mientras que el New York Times sostendrá que el resultado final -un sistema capaz de reproducir sus artículos detrás del muro de pago, párrafo a párrafo, ante quien simplemente lo solicite- es precisamente el tipo de sustitución comercial que el fair use fue diseñado para impedir. Veremos qué definen los tribunales.