El desarrollo de sistemas de inteligencia artificial y la posible infracción de derechos de autor

2023-04-26T17:03:00
Otros países
Demanda en Estados Unidos por infracción de derechos de autor contra los desarrolladores y comercializadores de un sistema de inteligencia artificial
El desarrollo de sistemas de inteligencia artificial y la posible infracción de derechos de autor
26 de abril de 2023

El fenómeno de la Inteligencia Artificial (“IA”) está en auge. Cada día son más los programas y herramientas que se inscriben en esta tecnología. En particular, la IA generativa -aquella que puede generar textos o imágenes a partir de las instrucciones recibidas en lenguaje natural- está experimentando un crecimiento exponencial, siendo ejemplo de ello el desarrollo de programas como Chat-GPT, Dall.E-2, o CopyAI, los cuales permiten ver -sea con esperanza o con temor- el enorme potencial de la IA.

Demanda contra los desarrolladores de Stable Diffusion

Desde el punto de vista jurídico, una de las noticias de mayor interés en las últimas semanas ha sido la demanda interpuesta ante una Corte de Distrito de California, en forma de class action, por tres artistas plásticas contra las compañías Stability AI, DeviantArt y Midjourney por el desarrollo y comercialización del software Stable Diffusion. La demanda atribuye a las demandadas diversas infracciones, tanto de derechos de autor como de derechos de imagen, competencia desleal e incumplimiento de contrato. Desde el punto de vista del copyright, les imputa infracciones por violación directa de los derechos exclusivos de reproducción, distribución, comunicación pública y transformación, infracciones por violación indirecta (vicarious liability) por propiciar la comisión de otras infracciones por parte de los usuarios de Stable Diffusion, y una infracción por supresión o alteración de la información para la gestión digital de los derechos. En la demanda se solicita una doble tutela, cesatoria y resarcitoria, la primera dirigida a que las demandadas pongan fin a las conductas infractoras que se les atribuyen y la segunda a obtener la indemnización de los diversos daños y perjuicios que dichas conductas habrían causado a las actoras y a los demás miembros de la clase en cuya representación ejercitan la acción.

Desde el punto de vista técnico, Stable Diffusion es capaz de producir imágenes digitales a partir de una descripción en texto hecha por el usuario (“text prompt”). El ejemplo de instrucción puesto por la propia demanda es “un perro con una gorra de béisbol comiéndose un helado”. Para poder llevar a cabo esa tarea, el sistema se apoya en un previo proceso de aprendizaje, para el cual es necesario disponer de un gran conjunto de imágenes etiquetadas con descripciones en texto de lo que cada una de ellas representa. En el caso de Stable Diffusion, este programa ha sido entrenado sobre la base de datos LAION-5B, que posee cinco mil millones de combinaciones imagen-texto extraídas de Internet a través de la técnica del “web scraping”. A partir de esos inputs, observando la correlación de patrones extraídos de los datos de entrenamiento, el sistema “aprende” a sintetizar imágenes similares a las que le han sido suministradas como alimento.

Según lo describen algunos expertos, el proceso de machine learning se atiene a la siguiente mecánica: en primer lugar, el modelo descompone todas las imágenes del banco de datos que pueden responder a un mismo ítem (p. ej., todas las imágenes de perros, de gorras de béisbol y de helados) convirtiéndolas en “ruido” (id est, un patrón aleatorio de píxeles). Luego, mediante prueba y error, trata de revertir el proceso para recrear la imagen original. Son los llamados “modelos probabilísticos de eliminación de ruido” (“denoising diffusion probabilistic models”). Para estos expertos, es difícil definir el proceso de “memorización” de estos sistemas, y no se puede afirmar de manera concluyente si los outputs que generan son auténticamente nuevos, o simplemente copian e interpolan entre ejemplos de entrenamiento individuales.

Según la demanda, el objetivo de la técnica de “difusión” es sintetizar imágenes con la máxima precisión y fidelidad a las empleadas para el entrenamiento, y dado que los sistemas más avanzados, como Stable Diffusion, permiten almacenar los datos de entrenamiento de forma eficiente sin mermar su capacidad para reconstruir copias de alta calidad a partir de ellos, no existen diferencias entre las imágenes reconstruidas y las originales, sino que se trata de auténticas copias de las imágenes usadas como base de aprendizaje. Por ello, en opinión de las demandantes, el sistema de Stable Diffusion puede considerarse una forma alternativa de almacenar copias de todas las imágenes que forman su base de entrenamiento. La demanda arguye también que el software de las demandadas es capaz de interpolar matemáticamente dos imágenes, produciendo imágenes aparentemente independientes, pero que en realidad son el producto de una mera combinación, superposición o mezcla de imágenes originales de cientos de miles de artistas, al modo de una sofisticada herramienta de collage. De ahí que, a su juicio, el sistema de Stable Diffusion no solo comporte una infracción del derecho de reproducción, sino también del derecho a preparar obras derivadas, ambos reconocidos en la sección 106 de la Copyright Act americana.

Por su parte, el CEO de Stability AI, Emad Mostaque, afirmaba en un tuit de 15 de enero pasado que la obtención y utilización de las imágenes de las bases de datos empleadas para el entrenamiento de su sistema eran correctas desde un plano ético, moral y legal. Mostaque continuaba anunciando que, dado que no todo el mundo está de acuerdo con estas afirmaciones, la compañía había decidido implementar fórmulas de opt-out y de emplear conjuntos de datos alternativos que estén licenciados bajo licencias públicas generales tipo creative commons.

Algunos elementos de análisis bajo Derecho USA y bajo Derecho UE

Con toda probabilidad las demandadas en el caso de Stable Diffusion alegarán en su defensa la cláusula de fair use, contemplada en la section 107 de la Copyright Act USA, la cual admite la posibilidad de realizar un uso legítimo de obras protegidas sin contar con permiso de su titular, siempre que se haga para ciertas finalidades, tales como la crítica, el comentario, la actividad docente, la información o la investigación, sujeto a la ponderación, en el caso particular, de cuatro factores: (i) la finalidad y el carácter del uso, incluyendo si dicho uso es de naturaleza comercial o tiene fines educativos no lucrativos; (ii) la naturaleza de la obra protegida por derechos de autor; (iii) la cantidad y sustancialidad de la parte utilizada en relación con la obra protegida en su conjunto; y (iv) el efecto del uso sobre el mercado potencial o el valor de la obra protegida.

Los tribunales americanos han ido interpretando y aplicando estos cuatro factores en numerosos supuestos. Entre ellos, merece citarse la sentencia dictada el 16 de octubre de 2015 por la Corte de Apelaciones del Segundo Circuito (804 F.3d 202) en el asunto Authors Guild vs. Google, Inc.. Entonces se determinó que el servicio de Google conocido como Library Project podía acogerse a la defensa del fair use. Para prestar ese servicio, consistente en un motor de búsqueda para la localización de términos aislados aparecidos en libros, Google escaneaba los libros y generaba un archivo de texto apto para realizar búsquedas de palabras (conservando una copia escaneada de cada ítem de cara a implementar mejoras). Los resultados de las búsquedas ofrecían tres breves snippets para contextualizar la palabra buscada. El tribunal observó que el uso que hacía Google era transformativo, pues convertía los libros en bases de datos informáticamente accesibles para permitir las búsquedas. También valoró, a favor de apreciar fair use, que las copias completas de los libros no se hacían accesibles al público y que, en definitiva, el servicio daba un acceso muy marginal al contenido, no permitiendo una lectura sustancial de la obra ni afectando a fragmentos expresivos, sino sólo a retazos aislados y aleatorios que rodean unos términos de búsqueda, por lo cual no mermaba el mercado potencial derivativo a las obras en cuestión.

En el ámbito europeo el derecho de transformación no se encuentra armonizado, pero sí el derecho de reproducción, el cual es definido en el artículo 2 de la Directiva 2001/29 en unos términos omnicomprensivos (el derecho a autorizar o prohibir la reproducción directa o indirecta, provisional o permanente, por cualquier medio y en cualquier forma, de la totalidad o parte de una obra o prestación). En el sistema europeo de Derecho de autor no hay una cláusula general de fair use, y las utilizaciones libres solo pueden hacerse en determinados casos concretos que no entren en conflicto con la explotación normal de la obra y no perjudiquen injustificadamente los intereses legítimos del autor.

El Tribunal de Justicia de la Unión Europea (“TJUE”) se ha enfrentado en varias de sus sentencias a la interpretación del derecho de reproducción y de los límites al mismo. Uno de los casos más célebres es el que enfrentaba en el conflicto principal a Infopaq, una empresa que elaboraba resúmenes de prensa, y a la asociación danesa de editores de prensa. De este conflicto se derivaron dos sucesivas cuestiones prejudiciales, las de los casos C-50/08 y C-302/10, resueltas respectivamente por la sentencia del TJUE de 16 de julio de 2009 y el auto de 17 de enero de 2012. En ellos se establece que los fragmentos de once palabras que Infopaq reproducía en respuesta a la búsqueda por un término aislado podrían considerarse una reproducción parcial de una obra, en tanto no es descartable que un fragmento de ese tamaño contenga la expresión original de una creación intelectual. Al mismo tiempo, el TJUE admite la posibilidad de aplicar el límite del artículo 5.1 de la Directiva 2001/29, en tanto las reproducciones que hacía Infopaq para prestar su servicio, salvo la consistente en imprimir en papel los outputs de las búsquedas, podían considerarse reproducciones provisionales y transitorias que formaban parte de un proceso tecnológico, carecían de significación económica propia y eran necesarias para facilitar un uso lícito (la confección de reseñas de prensa). 

Las empresas que desarrollen sistemas de IA cuyo proceso de aprendizaje se base en la previa extracción desde sitios web y/o el volcado de miles de ítems de información protegidos por derechos de propiedad intelectual, deben saber que antecedentes como esos serán los que, en caso de litigio, aplicarán los tribunales de uno y otro lado del océano respectivamente. A lo que cabe añadir, en el caso europeo, la reciente regulación de la excepción de minería de textos y datos (“TDM” por sus siglas en inglés), en los artículos 3 y 4 de la Directiva 2019/790, aún carente de interpretación jurisprudencial que permita arrojar mayor luz sobre su aplicación a casos concretos.

El TDM se define como toda técnica analítica automatizada destinada a analizar textos y datos en formato digital a fin de generar información que incluye, sin carácter exhaustivo, pautas, tendencias o correlaciones. La relevancia de estas técnicas para la propiedad intelectual deriva de que comportan la necesidad de volcar, aunque sea de forma transitoria e instrumental, el contenido de una obra o prestación en un sistema informático, en su caso trasvasándolo a un formato digital legible por la máquina, a fin de que esta pueda después efectuar el análisis automático de los datos que la obra o prestación contengan. No es difícil reconducir a la noción de TDM alguna de las fases del proceso de machine learning que hemos descrito, por ejemplo, al referir la mecánica de aprendizaje de Stable Diffusion.

Por lo tanto, al margen de otras consideraciones, todo apunta a que en Europa uno de los ángulos de análisis que suscite, a nivel jurídico, el uso de contenidos protegidos por propiedad intelectual para alimentar sistemas de IA, sea el de la aplicabilidad o no de la excepción de TDM. Esta excepción es obligatoria para los Estados miembros y, en la modalidad que favorece exclusivamente la investigación científica por organismos de investigación e instituciones responsables del patrimonio cultural, no puede ser prohibida por los titulares de derechos. No ocurre lo mismo con el TDM realizado sin esa finalidad ni por esos beneficiarios, el cual está subordinado a que los titulares de derechos de propiedad intelectual no hayan efectuado una reserva expresa impidiendo dicho uso (opt out). Esta previsión es considerada insuficiente por muchos interesados. Los artistas visuales europeos, por ejemplo, se han movilizado a fin de intentar que el futuro Reglamento comunitario de Inteligencia Artificial incorpore la garantía de que la utilización de sus creaciones no podrá hacerse a menos que medie su consentimiento informado explícito previo.

Si las anteriores consideraciones tienen que ver sobre todo con la cuestión de los inputs de la IA, lo relacionado con los outputs nos conecta no solo, o no tanto, con el derecho de reproducción sino con el derecho de transformación, en tanto los resultados de usar estos sistemas podrían considerarse obras derivadas a partir de aquellas con las que se les haya nutrido. Esa transformación podría obedecer a los cambios expresivos que el sistema pueda implementar, modificando la configuración de los ítems originarios, o bien al efecto transformativo procedente de la superposición o combinación de ítems diferentes. Para los desarrolladores de sistemas de IA, el alegato de que sus productos generan en realidad obras derivadas podría resultar, no obstante, menos conveniente que sostener su carácter puramente reproductivo, ya que las excepciones al derecho de transformación son más escasas y sirven a usos a los que solo excepcionalmente se podría reconducir el fenómeno de la IA (v. gr. parodia).

Ciertamente, cabe la posibilidad adicional de defender que los resultados generados por la IA son enteramente independientes de los elementos con los que el sistema se haya entrenado, no habiendo efecto reproductivo ni tampoco ligamen de derivación, como si las obras sintetizadas no fuesen tributarias de los inputs introducidos en la base de datos de la que la IA bebió, o al menos no más tributarias de lo que puedan serlo las obras creadas por humanos por el procedimiento de mera inspiración en obras anteriores. Conforme a este entendimiento, cuando a la IA se le pide que dibuje un perro con una gorra de béisbol comiendo un helado, el sistema recordaría todas las imágenes de esa especie con las que ha sido enseñado, para a continuación dar a luz una imagen de su propia cosecha, no vinculada en un grado lo bastante reconocible con ninguna de las imágenes de partida.

El gran reto para quienes comercializan -y para quienes utilizan- programas de IA es, probablemente, poder demostrar que el sistema efectivamente funciona de tal modo que no se puede establecer un vínculo intelectual lo suficientemente intenso entre los outputs y los inputs. Aun así, el sistema de derechos de autor podría no estar preparado para otorgar protección a los productos sintetizados mediante el uso de IA. Una reciente decisión de la Copyright Office USA (la oficina del Registro de la Propiedad Intelectual) descarta la inscripción como obra protegible a favor de la solicitante de cada una de las imágenes individuales que esta incluyó en un cómic de su creación (titulado “Zarya of the dawn”) y que habían sido realizadas mediante el uso de un programa de inteligencia artificial de la compañía Midjourney. Según el criterio expresado por la Oficina, no cabe registrar como obras los productos de una máquina o proceso que opera al azar o de modo automático, sin que el humano que lo activa pueda predecir o guiar el resultado de una manera lo bastante precisa. La decisión, no obstante, admite la posibilidad de calificar como obra la selección y disposición de las imágenes obtenidas con el uso de la IA, tarea en la que la creadora del cómic sí podía haber hecho una aportación autoral.

Finalmente, existe otra aproximación relevante a aspectos de propiedad intelectual en relación con el desarrollo de sistemas de inteligencia artificial, cuando estos se nutren, para su entrenamiento, de bancos de datos, los cuales pueden merecer protección a través del llamado derecho sui generis sobre bases de datos, introducido a nivel UE por la Directiva 96/9/CE. Este derecho se puede ostentar, incluso sobre bases de datos cuyos elementos, en todo o en parte, no estén protegidos por derechos de propiedad intelectual (v. gr. obras en dominio público, fotografías no protegibles), ya que se confiere al fabricante de una base de datos en función de que la obtención, verificación o presentación del contenido de la base de datos comporten una inversión sustancial desde el punto de vista cuantitativo o cualitativo (v. gr. en medios financieros, empleo de tiempo, esfuerzo, energía u otros similares).

En virtud de esta protección sui generis, el fabricante de una base de datos puede oponerse a la extracción y/o reutilización de la totalidad o de una parte sustancial del contenido de esta, evaluada cualitativa o cuantitativamente. El TJUE ha interpretado las nociones de «extracción» y «reutilización» en diversas sentencias. Su punto de vista es que estos conceptos deben entenderse en un sentido amplio, en consonancia con el objetivo de la Directiva 96/9/CE de garantizar al fabricante de una base de datos el retorno de su inversión, protegiéndole frente a la apropiación no autorizada de los resultados de esa inversión mediante actos que consistan en reconstituir la base, o una parte sustancial de la misma, a un coste inferior al necesario para crearla de forma independiente. Así, en el asunto Directmedia, resuelto por sentencia de 9 de octubre de 2008 (C-304/07), el TJUE confirma que la transferencia de datos de una base de datos protegida a otra base de datos constituye un acto de «extracción» a los efectos de la Directiva 96/9/CE. No obstante, en la más reciente sentencia de 3 de junio de 2021 (C-762/19), dictada en el asunto Melons, el TJUE ha puntualizado que un motor de búsqueda en Internet especializado en la búsqueda del contenido de bases de datos, que copia o indexa la totalidad o una parte sustancial de una base de datos accesible libremente en Internet, y a continuación permite a sus usuarios efectuar búsquedas en esa base de datos en su propio sitio de Internet según criterios pertinentes desde el punto de vista de su contenido, realiza una «extracción» y una «reutilización» de dicho contenido que el fabricante de dicha base de datos puede prohibir, pero solo en la medida en que esos actos constituyan un riesgo para las posibilidades de amortización de la inversión en la obtención, verificación o presentación de aquel contenido por vía de la explotación normal de la base de datos en cuestión.

Por lo tanto, los desarrolladores de sistemas de IA deben tener en cuenta también la posible afectación de los derechos de extracción y reutilización del fabricante de una base de datos, incluso aunque los elementos que compongan la base no estén, ellos mismos, protegidos por derechos de propiedad intelectual. Ahora bien, como en el caso del derecho de reproducción, también puede jugar a favor de aquellos el límite de TDM, que se proyecta sobre los derechos de extracción y reutilización de las bases de datos, de nuevo más intensamente cuando se trate de un uso para fines de investigación por parte de organismos de investigación e instituciones de patrimonio cultural, y de forma subordinada al posible opt out del fabricante de la base cuando el TDM se lleve a cabo con finalidad comercial.

En otra controversia suscitada en relación con el software Stable Diffusion, que ha dado lugar a una segunda demanda, en esta ocasión de Getty Images contra Stability AI ante la Corte de Distrito de Delaware, se pone el acento no solo en el copyright sobre los ítems que conforman el contenido de la base, en el caso fotografías del catálogo de Getty Images -los cuales, según sostiene la demanda, habrían sido objeto de actos no consentidos de reproducción y de transformación-, sino precisamente en el copyright sobre la base de datos en sí, en la medida en que Getty Images habría realizado, entre otras, tareas de fijación de criterios y selección de las imágenes a incluir, creación e incorporación de títulos y otros textos para las mismas, y organización del contenido de la base de datos para poder buscar y filtrar los resultados.

Estos pioneros litigios en materia de IA generativa y derechos de propiedad intelectual revelan que esta tecnología plantea un enorme desafío para los sujetos incumbentes en diversas industrias creativas, sean los autores o las empresas que comercializan sus creaciones. Los procedimientos en marcha mostrarán el grado de adaptación al que los jueces deberán someter la normativa presente para solucionar estos conflictos. Eso, a su vez, dará pistas a los legisladores para continuar en el proceso de normación de los retos legales de la inteligencia artificial. Todo apunta a que esta va a provocar una redefinición del pacto social entre arte y tecnología, dos mundos tradicionalmente antagónicos pero cada día más interconectados. Ese nuevo equilibrio se trasladará, igualmente, al mundo del Derecho, en el que una vez más, como en tantos otros momentos de disrupción tecnológica, se tratará de lograr el balance adecuado entre la protección de los derechos de autor y la promoción de la innovación y la competitividad. 

26 de abril de 2023