Todas las grandes IA han ignorado las leyes del copyright. Lo alucinante es que sigue sin haber consecuencias
Las editoriales francesas estĂĄn hartas y acaban de demandar a Meta por violaciĂłn del copyright. No son las primeras ni serĂĄn las Ășltimas, pero el problema no es ese: el problema es que las empresas de IA han usado contenidos con derechos de autor para entrenar sus modelos, y es como si no pasara nada.
Todo sigue igual. Han pasado mĂĄs dos años desde que Getty denunciara a Stable Diffusion, a la que acusaba de robar sus fotos para entrenar su modelo de IA de generaciĂłn de imĂĄgenes. Aquella fue la primera de una gran lista de demandas por exactamente lo mismo, pero a pesar del tiempo que ha transcurrido, no ha habido novedades al respecto. Es como si lo que hizo Stable Diffusion —como las demĂĄs— acabara en un segundo plano para los tribunales de justicia.
¿Uso justo? El juicio del caso de The New York Times contra OpenAI se iniciĂł en enero de 2025 y es sin duda uno de los mĂĄs importantes en este ĂĄmbito. La empresa liderada por Sam Altman —que ha usado todos los datos que ha podido— se escuda en que ellos hacen un "uso justo" de los contenidos para poder entrenar sus modelos. Lo curioso es que por un lado dicen eso, y por el otro han ido llegando a acuerdos millonarios con plataformas como Reddit y medios o editoriales como El PaĂs precisamente para licenciar sus contenidos y evitar nuevas demandas.
Lo de Meta es otro nivel. Los extremos a los que estĂĄn llegando las empresas para tener datos de calidad con los que entrenar sus modelos de IA son extraordinarios. Perplexity se saltĂł las barreras de internet, pero lo de Meta fue aĂșn mĂĄs llamativo: hace poco supimos que habĂan utilizado mĂĄs de 80 TB de libros descargados vĂa BitTorrent para entrenar su modelo. Muchos de ellos con derechos de autor, algo que ha provocado muchas crĂticas y la reciente demanda de algunos grupos editoriales franceses.
No parece haber castigo. Pero como decimos, ese robo histĂłrico de propiedad intelectual parece estar ya asumido: no hay sentencias que hayan castigado esas violaciones del copyright de momento, y es como si colectivamente se hubieran ignorado esas violaciones porque la IA ofrece ventajas interesantes. Pero nos estamos olvidando de cĂłmo las han obtenido... o eso parece.
En este blog 5.000 "tokens" de mi blog estĂĄn siendo usados para entrenar una IA. No he dado mi permiso
No hay comentarios.: