C贸digo de copiloto sin piedad. Ahora Microsoft se enfrenta a una declaraci贸n colectiva que podr铆a poner en jaque a la herramienta

c贸digo de copiloto sin piedad. ahora microsoft se enfrenta a una declaraci贸n colectiva que podr铆a poner en jaque a la herramienta

Se ve铆a venir. Microsoft, GitHub y Openai se enfrentan a una *demanda de copyright* que cuestiona el funcionamiento de Copilot, el programa basado en inteligencia artificial (IA) que sugiere c贸digo y funciones completas en tiempo real a los programadores que lo utilizan.


La demanda alega que Copilot viola los requisitos de atribuci贸n de varias licencias de c贸digo abierto, como las licencias MIT, GPL y Apache. Estos, seg煤n un documento publicado por los demandantes, requieren la atribuci贸n de la autor铆a y la definici贸n de las autoridades privadas. Copilot se enfrenta a sus primeros desaf铆os legales


⠿ Encu茅ntrame en Youtube/ RomerBatista | Contenido de tecnolog铆a y criptomonedas.


Copilot es una herramienta muy * valorada por muchos desarrolladores *. Poco m谩s de un a帽o despu茅s de su lanzamiento, cada vez sugiere m谩s c贸digo y muestra avances significativos en lenguajes tan populares como Java y Python. Desde Microsoft, incluso celebran su gran crecimiento.


"Creemos que la codificaci贸n asistida por IA cambiar谩 fundamentalmente la naturaleza del desarrollo de software, proporcionando nuevas oportunidades para los desarrolladores", dijo Satya Nadella el mes pasado en el evento Microsoft Ignite Developers, pero no todos est谩n contentos.


⠿ Encu茅ntrame en Tiktok/ RomerBatistta | Contenido de s贸lo tecnolog铆a.


Tim Davis, un profesor de Inform谩tica e Ingenier铆a en la Universidad A&M de Texas advert铆a que Copilot *copiaba su c贸digo de transposici贸n de matrices dispersas*, un c贸digo que estaba protegido por la licencia LGPL 2.1 y que t茅cnicamente estaba siendo infringida por la aplicaci贸n.


Davis explicaba en Twitter que, aunque precis贸 expl铆citamente que su c贸digo no fuera utilizado para Copilot, igualmente fue recogido por la herramienta de Microsoft. Esta situaci贸n sembr贸 la preocupaci贸n de la existencia de casos similares de otros desarrolladores.


@github copilot, with "public code" blocked, emits large chunks of my copyrighted code, with no attribution, no LGPL license. For example, the simple prompt "sparse matrix transpose, cs_" produces my cs_transpose in CSparse. My code on left, github on right. Not OK. pic.twitter.com/sqpOThi8nf— Tim Davis (@DocSparse) October 16, 2022


El abogado y desarrollador Matthew Butterick contaba el mes pasado que estaba evaluando demandar a los responsables de Copilot “*por violar sus obligaciones legales con los autores de c贸digo abierto y los usuarios finales*”. Finalmente, Butterick se ha convertido en la cabeza de la demanda conectiva contra el tr铆o de empresas tecnol贸gicas detr谩s de la herramienta.


La demanda cuestiona el funcionamiento de Copilot en base a los repositorios de GitHub. En ese sentido, impulsa el debate sobre los derechos de autor del c贸digo escrito por otros programadores que lleva en escena desde el momento en el que empez贸 a funcionar la herramienta.


Copilot funciona con Codex, un modelo de lenguaje generativo creado por OpenAI y entrenado en miles de* millones de l铆neas de c贸digo disponibles en repositorios p煤blicos, como el de GitHub*. As铆, el programa puede utilizar los comentarios y el c贸digo junto con el contexto para sintetizar y sugerir l铆neas individuales y funciones completas.


¿El problema? Toda esa monta帽a de c贸digo disponible p煤blicamente est谩 sujeta a la licencia GPL, que, si bien permite c贸digos derivados, estos deber铆an ofrecerse bajo las mismas condiciones. En el caso de Copilot est谩 siendo utilizado para alimentar un programa comercial que puede generar c贸digo que se ofrezca con otros tipos de licencias.


Adem谩s, los demandantes aseguran que Copilot est谩 infringiendo las propias condiciones de GitHub, la Ley de Privacidad del Consumidor de California y otras leyes que dan lugar a reclamos similares en diferentes partes del mundo.


Si bien la demanda se encuentra en las primeras etapas, el desenlace de la misma podr铆a marcar un* precedente en el campo del entrenamiento de modelos de inteligencia artificial* en base al datos que en parte pueden estar protegidos por derechos de autor.


No debemos olvidar que generadores de im谩genes tan populares como Stable Diffusion, IMAGEN, DALLE-E 2, entre otros, funcionan gracias a enormes conjuntos o subconjuntos de datos de im谩genes y referencias textuales disponibles en la web de creadores que no reciben nada a cambio.


*Im谩genes: **GitHub** **Rahul Mishra*


*


No hay comentarios.:

Con tecnolog铆a de Blogger.