Que Reddit y Twitter hayan restringido sus API es un desastre para todo Internet. Pero especialmente para Google
Hasta no hace mucho, la informaciĂłn fluĂa libremente en internet. Eso estĂĄ cambiando, y la culpa la tienen plataformas que nacieron como punto de encuentro de millones de usuarios.
Son esos usuarios los que las han alimentado todos estos años con inmensas cantidades de informaciĂłn y las han convertido en gigantes tecnolĂłgicos. Unos gigantes que ahora se han vuelto egoĂstas y estĂĄn controlando cuĂĄnto y cĂłmo se accede a toda esa informaciĂłn.
Eso es un problemĂłn, y lo es especialmente para Google. El buscador que lo domina todo era el recurso de facto para encontrar cualquier tipo de informaciĂłn en internet, pero los Ășltimos movimientos de empresas como Reddit o Twitter estĂĄn provocando un efecto preocupante: de repente millones de resultados de bĂșsqueda pueden llevar a enlaces rotos.
La raĂz del problema, argumentan quienes lo denuncian, estĂĄ en la inteligencia artificial. Modelos de IA generativa conversacional como ChatGPT o Bard funcionan asĂ de bien gracias en buena medida a que han sido entrenados con ingentes cantidades de datos que han cogido sin aviso y sin permiso.
No es que tuvieran que hacerlo, al menos en el caso de contenidos no protegidos por derechos de autor. La informaciĂłn, insistimos, estaba ahĂ para quien quisiera consultarla, pero de repente hacerlo a esta escala se ha convertido en un problema.
Twitter fue la primera en hacer un movimiento polĂ©mico. En febrero Elon Musk anunciaba que se acababa el acceso a la API gratuita. Eso significaba que el acceso automatizado a la plataforma quedaba vetado, y con ello todo tipo de desarrollos y servicios que "tiraban" de esa API sin tener que pagar quedaban entre la espada y la pared. Bots y aplicaciones de terceros como Twitterriffic se veĂan obligados a decir adiĂłs al no poder asumir el coste de acceso a esas APIs.
Reddit siguiĂł sus pasos poco despuĂ©s. En abril sus responsables anunciaron que comenzarĂan a cobrar por el acceso a su API. La razĂłn que exponĂan era la misma que Twitter (y Elon Musk) habĂan planteado: los modelos de IA estaban recolectando y usando sus datos de forma indiscriminada para entrenarse, y eso era demasiado.
Puede que efectivamente esa recolecciĂłn masiva de datos fuera un problema para Reddit, pero por el camino la plataforma provocĂł el cierre de varios clientes muy populares como Apollo o RedPlanet. Las protestas fueron a mĂĄs, y hace unos dĂas se producĂa la mayor "huelga digital" de la historia de Reddit: mĂĄs de 6.000 subreddits quedaron inaccesibles temporalmente al convertirse en foros privados.
Aquello no solo provocĂł una caĂda del trĂĄfico a Reddit y un disgusto para quienes buscaban respuesta en sus foros esos dĂas. Ese motĂn tuvo un impacto en el buscador de Google, cuyos resultados, cuando llevaban a Reddit, acaban en enlaces rotos o que mostraban que el foro al que estĂĄbamos intentando acceder era en ese momento privado.
Como explicaba Matt Rickard, ingeniero software que trabaja en el desarrollo de grandes modelos de lenguaje (LLMs), la situaciĂłn actual es una amenaza crĂtica para Google. Como Ă©l decĂa,
AsĂ es: Twitter ha ido mĂĄs allĂĄ este fin de semana y estableciĂł un lĂmite de mensajes que podĂan leer los mensajes. La medida evitaba (o al menos perjudicaba) la recolecciĂłn de datos que trataba de saltarse la API de pago, pero una vez mĂĄs ponĂa de manifiesto un problema mayor: muchos resultados de bĂșsqueda podĂan acabar en mensajes de error y enlaces rotos.
Las cosas podrĂan ir a peor para Google y tambiĂ©n para los modelos de IA como ChatGPT o Bard en el futuro: si no pagan el acceso a esas APIs, no podrĂĄn seguir entrenĂĄndolas como hasta ahora y logrando que evolucionen y mejoren a partir de esos datos. Reddit y Twitter son desde luego fuentes muy relevantes de informaciĂłn, pero hay una amenaza aĂșn mĂĄs llamativa.
Se trata de Wikipedia. ¿QuĂ© pasa si la organizaciĂłn que la gestiona acaba decidiendo que el acceso va a estar regulado por una API de pago? Teniendo en cuenta que esta fuente de informaciĂłn es especialmente importante para los modelos de IA —y tambiĂ©n para Google—, ese golpe serĂa especialmente notable.
Parece plausible que Wikipedia pueda hacer un movimiento de este tipo, sobre todo teniendo en cuenta que este organismo pide donaciones a los usuarios con relativa frecuencia y por tanto siempre estĂĄ buscando fuentes de ingresos. Esa API de pago serĂa una soluciĂłn interesante para ellos, pero nos encerrarĂa aĂșn mĂĄs en una situaciĂłn preocupante.
Una en la que Google ya no nos darĂa respuestas. TendrĂamos que ir especĂficamente a Reddit, a Twitter, a StackOverflow o a Wikipedia a buscarlas, quizĂĄs pagando por poder hacerlo.
La informaciĂłn, que fluĂa libremente en internet, habrĂa dejado de hacerlo. Ahora todo estarĂa mĂĄs fragmentado, y cada plataforma serĂa una especie de pequeña internet autocontenida y aislada del resto. Eso serĂa terrible para todos, pero sin duda lo serĂa especialmente para Google.
No hay comentarios.: