Elon Musk ha vuelto a centrar su atención en Sam Altman, respondiendo a la acusación de un usuario que afirmaba que el CEO de OpenAI había robado efectivamente el internet, redistribuyéndolo a través de llamadas API incrementales.
¿Qué pasó?
El lunes, un usuario de X (anteriormente Twitter) acusó a Altman de sustraer el internet y luego revenderlo a los usuarios, mediante una llamada API tras otra.
Esta declaración capturó inmediatamente la atención de Musk, quien cofundó OpenAI, la organización madre de ChatGPT, en 2015 y la dejó en 2018.
El comentario de Musk avivó el debate existente sobre la práctica de raspar y comprimir datos del internet abierto para desarrollar potentes modelos de IA. La acusación del usuario también expuso una estrategia que consistía en revender estos datos a los usuarios a través de APIs, estableciendo al mismo tiempo barreras legales para prevenir que otros replicaran el mismo método.
En los comentarios, varias personas expresaron que los modelos entrenados con datos disponibles gratuitamente en internet deberían mantenerse abiertos y accesibles. Es relevante mencionar que ChatGPT Plus se ofrece por una suscripción mensual de 20 dólares en Estados Unidos, proporcionando acceso a GPT-4, el modelo LLM más reciente de OpenAI.
El debate también tocó el tema de los costos asociados con el entrenamiento de modelos de IA, y si estos costos podrían justificar tal monetización de datos.
Es importante notar que OpenAI, que una vez fue una organización sin fines de lucro y de código abierto, ha evolucionado hacia una estructura más cerrada. Musk ha comentado anteriormente sobre el supuesto rol de Microsoft Corporation en esta transformación, acusando a la empresa de tener acceso al código fuente de OpenAI.
Por qué es importante
En abril, se reportó que OpenAI había perdido su acceso a los datos de Twitter, ahora conocido como X, porque Musk consideró que los 2 millones de dólares que la empresa dirigida por Altman pagó por la licencia eran insuficientes.
Durante ese mismo periodo, OpenAI introdujo un “modo incógnito” que permite a los usuarios elegir si sus registros de conversación deberían guardarse para mejorar la IA de ChatGPT. Además, la compañía anunció que está desarrollando ChatGPT Business, un servicio de suscripción orientado a empresas que buscan tener un mayor control sobre los datos de sus usuarios.
A comienzos de este año, Italia prohibió temporalmente ChatGPT, pero después permitió su funcionamiento bajo ciertas condiciones, incluyendo la opción para los usuarios de oponerse al procesamiento de sus datos.
Por otro lado, la semana pasada, China propuso una lista negra de fuentes que no pueden utilizarse para entrenar modelos generativos de IA, la cual incluye contenido censurado en el internet chino.
Fotos vía Shutterstock.
También puedes leer: China propone lista negra para los datos de entrenamiento de IA