OpenAI acusa a la empresa china DeepSeek de usar su modelo para entrenar a su nueva herramienta
OpenAI afirma haber encontrado evidencias de que la empresa emergente china de inteligencia artificial DeepSeek utilizó los modelos patentados de la compañía estadounidense para entrenar su propia herramienta open-source, en medio de crecientes preocupaciones sobre una posible violación de la propiedad intelectual.
El creador de ChatGPT, con sede en San Francisco, dijo al Financial Times que había visto cierta evidencia de "destilación", que sospecha proviene de DeepSeek. La técnica de destilación es utilizada por los desarrolladores para mejorar el rendimiento de modelos más pequeños aprovechando los outputs de modelos más grandes y avanzados, lo que les permite obtener resultados similares en tareas específicas a un coste mucho menor.
Si bien la destilación es una práctica común en la industria, la preocupación radica en que DeepSeek podría estar usándola para desarrollar su propio modelo rival, lo que violaría los términos de servicio de OpenAI, que establecen que los usuarios no pueden "copiar" ninguno de sus servicios ni "usar los outputs para desarrollar modelos que compitan con OpenAI".
"El problema surge cuando sacas los datos de la plataforma y los utilizas para crear tu propio modelo con fines personales", comentó un experto al citado medio.
El bajo coste del modelo de DeepSeek
DeepSeek afirmó que utilizó solo 2.048 tarjetas gráficas Nvidia H800 y gastó 5,6 millones de dólares para entrenar su modelo V3, que cuenta con 671.000 millones de parámetros, una pequeña fracción de lo que OpenAI y Google han gastado en modelos de tamaño comparable. Algunos expertos señalaron que las respuestas generadas por el modelo de DeepSeek indicaban que había sido entrenado con outputs de GPT-4 de OpenAI, lo que violaría sus términos de servicio.
No obstante, expertos de la industria sostienen que es una práctica común en laboratorios de inteligencia artificial tanto en China como en EE. UU. utilizar outputs de empresas como OpenAI, que han hecho grandes inversiones en contratación de personas para enseñar a sus modelos a producir respuestas más humanas. Este proceso es costoso y requiere mucha mano de obra, por lo que es habitual que actores más pequeños se beneficien de este trabajo, afirman los expertos.
Ventaja tecnológica
"Es muy común que startups y académicos utilicen los outputs de modelos comerciales alineados con el comportamiento humano, como ChatGPT, para entrenar otro modelo", dijo Ritwik Gupta, candidato a doctorado en inteligencia artificial en la Universidad de California, Berkeley. "Eso significa que obtienes ese feedback humano sin coste adicional. No me sorprende que supuestamente DeepSeek esté haciendo lo mismo. Si ese fuera el caso, detener esta práctica podría ser difícil", agregó.
Esta situación resalta la dificultad a la que se enfrentan las empresas para proteger su ventaja tecnológica. "Sabemos que empresas con sede en China y en otros lugares intentan constantemente destilar los modelos de las principales compañías de inteligencia artificial en EE. UU.", afirmó OpenAI en su última declaración. "Implementamos contramedidas para proteger nuestra propiedad intelectual, incluido un cuidadoso proceso para decidir qué capacidades avanzadas incluir en los modelos que lanzamos. Creemos que, en el futuro, será fundamental que trabajemos estrechamente con el gobierno de EE. UU. para proteger los modelos más avanzados de los intentos de adversarios y competidores de apropiarse de la tecnología estadounidense".
Actualmente, OpenAI se enfrenta a sus propias acusaciones de infracción de derechos de autor por parte de periódicos y creadores de contenido, incluidos The New York Times y otros medios reconocidos, quienes han demandado a la empresa por entrenar sus modelos con sus artículos y libros sin permiso.
Caídas históricas de Nvidia en bolsa
El lanzamiento del modelo de razonamiento R1 de DeepSeek ha sorprendido a los mercados, así como a inversores y empresas tecnológicas en Silicon Valley. Sus modelos, desarrollados con presupuestos muy ajustados, han alcanzado clasificaciones altas y resultados comparables a los principales modelos estadounidenses.
De hecho, las acciones de Nvidia cayeron un 17% hace unos días, lo que eliminó 589.000 millones de dólares de su valor de mercado, debido a temores de que las grandes inversiones en su costoso hardware de inteligencia artificial podrían no ser necesarias. Sin embargo, horas después se recuperaron un 9% junto con otras acciones tecnológicas.
OpenAI y su socio Microsoft ya investigaron el otoño pasado algunas cuentas que se creía que podían pertenecer a DeepSeek y que estaban utilizando la interfaz de programación de aplicaciones (API) de OpenAI. Según una persona con conocimiento directo del asunto, estas cuentas fueron bloqueadas por sospecha de destilación. Bloomberg fue el primer medio en informar sobre estas investigaciones.
Anteriormente, David Sacks, quien fue asesor de inteligencia artificial y criptomonedas durante la presidencia de Donald Trump, declaró que "es posible" que haya ocurrido un robo de propiedad intelectual.