ChatGPT vs DeepSeek

La disputa entre OpenAI y DeepSeek ha encendido las alarmas en el sector tecnológico, al girar en torno a la supuesta utilización sin autorización de una técnica conocida como destilado para entrenar modelos de inteligencia artificial. OpenAI asegura que esta práctica vulnera sus términos de uso y DeepSeek se enfrenta a serias acusaciones legales que pueden sentar precedentes en la industria.

El destilado es un método de entrenamiento en el que se utiliza un modelo de IA de gran escala, denominado profesor, para generar respuestas a partir de las cuales se entrena a otro modelo, el alumno. La analogía es sencilla: así como un catedrático cuando dicta apuntes está sintetizando una gran cantidad de información (manuales, artículos, monografías…), el alumno adquiere todo ese conocimiento a un coste muy inferior (en tiempo y energía) para dar lugar a respuestas muy similares a las que daría el catedrático, en la IA esta técnica permite obtener modelos más ágiles y eficientes. Sin embargo, la controversia surge cuando el proceso se realiza utilizando los outputs de un tercero sin su consentimiento. En este caso, DeepSeek habría empleado las respuestas generadas por ChatGPT para crear un modelo propio, lo que contraviene explícitamente los términos de uso de OpenAI.

Según estos términos, está prohibido extraer datos o outputs de forma automatizada -o incluso manual- mediante programación, así como utilizarlos para desarrollar sistemas que compitan directamente con los ofrecidos por OpenAI. En los términos de uso para empresas, las condiciones de uso son aún más estrictas, limitando cualquier método de interacción con ChatGPT alternativo al uso de las API oficiales. Si se confirma que DeepSeek ha realizado el destilado de esta manera, la empresa se enfrentaría a un incumplimiento contractual grave.

Demostrar los hechos

La cuestión probatoria resulta esencial para el caso. OpenAI podría recurrir a los registros (logs) de las interacciones -ya sean realizadas vía API o mediante otro mecanismo- para demostrar que DeepSeek realizó numerosas peticiones a ChatGPT y obtuvo los outputs de manera automatizada. No obstante, la situación se complica aún más si las solicitudes se efectuaron manualmente o mediante cuentas interpuestas, lo que dificultaría atribuir la conducta a la firma. Asumiendo que lo que realmente ha ocurrido es que DeeSeek destiló el modelo de ChatGPT, la resolución de controversias se resolvería en el marco del arbitraje previsto en la cláusula 13 de los términos de uso: un árbitro podría ordenar a DeepSeek la presentación de dicha evidencia, poniendo a la empresa en una posición vulnerable ante posibles sanciones contractuales.

Aunque se trate de un uso no autorizado, la discusión sobre si se configura como una apropiación indebida de propiedad intelectual e industrial es matizada, siempre asumiendo que nos movemos en el ámbito del destilado como fuente de creación del modelo de DeepSeek.

Los términos de OpenAI indican que los outputs generados pertenecen al usuario, lo que implica que, en esencia, DeepSeek no estaría robando activos, sino haciendo un uso prohibido por contrato. La creación de un modelo nuevo a partir de estos outputs, sin copiar elementos del modelo subyacente de OpenAI, refuerza la idea de que la disputa se centra en el incumplimiento contractual más que en la apropiación de propiedad intelectual.

Por otro lado, en caso de que no se logren demostrar las acusaciones, DeepSeek podría verse inmerso en un ataque reputacional. En jurisdicciones como España, la empresa podría considerar reclamar daños y perjuicios por los perjuicios ocasionados a su imagen, siempre y cuando se acrediten los daños causados por las declaraciones y acciones de OpenAI.

Debates éticos

La ironía del asunto no pasa desapercibida: OpenAI, cuyo propio modelo se ha entrenado con referencias extraídas de la vastedad de Internet -práctica que actualmente se encuentra en el centro de debates legales y éticos- se ve forzada a proteger su servicio de técnicas que, en sí, no son legalmente ilícitas. Este enfrentamiento refleja la compleja dinámica del sector digital, en el que la protección de los datos como activos básicos para el entrenamiento de modelos y la preservación de ventajas competitivas se mezclan con matices legales y estratégicos propios de un mercado donde el winner takes all es la norma.

En definitiva, el conflicto entre OpenAI y DeepSeek ejemplifica los desafíos legales que plantea el entrenamiento de modelos de inteligencia artificial en un entorno altamente competitivo. Mientras la técnica de destilado puede ser legítima cuando se realiza con consentimiento, su aplicación sin autorización podría acarrear consecuencias contractuales y reputacionales significativas.

La resolución del caso, que dependiendo de las circunstancias de la controversia, probablemente se someterá a arbitraje, marcará un precedente sobre cómo se interpretan y aplican las restricciones en el uso de datos generados por servicios de IA, en un mercado cada vez más globalizado y exigente en materia de innovación y propiedad intelectual.