Meta limita el uso interno de Claude y Codex para proteger sus datos de entrenamiento
Meta restringió el uso que sus ingenieros hacen de las herramientas de programación con inteligencia artificial de sus rivales, en particular Claude Code de Anthropic y Codex de OpenAI. La razón, según trascendió, es evitar que las respuestas generadas por esos sistemas terminen incorporadas en los datos con los que la compañía entrena sus propios modelos.
La medida fue reportada a partir de documentos internos de la empresa y apunta a un temor concreto en la industria: la llamada destilación, una técnica por la cual un modelo aprende a partir de las salidas de otro modelo más capaz, replicando indirectamente sus capacidades. Si la producción de Claude o Codex se filtrara hacia los conjuntos de entrenamiento de Meta, la empresa podría enfrentar problemas legales y de cumplimiento con los términos de servicio de sus competidores.
Por qué a Meta le preocupa la destilación
Casi todas las grandes compañías de IA prohíben, en sus condiciones de uso, que sus productos se empleen para entrenar modelos rivales. Anthropic y OpenAI no son la excepción. Por eso, permitir que ingenieros usen libremente esas herramientas dentro de los flujos de trabajo de Meta abre un riesgo: que fragmentos de código o texto generados por sistemas ajenos contaminen los datos internos de la empresa.
La destilación es un atajo conocido en el desarrollo de modelos de lenguaje —los sistemas que generan texto a partir de enormes volúmenes de datos—. En lugar de entrenar desde cero con datos originales, un modelo puede aprender imitando las respuestas de otro ya entrenado. Esa práctica acelera el desarrollo, pero puede vulnerar derechos de propiedad y los acuerdos comerciales entre empresas.
El tema cobró relevancia en el último año, cuando varias compañías estadounidenses denunciaron que modelos competidores podrían haber sido entrenados, en parte, a partir de salidas de sus propios sistemas. La preocupación de Meta encaja en ese clima de mayor cautela legal dentro del sector.
Una restricción que también revela dependencia
El episodio resulta llamativo porque Meta es una de las empresas que más ha impulsado la apertura en la industria, con su familia de modelos Llama distribuida bajo licencias relativamente permisivas. Sin embargo, el hecho de que sus propios ingenieros recurran a herramientas de Anthropic y OpenAI para programar sugiere que esos productos siguen siendo competitivos en tareas de codificación asistida.
Claude Code, de Anthropic, y Codex, de OpenAI, son asistentes orientados a la generación y revisión de código que se integran en los entornos de desarrollo de los programadores. Su adopción se aceleró porque permiten escribir, depurar y documentar software con mayor rapidez. Que una empresa como Meta deba limitar formalmente su uso muestra hasta qué punto estas herramientas se han vuelto cotidianas incluso entre los grandes laboratorios.
La información sobre los documentos internos fue publicada por The Information, que detalló las restricciones aplicadas por la compañía.
Un dilema para toda la industria
La decisión de Meta ilustra una tensión creciente en el desarrollo de IA: las empresas compiten ferozmente entre sí, pero al mismo tiempo dependen de las herramientas de sus rivales para acelerar su propio trabajo. A medida que crecen las disputas sobre cómo se entrenan los modelos y qué datos los alimentan, es probable que más compañías endurezcan sus políticas internas para evitar contaminaciones que luego sean difíciles de rastrear o justificar ante un tribunal.
El caso anticipa un escenario donde la procedencia de los datos de entrenamiento se vuelve un activo tan vigilado como los propios modelos.
