Cuando un empleado pega el contrato con un cliente en ChatGPT para que le ayude a resumirlo, ¿sabe que esos datos pueden usarse para entrenar el modelo? La privacidad de datos es uno de los riesgos más infravalorados en la adopción de IA empresarial. Este artículo explica los riesgos reales y cómo mitigarlos.

Riesgos reales de privacidad con IA

Los principales riesgos de privacidad al usar herramientas de IA en empresa:

1. Datos usados para entrenamiento

Muchos proveedores de IA en sus planes gratuitos y básicos pueden usar las conversaciones para mejorar sus modelos. En enero 2023, Samsung tuvo que prohibir internamente el uso de ChatGPT después de que empleados enviaran código fuente propietario. Aunque ChatGPT no "recuerda" esa información de forma directa, los datos podrían usarse en el entrenamiento futuro.

2. Almacenamiento y retención de datos

Los datos enviados a herramientas de IA se almacenan en los servidores del proveedor. La duración de retención varía: OpenAI conserva las conversaciones 30 días por defecto en los planes de pago con historial desactivado. En planes gratuitos, puede ser indefinido.

3. Acceso de empleados del proveedor

Los proveedores suelen reservarse el derecho de que sus empleados accedan a las conversaciones para revisión de seguridad y mejora del modelo. Aunque este acceso está sujeto a NDA y controles, es un riesgo para información muy sensible.

4. Brechas de seguridad en el proveedor

En marzo 2023, OpenAI tuvo un bug que expuso brevemente partes del historial de conversaciones de algunos usuarios. Un proveedor con millones de conversaciones sensibles de empresas es un objetivo atractivo para atacantes.

Qué datos no deberías enviar a la IA

Como regla general, salvo que tengas un DPA firmado y verificado con el proveedor, no deberías enviar:

  • Datos personales de clientes: Nombres, emails, teléfonos, DNI, datos de pago
  • Datos de salud: Historial médico, diagnósticos, información de seguros de salud
  • Información financiera: Datos bancarios, información fiscal, balances no públicos
  • Secretos comerciales: Código fuente propietario, fórmulas, estrategias de producto no publicadas
  • Datos de empleados: Evaluaciones de desempeño, información de nóminas, datos de RRHH
  • Información confidencial de negociaciones: Términos de contratos en negociación, estrategia de adquisiciones
  • Credenciales de acceso: Contraseñas, API keys, tokens de acceso
La regla del periódico: Antes de pegar información en una herramienta de IA, pregúntate: ¿estaría cómodo si esta información apareciera publicada en un periódico? Si la respuesta es no, no la envíes.

Configuración de privacidad en herramientas de IA

La mayoría de los proveedores permiten configurar opciones de privacidad que reducen el riesgo:

ChatGPT (OpenAI)

  • Desactivar historial de conversaciones: En Configuración → Controles de datos → "Mejorar el modelo para todos" → Off. Cuando está desactivado, las conversaciones no se usan para entrenamiento
  • Plan Teams/Enterprise: Garantiza contractualmente que los datos no se usan para entrenamiento. Es el único plan adecuado para datos confidenciales
  • Data Export: Puedes descargar todo tu historial de conversaciones y solicitar la eliminación

Claude (Anthropic)

  • El plan gratuito puede usar conversaciones para mejorar el modelo
  • Claude.ai Pro (de pago) tiene más controles sobre retención de datos
  • API de Anthropic: Por defecto, las llamadas a la API no se usan para entrenamiento. Ideal para integraciones empresariales

Microsoft Copilot / Azure OpenAI

  • Para empresas con Azure, el servicio Azure OpenAI garantiza que los datos no se usan para entrenar los modelos base de OpenAI
  • Los datos permanecen dentro del tenant de Azure de la empresa
  • Cumple con las certificaciones ISO 27001, SOC 2 y es compatible con RGPD

Anonimizar y seudonimizar datos

Cuando necesites usar IA con información que contiene datos personales, la anonimización y seudonimización reducen el riesgo:

Seudonimización básica

Sustituye los datos identificadores por códigos o nombres ficticios antes de enviarlo a la IA. Por ejemplo: "El cliente Juan García (ID: C001) tiene una deuda de..." → "El cliente C001 tiene una deuda de...". La IA puede ayudarte igualmente sin necesitar saber quién es específicamente C001.

"Antes de enviarte este documento, he sustituido todos los nombres propios y datos identificadores por códigos. Cuando necesites referirte a personas, usa los códigos [P1, P2...], empresas [E1, E2...] y ubicaciones [L1, L2...] que aparecen en el texto. El documento es: [texto con datos seudonimizados]."

IA local y modelos privados

La solución más segura para datos muy sensibles es usar modelos de IA que se ejecuten localmente en los servidores de la empresa:

  • Ollama: Permite ejecutar modelos como Llama 3, Mistral o Phi localmente en cualquier ordenador. Los datos nunca salen del dispositivo
  • Azure Private Endpoints: Para empresas grandes, acceso privado a modelos de Azure OpenAI sin que los datos pasen por internet público
  • Modelos fine-tuned en infraestructura propia: La opción más cara pero más completa para empresas con requisitos de cumplimiento muy estrictos

Política de uso de IA en la empresa

Sin una política clara, los empleados toman sus propias decisiones sobre qué datos pueden enviar a herramientas de IA. La política debe cubrir:

  • Qué herramientas de IA están autorizadas para uso profesional
  • Qué categorías de datos están prohibidas de enviar a IA externa
  • Proceso de aprobación para nuevas herramientas de IA
  • Formación obligatoria sobre uso seguro de IA
  • Consecuencias del incumplimiento
Punto de partida: Si tu empresa todavía no tiene política de IA, empieza con una regla simple y clara: "No envíes datos personales de clientes ni información confidencial de negocio a herramientas de IA sin aprobación previa del responsable de cumplimiento." Esta regla simple previene el 80% de los incidentes de privacidad relacionados con IA.