Privacidad de datos al usar IA en empresa: riesgos y buenas prácticas
Cuando un empleado pega el contrato con un cliente en ChatGPT para que le ayude a resumirlo, ¿sabe que esos datos pueden usarse para entrenar el modelo? La privacidad de datos es uno de los riesgos más infravalorados en la adopción de IA empresarial. Este artículo explica los riesgos reales y cómo mitigarlos.
Riesgos reales de privacidad con IA
Los principales riesgos de privacidad al usar herramientas de IA en empresa:
1. Datos usados para entrenamiento
Muchos proveedores de IA en sus planes gratuitos y básicos pueden usar las conversaciones para mejorar sus modelos. En enero 2023, Samsung tuvo que prohibir internamente el uso de ChatGPT después de que empleados enviaran código fuente propietario. Aunque ChatGPT no "recuerda" esa información de forma directa, los datos podrían usarse en el entrenamiento futuro.
2. Almacenamiento y retención de datos
Los datos enviados a herramientas de IA se almacenan en los servidores del proveedor. La duración de retención varía: OpenAI conserva las conversaciones 30 días por defecto en los planes de pago con historial desactivado. En planes gratuitos, puede ser indefinido.
3. Acceso de empleados del proveedor
Los proveedores suelen reservarse el derecho de que sus empleados accedan a las conversaciones para revisión de seguridad y mejora del modelo. Aunque este acceso está sujeto a NDA y controles, es un riesgo para información muy sensible.
4. Brechas de seguridad en el proveedor
En marzo 2023, OpenAI tuvo un bug que expuso brevemente partes del historial de conversaciones de algunos usuarios. Un proveedor con millones de conversaciones sensibles de empresas es un objetivo atractivo para atacantes.
Qué datos no deberías enviar a la IA
Como regla general, salvo que tengas un DPA firmado y verificado con el proveedor, no deberías enviar:
- Datos personales de clientes: Nombres, emails, teléfonos, DNI, datos de pago
- Datos de salud: Historial médico, diagnósticos, información de seguros de salud
- Información financiera: Datos bancarios, información fiscal, balances no públicos
- Secretos comerciales: Código fuente propietario, fórmulas, estrategias de producto no publicadas
- Datos de empleados: Evaluaciones de desempeño, información de nóminas, datos de RRHH
- Información confidencial de negociaciones: Términos de contratos en negociación, estrategia de adquisiciones
- Credenciales de acceso: Contraseñas, API keys, tokens de acceso
Configuración de privacidad en herramientas de IA
La mayoría de los proveedores permiten configurar opciones de privacidad que reducen el riesgo:
ChatGPT (OpenAI)
- Desactivar historial de conversaciones: En Configuración → Controles de datos → "Mejorar el modelo para todos" → Off. Cuando está desactivado, las conversaciones no se usan para entrenamiento
- Plan Teams/Enterprise: Garantiza contractualmente que los datos no se usan para entrenamiento. Es el único plan adecuado para datos confidenciales
- Data Export: Puedes descargar todo tu historial de conversaciones y solicitar la eliminación
Claude (Anthropic)
- El plan gratuito puede usar conversaciones para mejorar el modelo
- Claude.ai Pro (de pago) tiene más controles sobre retención de datos
- API de Anthropic: Por defecto, las llamadas a la API no se usan para entrenamiento. Ideal para integraciones empresariales
Microsoft Copilot / Azure OpenAI
- Para empresas con Azure, el servicio Azure OpenAI garantiza que los datos no se usan para entrenar los modelos base de OpenAI
- Los datos permanecen dentro del tenant de Azure de la empresa
- Cumple con las certificaciones ISO 27001, SOC 2 y es compatible con RGPD
Anonimizar y seudonimizar datos
Cuando necesites usar IA con información que contiene datos personales, la anonimización y seudonimización reducen el riesgo:
Seudonimización básica
Sustituye los datos identificadores por códigos o nombres ficticios antes de enviarlo a la IA. Por ejemplo: "El cliente Juan García (ID: C001) tiene una deuda de..." → "El cliente C001 tiene una deuda de...". La IA puede ayudarte igualmente sin necesitar saber quién es específicamente C001.
IA local y modelos privados
La solución más segura para datos muy sensibles es usar modelos de IA que se ejecuten localmente en los servidores de la empresa:
- Ollama: Permite ejecutar modelos como Llama 3, Mistral o Phi localmente en cualquier ordenador. Los datos nunca salen del dispositivo
- Azure Private Endpoints: Para empresas grandes, acceso privado a modelos de Azure OpenAI sin que los datos pasen por internet público
- Modelos fine-tuned en infraestructura propia: La opción más cara pero más completa para empresas con requisitos de cumplimiento muy estrictos
Política de uso de IA en la empresa
Sin una política clara, los empleados toman sus propias decisiones sobre qué datos pueden enviar a herramientas de IA. La política debe cubrir:
- Qué herramientas de IA están autorizadas para uso profesional
- Qué categorías de datos están prohibidas de enviar a IA externa
- Proceso de aprobación para nuevas herramientas de IA
- Formación obligatoria sobre uso seguro de IA
- Consecuencias del incumplimiento