El flujo de ida y vuelta
La desanonimización existe para un único patrón: usar con seguridad una herramienta que no controlas sobre documentos que no puedes compartir. Anonimizar a la salida, restaurar a la vuelta. La PII real nunca cruza la frontera.
El ciclo
Sección titulada «El ciclo»Tu documento ──anonimizar──▶ copia segura ──▶ herramienta externa (LLM, compañero, servicio) ▲ │ └──────────── desanonimizar ◀──── copia editada/respondida ┘- Anonimiza con modo sintético (para que el documento siga leyéndose con naturalidad) y un diccionario adjunto con añadir al diccionario activado (para que las sustituciones queden registradas).
- Usa la herramienta externa sobre la copia segura. Solo ve valores falsos — David Romero Gil, no Marcos Patel.
- Trae el resultado de vuelta — el fichero editado, el resumen o la respuesta de la herramienta, todavía escritos en valores falsos.
- Desanonimízalo. Piixie cambia los falsos por los originales, con exactitud si reconoce el fichero, o mediante el diccionario si la herramienta lo modificó.
Un ejemplo trabajado: resumir un historial médico con un LLM en la nube
Sección titulada «Un ejemplo trabajado: resumir un historial médico con un LLM en la nube»Necesitas un modelo en la nube para resumir el historial de un paciente, pero el expediente no puede salir tal cual de los sistemas conformes.
- Anonimiza
expediente-clinico-marcos-patel.pdf→expediente-clinico-david-romero.pdf, sintético, Español, con tu diccionario Clínica creciendo. - Pega la copia segura en el chat en la nube: «Resume el historial cardíaco de este paciente.» El modelo responde sobre David Romero Gil, NHC 84913366.
- Guarda la respuesta del modelo en un fichero de texto.
- Suéltalo en Piixie con el interruptor Desanonimizar activado. El fichero no lo produjo Piixie, así que usa el diccionario: David Romero Gil → Marcos Patel, 84913366 → 1029384. Obtienes un resumen sobre el paciente real, sin haber enviado nunca al paciente real a la nube.
El flujo de «pegar con seguridad y luego restaurar» también se trata, de principio a fin, en Compartir con seguridad con un LLM y restaurar.
Por qué el modo sintético para el trayecto de ida y vuelta
Sección titulada «Por qué el modo sintético para el trayecto de ida y vuelta»Solo la salida sintética y con etiquetas es reversible — conservan una sustitución que puedes deshacer. Ocultar destruye el original. Y el sintético en concreto mantiene el documento legible, de modo que la herramienta externa hace un buen trabajo con él: un modelo resume mucho mejor un documento natural que un mar de [REDACTED].
Conserva los medios para revertir
Sección titulada «Conserva los medios para revertir»El trayecto solo se cierra si Piixie puede volver. Dos cinturones, unos tirantes:
- Mantén intacto el fichero de salida si puedes — eso habilita la reversión exacta.
- Haz crecer un diccionario a partir de tus ejecuciones — eso habilita la reversión por diccionario incluso cuando el fichero se modificó más adelante.
Con ambos, puedes restaurar tanto si recuperas el mismo fichero como uno reescrito.
La frontera, de nuevo
Sección titulada «La frontera, de nuevo»El documento restaurado vuelve a tener PII real — está de nuevo en el lado de confianza. Plantea el trayecto así: texto plano dentro (tuyo) → falso fuera (suyo) → falso dentro (suyo) → texto plano fuera (tuyo). El lado externo solo guarda falsos en todo momento. Esa es la garantía. Más sobre qué se almacena y qué cruza la red: privacidad.