Saltearse al contenido

El flujo de ida y vuelta

La desanonimización existe para un único patrón: usar con seguridad una herramienta que no controlas sobre documentos que no puedes compartir. Anonimizar a la salida, restaurar a la vuelta. La PII real nunca cruza la frontera.

Tu documento ──anonimizar──▶ copia segura ──▶ herramienta externa (LLM, compañero, servicio)
▲ │
└──────────── desanonimizar ◀──── copia editada/respondida ┘
  1. Anonimiza con modo sintético (para que el documento siga leyéndose con naturalidad) y un diccionario adjunto con añadir al diccionario activado (para que las sustituciones queden registradas).
  2. Usa la herramienta externa sobre la copia segura. Solo ve valores falsos — David Romero Gil, no Marcos Patel.
  3. Trae el resultado de vuelta — el fichero editado, el resumen o la respuesta de la herramienta, todavía escritos en valores falsos.
  4. Desanonimízalo. Piixie cambia los falsos por los originales, con exactitud si reconoce el fichero, o mediante el diccionario si la herramienta lo modificó.

Un ejemplo trabajado: resumir un historial médico con un LLM en la nube

Sección titulada «Un ejemplo trabajado: resumir un historial médico con un LLM en la nube»

Necesitas un modelo en la nube para resumir el historial de un paciente, pero el expediente no puede salir tal cual de los sistemas conformes.

  1. Anonimiza expediente-clinico-marcos-patel.pdfexpediente-clinico-david-romero.pdf, sintético, Español, con tu diccionario Clínica creciendo.
  2. Pega la copia segura en el chat en la nube: «Resume el historial cardíaco de este paciente.» El modelo responde sobre David Romero Gil, NHC 84913366.
  3. Guarda la respuesta del modelo en un fichero de texto.
  4. Suéltalo en Piixie con el interruptor Desanonimizar activado. El fichero no lo produjo Piixie, así que usa el diccionario: David Romero Gil → Marcos Patel, 84913366 → 1029384. Obtienes un resumen sobre el paciente real, sin haber enviado nunca al paciente real a la nube.

El flujo de «pegar con seguridad y luego restaurar» también se trata, de principio a fin, en Compartir con seguridad con un LLM y restaurar.

Por qué el modo sintético para el trayecto de ida y vuelta

Sección titulada «Por qué el modo sintético para el trayecto de ida y vuelta»

Solo la salida sintética y con etiquetas es reversible — conservan una sustitución que puedes deshacer. Ocultar destruye el original. Y el sintético en concreto mantiene el documento legible, de modo que la herramienta externa hace un buen trabajo con él: un modelo resume mucho mejor un documento natural que un mar de [REDACTED].

El trayecto solo se cierra si Piixie puede volver. Dos cinturones, unos tirantes:

Con ambos, puedes restaurar tanto si recuperas el mismo fichero como uno reescrito.

El documento restaurado vuelve a tener PII real — está de nuevo en el lado de confianza. Plantea el trayecto así: texto plano dentro (tuyo) → falso fuera (suyo) → falso dentro (suyo) → texto plano fuera (tuyo). El lado externo solo guarda falsos en todo momento. Esa es la garantía. Más sobre qué se almacena y qué cruza la red: privacidad.