Saltearse al contenido

Diccionarios

Un diccionario es un conjunto guardado de pares original → sustitución. Es la forma de hacer que la anonimización sea coherente entre documentos, no solo dentro de uno. Si “Acme GmbH” siempre debe convertirse en “Globex AG” en cada exportación que produce tu equipo —entre ficheros, entre días, entre personas—, un diccionario lo garantiza, en lugar de confiar en que el modelo acierte con el mismo valor falso dos veces.

El gestor de diccionarios: original, sustitución, fichero de origen y fecha de cada entrada

El modo sintético es coherente internamente: dentro de un mismo documento, cada mención de una persona se asigna a una identidad falsa. Pero vuelve a procesar el fichero de esa misma persona la semana que viene, o procesa un documento distinto que la menciona, y el modo sintético no tiene memoria: inventará un nombre falso nuevo cada vez.

Para un documento puntual, eso vale. Para un flujo de trabajo continuo —un informe recurrente, un cliente cuyos ficheros anonimizas una y otra vez, un conjunto compartido de fixtures de prueba— quieres que el mismo valor real se convierta siempre en el mismo valor falso. Para eso está el diccionario.

Un diccionario contiene pares. Cuando está asociado a un perfil, Piixie aplica esos pares junto con el trabajo del modelo:

  • Un original conocido del documento se sustituye por su valor fijo del diccionario, siempre.
  • Los valores nuevos que sintetiza el modelo se pueden añadir al diccionario, para que la próxima vez también sean conocidos.

Cada entrada asigna un original a exactamente una sustitución. Si reutilizas un original con una sustitución nueva, esta sobrescribe la anterior: un término dado se resuelve siempre igual, sin duplicados.

Piixie incluye un diccionario Predeterminado que no se puede borrar. Puedes añadir tus propios diccionarios para distintos contextos —uno por cliente, uno por proyecto, uno para una batería de pruebas— y asociar el que encaje con la tarea.

Los diccionarios también permiten la desanonimización inversa: los mismos pares que cambian lo real por lo falso pueden cambiar lo falso de vuelta a lo real.