Saltearse al contenido

Reversión basada en diccionario

A veces el fichero que quieres revertir no es una copia limpia de la salida de una ejecución pasada. Una herramienta externa lo editó, vino de la máquina de un compañero o se borró su historial. Sin una ejecución que invertir, Piixie recurre a un diccionario de sustituciones conocidas.

Si intentas desanonimizar un fichero que Piixie no reconoce del historial, te ofrece la vía del diccionario:

No existe registro de desanonimización del fichero, ¿probar con un diccionario existente?

Elige un diccionario, o Todos los diccionarios (gana la entrada más reciente) para buscar en todo lo que tengas. Piixie revierte entonces usando esos pares.

A diferencia de la reversión exacta, no hay un mapeo preciso que invertir, así que Piixie tiene que encontrar primero los valores falsos en el texto:

  1. Lee el documento e identifica las entidades candidatas (nombres, identificadores, correos, etc.).
  2. Para cada candidato, busca una entrada del diccionario cuya sustitución coincida — dando la vuelta a ese par para restaurar el original.
  3. Aplica las restauraciones que ha encontrado.
Copia editada: "Summary for david romero gil (id 84913366): stable, discharged."
↓ reversión por diccionario
Restaurado: "Summary for Marcos Patel (id 1029384): stable, discharged."

Las herramientas externas no siempre conservan el texto al pie de la letra. La reversión por diccionario tolera las variaciones habituales:

  • Mayúsculasdavid romero gil sigue coincidiendo con David Romero Gil.
  • AcentosLucia Saez sigue coincidiendo con Lucía Sáez.
  • Espaciado y puntuación alrededor — diferencias menores no impiden la coincidencia.

Esto la hace robusta ante un documento que ha pasado por un resumidor, un traductor o una herramienta de chat que pasó el texto a minúsculas o lo redistribuyó.

Cuando reviertes en todos los diccionarios, el mismo valor falso podría aparecer en más de uno. Piixie resuelve el conflicto por recencia — gana la entrada añadida más recientemente para ese valor. Normalmente eso es lo que quieres: tus mapeos más recientes reflejan tu intención actual.

Por qué un diccionario hace duradero el trayecto de ida y vuelta

Sección titulada «Por qué un diccionario hace duradero el trayecto de ida y vuelta»

La reversión exacta depende de que el fichero de salida original se mantenga intacto. Un diccionario no — puede restaurar valores de un documento que se ha reescrito, siempre que los propios valores falsos hayan sobrevivido en el texto. Esa es exactamente la situación después de que un LLM edite tu fichero anonimizado. Mantener un diccionario que crece a partir de tus ejecuciones es lo que hace fiable todo el trayecto de ida y vuelta.

Si ninguno de los pares del diccionario aparece en el documento, Piixie te lo dice:

Ninguna entrada del diccionario coincidió con este documento.

Eso suele significar un diccionario equivocado, o un documento cuyos valores falsos se modificaron aún más más adelante. Prueba Todos los diccionarios, o confirma que el fichero es realmente uno que anonimizaste con estos mapeos.