Salida por lotes: copias y nomenclatura
La mayoría de las ejecuciones producen una copia segura. Pero con el modo sintético puedes pedir que una sola ejecución produzca varias variantes de un documento —cada una con un reparto falso distinto— y puedes controlar cómo se nombran todos tus ficheros de salida. Estos son los controles de salida por lotes.
Copias: muchas variantes de un documento
Sección titulada «Copias: muchas variantes de un documento»Cuando un perfil usa el modo sintético, la tabla de preparación gana una columna de Copies con un selector incremental. Ponla por encima de 1 y ese documento se anonimiza esas veces en una sola ejecución, generando cada pasada un nuevo conjunto de valores falsos.
expediente-clinico-marcos-patel.pdf Copies: 3 ↓ one runexpediente…__001-1.pdf (David Romero Gil, NHC 84913366, …)expediente…__001-2.pdf (Hugo Navarro Ortiz, NHC 55120947, …)expediente…__001-3.pdf (Iker Pardo Vega, NHC 73048815, …)Cada copia es internamente coherente —dentro de una sola variante, cada mención de una persona sigue apuntando a una identidad falsa— pero las variantes difieren entre sí.
Por qué generar copias
Sección titulada «Por qué generar copias»- Datos de entrenamiento y de prueba. Convierte un documento real en muchos ejemplos realistas y no identificativos que comparten su estructura.
- Demos. Muestra un flujo de trabajo sobre varios registros “distintos” sin tocar datos de producción.
- Pruebas de robustez. Alimenta una canalización con muchas entradas de forma idéntica pero con valores variados.
Nomenclatura de la salida
Sección titulada «Nomenclatura de la salida»Cómo se nombran los ficheros de salida se configura en la sección Output del perfil, en Output file naming. A cada salida se le añade un token con la forma name__token:
| Estilo | El token tiene esta forma | Notas |
|---|---|---|
| Number | 001, 002, … | Un contador por fichero guardado en este ordenador |
| Hash | ba72c58e | Un hash corto, bueno para la unicidad |
| Date | 20260612 | La fecha de la ejecución (YYYYMMDD) |
El estilo de número incrementa un contador por fichero de origen que persiste entre ejecuciones, así que la tercera vez que anonimizas informe.pdf obtienes informe__003. Cuando además generas copias, también se añade el índice de copia: informe__003-1, informe__003-2.
El propio nombre de fichero base se anonimiza: si el original era invoice-marcos-patel.pdf, la PII del nombre recibe el mismo trato que el cuerpo. Consulta ubicación de la salida.
Cómo aparecen los lotes en el historial
Sección titulada «Cómo aparecen los lotes en el historial»Una ejecución que produjo varias copias es una única entrada del historial, etiquetada con un recuento como 3 files. Al abrirla se ofrece abrir todos los ficheros generados (Piixie pregunta primero si son muchos). La tabla de sustituciones refleja la ejecución; los ficheros de cada variante quedan juntos en tu carpeta de salida.
Combinar con diccionarios y plantillas
Sección titulada «Combinar con diccionarios y plantillas»- Para una salida variada (el sentido de las copias), deja desactivada la reutilización de diccionario: quieres repartos distintos.
- Para una salida coherente entre ejecuciones, eso es trabajo de un diccionario, no de las copias.
- Una plantilla define cómo se anonimiza cada copia (qué campos, qué métodos); las copias solo la multiplican.