Saltearse al contenido

Perfiles

Un perfil es una configuración de anonimización guardada. En lugar de elegir un modo simple para cada fichero, seleccionas un perfil que lleva el método más todo lo que lo rodea: ajustes del método, personalizaciones de prompt, qué campos de PII tratar, sustituciones mecánicas de texto y un diccionario. Los perfiles se pueden crear, clonar, exportar e importar como JSON, y un perfil se marca como el predeterminado.

Cada ejecución completada guarda una instantánea del perfil que usó, así que las entradas del historial siguen siendo interpretables incluso después de editar o eliminar el perfil.

Cada perfil usa un método: Synthetic, Redact, Replace, LLM Gen o JS (consulta modos para ver qué hacen). Cada método tiene su propio panel de ajustes.

Synthetic

  • Seed: fija el generador aleatorio para valores falsos reproducibles (0 significa aleatorio en cada ejecución)
  • Locale: idioma/región para los nombres, direcciones y formatos de teléfono generados

Redact

  • Redaction token: el texto del marcador, [REDACTED] por defecto
  • Length mode: usar el token tal cual, igualar la longitud del valor original, usar una longitud aleatoria o una longitud fija
  • Fill character: cuando hay un modo de longitud activo, rellenar con asteriscos, un glifo de bloque o sombreado que simula una ocultación gráfica (█ ▓ ▒ ░ ■ ▬), un carácter personalizado o una cadena personalizada. El mismo conjunto de caracteres se ofrece en el Editor de anonimización, así que ambos se mantienen sincronizados.

Replace

  • Token format: patrón para los tokens generados, [TYPE_NUM] por defecto (produciendo [NAME_1], [EMAIL_2], …)

LLM Gen

  • Sin ajustes propios; guíalo a través de la personalización de prompt del perfil más abajo

JS

  • Un fragmento de JavaScript que calcula cada sustitución, más seed y locale. Se ejecuta en la VM de JavaScript incrustada de Piixie.

Por defecto, un perfil usa el prompt de detección integrado de Piixie. Puedes:

  • Reemplazarlo por completo con un prompt personalizado
  • Anteponer o añadir un mensaje de sistema al integrado
  • Anteponer o añadir texto al prompt de usuario

Añadir al final es la opción más segura para incorporar directrices propias de la organización (“trata los nombres en clave de proyectos como PII”) sin perder la coherencia y las reglas de formato del prompt integrado.

Los perfiles controlan sobre qué tipos de entidad actúa el modelo:

  • Auto-detect all: el catálogo integrado de tipos de PII (nombres, correos, teléfonos, direcciones, documentos de identidad, números de cuenta, fechas de nacimiento, etc.)
  • Only selected fields: restringir la detección a un conjunto de tipos elegido
  • Custom fields: una lista definida por el usuario

Tras estos modos hay un catálogo de campos de PII con entradas del sistema y definidas por el usuario (etiqueta, tipo, locale, descripción). La selección de campos y la edición del catálogo son superficies en evolución; lo que la versión actual expone en el editor de perfiles puede ir por detrás de lo que admite el motor, y el JSON de perfil importado puede llevar reglas que el editor aún no muestra.

Un interruptor aparte controla qué ocurre con los importes numéricos (precios, totales, cantidades): conservar los originales, aleatorizarlos o ponerlos a cero. Los importes a menudo no son PII por sí mismos, pero pueden ser identificativos en contexto, así que esta es una decisión por perfil.

Los perfiles pueden llevar sustituciones de texto plano aplicadas sin intervención del modelo, cada una una regla ordenada from → to con un momento de aplicación:

  • Before: aplicada al texto antes de que el modelo lo vea. Úsala para ocultar cadenas que ya conoces (el dominio de tu empresa, un nombre en clave de producto) para que el modelo nunca las reciba.
  • After: aplicada a la salida después de los mapeos del modelo. Úsala para normalizar lo que sea que el modelo haya producido.

Las reglas se pueden desactivar individualmente sin eliminarlas. El editor de perfiles aún no expone un panel de sustituciones; las reglas viajan con el JSON de perfil importado y se ejecutan como parte de la canalización.

Un diccionario es un conjunto reutilizable de pares original → replacement compartido entre perfiles, aplicado antes o después de la pasada del modelo. Los diccionarios son la forma de mantener las mismas identidades falsas en muchos documentos y muchas ejecuciones: si “Acme GmbH” siempre debe convertirse en “Globex AG” en cada exportación que produzca tu equipo, un diccionario lo garantiza en vez de confiar en que el modelo elija el mismo valor dos veces. Piixie también puede rellenar un diccionario a partir de los resultados de una ejecución, promoviendo un buen conjunto de sustituciones generadas a un mapeo permanente.

Cada entrada asigna un original a exactamente una sustitución. Reutilizar un original con una nueva sustitución (o una nueva fuente) sobrescribe la entrada existente en lugar de añadir un duplicado, así que un término dado siempre se resuelve igual.

Abre el gestor de diccionarios en su propia ventana desde el botón de diccionarios junto al selector de perfiles, o desde el control de diccionario dentro del editor de perfiles (el botón al lado del desplegable de diccionario). El desplegable muestra el número de entradas de cada diccionario entre paréntesis, por ejemplo Default (1342).

En el gestor puedes:

  • Seleccionar cualquier diccionario del combo y examinar sus entradas.
  • Crear, renombrar, duplicar y eliminar diccionarios. El diccionario integrado Default no se puede eliminar. Al duplicar se copian todas las entradas en un diccionario nuevo.
  • Añadir, editar y eliminar entradas. Las entradas creadas por una ejecución de anonimización registran el fichero de origen y la fecha en que se introdujeron; las entradas añadidas manualmente aparecen como Manual.
  • Buscar entre originales, sustituciones y ficheros de origen.
  • Ocultar el original con un interruptor que difumina solo la columna del original —útil cuando hay ojos curiosos cerca— dejando legible la sustitución.

Los diccionarios se asocian a los perfiles desde el editor de perfiles (un diccionario se puede asociar a cero, uno o muchos perfiles); la ventana del gestor en sí trata de organizar los diccionarios y sus entradas.