Saltearse al contenido

Tu primera anonimización

Esta guía lleva un documento desde que lo sueltas hasta la copia segura.

Arrastra un fichero (o una carpeta) a la ventana de Piixie, o haz clic en la zona de soltado para examinar. Piixie acepta ficheros .txt, .md, .pdf y .docx. Los ficheros llegan a una cola donde puedes revisarlos antes de procesar nada.

En los PDF, Piixie cuenta de antemano las imágenes incrustadas para que sepas si entrará en juego la ocultación de imágenes.

Cada fichero en cola recibe un modo de anonimización. Las tres opciones del día a día:

ModoQué ocurreBueno para
OcultarEl PII se convierte en marcas [REDACTED]Máxima certeza, revisión legal
SustituirEtiquetas numeradas como [NAME_1], [EMAIL_2]Mantener las entidades distinguibles
SintetizarValores falsos verosímiles (“Marcus Patel” → “Ethan Vance”)Documentos que deben leerse con naturalidad

Hay dos modos más, LLM Gen y JavaScript, disponibles a través de perfiles. La comparación completa está en la página de modos.

También puedes elegir un perfil en lugar de un modo a secas. Un perfil lleva su propio modo más prompts, reglas de campo y diccionarios de sustitución.

Pulsa procesar. Un diálogo muestra en tiempo real el progreso del modelo: las fases de extracción, detección y reescritura, con un flujo de tokens en directo para que veas trabajar al modelo. Puedes cancelar en cualquier momento; no se escribe nada hasta que la ejecución termina.

Si el modelo seleccionado no puede analizar imágenes y el fichero contiene alguna, Piixie pregunta antes de continuar: seguir solo con texto, difuminar todas las imágenes automáticamente o aplicar la elección a todos los ficheros de la cola.

La copia anonimizada se escribe en la carpeta de salida de Piixie, dentro de su directorio de datos de la aplicación, salvo que configures otra ubicación de salida (la misma carpeta que el original, o un directorio personalizado). La pestaña de historial registra la ejecución con una tabla de sustituciones completa: cada entidad detectada, su tipo, el texto original y en qué se convirtió.

Mantén el original y la copia segura uno al lado del otro hasta que te fíes del resultado. Los modelos son buenos en esto, pero no son infalibles. Repasa por si algo se ha colado, sobre todo formas cortas de nombres y fechas.

Envía el resultado anonimizado allá donde el original no podía ir: un prompt de un LLM, un ticket de soporte, un fixture de pruebas compartido, una demo.