Datos sintéticos
El modo sintético mantiene los documentos utilizables sustituyendo valores privados reales por valores falsos que conservan la misma estructura. Ocultar elimina el contexto y las etiquetas de sustitución parecen artificiales; la salida sintética se lee como un documento real que resulta describir a personas distintas.
Cómo funciona
Sección titulada «Cómo funciona»El modelo local identifica las entidades y devuelve un plan: tipo de entidad, localización, generador, las partes del texto original y cualquier transformación. Piixie ejecuta ese plan a través de un runtime de @faker-js/faker incluido, alojado dentro de una VM de JavaScript pura en Go.
Todos los valores falsos se producen en tu equipo. No interviene ninguna API de generación de datos en la nube.
Familias de generadores
Sección titulada «Familias de generadores»Personas y organizaciones. Nombres, nombres de pila, apellidos, tratamientos, formas posesivas, nombres de empresa y partes de nombre aptas para correo.
Datos de contacto y ubicación. Direcciones postales, ciudades, provincias, países, códigos postales, números de teléfono, URL, direcciones IP y direcciones de correo.
Identificadores y finanzas. Números de cuenta, IBAN, números de tarjeta, UUID, ID alfanuméricos y fechas de nacimiento.
Reglas de coherencia
Sección titulada «Reglas de coherencia»Cada entidad lógica recibe un perfil de Faker en caché. Si el nombre completo de una persona aparece en un párrafo y su apellido aparece tres páginas después, ambos se asignan a la misma identidad falsa.
- Las direcciones de varias líneas se generan a partir de un único perfil de dirección
- Los correos reutilizan las partes del nombre de la persona sintética
- Los dominios de empresa usan nombres con forma de empresa
- Las pistas de localización se normalizan. El inglés, el español (incl. México), el portugués (Portugal y Brasil), el francés, el italiano y el alemán usan sus datos nativos de
@faker-js/faker. El català, el euskera y el galego no tienen localización de faker, así que toman los nombres de persona de un paquete regional de nombres incluido, sobre la base estructural española (los teléfonos, los ID y las direcciones conservan los formatos españoles).
Conservación de la forma
Sección titulada «Conservación de la forma»Algunos valores son útiles porque su forma carga con significado, así que Piixie conserva los separadores, las mayúsculas/minúsculas, el número de dígitos y los patrones de formato mientras sustituye el valor en sí. Una fecha de nacimiento escrita como 14/03/1982 se mantiene en estilo día/mes/año. Un ID que mezcla letras y dígitos conserva el mismo patrón aproximado. Un correo de trabajo conserva su estilo sin el nombre real.
Reproducibilidad
Sección titulada «Reproducibilidad»En un perfil, el modo sintético admite una semilla aleatoria y una localización. La misma semilla sobre el mismo documento produce los mismos valores falsos, lo que importa en los fixtures de pruebas que no deberían cambiar en cada ejecución.
Cuándo usarlo
Sección titulada «Cuándo usarlo»- Prompts de LLM: ejemplos seguros sin filtrar PII de producción
- Demos que necesitan parecer reales sin datos de producción
- Fixtures de pruebas construidos a partir de formas de documentos reales
- Casos de soporte donde ocultar quitaría demasiado contexto
Revisa las sustituciones generadas en la tabla de historial antes de publicar documentos sintéticos como ejemplos. Los valores falsos son verosímiles por diseño, lo que también significa que una lectura descuidada puede pasar por alto un valor real que el modelo no llegó a asignar.