El catálogo de tipos de PII
Cada entrada lleva un tipo — la clasificación que hace el modelo de lo que es el valor. El tipo es más que una etiqueta: decide qué aspecto tiene una sustitución sintética, y es la forma de filtrar y buscar entradas.
Tipos comunes
Sección titulada «Tipos comunes»| Tipo | Cubre | Ejemplo sintético |
|---|---|---|
NAME | Nombres de personas, en cualquier forma (completo, nombre, apellido, con título) | Marcos Patel → David Romero Gil |
EMAIL | Direcciones de correo electrónico | [email protected] → [email protected] |
PHONE | Números de teléfono y fax | +34 612 345 678 → +34 698 112 530 |
ADDRESS | Direcciones postales, completas o parciales | C/ Mayor 12, Madrid → Av. del Sol 84, Sevilla |
ID | Identificadores oficiales y de registro — DNI/NIE, NHC, pasaporte, SSN | 47829105T → 71530642M |
IBAN | Números de cuenta bancaria (IBAN y formatos locales) | ES91 2100 0418 45… → ES66 0049 1500 05… |
CARD | Números de tarjeta de pago | 4539 1488 0343 6467 → 4716 9012 3456 7890 |
DOB | Fechas de nacimiento | 14/03/1982 → 02/11/1979 |
DATE | Otras fechas identificativas (periodos de empleo, fechas de ingreso) | Jan 2020 – Mar 2023 → 02/2018 – 11/2021 |
ORG | Organizaciones, empleadores, instituciones | Acme Ibérica SL → Globex Hispania SA |
URL | Sitios personales y enlaces a perfiles | linkedin.com/in/mpatel → … |
IP | Direcciones IP | 192.168.1.42 → 10.0.4.207 |
OTHER | Cualquier cosa sensible que no encaje en una categoría |
El catálogo exacto que usa el modelo es amplio y puede crecer; estos son los que verás más a menudo. El desplegable de tipos del editor lista el conjunto completo con descripciones.
El tipo decide la forma sintética
Sección titulada «El tipo decide la forma sintética»El modo sintético no se limita a cambiar una cadena por otra — genera un valor del tipo y la forma adecuados. Un DOB de 14/03/1982 se convierte en otra fecha día/mes/año, no en un número al azar. Un ID conserva su patrón aproximado de letras y dígitos. Un EMAIL reutiliza el nombre de la persona falsa. Por eso es importante acertar con el tipo cuando editas una entrada: cambia un PHONE mal clasificado a ID y el valor regenerado coincidirá con la forma real.
Consulta datos sintéticos para ver el conjunto completo de familias de generadores y cómo se conservan las formas.
Las fechas son una decisión de criterio
Sección titulada «Las fechas son una decisión de criterio»No toda fecha es PII. «Lanzado en marzo de 2023» en una nota de prensa es público. «Empleado de enero 2020 a marzo 2023» en un CV fija la trayectoria de una persona y sí es identificativo. El modelo está instruido para tratar las fechas de trayectoria personal como PII (DATE) y dejar en paz las claramente públicas — una distinción que un buscador de patrones no puede hacer. Consulta por qué LLM para la detección de PII.
Importes numéricos
Sección titulada «Importes numéricos»Los precios, totales y cantidades no suelen ser PII, pero pueden ser identificativos en contexto (un salario muy concreto, un importe de siniestro único). Se gestionan por separado mediante un interruptor por perfil — conservar, aleatorizar o poner a cero — en lugar de como entradas tipadas.
Caracteres de ocultado (para el método Ocultar)
Sección titulada «Caracteres de ocultado (para el método Ocultar)»Cuando una entrada se oculta en lugar de sustituirse, eliges el carácter de relleno. El catálogo compartido (usado tanto en el editor como en los ajustes del perfil):
█ bloque completo · ▓ sombra oscura · ▒ sombra media · ░ sombra clara · ■ ▬ bloques · * asterisco · o un carácter o cadena personalizados.