Saltearse al contenido

Receta: anonimizar un historial médico

Los historiales clínicos son el caso más difícil y aquel para el que Piixie está pensado. La PII se esconde en las relaciones: un paciente vinculado a un médico, un familiar con solo el nombre de pila, una fecha de ingreso que ancla una cronología, una institución que no debería borrarse. Aquí es donde un modelo de razonamiento demuestra su valor.

Objetivo: un informe clínic que puedas entregar a un investigador, un proveedor o un modelo externo —clínicamente intacto, personalmente anónimo.

Sintetizar, región Español —el historial debería seguir leyéndose como una nota clínica de verdad. Sube el razonamiento a Medio o Alto: las decisiones de contexto de este documento son justo lo que aciertan los modelos que piensan primero. Si tu política de datos lo permite y quieres la máxima calidad, un endpoint en la nube con razonamiento Alto es la opción más potente; si no, el modelo local de 12B.

Procesa el documento. Con el razonamiento activado, el diálogo de procesamiento transmite el pensamiento del modelo. Lo verás tomar las decisiones que importan:

El encabezado lista un nombre de paciente ‘Marcos Patel’ (NAME) y un número de NHC —ambos PII. El ‘Dr.’ antes de ‘Ruiz’ marca un profesional; trata el apellido como NAME. ‘14/03/1982’ junto a ‘F. Nacimiento’ es una fecha de nacimiento. ‘Hospital Clínic’ es una institución pública, no personal —déjalo. El periodo ‘ene 2020 – mar 2023’ ancla una cronología personal → trátalo como DATE.

Abre en el editor y comprueba en concreto las que dependen del contexto:

  • Paciente frente a profesional — ambos son NAME y ambos se sintetizan, que suele ser lo correcto. Si necesitas conservar a los profesionales (un especialista conocido relevante para el estudio), desactiva esas entradas.
  • Instituciones conservadas — confirma que Hospital Clínic sobrevivió. Si el modelo lo borró de más, desactiva su entrada.
  • Fechas identificativas — la fecha de nacimiento y los periodos de ingreso/alta deberían gestionarse; las fechas públicas puntuales se dejan en paz. Añade cualquiera que el modelo se haya saltado.
  • Números de historia — NHC, episodio e identificadores de caso sintetizados con la forma correcta (consulta tipos de entrada).

La fila de historial y la tabla de sustitución de un historial médico guardan los valores reales en local —eso es lo que da pie a la búsqueda y a la inversión, y significa que la base de datos local es tan sensible como el historial. Mantén activado el cifrado de disco completo y borra el historial (con “eliminar ficheros”) cuando termines. La detección en sí se queda en tu equipo salvo que elijas deliberadamente un modelo en la nube.

Guarda en la salida. Si anonimizas a los mismos pacientes en distintas visitas, adjunta un diccionario con la reutilización activada para que cada paciente conserve una identidad falsa en todos los documentos —consulta coherencia de equipo. Guarda una plantilla para la forma del informe.

¿Quieres que un LLM en la nube resuma el historial sin ver al paciente real? Anonimiza primero, resume la copia segura y luego desanonimiza la respuesta de vuelta a los valores reales. Los pasos completos en compartir con seguridad con un LLM.