Saltearse al contenido

Elegir un modelo

Piixie puede ejecutar la detección con un modelo en tres sitios: en local en tu equipo, en un servidor compartido de tu red o en un endpoint en la nube como Anthropic u OpenAI. Desde el punto de vista de la canalización son intercambiables: los mismos modos, los mismos perfiles, el mismo editor después. La elección se reduce a tres preguntas.

  1. ¿Adónde puede ir el documento? Esta es la restricción dura. Puede que a los datos regulados o confidenciales se les permita quedarse en tu equipo o en un servidor interno controlado, pero no pasar a una API de terceros.
  2. ¿Es tu hardware lo bastante rápido? Un portátil ejecuta sin problemas el modelo local por defecto para documentos del día a día; los PDF largos y con muchas imágenes son lentos.
  3. ¿Qué dificultad tiene el documento? El contenido enrevesado y ambiguo se beneficia de un modelo más grande, y del razonamiento.

El modelo se ejecuta en tu equipo; nada cruza la red tras la descarga única.

  • Mejor para: la opción por defecto. Máxima privacidad, sin configuración, funciona sin conexión.
  • Modelos: Gemma 4 E4B (rápido) y Gemma 4 12B (más calidad). Consulta modelos locales.
  • Ten en cuenta: la velocidad en hardware antiguo y los documentos muy largos (limitados por el contexto del modelo).

Un equipo (idealmente con GPU) aloja el modelo; los equipos de escritorio ligeros se conectan a él.

  • Mejor para: equipos, alto volumen, redes aisladas (air-gapped) o con requisitos de cumplimiento donde las API externas quedan descartadas pero un servidor interno sí vale.
  • Qué cruza: el texto y las imágenes del documento viajan al servidor por tu LAN, retenidos en memoria solo durante la ejecución. La salida y el historial se quedan en la estación de trabajo.
  • Ten en cuenta: ponlo detrás de TLS si la red no es de confianza.

Un modelo de frontera de Anthropic u OpenAI, a través de un endpoint remoto.

  • Mejor para: los documentos más difíciles, cuando tu política de datos lo permite y quieres la máxima calidad de detección (y un razonamiento potente).
  • Qué cruza: el texto y las imágenes del documento se envían a ese proveedor, bajo sus condiciones. Piixie muestra una confirmación la primera vez que eliges un modelo en la nube.
  • Ten en cuenta: confírmalo con tu responsable de cumplimiento antes de usarlo con datos regulados. Esta es la única vía por la que los documentos en bruto salen de tu control.
SituaciónElige
Datos sensibles, privacidad por defectoEn local
Datos sensibles, portátiles lentos, un equipoServidor compartido
Red aislada (air-gapped)En local o servidor compartido
Datos públicos/de bajo riesgo, detección más difícilEndpoint en la nube
Máxima calidad, la política lo permiteEndpoint en la nube + razonamiento Alto

Todos los modelos disponibles —los locales descargados, los que puedes descargar y los remotos habilitados— están en un único selector en ajustes. Los modelos remotos llevan la etiqueta de su endpoint. Cambia según el documento a medida que cambia la situación; todo lo que viene después se comporta igual.

El límite de privacidad se mantiene en todo caso

Sección titulada «El límite de privacidad se mantiene en todo caso»

Elijas lo que elijas, el patrón previsto es el mismo: anonimiza donde vive el documento y envía hacia adelante solo la copia segura. Un modelo de anonimización en la nube es una opción explícita para el paso de detección; la vía habitual y recomendada mantiene la detección en local y solo la salida anonimizada llega a herramientas externas. Consulta privacidad.