Foxit Smart Redact
Resumen de Seguridad

Foxit Smart Redact es una herramienta impulsada por IA proporcionada por Foxit que detecta y elimina automáticamente datos sensibles como nombres, direcciones e identificaciones. Ayuda a los usuarios a completar flujos de trabajo de redacción de manera eficiente y segura, proteger la información sensible de accesos no autorizados y cumplir con las regulaciones globales de privacidad de datos. Foxit prioriza la seguridad de los datos a través de la transmisión encriptada de extremo a extremo, el almacenamiento encriptado de información sensible, centros de datos de alto nivel y políticas prudentes de retención de datos. Además, su proceso de desarrollo sigue el Ciclo de Desarrollo de Seguridad (SDL). Este enfoque multicapa proporciona a individuos y empresas una solución eficiente y segura para la detección y redacción de datos sensibles.

Acerca de Foxit Smart Redact

Foxit Smart Redact utiliza modelos de IA entrenados para cumplir con las regulaciones globales de privacidad de datos (por ejemplo, GDPR, HIPAA), lo que permite la identificación inteligente de información sensible. Utiliza flujos de trabajo optimizados para mejorar la velocidad y precisión de la redacción. Además, ofrece soluciones orientadas a empresas para ayudar a empresas y organizaciones a detectar y redactar información sensible en documentos a gran escala.
Foxit Smart Redact incluye:

  • Smart Redact Plugin de PDF Editor, integrado en Foxit PDF Editor para una redacción fluida y segura.
  • Smart Redact Server, una solución empresarial que escanea repositorios de documentos en masa para detectar y etiquetar información sensible, permitiendo a los usuarios revisar y redactar eficientemente según sea necesario.

¿Qué tipos de datos se pueden detectar?

Smart Redact detecta Información de Identificación Personal (PII) e Información de Salud Protegida (PHI) según se define en las regulaciones modernas de datos, incluyendo el GDPR de la UE, la Ley de Privacidad del Consumidor de California (CCPA) modificada por el CPRA y HIPAA. Esto incluye elementos de datos como nombres personales, números de seguro social, números de tarjetas de crédito, números de licencia de conducir, registros médicos y códigos de diagnóstico. Actualmente, la detección solo admite documentos en inglés.
Para ver una lista detallada de las categorías admitidas, consulte Apéndice A.

¿Cómo funciona Smart Redact?

Esta sección analiza los flujos de trabajo y los flujos de datos clave del Smart Redact Plugin para PDF Editor y Smart Redact Server, ayudando a los usuarios a elegir la solución adecuada según sus necesidades.

Flujo de trabajo del Smart Redact Plugin

Al usar el Smart Redact Plugin, los usuarios pueden realizar redacciones de forma segura sin cambiar de herramientas, ahorrando tiempo, protegiendo la integridad del documento y manteniendo el cumplimiento en un espacio de trabajo fluido.

Arquitectura del servicio Foxit AI Assistant

El diagrama anterior ilustra los participantes clave y su respectivo flujo de datos durante la redacción usando el Smart Redact Plugin. Los participantes en el flujo de trabajo son los siguientes:

  • PDF Editor: Se ejecuta localmente en el dispositivo del usuario. Es responsable de extraer información del documento y realizar la redacción. Esta es la interfaz principal con la que interactúan los usuarios.
  • SRP (Smart Redact Plugin) Service: Gestiona el control de acceso y el procesamiento de lógica empresarial. Actúa como intermediario entre el PDF Editor y los servicios de IA.
  • Sistema de IA Multimodelo Interno: Alojado en AWS. Analiza documentos para detectar información sensible y devuelve resultados al SRP Service.
  • Azure AI Language Service: Un servicio de IA externo utilizado para identificar información sensible y que interactúa con el SRP Service para proporcionar resultados de detección.

Los pasos siguientes describen el flujo de trabajo principal del Smart Redact Plugin de PDF Editor para detectar y redactar información sensible.

  • Preparación del documento: El usuario abre el documento. Si el documento es un archivo escaneado o contiene imágenes incrustadas, el Reconocimiento de Texto extraerá el texto del documento.
  • Iniciar Smart Redact: El usuario activa Smart Redact, selecciona opciones (por ejemplo, regiones, categorías sensibles) e inicia el escaneo.
  • Extracción local de texto: El PDF Editor extrae todo el contenido de texto, tanto nativo como generado por OCR, y lo envía junto con los parámetros definidos por el usuario al SRP Service.
  • Detección de información sensible impulsada por IA:
    • a) Análisis de IA: El SRP utiliza varios modelos (Azure AI Language y el Sistema de IA Multimodelo Interno) para detectar el contenido de texto por separado.
    • b) Integración de Model Ensemble y Votación: El SRP Service agrega las salidas de los dos sistemas de IA usando un enfoque de Model Ensemble, aplicando la votación mayoritaria para consolidar los resultados. Este método impulsado por el consenso genera una lista unificada de información sensible, mejorando significativamente la precisión de la detección.
  • Revisión y confirmación del usuario: El PDF Editor muestra la información sensible detectada al usuario. El usuario revisa y confirma qué elementos redactar.
  • Realizar redacción después de la confirmación: El PDF Editor realiza la redacción solo después de la confirmación explícita del usuario, garantizando el cumplimiento de las políticas de privacidad.

El Smart Redact Plugin ayuda a los usuarios a identificar y redactar información sensible de forma inteligente, simplificando el proceso de redacción. Las acciones de detección y redacción solo se ejecutan después de la confirmación del usuario, asegurando que los usuarios mantengan el control total sobre el proceso y que todas las acciones cumplan con los requisitos de privacidad de datos.

Flujo de trabajo del Smart Redact Server

El Smart Redact Server (SRS) automatiza eficientemente la detección de información sensible y la migración de archivos. Por ejemplo, puede escanear 10.000 contratos de clientes en un bucket de AWS S3 y aplicar políticas preestablecidas para manejar automáticamente tareas de redacción y migración.

Arquitectura del servicio Foxit AI Assistant

La figura ilustra los participantes clave y su respectivo flujo de datos durante la redacción usando el Smart Redact Server. Los participantes en el flujo de trabajo son los siguientes:

  • Almacenes en la nube: Las plataformas de almacenamiento en la nube del usuario (por ejemplo, OneDrive, AWS S3) sirven como fuente de datos de documentos.
  • SRS (Smart Redact Server) Service: Una aplicación web independiente que gestiona el control de acceso, la lógica empresarial, la autenticación de usuarios, la orquestación de flujos de trabajo y la interfaz de usuario.
  • Sistema de IA Multimodelo Interno
  • Azure AI Language Service
  • Azure AI-Vision OCR Service: Extrae contenido de texto de documentos escaneados o imágenes para proporcionar entrada para la detección de información sensible.

Los pasos siguientes describen el flujo de trabajo principal del Smart Redact Server (SRS) para detectar y redactar información sensible.

  • Crear un proyecto
    • a) Seleccionar/Crear Política: Defina los tipos de datos sensibles a detectar.
    • b) Seleccionar/Conectar Fuente de Datos: Conecte el almacenamiento en la nube (por ejemplo, AWS S3, OneDrive). SRS sigue las directrices de seguridad de cada proveedor de almacenamiento en la nube para conectarse y acceder a los datos, como el uso de autenticación basada en tokens en lugar de almacenamiento de contraseñas.
    • c) Configurar Alcance y Programa de Escaneo:
      • i.Especifique la carpeta raíz y los tipos de documentos a escanear.
      • ii.Establezca el programa de escaneo (diario/semanal/mensual o activación manual).
    • d) Definir Política de Migración de Archivos: Para documentos que contienen datos sensibles, elija copiarlos o moverlos a rutas designadas.
  • Flujo de Trabajo de Procesamiento por Lote de Documentos: SRS procesa documentos periódicamente según el programa. Determina si se necesita un nuevo escaneo comparando nombres de archivos, horas de modificación y registros históricos.
  • Pasos de procesamiento de un solo documento:
    • a) Descargar Documento: Obtener archivos de la fuente de datos al servidor SRS.
    • b) Extracción de Texto: Usar Azure AI-Vision OCR para extraer contenido de texto del documento.
    • c) Detección de información sensible impulsada por IA: Esto sigue el flujo de trabajo del modelo basado en ensemble, que se describe para el Smart Redact Plugin y no se repite aquí.
    • d) Almacenamiento de Registros: Guardar registros de escaneo, registros y información sensible detectada en la base de datos. Todos los datos están encriptados.
    • e) Migración de Archivos: Copiar o mover documentos sensibles según la configuración definida por el usuario.
    • f) Limpieza: Eliminar copias temporales de archivos del servidor SRS.
  • Posprocesamiento para Usuarios: Los usuarios pueden revisar registros de escaneo en la plataforma SRS y realizar operaciones de redacción, movimiento o copia.

Cuando los usuarios usan Smart Redact Server para detectar y redactar información sensible, SRS procesa los documentos en los Almacenes en la Nube designados por el usuario según la política del usuario. SRS no retiene documentos originales ni intermedios. Sin embargo, la información sensible se almacena en forma encriptada para su revisión y acciones de seguimiento.

¿Cómo mantiene Smart Redact los datos seguros?

Datos seguros en tránsito

  • Todas las API web se llaman a través de HTTPS, incluidas las llamadas a la API de Foxit Smart Redact Services y la API de Azure AI Services. Esto garantiza la transmisión segura de documentos y datos de usuario. Además, las versiones de HTTPS y las selecciones de conjuntos de cifrado se revisan y actualizan periódicamente para cumplir con las mejores prácticas de la industria.
  • Cuando Smart Redact Server accede a servicios de almacenamiento en la nube, todas las solicitudes se realizan según las directrices recomendadas de los almacenes en la nube para garantizar la seguridad del acceso.

Datos seguros en reposo

Foxit implementa una variedad de medidas para garantizar la seguridad de los datos en reposo, siendo las medidas clave las siguientes.

  • Cifrado de información sensible: La información sensible se cifra y almacena usando el Estándar de Cifrado Avanzado (AES) de 256 bits.
  • Seguridad del Centro de Datos: Al aprovechar los centros de datos de Nivel 4 de AWS, Foxit garantiza controles de acceso robustos, medidas de protección ambiental y acceso restringido limitado al personal autorizado en Virginia, Fráncfort y Montreal.
  • Privacidad de datos: Las bases de datos están protegidas por firewall y no son accesibles públicamente, con acceso restringido al personal autorizado solo para fines comerciales o legales.
  • Operación Off-Grid: Para necesidades de alta seguridad, Foxit ofrece un modo "off-grid", que permite el funcionamiento del SmartRedact Server sin acceso a la nube.

Retención prudente de datos

  • Cuando los usuarios usan el Smart Redact Plugin de PDF Editor para detectar y redactar información sensible en documentos, Smart Redact sigue una política de retención cero. Una vez completada la tarea, todos los documentos originales e intermedios, junto con los resultados, se eliminan instantáneamente.
  • Al usar el Smart Redact Server (SRS) para procesamiento de documentos, SRS no retiene documentos originales ni intermedios. La información sensible detectada se almacena en forma encriptada. Eliminar un proyecto también eliminará permanentemente todos los resultados de detección asociados.

Prácticas de desarrollo seguro

Foxit sigue el Ciclo de Desarrollo de Seguridad (SDL) estándar de la industria para garantizar la seguridad y confiabilidad de Smart Redact. Las medidas clave incluyen:

  • Diseño Seguro: Se realiza modelado de amenazas temprano para identificar riesgos, con controles de seguridad integrados en la fase de diseño.
  • Codificación Segura: El cumplimiento de estándares estrictos de codificación previene vulnerabilidades comunes.
  • Auditorías de código y prueba de vulnerabilidades: Auditorías y pruebas regulares garantizan la integridad del código.
  • Pruebas de Seguridad: Se usa una combinación de pruebas automatizadas y manuales para validar la seguridad del sistema.
  • Lanzamiento seguro: Revisiones de seguridad rigurosas garantizan el cumplimiento antes del despliegue.

Además, Foxit prioriza la capacitación en seguridad para mejorar la experiencia de los desarrolladores. Estas prácticas refuerzan el compromiso de Foxit de entregar una solución Smart Redact segura y confiable.

Privacidad y Directrices

Su uso de las soluciones Smart Redact de Foxit está regido por el Acuerdo de Licencia de Usuario Final de Foxit (Foxit EULA) y los Términos Generales de Servicio de Foxit. Las Directrices reflejan la dedicación de Foxit a cumplir con las leyes y regulaciones aplicables, mantener los valores de la empresa y promover el uso ético de las tecnologías de IA.

Foxit utiliza algunas de las tecnologías de Azure AI Service para proporcionar la solución Smart Redact. Cada servicio de Azure AI utilizado por Smart Redact cumple con sus propios estándares de seguridad y privacidad. Para más detalles, consulte:

Conclusión

Foxit ofrece un nivel de seguridad de clase mundial adaptado a las diversas necesidades de usuarios y organizaciones de diferentes industrias. Reconocemos la sensibilidad de su información y flujos de trabajo y nos comprometemos a protegerlos con el más alto nivel de seguridad. Con Foxit, obtiene un proveedor de confianza comprometido no solo a entregar software PDF inmejorable, sino también a garantizar su seguridad en todos los aspectos de acuerdo con las mejores prácticas de la industria.
Para obtener más información sobre la seguridad de Foxit, visite el Foxit Security Center.

Apéndice A

Lista detallada de categorías admitidas por Smart Redact

Nombre de códigoPaísObservación
PersonaTodo(PII)
OrganizaciónTodo(PII)
Tipo de personaTodo(PII)
DirecciónTodo(PII)
Código postalTodo(PII) Los tres primeros dígitos de un código postal
UbicaciónTodo(PII) Location All incluye nombres como ciudades, países, regiones, estados, estructuras artificiales y ubicaciones geográficas, como ríos, océanos y desiertos.
Correo electrónicoTodo(PII)
Número de faxTodo(PII)
Fecha y horaTodo(PII)
TemperaturaTodo(PII)
MonedaTodo(PII)
EdadTodo(PII)
PorcentajeTodo(PII)
Número de tarjeta de créditoTodo(PII)
Número de cuenta bancaria internacionalTodo(PII) IBAN
GéneroTodo(PII) Términos que revelan el género del sujeto, p. ej., masculino, femenino, mujer, caballero o dama.
Código SWIFTTodo
URL de redes socialesTodo(PII) Admite la detección de cuentas de redes sociales:
* nombre de usuario de Twitter
* nombre de usuario de Facebook
* cuenta de YouTube
* cuenta de Vimeo
* nombre de usuario de Instagram
* URL de LinkedIn
* nombre de usuario de Pinterest
Raza humanaTodo(PII) Ejemplos: "Africano", "Asiático", "Europeo", "Nativo americano", "Oceanía"
Visión religiosaTodo(PII) Ejemplo: "Judaísmo", "Catolicismo"
Preferencia sexualTodo(PII) Ejemplo: "bisexual", "homosexual", "heterosexual"
Afiliación políticaTodo(PII) Ejemplo: "Partido Demócrata (Estados Unidos)" o "Partido Republicano (Estados Unidos)"
Código de paísTodo(PII) Ejemplo: +591, +886
IdiomaTodo(PII) Ejemplo: Inglés, Francés
OcupaciónTodo(PII) Ejemplo: Científico, Doctor
Tipo de sangreTodo(PII) p. ej., A, B, AB, O
Estado civilTodo(PII) p. ej., Casado, Soltero, Divorciado
IPTodo(PII) Direcciones de red IPv4 e IPv6. Ejemplo: 168.131.1.1 y 21DA:D3:0:2F3B:2AA:FF:FE28:9C5A
Número de enrutamiento ABAEstados Unidos(PII)
Número de teléfono de EE.UU.Estados Unidos(PII)
Identificación de contribuyente individual de EE.UU.Estados Unidos(PII)
Número de seguro social de EE.UU.Estados Unidos(PII)
Número de licencia de conducir de EE.UU.Estados Unidos(PII)
Número de pasaporte de EE.UU./Reino UnidoUS and UK(PII) Conocimiento consciente del contexto. Necesita texto de número de pasaporte alrededor de los números.
Número de cuenta bancaria de EE.UU.Estados Unidos(PII)
Número de enrutamiento ACHEstados Unidos(PII) Número de Automatic Clearing House
Proveedor de segurosEstados Unidos(PII)
ID de miembroEstados Unidos(PII) Número de ID de miembro de seguro
ID de grupoEstados UnidosNúmero de grupo de seguro
Licencia de conducir de AustraliaAustralia(PII) Insurance group number
Número de pasaporte de AustraliaAustralia(PII) Insurance group number
Número de empresa de AustraliaAustralia(PII) Número de empresa australiano
Código BSBAustralia(PII) Código de sucursal bancaria estatal
Número de teléfono de AustraliaAustralia(PII)
Número de referencia del clienteAustralia(PII) Un CRN consta de 9 números y termina con una letra. Por ejemplo: 123 456 789A.
Número de archivo impositivoAustralia(PII) Un número de archivo impositivo (TFN) es gratuito e identifica al usuario para fines impositivos y de jubilación.
Número de licencia de conducir del Reino UnidoUK(PII) Número de licencia de conducir del Reino Unido
Índice de salud comunitariaUK(PII) Número de Índice de Salud Comunitaria (CHI), p. ej., 0911640250
Número de salud nacional del Reino UnidoUK(PII) Número del Servicio Nacional de Salud (NHS)
Número de seguro nacional del Reino UnidoUK(PII) Número de seguro nacional
Número de salud nacional del Reino UnidoUK(PII) Número del Servicio Nacional de Salud
Número de teléfono del Reino UnidoUK(PII) Número de teléfono del Reino Unido
Nombre del examenTodoExamen (PHI); procedimientos y pruebas de diagnóstico, incluidos signos vitales y mediciones corporales
DiagnósticoTodoDiagnóstico (PHI); enfermedad, síndrome, envenenamiento
Síntoma o signoTodoSíntoma (PHI); evidencia subjetiva u objetiva de enfermedad u otros diagnósticos
Nombre del tratamientoTodoTratamiento (PHI); procedimientos terapéuticos
AlérgenoTodoAlérgeno (PHI); un antígeno que provoca una reacción alérgica
CursoTodoCurso (PHI); descripción de un cambio en otra entidad a lo largo del tiempo, como la progresión de una condición, un curso de tratamiento o medicación
Valor de mediciónTodoValor de medición (PHI); el valor relacionado con un examen o una medición de condición médica
VarianteTodoVariante (PHI); todas las menciones de variaciones y mutaciones genéticas
Gen o proteínaTodoGen/Proteína (PHI); todas las menciones de nombres y símbolos de genes humanos, así como cromosomas y partes de cromosomas y proteínas
Tipo de mutaciónTodoTipo de mutación (PHI); descripción de la mutación, incluido su tipo, efecto y ubicación
ExpresiónTodoExpresión (PHI); nivel de expresión génica
Evento administrativoTodoEvento administrativo (PHI); eventos relacionados con el sistema de salud pero de naturaleza administrativa/semi-administrativa
Entorno de cuidadoTodoEntorno de cuidado (PHI); un entorno o ubicación donde se brinda atención a los pacientes
Cualificador de condiciónTodoCualificador de condición (PHI); términos cualitativos que se utilizan para describir una condición médica
Nombre del medicamentoTodoNombre del medicamento (PHI); menciones de medicamentos, incluidos nombres de marca con derechos de autor y nombres sin marca
DosisTodoDosis (PHI); cantidad de medicamento ordenada
Relación familiarTodoRelación familiar (PHI); menciones de parientes del sujeto
Estructura corporalTodoEstructura corporal (PHI); sistemas corporales, ubicaciones o regiones anatómicas y sitios corporales
DirecciónTodoDirección (PHI); términos direccionales que pueden relacionarse con una estructura corporal, condición médica, examen o tratamiento
FrecuenciaTodoFrecuencia (PHI); describe con qué frecuencia una condición médica, examen, tratamiento o medicamento ocurrió, ocurre o debería ocurrir
TiempoTodoTiempo (PHI); términos temporales relacionados con el inicio y/o la duración de una condición médica, examen, tratamiento, medicamento o evento administrativo
Unidad de mediciónTodoValor de medición (PHI); el valor relacionado con un examen o una medición de condición médica
Operador relacionalTodoOperador relacional (PHI); frases que expresan la relación cuantitativa entre una entidad y alguna información adicional
Profesión sanitariaTodoProfesión sanitaria (PHI); un profesional de la salud con licencia o sin licencia
Escala de condiciónTodoEscala de condición (PHI); términos cualitativos que caracterizan la condición mediante una escala, que es una lista ordenada finita de valores
Clase de medicamentoTodoClase de medicamento (PHI); un conjunto de medicamentos que tienen un mecanismo de acción similar, un modo de acción relacionado, una estructura química similar y/o se utilizan para tratar la misma enfermedad
Forma del medicamentoTodoForma del medicamento (PHI); la forma del medicamento
Ruta de medicaciónTodoRuta de medicación (PHI); el método de administración del medicamento