Foxit Smart Redact
Visão Geral de Segurança

Foxit Smart Redact é uma ferramenta alimentada por IA fornecida pela Foxit que detecta e remove automaticamente dados sensíveis, como nomes, endereços e IDs. Ajuda os usuários a concluírem fluxos de trabalho de redação de forma eficiente e segura, protegendo informações sensíveis contra acesso não autorizado e garantindo conformidade com regulamentações globais de privacidade de dados. A Foxit prioriza a segurança dos dados por meio de transmissão criptografada de ponta a ponta, armazenamento criptografado de informações sensíveis, data centers de alto nível e políticas prudentes de retenção de dados. Além disso, seu processo de desenvolvimento segue o Ciclo de Desenvolvimento de Segurança (SDL). Essa abordagem em camadas fornece a indivíduos e empresas uma solução eficiente e segura para detecção e redação de dados sensíveis.

Sobre o Foxit Smart Redact

Foxit Smart Redact utiliza modelos de IA treinados para cumprir regulamentações globais de privacidade de dados (por exemplo, GDPR, HIPAA), permitindo a identificação inteligente de informações sensíveis. Usa fluxos de trabalho otimizados para melhorar a velocidade e precisão da redação. Além disso, oferece soluções orientadas para empresas para ajudar negócios e organizações a detectar e redigir informações sensíveis em documentos em larga escala.
Foxit Smart Redact inclui o

  • Smart Redact Plugin do PDF Editor, integrado ao Foxit PDF Editor para redação contínua e segura.
  • Smart Redact Server, uma solução empresarial que varre repositórios de documentos em massa para detectar e rotular informações sensíveis, permitindo que os usuários revisem e redigam eficientemente conforme necessário.

Quais tipos de dados podem ser detectados?

Smart Redact detecta Informações de Identificação Pessoal (PII) e Informações de Saúde Protegidas (PHI) conforme definido por regulamentações modernas de dados, incluindo o GDPR da UE, a Lei de Privacidade do Consumidor da Califórnia (CCPA) conforme alterada pelo CPRA, e HIPAA. Isso inclui elementos de dados como nomes pessoais, números de seguro social, números de cartão de crédito, números de carteira de motorista, registros médicos e códigos de diagnóstico. A detecção atualmente suporta apenas documentos em inglês.
Para obter uma lista detalhada das categorias suportadas, consulte Apêndice A.

Como o Smart Redact funciona?

Esta seção detalha os fluxos de trabalho e os fluxos de dados-chave do Smart Redact Plugin para PDF Editor e Smart Redact Server, ajudando os usuários a escolher a solução certa com base em suas necessidades.

Fluxo de trabalho do Smart Redact Plugin

Ao usar o Smart Redact Plugin, os usuários podem realizar redações de forma segura sem alternar ferramentas — economizando tempo, protegendo a integridade do documento e mantendo a conformidade em um workspace contínuo.

Arquitetura do serviço Foxit AI Assistant

O diagrama acima ilustra os participantes-chave e seus respectivos fluxos de dados durante a redação usando o Smart Redact Plugin. Os participantes no fluxo de trabalho são os seguintes:

  • PDF Editor: Executa localmente no dispositivo do usuário. É responsável por extrair informações do documento e realizar a redação. Esta é a interface principal com a qual os usuários interagem.
  • Serviço SRP (Smart Redact Plugin): Gerencia o controle de acesso e o processamento da lógica de negócios. Atua como intermediário entre o PDF Editor e os serviços de IA.
  • Sistema de IA Multi-Modelo Interno: Hospedado na AWS. Analisa documentos para detectar informações sensíveis e retorna resultados ao Serviço SRP.
  • Serviço Azure AI Language: Um serviço de IA externo usado para identificar informações sensíveis e interage com o Serviço SRP para fornecer resultados de detecção.

Os passos subsequentes descrevem o fluxo de trabalho principal do Smart Redact Plugin do PDF Editor para detectar e redigir informações sensíveis.

  • Preparação do Documento: O usuário abre o documento. Se o documento for um arquivo digitalizado ou contiver imagens embutidas, o Reconhecimento de Texto extrairá texto do documento.
  • Iniciar Smart Redact: O usuário ativa o Smart Redact, seleciona opções (por exemplo, regiões, categorias sensíveis) e inicia a varredura.
  • Extração de Texto Local: O PDF Editor extrai todo o conteúdo de texto — tanto nativo quanto gerado por OCR — e envia-o, juntamente com parâmetros definidos pelo usuário, para o Serviço SRP.
  • Detecção de Informações Sensíveis Impulsionada por IA:
    • a) Análise de IA: O SRP usa vários modelos (Azure AI Language e Sistema de IA Multi-Modelo Interno) para detectar o conteúdo de texto separadamente.
    • b) Integração de Ensemble de Modelos e Votação: O Serviço SRP agrega saídas dos dois sistemas de IA usando uma abordagem de Ensemble de Modelos, aplicando votação majoritária para consolidar resultados. Este método impulsionado por consenso gera uma lista unificada de informações sensíveis, melhorando significativamente a precisão da detecção.
  • Revisão e Confirmação do Usuário: O PDF Editor exibe as informações sensíveis detectadas para o usuário. O usuário revisa e confirma quais itens redigir.
  • Executar redação após confirmação: O PDF Editor executa a redação apenas após confirmação explícita do usuário, garantindo conformidade com políticas de privacidade.

O Smart Redact Plugin ajuda os usuários a identificar e redigir inteligentemente informações sensíveis, simplificando o processo de redação. As ações de descoberta e redação só são executadas após confirmação do usuário, garantindo que os usuários mantenham controle total sobre o processo e que todas as ações estejam em conformidade com os requisitos de privacidade de dados.

Fluxo de trabalho do Smart Redact Server

O Smart Redact Server (SRS) automatiza eficientemente a detecção de informações sensíveis e a migração de arquivos. Por exemplo, pode varrer 10.000 contratos de clientes em um bucket AWS S3 e aplicar políticas pré-definidas para lidar automaticamente com tarefas de redação e migração.

Arquitetura do serviço Foxit AI Assistant

A figura ilustra os participantes-chave e seus respectivos fluxos de dados durante a redação usando o Smart Redact Server. Os participantes no fluxo de trabalho são os seguintes:

  • Armazenamentos em Nuvem: As plataformas de armazenamento em nuvem do usuário (por exemplo, OneDrive, AWS S3) servem como fonte de dados do documento.
  • Serviço SRS (Smart Redact Server): Um aplicativo web autônomo que gerencia controle de acesso, lógica de negócios, autenticação de usuários, orquestração de fluxos de trabalho e interface do usuário.
  • Sistema de IA Multi-Modelo Interno
  • Serviço Azure AI Language
  • Serviço Azure AI-Vision OCR: Extrai conteúdo de texto de documentos digitalizados ou imagens para fornecer entrada para a detecção de informações sensíveis.

Os passos subsequentes descrevem o fluxo de trabalho principal do Smart Redact Server (SRS) para detectar e redigir informações sensíveis.

  • Criar um Projeto
    • a) Selecionar/Criar Política: Defina os tipos de dados sensíveis a detectar.
    • b) Selecionar/Conectar Fonte de Dados: Conectar armazenamento em nuvem (por exemplo, AWS S3, OneDrive). O SRS segue as diretrizes de segurança de cada provedor de armazenamento em nuvem para conectar e acessar dados, como usar autenticação baseada em token em vez de armazenamento de senha.
    • c) Configurar Escopo e Agendamento da Varredura:
      • i.Especifique a pasta raiz e os tipos de documento a serem varridos.
      • ii.Defina o agendamento da varredura (diário/semanal/mensal ou acionamento manual).
    • d) Definir Política de Migração de Arquivos: Para documentos contendo dados sensíveis, escolha copiá-los ou movê-los para caminhos designados.
  • Fluxo de Trabalho de Processamento em Lote de Documentos: O SRS processa documentos periodicamente com base no agendamento. Determina se uma nova varredura é necessária comparando nomes de arquivos, horários de modificação e registros históricos.
  • Passos de Processamento de Documento Único:
    • a) Baixar Documento: Buscar arquivos da fonte de dados para o servidor SRS.
    • b) Extração de Texto: Usar Azure AI-Vision OCR para extrair conteúdo de texto do documento.
    • c) Detecção de Informações Sensíveis Impulsionada por IA: Isso segue o fluxo de trabalho do modelo baseado em ensemble, que é descrito para o Smart Redact Plugin e não é reiterado aqui.
    • d) Armazenamento de Registros: Salvar registro de varredura, logs e informações sensíveis detectadas no banco de dados. Todos os dados são criptografados.
    • e) Migração de Arquivos: Copiar ou mover documentos sensíveis de acordo com a configuração definida pelo usuário.
    • f) Limpeza: Excluir cópias temporárias de arquivos do servidor SRS.
  • Pós-processamento para Usuários: Os usuários podem revisar registros de varredura na plataforma SRS e executar operações de redação, movimentação ou cópia.

Quando os usuários usam o Smart Redact Server para detectar e redigir informações sensíveis, o SRS processa os documentos nos Armazenamentos em Nuvem designados pelo usuário de acordo com a política do usuário. O SRS não retém documentos originais ou intermediários. No entanto, as informações sensíveis são armazenadas de forma criptografada para revisão e ações de acompanhamento.

Como o Smart Redact mantém os dados seguros?

Dados seguros em trânsito

  • Todas as APIs web são chamadas via HTTPS, incluindo chamadas para a API Foxit Smart Redact Services e a API Azure AI Services. Isso garante a transmissão segura de documentos e dados do usuário. Além disso, as versões HTTPS e as seleções de conjuntos de cifras são revisadas e atualizadas regularmente para alinhar-se com as melhores práticas da indústria.
  • Quando o Smart Redact Server acessa serviços de armazenamento em nuvem, todas as solicitações são executadas de acordo com as diretrizes recomendadas dos Armazenamentos em Nuvem para garantir a segurança do acesso.

Dados seguros em repouso

Foxit implementa uma variedade de medidas para garantir a segurança dos dados em repouso, com as principais medidas如下.

  • Criptografia de informações sensíveis: As informações sensíveis são criptografadas e armazenadas usando o Advanced Encryption Standard (AES) de 256 bits.
  • Segurança do Data Center: Ao aproveitar os data centers Tier-4 da AWS, a Foxit garante controles de acesso robustos, salvaguardas ambientais e acesso restrito limitado a pessoal autorizado em Virgínia, Frankfurt e Montreal.
  • Privacidade de dados: Bancos de dados são protegidos por firewall e não acessíveis publicamente, com acesso restrito a pessoal autorizado apenas para fins comerciais ou legais.
  • Operação Off-Grid: Para necessidades de alta segurança, a Foxit oferece um modo "off-grid", permitindo a operação do SmartRedact Server sem acesso à nuvem.

Retenção prudente de dados

  • Quando os usuários usam o Smart Redact Plugin do PDF Editor para detectar e redigir informações sensíveis em documentos, o Smart Redact segue uma política de retenção zero. Uma vez que a tarefa é concluída, todos os documentos originais e intermediários, juntamente com os resultados, são excluídos instantaneamente.
  • Ao usar o Smart Redact Server (SRS) para processamento de documentos, o SRS não retém documentos originais ou intermediários. As informações sensíveis detectadas são armazenadas de forma criptografada. A exclusão de um projeto também excluirá permanentemente todos os resultados de descoberta associados.

Práticas de desenvolvimento seguro

Foxit segue o ciclo de desenvolvimento de segurança padrão da indústria (SDL) para garantir a segurança e confiabilidade do Smart Redact. As principais medidas incluem:

  • Design Seguro: A modelagem de ameaças é realizada precocemente para identificar riscos, com controles de segurança integrados na fase de design.
  • Codificação Segura: A adesão a padrões estritos de codificação evita vulnerabilidades comuns.
  • Auditorias de código e teste de vulnerabilidades: Auditorias e testes regulares garantem a integridade do código.
  • Testes de Segurança: Uma combinação de testes automatizados e manuais é usada para validar a segurança do sistema.
  • Lançamento seguro: Revisões rigorosas de segurança garantem conformidade antes do lançamento.

Além disso, a Foxit prioriza treinamento de segurança para melhorar a expertise dos desenvolvedores. Essas práticas reforçam o compromisso da Foxit em entregar uma solução Smart Redact segura e confiável.

Privacidade e Diretrizes

Seu uso das soluções Smart Redact da Foxit é regido pelo Contrato de Licença de Usuário Final da Foxit (Foxit EULA) e pelos Termos Gerais de Serviço da Foxit. As Diretrizes refletem o compromisso da Foxit em cumprir leis e regulamentações aplicáveis, manter os valores da empresa e promover o uso ético de tecnologias de IA.

Foxit usa algumas das tecnologias do Azure AI Service para fornecer a solução Smart Redact. Cada serviço Azure AI usado pelo Smart Redact segue seus próprios padrões de segurança e privacidade. Para detalhes, consulte:

Conclusão

Foxit oferece um nível de segurança de classe mundial adaptado às diversas necessidades de usuários e organizações em todos os setores. Reconhecemos a sensibilidade de suas informações e fluxos de trabalho e estamos comprometidos em protegê-los com o mais alto nível de proteção. Com Foxit, você obtém um fornecedor confiável comprometido não apenas em entregar software PDF inquestionável, mas também em garantir sua segurança em todos os aspectos de acordo com as melhores práticas da indústria.
Para obter mais informações sobre a segurança da Foxit, visite o Foxit Security Center.

Apêndice A

Uma lista detalhada das categorias suportadas pelo Smart Redact

Nome do CódigoPaísObservação
PessoaTodos(PII)
OrganizaçãoTodos(PII)
Tipo de PessoaTodos(PII)
EndereçoTodos(PII)
CEPTodos(PII) Os três primeiros dígitos de um CEP
LocalizaçãoTodos(PII) Location All inclui nomes como cidades, países, regiões, estados, estruturas artificiais e locais geográficos, como rios, oceanos e desertos.
EmailTodos(PII)
Número de FaxTodos(PII)
Data e HoraTodos(PII)
TemperaturaTodos(PII)
MoedaTodos(PII)
IdadeTodos(PII)
PercentualTodos(PII)
Número de Cartão de CréditoTodos(PII)
Número de Conta Bancária InternacionalTodos(PII) IBAN
GêneroTodos(PII) Termos que revelam o gênero do sujeito, por exemplo, masculino, feminino, mulher, senhor ou senhora.
Código SWIFTTodos
URL de Mídia SocialTodos(PII) Suporta a detecção de contas de mídia social:
* nome de usuário do Twitter
* nome de usuário do Facebook
* conta do YouTube
* conta do Vimeo
* nome de usuário do Instagram
* URL do LinkedIn
* nome de usuário do Pinterest
RaçaTodos(PII) Exemplos: "Africano", "Asiático", "Europeu", "Nativo Americano", "Oceânico"
Visão ReligiosaTodos(PII) Exemplo: "Judaísmo", "Católico"
Preferência SexualTodos(PII) Exemplo: "bisexual", "homossexual", "heterossexual"
Afiliação PolíticaTodos(PII) Exemplo: "Partido Democrata (Estados Unidos)" ou "Partido Republicano (Estados Unidos)"
Código do PaísTodos(PII) Exemplo: +591, +886
IdiomaTodos(PII) Exemplo: Inglês, Francês
OcupaçãoTodos(PII) Exemplo: Cientista, Médico
Tipo SanguíneoTodos(PII) por exemplo, A, B, AB, O
Estado CivilTodos(PII) por exemplo, Casado, Solteiro, Divorciado
IPTodos(PII) Endereços de rede IPv4 e IPv6. Exemplo: 168.131.1.1 e 21DA:D3:0:2F3B:2AA:FF:FE28:9C5A
Número de Roteamento ABAEUA(PII)
Número de Telefone dos EUAEUA(PII)
Identificação de Contribuinte Individual dos EUAEUA(PII)
Número de Seguro Social dos EUAEUA(PII)
Número de Carteira de Motorista dos EUAEUA(PII)
Número de Passaporte dos EUA/Reino UnidoUS and UK(PII) Cognição consciente do contexto. Precisa de texto de número de passaporte ao redor dos números.
Número de Conta Bancária dos EUAEUA(PII)
Número de Roteamento ACHEUA(PII) Número do Automatic Clearing House
Provedor de SeguroEUA(PII)
ID de MembroEUA(PII) Número de ID de membro do seguro
ID de GrupoEUANúmero de grupo de seguro
Carteira de Motorista AustralianaAustrália(PII) Insurance group number
Número de Passaporte AustralianoAustrália(PII) Insurance group number
Número de Negócios AustralianoAustrália(PII) Número de Negócios Australiano
Código BSBAustrália(PII) Código de agência bancária estadual
Número de Telefone AustralianoAustrália(PII)
Número de Referência do ClienteAustrália(PII) Um CRN é composto por 9 números e termina com uma letra. Por exemplo: 123 456 789A.
Número de Arquivo de ImpostoAustrália(PII) Um número de arquivo de imposto (TFN) é gratuito e identifica o usuário para fins de impostos e aposentadoria.
Número de Carteira de Motorista do Reino UnidoUK(PII) Número de carteira de motorista do Reino Unido
Índice de Saúde ComunitáriaUK(PII) Número do Índice de Saúde Comunitária (CHI), por exemplo, 0911640250
Número de Saúde Nacional do Reino UnidoUK(PII) Número do Serviço Nacional de Saúde (NHS)
Número de Seguro Nacional do Reino UnidoUK(PII) Número de seguro nacional
Número de Saúde Nacional do Reino UnidoUK(PII) Número do Serviço Nacional de Saúde
Número de Telefone do Reino UnidoUK(PII) Número de telefone do Reino Unido
Nome do ExameTodosExame (PHI); procedimentos e testes diagnósticos, incluindo sinais vitais e medições corporais
DiagnósticoTodosDiagnóstico (PHI); doença, síndrome, envenenamento
Sintoma ou SinalTodosSintoma (PHI); evidência subjetiva ou objetiva de doença ou outros diagnósticos
Nome do TratamentoTodosTratamento (PHI); procedimentos terapêuticos
AlérgenoTodosAlérgeno (PHI); um antígeno que desencadeia uma reação alérgica
CursoTodosCurso (PHI); descrição de uma mudança em outra entidade ao longo do tempo, como progressão da condição, curso de tratamento ou medicação
Valor de MedidaTodosValor de medida (PHI); o valor relacionado a um exame ou medida de condição médica
VarianteTodosVariante (PHI); todas as menções a variações e mutações genéticas
Gene ou ProteínaTodosGene/Proteína (PHI); todas as menções a nomes e símbolos de genes humanos, bem como cromossomos, partes de cromossomos e proteínas
Tipo de MutaçãoTodosTipo de mutação (PHI); descrição da mutação, incluindo seu tipo, efeito e localização
ExpressãoTodosExpressão (PHI); nível de expressão gênica
Evento AdministrativoTodosEvento administrativo (PHI); eventos relacionados ao sistema de saúde, mas de natureza administrativa/semi-administrativa
Ambiente de CuidadoTodosAmbiente de cuidado (PHI); um ambiente ou local onde os pacientes recebem cuidado
Qualificador de CondiçãoTodosQualificador de condição (PHI); termos qualitativos usados para descrever uma condição médica
Nome do MedicamentoTodosNome do medicamento (PHI); menções a medicamentos, incluindo nomes de marca protegidos por direitos autorais e nomes não comerciais
DoseTodosDose (PHI); quantidade de medicamento prescrito
Relação FamiliarTodosRelação familiar (PHI); menções a parentes da família do sujeito
Estrutura CorporalTodosEstrutura corporal (PHI); sistemas corporais, localizações ou regiões anatômicas e sítios corporais
DireçãoTodosDireção (PHI); termos direcionais que podem se relacionar a uma estrutura corporal, condição médica, exame ou tratamento
FrequênciaTodosFrequência (PHI); descreve com que frequência uma condição médica, exame, tratamento ou medicação ocorreu, ocorre ou deve ocorrer
TempoTodosTempo (PHI); termos temporais relacionados ao início e/ou duração de uma condição médica, exame, tratamento, medicação ou evento administrativo
Unidade de MedidaTodosValor de medida (PHI); o valor relacionado a um exame ou medida de condição médica
Operador RelacionalTodosOperador relacional (PHI); frases que expressam a relação quantitativa entre uma entidade e alguma informação adicional
Profissão de SaúdeTodosProfissão de saúde (PHI); um profissional de saúde licenciado ou não licenciado
Escala de CondiçãoTodosEscala de condição (PHI); termos qualitativos que caracterizam a condição por uma escala, que é uma lista ordenada finita de valores
Classe de MedicamentoTodosClasse de medicamento (PHI); um conjunto de medicamentos que têm um mecanismo de ação semelhante, um modo de ação relacionado, uma estrutura química semelhante e/ou são usados para tratar a mesma doença
Forma do MedicamentoTodosForma do medicamento (PHI); a forma do medicamento
Via de AdministraçãoTodosVia de administração (PHI); o método de administração do medicamento