Foxit Smart Redact
安全概覽

Foxit Smart Redact 是 Foxit 提供的 AI 驅動工具,可自動偵測並移除姓名、地址和身份證號碼等敏感資料。它幫助使用者高效且安全地完成編輯工作流程,保護敏感資訊免受未授權存取,並遵守全球資料隱私法規。Foxit 透過端對端加密傳輸、敏感資訊加密儲存、高級資料中心和謹慎的資料保留政策來優先考慮資料安全。此外,其開發過程遵循安全開發生命週期 (SDL)。這種多層次方法為個人與企業提供了高效且安全的敏感資料發現和編輯解決方案。

關於 Foxit Smart Redact

Foxit Smart Redact 利用經過訓練以符合全球資料隱私法規(例如 GDPR、HIPAA)的 AI 模型,實現敏感資訊的智慧識別。它使用最佳化工作流程來提高編輯速度和準確性。此外,它提供面向企業的解決方案,幫助企業和組織大規模地檢測和編輯文件中的敏感資訊。
Foxit Smart Redact 包括

  • PDF Editor 的 Smart Redact 外掛程式,內建於 Foxit PDF Editor 中,實現無縫且安全的編輯。
  • Smart Redact Server,企業級解決方案,可批量掃描文件儲存庫以檢測和標記敏感資訊,使用戶能夠根據需要高效地檢閱和編輯。

可以檢測哪些類型的資料?

Smart Redact 檢測現代資料法規所定義的個人身份資訊 (PII) 和受保護健康資訊 (PHI),包括歐盟 GDPR、加州消費者隱私法 (CCPA)(經 CPRA 修訂)和 HIPAA。這包括個人姓名、社會安全號碼、信用卡號碼、駕駛執照號碼、醫療記錄和診斷代碼等資料元素。目前僅支援英文文件的檢測。
有關支援類別的詳細清單,請參閱 附錄 A.

Smart Redact 如何運作?

本節詳細介紹 PDF Editor 的 Smart Redact 外掛程式和 Smart Redact Server 的工作流程及關鍵資料流程,幫助使用者根據自身需求選擇合適的解決方案。

工作流程:Smart Redact 外掛程式

使用 Smart Redact 外掛程式時,使用者可以在不切換工具的情況下安全地執行編輯——節省時間、保護文件完整性,並在無縫工作空間中保持合規性。

Foxit AI Assistant 服務架構

上圖說明使用 Smart Redact 外掛程式進行編輯時的主要參與者及其各自的資料流程。工作流程中的參與者如下:

  • PDF Editor:在使用者設備上本地執行。負責提取文件資訊並執行編輯。這是使用者互動的主要介面。
  • SRP(Smart Redact 外掛程式)服務:管理存取控制和業務邏輯處理。它充當 PDF Editor 和 AI 服務之間的中介。
  • 內部多模型 AI 系統:託管在 AWS 上。分析文件以檢測敏感資訊,並將結果返回給 SRP 服務。
  • Azure AI Language 服務:用於識別敏感資訊的外部 AI 服務,與 SRP 服務互動以提供檢測結果。

以下步驟概述 PDF Editor 的 Smart Redact 外掛程式檢測和編輯敏感資訊的主要工作流程。

  • 文件準備:使用者開啟文件。如果文件是掃描檔或包含嵌入圖像,文字辨識功能將從文件中提取文字。
  • 啟動 Smart Redact:使用者啟動 Smart Redact,選擇選項(例如區域、敏感類別),並啟動掃描。
  • 本地文字提取:PDF Editor 提取所有文字內容(包括原生和 OCR 生成的),並將其與使用者定義的參數一起發送到 SRP 服務。
  • AI 驅動的敏感資訊檢測:
    • a) AI 分析:SRP 使用多個模型(Azure AI Language 和內部多模型 AI 系統)單獨檢測文字內容。
    • b) 模型整合與投票集成:SRP 服務使用模型整合方法聚合兩個 AI 系統的輸出,應用多數投票來合併結果。這種基於共識的方法生成統一的敏感資訊清單,顯著提高檢測準確性。
  • 使用者檢閱與確認:PDF Editor 向使用者顯示檢測到的敏感資訊。使用者檢閱並確認要編輯的項目。
  • 確認後執行編輯:PDF Editor 僅在使用者明確確認後才執行編輯,確保符合隱私政策。

Smart Redact 外掛程式幫助使用者智慧識別和編輯敏感資訊,簡化編輯流程。發現和編輯操作僅在使用者確認後執行,確保使用者對流程保持完全控制,且所有操作符合資料隱私要求。

工作流程:Smart Redact Server

Smart Redact Server (SRS) 高效自動化敏感資訊檢測和文件遷移。例如,它可以掃描 AWS S3 儲存桶中的 10,000 份客戶合約,並應用預設政策自動處理編輯和遷移任務。

Foxit AI Assistant 服務架構

圖表說明使用 Smart Redact Server 進行編輯時的主要參與者及其各自的資料流程。工作流程中的參與者如下:

  • 雲端儲存:使用者的雲端儲存平台(例如 OneDrive、AWS S3)充當文件資料來源。
  • SRS(Smart Redact Server)服務:獨立的 Web 應用程式,管理存取控制、業務邏輯、使用者驗證、工作流程協調和使用者介面。
  • 內部多模型 AI 系統
  • Azure AI Language 服務
  • Azure AI-Vision OCR 服務:從掃描文件或圖像中提取文字內容,為敏感資訊檢測提供輸入。

以下步驟概述 Smart Redact Server (SRS) 檢測和編輯敏感資訊的主要工作流程。

  • 建立專案
    • a) 選擇/建立政策:定義要檢測的敏感資料類型。
    • b) 選擇/連線資料來源:連結雲端儲存(例如 AWS S3、OneDrive)。SRS 遵循每個雲端儲存提供商的安全指南進行資料連線和存取,例如使用基於令牌的驗證而非密碼儲存。
    • c) 配置掃描範圍和排程:
      • i.指定要掃描的根資料夾和文件類型。
      • ii.設定掃描排程(每日/每周/每月或手動觸發)。
    • d) 定義文件遷移政策:對於包含敏感資料的文件,選擇將其複製或移動到指定路徑。
  • 批量文件處理工作流程:SRS 根據排程定期處理文件。它透過比較檔案名稱、修改時間和歷史記錄來確定是否需要重新掃描。
  • 單一文件處理步驟:
    • a) 下載文件:從資料來源擷取文件到 SRS 伺服器。
    • b) 文字提取:使用 Azure AI-Vision OCR 從文件中提取文字內容。
    • c) AI 驅動的敏感資訊檢測:遵循基於整合的模型工作流程,該流程已在 Smart Redact 外掛程式中描述,此處不再重複。
    • d) 記錄儲存:將掃描記錄、日誌和檢測到的敏感資訊儲存到資料庫。所有資料均經過加密。
    • e) 文件遷移:根據使用者定義的配置複製或移動敏感文件。
    • f) 清理:從 SRS 伺服器刪除臨時文件副本。
  • 使用者後處理:使用者可以在 SRS 平台上檢閱掃描記錄,並執行編輯、移動或複製操作。

當使用者使用 Smart Redact Server 檢測和編輯敏感資訊時,SRS 根據使用者的政策處理使用者指定的雲端儲存中的文件。SRS 不保留原始或中間文件。然而,敏感資訊以加密形式儲存,以便檢閱和後續操作。

Smart Redact 如何確保資料安全?

傳輸中的資料保護

  • 所有 Web API 透過 HTTPS 調用,包括 Foxit Smart Redact Services API 和 Azure AI Services API。這確保文件和使用者資料的安全傳輸。此外,HTTPS 版本和密碼套件選擇會定期檢閱和更新,以符合行業最佳實踐。
  • 當 Smart Redact Server 存取雲端儲存服務時,所有請求均按照雲端儲存的建議指南執行,以確保存取安全。

靜止時的資料保護

Foxit 實施多種措施確保靜止資料的安全,主要措施如下。

  • 敏感資訊加密:敏感資訊使用 256 位元高級加密標準 (AES) 進行加密和儲存。
  • 資料中心安全:透過利用 AWS 的 Tier-4 資料中心,Foxit 確保強大的存取控制、環境保護措施,以及僅限於維吉尼亞、法蘭克福和蒙特婁的授權人員受限存取。
  • 資料隱私權:資料庫受防火牆保護且不公開存取,存取僅限於業務或法律目的的授權人員。
  • 離網操作:對於高安全性需求,Foxit 提供「離網」模式,允許 SmartRedact Server 在無雲端存取的情況下運行。

謹慎的資料保留

  • 當使用者使用 PDF Editor 的 Smart Redact 外掛程式檢測和編輯文件中的敏感資訊時,Smart Redact 遵循零保留政策。任務完成後,所有原始和中間文件以及結果將立即刪除。
  • 使用 Smart Redact Server (SRS) 進行文件處理時,SRS 不保留原始或中間文件。檢測到的敏感資訊以加密形式儲存。刪除專案也將永久刪除所有相關的發現結果。

安全開發實踐

Foxit 遵循行業標準的安全開發生命週期 (SDL),以確保 Smart Redact 的安全性和可靠性。主要措施包括:

  • 安全設計:早期進行威脅建模以識別風險,在設計階段嵌入安全控制。
  • 安全編碼:遵守嚴格的編碼標準可防止常見漏洞。
  • 程式碼審計與漏洞測試:定期審計和測試確保程式碼完整性。
  • 安全測試:使用自動化和手動測試的組合來驗證系統安全性。
  • 安全發布:嚴格的安全審查確保部署前的合規性。

此外,Foxit 優先考慮安全培訓以提高開發人員的專業知識。這些做法加強了 Foxit 提供安全可靠的 Smart Redact 解決方案的承諾。

隱私權與指南

您使用 Foxit 的 Smart Redact 解決方案受 Foxit 最終使用者授權合約 (Foxit EULA) 和 Foxit 一般服務條款管轄。指南反映了 Foxit 遵守適用法律法規、維護公司價值觀以及促進 AI 技術道德使用的承諾。

Foxit 使用一些 Azure AI Service 技術來提供 Smart Redact 解決方案。Smart Redact 使用的每個 Azure AI 服務都遵守其自己的安全和隱私標準。有關詳細資訊,請參閱:

結論

Foxit 提供一流的安全級別,量身定制以滿足不同行業使用者和組織的多樣化需求。我們認可您的資訊和工作流程的敏感性,並致力於以最高級別的保護來保障它們。選擇 Foxit,您將獲得一個值得信賴的供應商,不僅致力於提供無妥協的 PDF 軟體,還確保其在各個方面的安全性符合行業最佳實踐。
有關 Foxit 安全的更多資訊,請造訪 Foxit Security Center

附錄 A

Smart Redact 支援的類別詳細清單

代碼名稱國家備註
人員全部(PII)
組織全部(PII)
人員類型全部(PII)
地址全部(PII)
郵遞區號全部(PII) 郵遞區號的前三個數字
位置全部(PII) Location All 包括城市、國家、地區、州、人造結構等地名,以及河流、海洋、沙漠等地理位置。
電子郵件全部(PII)
傳真號碼全部(PII)
日期時間全部(PII)
溫度全部(PII)
貨幣全部(PII)
年齡全部(PII)
百分比全部(PII)
信用卡號碼全部(PII)
國際銀行帳戶號碼全部(PII) IBAN
性別全部(PII) 揭示主體性別的術語,例如男性、女性、婦女、紳士或女士。
SWIFT 程式碼全部
社交媒體 URL全部(PII) 支援社交媒體帳戶檢測:
* Twitter 使用者名稱
* Facebook 使用者名稱
* YouTube 帳戶
* Vimeo 帳戶
* Instagram 使用者名稱
* LinkedIn URL
* Pinterest 使用者名稱
人種全部(PII) 例如:「非洲人」、「亞洲人」、「歐洲人」、「美洲原住民」、「大洋洲人」
宗教觀點全部(PII) 例如:「猶太教」、「天主教」
性偏好全部(PII) 例如:「雙性戀」、「同性戀」、「異性戀」
政治隸屬全部(PII) 例如:「美國民主黨」或「美國共和黨」
國家代碼全部(PII) 例如:+591、+886
語言全部(PII) 例如:英語、法語
職業全部(PII) 例如:科學家、醫生
血型全部(PII) 例如:A、B、AB、O
婚姻狀況全部(PII) 例如:已婚、單身、離婚
IP全部(PII) 網路 IPv4 和 IPv6 位址。例如:168.131.1.1 和 21DA:D3:0:2F3B:2AA:FF:FE28:9C5A
ABA 路由號碼美國(PII)
美國電話號碼美國(PII)
美國個人納稅人識別號碼美國(PII)
美國社會安全號碼美國(PII)
美國駕駛執照號碼美國(PII)
美國/英國護照號碼US and UK(PII) 上下文感知認知。需要數字周圍有護照號碼文字。
美國銀行帳戶號碼美國(PII)
ACH 路由號碼美國(PII) 自動清算所號碼
保險提供商美國(PII)
會員 ID美國(PII) 保險會員 ID 號碼
組 ID美國保險組號碼
澳大利亞駕駛執照澳大利亞(PII) Insurance group number
澳大利亞護照號碼澳大利亞(PII) Insurance group number
澳大利亞商業號碼澳大利亞(PII) 澳大利亞商業號碼
BSB 程式碼澳大利亞(PII) 銀行州分行代碼
澳大利亞電話號碼澳大利亞(PII)
客戶參考號碼澳大利亞(PII) CRN 是 9 位數字並以字母結尾。例如:123 456 789A。
稅務檔案號碼澳大利亞(PII) 稅務檔案號碼 (TFN) 是免費的,用於識別使用者的稅務和退休金用途。
英國駕駛執照號碼UK(PII) 英國駕駛執照號碼
社區健康指數UK(PII) 社區健康指數 (CHI) 號碼,例如:0911640250
英國國家健康號碼UK(PII) 國家健康服務 (NHS) 號碼
英國國家保險號碼UK(PII) 國家保險號碼
英國國家健康號碼UK(PII) 國家衛生服務編號
英國電話號碼UK(PII) 英國電話號碼
檢查名稱全部檢查 (PHI);診斷程序和測試,包括生命體徵和身體測量
診斷全部診斷 (PHI);疾病、綜合症、中毒
症狀或徵象全部症狀 (PHI);疾病或其他診斷的主觀或客觀證據
治療名稱全部治療 (PHI);治療程序
過敏原全部過敏原 (PHI);觸發過敏反應的抗原
病程全部病程 (PHI);描述另一實體隨時間的變化,例如病情進展、治療過程或藥物
測量值全部測量值 (PHI);與檢查或醫學狀況測量相關的值
變異全部變異 (PHI);所有提及基因變異和突變
基因或蛋白質全部基因/蛋白質 (PHI);所有提及人類基因的名稱和符號以及染色體、染色體部分和蛋白質
突變類型全部突變類型 (PHI);突變的描述,包括其類型、影響和位置
表達全部表達 (PHI);基因表達水平
行政事件全部行政事件 (PHI);與醫療系統相關但具有行政/半行政性質的事件
護理環境全部護理環境 (PHI);患者接受護理的環境或地點
條件限定詞全部條件限定詞 (PHI);用於描述醫學狀況的定性術語
藥物名稱全部藥物名稱 (PHI);藥物提及,包括受版權保護的品牌名稱和非品牌名稱
劑量全部劑量 (PHI);訂購的藥物數量
家庭關係全部家庭關係 (PHI);提及主體的家庭親屬
身體結構全部身體結構 (PHI);身體系統、解剖位置或區域以及身體部位
方向全部方向 (PHI);可能與身體結構、醫學狀況、檢查或治療相關的方向術語
頻率全部頻率 (PHI);描述醫學狀況、檢查、治療或藥物發生、正在發生或應該發生的頻率
時間全部時間 (PHI);與醫學狀況、檢查、治療、藥物或行政事件的開始和/或長度(持續時間)相關的時間術語
測量單位全部測量值 (PHI);與檢查或醫學狀況測量相關的值
關係運算子全部關係運算子 (PHI);表達實體與一些附加資訊之間數量關係的短語
醫療職業全部醫療職業 (PHI);持照或未持照的醫療從業者
條件量表全部條件量表 (PHI);透過量表描述狀況的定性術語,量表是有限的有序值列表
藥物類別全部藥物類別 (PHI);一組具有相似作用機制、相關作用方式、相似化學結構和/或用於治療相同疾病的藥物
藥物形式全部藥物形式 (PHI);藥物的形式
給藥途徑全部給藥途徑 (PHI);藥物的給藥方法