用 OpenAI 隐私模型自动识别并涂黑 PDF 中的姓名、邮箱、电话、地址。完全本地处理,免费且无需上传。
拖放 PDF 或点击打开
支持最大 100MB 的 PDF 文件
使用 OpenAI 开源的 privacy-filter 模型——一个 15 亿参数的 NER 模型,可识别 8 类个人隐私信息,效果远超传统正则匹配。
约 900 MB 模型,首次扫描时下载到浏览器 Cache Storage。之后每次访问从本地缓存秒载,无需重新下载,无需联网。
检测在浏览器内通过 WebGPU 运行(不支持时 WASM 兜底)。PDF 文件和识别结果都不离开你的设备。
一次扫描覆盖人名、地址、邮箱、电话、URL、日期、账号、密钥 8 类隐私信息,识别效果远超传统正则。
面板顶部用复选框一键切换需要识别的 PII 类型,选择会自动记住,下次访问无需重新设置。
拖动阈值滑块(0.50–0.99)调整 AI 严格程度,阈值越高误报越少。
拖拽或点击上传需要扫描的 PDF 文件。
首次扫描会下载 privacy-filter 模型(一次性 ~900 MB),后续扫描秒级响应。
按类型筛选检测结果,移除误判,一键应用脱敏。
完全免费,没有隐藏费用,输出文件无水印,无文件数量限制。所有处理都在浏览器中完成。
绝对安全。文件不会离开你的设备,所有处理都在浏览器本地完成,无需上传到服务器。
采用 OpenAI 开源的 privacy-filter 模型——一个 15 亿参数的 NER(命名实体识别)模型,可识别 8 类隐私信息:人名、地址、邮箱、电话、URL、日期、账号、密钥。
privacy-filter 模型基于数百万真实样本训练,远超传统正则匹配——能根据上下文判断(比如「苹果」作为水果不会被标,但「张三」作为人名会被标),也能识别国际电话号码格式、被混淆的邮箱地址。各类别准确度有差异:邮箱和结构化数字接近 99%,复杂语境下的人名约 92–95%。可拖动置信度阈值在召回率和精确率之间平衡。
约 900 MB(q4 量化)。首次扫描时下载到浏览器 Cache Storage,之后每次访问都直接从本地缓存加载,无需重新下载。
不会。整个检测流程都在浏览器中运行(WebGPU 优先,WASM 回退),PDF 和检测结果都不离开您的设备。
完全可控。扫描完成后可一键关闭某类隐私、提高置信度阈值,或单独移除某条结果。在您点击「应用脱敏」前,PDF 不会被修改。