privacy-parser

chiefautism

Reverse of OpenAI Privacy Filter: same 1.5B model, returns PII as structured spans instead of masking.

AI 简介

该项目是一个用于从文本中提取个人身份信息（PII）的工具，与OpenAI的隐私过滤器功能相反。其核心功能是利用1.5B参数模型识别并以结构化方式输出文本中的敏感信息，如姓名、电子邮件、电话号码等，而不是简单地进行遮掩处理。技术上，它结合了深度学习模型、Viterbi算法和正则表达式来提高解析精度，并支持三种后端实现以适应不同场景需求。适用于需要对大量文本数据进行隐私审计或分析的情况，比如在数据泄露后的调查过程中寻找暴露的个人信息。

Python

Apache License 2.0

在 GitHub 查看

399

Stars

Forks

393

Watchers

Issues

Star 增长

今日0

近 7 天+3

近 30 天+8

综合评分46.97

默认分支main