chiefautism

privacy-parser

chiefautism

Reverse of OpenAI Privacy Filter: same 1.5B model, returns PII as structured spans instead of masking.

AI 简介

该项目是一个用于从文本中提取个人身份信息(PII)的工具,与OpenAI的隐私过滤器功能相反。其核心功能是利用1.5B参数模型识别并以结构化方式输出文本中的敏感信息,如姓名、电子邮件、电话号码等,而不是简单地进行遮掩处理。技术上,它结合了深度学习模型、Viterbi算法和正则表达式来提高解析精度,并支持三种后端实现以适应不同场景需求。适用于需要对大量文本数据进行隐私审计或分析的情况,比如在数据泄露后的调查过程中寻找暴露的个人信息。

Python
Apache License 2.0
399
Stars
35
Forks
393
Watchers
1
Issues

Star 增长

今日0
近 7 天+3
近 30 天+8
综合评分46.97
默认分支main