2026-AI-DETECTOR-BENCHMARK

mattc95

Benchmarking AI text detectors (GPTHumanizer, GPTZero, ZeroGPT, Sapling) across multiple datasets to evaluate accuracy, human false positive rates, and risk trade-offs.

AI 简介

该项目是一个面向AI生成文本检测工具的基准评测框架，用于系统性评估GPTHumanizer、GPTZero、ZeroGPT和Sapling等主流检测器在准确率、人类文本误判率（False Positive）及风险权衡上的表现。基于1000条平衡的英文测试样本（500条人类撰写、500条AI生成），项目提供标准化输入数据、可复现的评估脚本与细粒度指标（如TP/FP/FN/TN、AI检测率、人类误报率）。适用于教育机构、内容审核平台及AI安全研究者开展检测工具选型、算法对比与可信性分析。

Python

MIT License

在 GitHub 查看

Stars

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天0

综合评分40

默认分支main

2026-AI-DETECTOR-BENCHMARK

Star 增长

加入交流群