
2026-AI-DETECTOR-BENCHMARK
mattc95
Benchmarking AI text detectors (GPTHumanizer, GPTZero, ZeroGPT, Sapling) across multiple datasets to evaluate accuracy, human false positive rates, and risk trade-offs.
AI 简介
该项目旨在对四种AI文本检测系统(GPTHumanizer、GPTZero、ZeroGPT、Sapling)进行基准测试,以评估其在多个数据集上的准确性、人类误报率和风险权衡。项目使用Python语言编写,提供了平衡的英文数据集(1000篇文本),并包括了基准输入数据、评估脚本和汇总指标。它适用于需要评估AI文本检测工具性能的研究者或开发者,特别是在关注误报率和整体准确性的场景中。通过对比分析不同检测器的表现,用户可以更好地理解各工具的优势与局限性,从而做出更合适的选择。
Python
MIT License62
Stars
0
Forks
62
Watchers
0
Issues
Star 增长
今日0
近 7 天0
近 30 天0
综合评分40
默认分支main