
OBLITERATUS
elder-plinius
OBLITERATE THE CHAINS THAT BIND YOU
AI 简介
OBLITERATUS 是一个用于理解和移除大型语言模型拒绝行为的开源工具包。它采用了一种称为“消融”的技术,能够识别并精确移除导致内容拒绝的内部表示,而无需重新训练或微调模型,从而让模型能够对所有提示做出响应,同时保持其核心语言能力。项目基于Python开发,利用Gradio构建了用户友好的交互界面,适用于希望探索和研究模型行为机制的研究者以及需要定制化调整预训练模型以适应特定应用场景的开发者。此外,每次使用该工具时,都会匿名贡献数据到一个不断增长的数据集中,共同推动相关领域的科学研究。
Python
GNU Affero General Public License v3.06.3k
Stars
1.2k
Forks
70
Watchers
16
Issues
Star 增长
今日0
近 7 天+151
近 30 天+598
综合评分95.24
默认分支main