
ecoalign-forge
dengxianghua888-ops
Multi-Agent DPO Data Synthesis Factory — 多智能体偏好训练数据自动合成框架 | 红队攻击 → 多persona审核 → 终审裁决 → DPO偏好对
AI 简介
EcoAlign-Forge 是一个用于自动生成多智能体偏好训练数据的框架,旨在通过模拟红队攻击、多角色审核和终审裁决过程来生成高质量的数据偏好对。其核心功能包括自动合成符合安全策略的数据偏好对,无需人工标注,利用多智能体系统进行内容审核与决策。该框架采用Python编写,支持Pydantic等技术,并且能够实现从红队攻击到最终裁决的全流程自动化。适用于需要大量高质量训练数据的内容审核模型开发场景,如构建或优化基于深度学习的自然语言处理系统时使用,特别适合于偏好学习、强化学习人类反馈等领域。
Python
Apache License 2.0139
Stars
11
Forks
1
Watchers
0
Issues
Star 增长
今日0
近 7 天0
近 30 天+1
综合评分43.34
默认分支main