ecoalign-forge

dengxianghua888-ops

Multi-Agent DPO Data Synthesis Factory — 多智能体偏好训练数据自动合成框架 | 红队攻击 → 多persona审核 → 终审裁决 → DPO偏好对

AI 简介

EcoAlign-Forge 是一个面向内容安全的多智能体偏好数据合成框架，用于自动生成高质量DPO（Direct Preference Optimization）训练所需的成对偏好样本。其核心流程模拟红队攻击→多角色（persona）审核→终审裁决的协作推理链，全程可追溯、无需人工标注，并内置策略驱动的评估与质量度量（如IAA指标）。基于Pydantic构建，支持中文安全策略配置与本地化运行。适用于需要快速构建合规、可解释、低成本内容审核模型的场景，尤其适合LLM安全对齐、内容分级、平台风控等垂直领域。

Python

Apache License 2.0

content-moderation data-quality dpo llm multi-agent preference-learning pydantic red-teaming rlhf synthetic-data

在 GitHub 查看

109

Stars

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天0

综合评分43

默认分支main

ecoalign-forge

Star 增长

加入交流群