
ProDa
OpenRaiser
📖 Data Engineering from Raw Corpora
AI 简介
ProDa 是一个面向垂直领域的 AI 数据构建与模型迭代工作台,支持从原始文档到 Benchmark 构建、SFT 数据生成、微调、评测及诊断补数据的一站式闭环流程。项目采用 TypeScript 开发,并集成了 FastAPI 后端和 React 前端框架,提供了一个 VSCode 风格的 Web IDE 界面。用户可以轻松上传领域文档并抽取知识核心,自动生成选择题 Benchmark 和 FineTune 数据,通过 LLaMA-Factory 进行模型微调,并利用 OpenCompass 评测模型性能。此外,ProDa 还能生成详细的诊断报告并基于错误样本生成补充训练数据,帮助开发者高效地进行模型迭代。适用于需要处理大量领域文档并希望快速构建高质量 AI 模型的场景。
TypeScript
161
Stars
10
Forks
10
Watchers
0
Issues
Star 增长
今日0
近 7 天+1
近 30 天+5
综合评分41.12
默认分支main