ConardLi

easy-dataset

ConardLi

A powerful tool for creating datasets for LLM fine-tuning 、RAG and Eval

AI 简介

Easy Dataset 是一个专为构建大型语言模型(LLM)数据集而设计的强大工具。它提供了直观的用户界面,内置了强大的文档解析工具、智能分段算法以及数据清洗和增强功能。该项目支持多种文档格式如PDF、Markdown、DOCX等,并能将特定领域的文档转换成高质量的结构化数据集,适用于模型微调、检索增强生成(RAG)及模型性能评估等多种场景。其最新版本1.7.0引入了全新的评估能力,包括自动多维度任务评估与人工盲测系统,进一步增强了对垂直领域模型评估的支持。

JavaScript
Other
14.4k
Stars
1.5k
Forks
65
Watchers
109
Issues

Star 增长

今日+7
近 7 天+39
近 30 天+230
综合评分113
默认分支main