
DataFlow
OpenDCAI
Easy Data Preparation with latest LLMs-based Operators and Pipelines.
AI 简介
DataFlow 是一个基于最新大语言模型(LLM)的操作符和管道的数据准备工具。它集成了数据生成、清洗和预处理功能,支持快速构建高效的数据流水线。项目使用 Python 编写,具备简洁易用的 API 和强大的扩展性,能够轻松集成到现有的数据科学工作流中。其核心特点包括利用 LLM 提升数据处理自动化水平以及提供 Gradio 界面方便用户交互。适用于需要高质量训练数据的机器学习项目,特别是那些依赖于自然语言处理的任务场景。
Python
Apache License 2.04.7k
Stars
529
Forks
186
Watchers
8
Issues
Star 增长
今日+160
近 7 天+362
近 30 天+737
综合评分110.17
默认分支main