ucbepic

docetl

ucbepic

A system for agentic LLM-powered data processing and ETL

AI 简介

DocETL 是一个用于创建和执行数据处理流水线的系统,特别适用于复杂的文档处理任务。其核心功能包括一个交互式的UI游乐场,支持迭代式提示工程和流水线开发,以及一个Python包,允许用户通过命令行或Python代码运行生产流水线。技术上,DocETL利用了大型语言模型(LLM)来增强数据处理能力,支持从非结构化数据中提取语义信息。该工具非常适合需要对大量复杂文档进行自动化分析与处理的应用场景,如法律文件审查、科研文献整理等。

Python
MIT License
3.8k
Stars
403
Forks
31
Watchers
30
Issues

Star 增长

今日0
近 7 天+6
近 30 天+13
综合评分64.12
默认分支main