
unstract
Zipstack
LLM-Driven Extraction of Unstructured Data — Built for API Deployments & ETL Pipeline Workflows
AI 简介
Unstract 是一个利用大语言模型从非结构化文档(如PDF、图片等)中提取结构化数据的工具。其核心功能是通过自然语言提示定义所需提取的信息,并支持以API形式部署或集成到ETL工作流中。技术上,它基于Python开发,采用先进的机器学习技术来解析和转换文档内容。该项目适用于需要处理大量非结构化数据并希望将其转化为易于分析和使用的格式的企业和个人开发者,特别适合于自动化文档处理流程中的数据抽取环节。
Python
GNU Affero General Public License v3.06.6k
Stars
630
Forks
44
Watchers
37
Issues
Star 增长
今日0
近 7 天+18
近 30 天+69
综合评分80.3
默认分支main