google

langextract

google

A Python library for extracting structured information from unstructured text using LLMs with precise source grounding and interactive visualization.

AI 简介

LangExtract 是一个用于从非结构化文本中提取结构化信息的 Python 库,它利用大语言模型(LLM)并提供精确的源定位和交互式可视化。其核心功能包括基于用户定义指令的信息抽取、确保输出数据与源文本一致性的精确源定位技术、以及对长文档处理的支持。此外,它能够生成交互式 HTML 文件以便于审查提取结果,并支持多种 LLM,无论是云端还是本地开源模型均可兼容。此工具非常适合需要从大量文本数据中高效准确地提取关键信息的场景,如医学报告分析、法律文件处理等。

Python
Apache License 2.0
36.9k
Stars
2.5k
Forks
161
Watchers
72
Issues

Star 增长

今日+13
近 7 天+73
近 30 天+438
综合评分120
默认分支main