facebookresearch

nougat

facebookresearch

Implementation of Nougat Neural Optical Understanding for Academic Documents

AI 简介

Nougat 是一个用于解析学术文档PDF的工具,特别擅长理解和转换包含LaTeX数学公式和表格的内容。该项目采用Python开发,支持通过命令行界面处理单个或多个PDF文件,并可选择性地输出Markdown兼容格式。用户可以通过pip轻松安装并使用预训练模型进行预测,同时提供了API调用和数据集生成的额外依赖选项。Nougat非常适合需要从复杂布局的学术文章中提取结构化信息的研究人员、学生及教育工作者使用。

Python
MIT License
10k
Stars
631
Forks
69
Watchers
121
Issues

Star 增长

今日0
近 7 天+11
近 30 天+52
综合评分59.1
默认分支main