Nutlope

llama-ocr

Nutlope

Document to Markdown OCR library with Llama 3.2 vision

AI 简介

Llama OCR 是一个基于 Llama 3.2 视觉模型的文档到 Markdown 的 OCR 库。其核心功能是通过 Together AI 提供的免费或付费 API 端点,将图片中的文本识别并转换为 Markdown 格式,支持本地和远程图片处理,并计划在未来增加对 PDF 文件的支持。该库采用 TypeScript 编写,易于集成至 Node.js 项目中。适用于需要快速准确地从图像中提取文本并进行格式化输出的应用场景,如文档数字化、笔记应用等。

TypeScript
2.4k
Stars
237
Forks
18
Watchers
17
Issues

Star 增长

今日0
近 7 天0
近 30 天+1
综合评分56.23
默认分支main