mohsen1

yek

mohsen1

A fast Rust based tool to serialize text-based files in a repository or directory for LLM consumption

AI 简介

yek 是一个基于 Rust 的快速工具,用于将仓库或目录中的文本文件序列化以供大型语言模型(LLM)使用。它能够根据 `.gitignore` 规则和 Git 历史记录智能地忽略不必要的文件,并优先处理重要性较高的文件,同时支持多种配置选项如自定义忽略模式、多目录处理以及 glob 模式匹配等。此外,yek 还具备自动检测输出管道的能力,可以在需要时流式传输内容而非写入文件。此工具适用于需要准备大量代码或文档数据集供给 LLM 训练或分析的场景,特别是当这些数据分散在不同的文件中时。通过简单的命令行操作,用户可以高效地完成数据整理工作。

Rust
MIT License
2.5k
Stars
65
Forks
4
Watchers
7
Issues

Star 增长

今日+3
近 7 天+4
近 30 天+5
综合评分65.96
默认分支main