pachyderm

pachyderm

pachyderm

Data-Centric Pipelines and Data Versioning

AI 简介

Pachyderm 是一个专注于数据版本控制和数据驱动流水线的自动化工具。它通过自动检测数据变化来触发流水线,支持多种数据类型的数据版本控制与数据血缘追踪,并利用Kubernetes实现资源编排的自动扩展和平行处理。此外,Pachyderm 能够在标准对象存储上运行,支持数据自动去重,并且兼容各大主流云服务提供商及本地部署环境。该项目非常适合需要构建高效、可追溯的数据处理流程的企业或团队使用,特别是在大数据分析、机器学习模型训练等场景中表现尤为出色。

Go
Apache License 2.0
6.3k
Stars
575
Forks
150
Watchers
711
Issues

Star 增长

今日0
近 7 天0
近 30 天+3
综合评分44.58
默认分支master