apache

hudi

apache

Upserts, Deletes And Incremental Processing on Big Data.

AI 简介

Apache Hudi 是一个开放的数据湖仓平台,旨在支持大数据环境中的更新、删除和增量处理。它基于高性能的开放表格式,提供了数据摄入、索引、存储、服务、转换和管理等功能。Hudi 支持多种文件格式,并且能够与 Apache Spark 和 Apache Flink 等主流大数据处理框架无缝集成,同时具备自动管理文件大小和布局的能力,以及通过时间线元数据追踪变更历史的特点。适用于需要高效处理大规模数据集并保持数据一致性的场景,如实时数据分析、数据仓库构建等。

Java
Apache License 2.0
6.2k
Stars
2.5k
Forks
1.1k
Watchers
3.6k
Issues

Star 增长

今日+1
近 7 天+4
近 30 天+23
综合评分72.3
默认分支master