apache

beam

apache

Apache Beam is a unified programming model for Batch and Streaming data processing.

AI 简介

Apache Beam 是一个用于批处理和流数据处理的统一编程模型。它提供了一组特定语言的SDK,用于构建数据处理流水线,并支持在多种分布式处理后端上执行这些流水线,包括Apache Flink、Apache Spark、Google Cloud Dataflow和Hazelcast Jet等。核心功能包括定义PCollection(数据集)、PTransform(转换操作)以及Pipeline(流水线)。该项目特别适合需要同时处理批量数据和实时数据流的应用场景,如大数据分析、日志处理及实时监控系统等。

Java
8.6k
Stars
4.6k
Forks
259
Watchers
4k
Issues

Star 增长

今日+2
近 7 天+11
近 30 天+32
综合评分75.7
默认分支main