作者:陈守元、戴资力

一、Apache F 的定义、架构及原理

Apache F 是一个分布式大数据处理引擎,可对有限数据流和无限数据流进行有状态或无状态的计算,能够部署在各种集群环境,对各种规模大小的数据进行快速计算。

1. F Application

了解 F 应用开发需要先理解 F 的 Streams、State、Time 等基础处理语义以及 F 兼顾灵活性和方便性的多层次 API。

  • Streams:流,分为有限数据流与无限数据流,unbounded stream 是有始无终的数据流,即无限数据流;而 bounded stream 是限定大小的有始有终的数据集合,即有限数据流,二者的区别在于无限数据流的数据会随时间的推演而持续增加,计算持续进行且不存在结束的状态,相对的有限数据流数据大小

收藏 打印