Flink数据处理-自定义函数

2023-10-01 / lukelee

我们在详细说明中介绍了常用的一些操作，可以发现，使用Flink的算子必须进行自定义，自定义时可以使用Lambda表达式，也可以继承并重写函数类。本节将从源码和案例两方面对用户自定义函数进行一个总结和梳理。

Flink架构以及核心原理

2023-10-01 / lukelee

为了支持分布式运行，Flink跟其他大数据引擎一样，采用了主从（Master-Worker）架构。Flink运行时主要包括两个组件：

2023-10-01 / lukelee

在流处理中，时间是一个非常核心的概念，是整个系统的基石。我们经常会遇到这样的需求：给定一个时间窗口，比如一个小时，统计时间窗口内的数据指标。那如何界定哪些数据将进入这个窗口呢？在窗口的定义之前，首先需要确定一个作业使用什么样的时间语义。

2023-10-01 / lukelee

但是Flink依然选择了重新开发了自己的序列化框架，因为序列化和反序列化将关乎整个流处理框架各方面的性能，对数据类型了解越多，可以更早地完成数据类型检查，节省数据存储空间。

2023-10-01 / lukelee

window环境下的cmd或者powershell下执行下述命令

2023-10-01 / lukelee

我们知道，一个Java或Scala的程序入口一般是一个静态（static）的main函数。在main函数中，还需要定义下面几个核心步骤：

2023-10-01 / lukelee

Flink使用示例