1. 时间窗口触发
答案:
2. 周期性(Periodic)水印
答案:自定义见:flink-state , lesson08.UVByBloom
固定延迟水印:
延迟3秒的固定延迟水印
dataStream.assignTimestampsAndWatermarks(WatermarkStrategy.forBoundedOutOfOrderness(***\*Duration.ofSeconds(3)\****));
单调递增水印(每条数据都生成水印)固定延迟水印一个子类,没有了延迟时间:
dataStream.assignTimestampsAndWatermarks(WatermarkStrategy.forMonotonousTimestamps());
3. 定点(Punctuated)水印
答案:实现AssignerWithPunctuatedWatermarks接口,重写checkAndGetNextWatermark()方法,该方法会在针对每个事件的extractTimestamp()方法后立即调用,以此来决定是否生成一个新的水位线,如果该方法返回一个非空并且大于之前值的水位线,就会将这个新的水位线发出。
public class MyPunctuatedAssigner implements AssignerWithPunctuatedWatermarks{
// 定义1分钟的容忍间隔时间,即允许数据的最大乱序时间
private long maxOutofOrderness = 60 * 1000;
//先执行该函数,从element中提取时间戳
@Override
public long extractTimestamp(UserBehavior element, long previousElementTimestamp) {
return element.timestamp;
}
//再执行该函数,extractedTimestamp的值是方法extractTimestamp()的返回值
@Nullable
@Override
public Watermark checkAndGetNextWatermark(UserBehavior element, long extractedTimestamp) {
// 如果读取数据的用户行为是购买,就生成水位线
if(element.action.equals("buy")){
return new Watermark(extractedTimestamp - maxOutofOrderness);
}else{
// 不发出水位线
return null;
}
}
}
更多关于“大数据培训”的问题,欢迎咨询千锋教育在线名师。千锋教育多年办学,课程大纲紧跟企业需求,更科学更严谨,每年培养泛IT人才近2万人。不论你是零基础还是想提升,都可以找到适合的班型,千锋教育随时欢迎你来试听。