首页 >> 知识 >> Flink进阶(三):双流connect的用法

Flink进阶(三):双流connect的用法

业务需求:根据id将两个流中的数据匹配在一起组合成新的流数据,默认两个流的最大延迟时间为60s 超过60s还未匹配成功,意味着当前只有一个流来临,则任务流信息异常,需要将数据侧流输出 思路:先将两个流keyBy(),再connect,然后调用CoProcessFunction函数,在里面处理流1和流2,再设置一个60s的定时器,如果60s内另一个流没来,则把达到的流侧输出

直接上代码:

// 流1 要先按照id分组,再设置水印和事件时间,因为后面注册的定时器是基于事件时间的DataStreamSource sourceStream1 = env.addSource(consumer);KeyedStream stream1 = sourceStream1.assignTimestampsAndWatermarks(new BoundedOutOfOrdernessTimestampExtractor(Time.seconds(5)) { @Override public long extractTimestamp(Order element) {// 这里从element中获取事件时间 return Order.getTime; } }).keyBy(Order::getOrderId);// 流2 要先按照id分组,再设置水印和事件时间,因为后面注册的定时器是基于事件时间的DataStreamSource sourceStream2 = env.addSource(consumer);KeyedStream stream2 &
网站地图