整体来讲一个流处理过程可以划分为三部分DataSource、Transformations、Sinks。DataSource用来产生或者获取数据流,Transformations对数据流做转换,Sinks作为数据的出口输出到将数据输出到数据库,文件等系统,不过Transformations、Sinks并不是必须的。
在上一篇文章Flink-1.9流处理开发:一、最初的开始HELLO WORLD的hello world例子中的流处理过程就是由DataSource和Sinks组成的。
需求
本篇文章实现一个很简单的逻辑,创建一个数据流{"apple","orange","banana","watermelon"},将数据流的单词做大写转换,然后将其打印出来。
解决方案
代码语言:javascript复制public class StreamTest {
private static final Logger LOG = LoggerFactory.getLogger(StreamTest.class);
public static void main(String[] args) throws Exception {
final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
String[] words = {"apple","orange","banana","watermelon"};
//创建DataSource
//根据给定的元素创建一个数据流,元素必须是相同的类型,比如全部为String,或者全部为int。
DataStreamSource ds = env.fromElements(words);
//Transformations
//对DataStream应用一个Map转换。对DataStream中的每一个元素都会调用MapFunction接口的具体实现类。map方法仅仅只返回一个元素,这个flatMap不同
DataStream map = ds.map(new MapFunction() {
@Override
public String map(String value) throws Exception {
return value.toUpperCase();
}
});
//sinks打印出信息
//给DataStream添加一个Sinks
map.addSink(new SinkFunction() {
@Override
public void invoke(String value) throws Exception {
LOG.info(value);
}
});
env.execute("Flink Streaming Java API Skeleton");
}
}
执行效果
代码语言:javascript复制15:03:05,937 INFO fun.cosmozhu.session2.StreamTest - WATERMELON
15:03:05,937 INFO fun.cosmozhu.session2.StreamTest - ORANGE
15:03:05,937 INFO fun.cosmozhu.session2.StreamTest - APPLE
15:03:05,937 INFO fun.cosmozhu.session2.StreamTest - BANANA
代码地址
https://github.com/chaoxxx/learn-flink-stream-api/blob/master/src/main/java/fun/cosmozhu/session2/StreamTest.java
作者:cosmozhu --90后的老父亲,专注于保护地球的程序员
个人网站:https://www.cosmozhu.fun
欢迎转载,转载时请注明出处。
相关文章
- Flink-1.9流计算开发:十六、intervalJoin函数
- Flink-1.9流计算开发:十五、join函数
- Flink-1.9流计算开发:十四、union函数
- Flink-1.9流计算开发:十三、min、minBy、max、maxBy函数
- Flink-1.9流计算开发:十二、apply函数