<b>前言</b>
有的时候我们只要按条处理,追求实时性而非吞吐量的时候,类似storm的模式就比较好了。spark 在流式处理一直缺乏改进,而flink在流式方面做得很棒,两者高层的api也是互相借鉴,容易形成统一的感官,所以决定让streamingpro适配flink,让其作为streamingpro底层的流式引擎。
streamingpro自身设计之初就是为了支持多引擎的,所以改造成本很低,昨天花了一下午,晚上加了会班就重构完了。这次增强可以让我司的流式引擎有了新的选择。
<b>准备工作</b>
<b>下载安装包</b>
接着就是下载streamingpro的 flink版本:
<a href="https://pan.baidu.com/s/1slcpxxv" target="_blank">https://pan.baidu.com/s/1slcpxxv</a>
<a href="https://pan.baidu.com/s/1slcpxxv" target="_blank"></a>
<b>启动flink</b>
进入flink安装目录运行如下命令:
之后写一个flink.json文件:
目前source 只支持 kafka/socket ,sink则只支持console和csv。准备好这个文件你就可以提交任务了:
然后皆可以了。
你也可以到localhost:8081 页面上提交你的任务。
<b>后面的话</b>
flink目前在流式计算上对sql支持有限,暂时还不支持join,agg等行为操作,这个和spark相比较而言差距还比较大。不过我们很快会将script暴露出来,可以让大家直接进行编程,主要利用其table api。