天天看点

StreamingPro支持Flink的流式计算了

<b>前言</b>

有的时候我们只要按条处理,追求实时性而非吞吐量的时候,类似storm的模式就比较好了。spark 在流式处理一直缺乏改进,而flink在流式方面做得很棒,两者高层的api也是互相借鉴,容易形成统一的感官,所以决定让streamingpro适配flink,让其作为streamingpro底层的流式引擎。

streamingpro自身设计之初就是为了支持多引擎的,所以改造成本很低,昨天花了一下午,晚上加了会班就重构完了。这次增强可以让我司的流式引擎有了新的选择。

<b>准备工作</b>

<b>下载安装包</b>

接着就是下载streamingpro的 flink版本:

<a href="https://pan.baidu.com/s/1slcpxxv" target="_blank">https://pan.baidu.com/s/1slcpxxv</a>

<a href="https://pan.baidu.com/s/1slcpxxv" target="_blank"></a>

<b>启动flink</b>

进入flink安装目录运行如下命令:

之后写一个flink.json文件:

目前source 只支持 kafka/socket ,sink则只支持console和csv。准备好这个文件你就可以提交任务了:

然后皆可以了。

你也可以到localhost:8081 页面上提交你的任务。

StreamingPro支持Flink的流式计算了

<b>后面的话</b>

flink目前在流式计算上对sql支持有限,暂时还不支持join,agg等行为操作,这个和spark相比较而言差距还比较大。不过我们很快会将script暴露出来,可以让大家直接进行编程,主要利用其table api。

继续阅读