简单之美

使用 Flink 处理数据时，可以基于 Flink 提供的批式处理（Batch Processing）和流式处理（Streaming Processing）API 来实现，分别能够满足不同场景下应用数据的处理。这两种模式下，输入处理都被抽象为 Source Operator，包含对应输入数据的处理逻辑；输出处理都被抽象为 Sink Operator，包含了对应输出数据的处理逻辑。这里，我们只关注输出的 Sink Operator 实现。 Flink 批式处理模式，运行 Flink Batch Job 时作用在有界的输入数据集上，所以 Job 运行的时间是有时限的，一旦 Job 运行完成，对应的整个数据处理应用就已经结束，比如，输入是一个数据文件，或者一个 Hive SQL 查询对应的结果集，等等。在批式处理模式下处理数据的输出时，主要需要实现一个自定义的 OutputFormat，然后基于该 OutputFormat 来构建一个 Sink，下面看下 OutputFormat 接口的定义，如下所示： @Public public interface OutputFormat<IT> extends Serializable { void configure(Configuration parameters); void open(int taskNumber, int numTasks) throws IO

石浩枫: 作者你自己看看你写的通顺吗，图layer一半有颜色一半没颜色，画的啥东西
gsgsgsl: 赞一个，前几年搞过kafka2.x版本的鉴权，几年有这方面需求，发现很多api变了，2.x版本的鉴权配置在3.x版...
dack: GPT-2中的相对位置编码请问有出处吗，在GPT-2的论文& #8221;Language Models are...
zhang: 你好，这一行“前面计算已经得到 QKT 矩阵，n=6，dk=8，则 A 的大小也是 6 x 6。”请问在下面的代码中为什么dk =...
derek: 何时才能出现伴侣Ai
丘比特: 请问博主，如果在窗口中用到广播状态，现在您有什么实现方案吗？
z: 寫的真好
方俊: 大佬好有耐心，从14年回复到19年哈哈
Yanjun: 图是用 Astah 和 OminiGraffle 画的
JacobZheng: 问个题外话，图是用什么工具画的啊
Derek Dekker: 感觉还挺难的
luosijie: 博主你好，请问您知道K距离方法出自哪篇文献吗，我该如何引用？

简单之美，难得简单，享受简单的唯美。

按月份浏览文章: 七月 2018

使用 Flink 实现索引数据到 Elasticsearch