hadoop采用QJM共享存储机制来确保主备NameNode的元数据尽量一致。 1. 启动一组奇数的JournalNode节点,主NameNode将操作日志并行写入本地和所有JournalNode节点,当超过一半JournalNode节点写入成功时判定为成功,遵循Paxos协议。 2. 备NN会定时检查JournalNode上的EditLog,将它拉回本地 3. 备NN会定期将本地的FS镜像文件和EditLog合并成新的镜像文件(保存最新的内存状态),传回主NN 4. 主NN更新本地的镜像文件,删除旧的日志 5. 发生主备切换时,选取最好的JN同步最新日志到本地(日志恢复机制),更新到最近状态
hive外部表是使用external关键字并指定一个hdfs目录创建的表。hive内部表在创建时会在对应hive目录下创建相应的文件夹,外部表则以指定文件夹为...详情>>
2022-09-02 17:21:00Checkpoint是为runtime准备的,Savepoint 是为用户准备的。Checkpoint 机制的目标在于保证Flink作业意外崩溃重启不影响exactly once 准确性,通...详情>>
2022-09-02 16:59:22State:指一个具体的Task/Operator的状态。State可以被记录,在失败的情况下数据还可以恢复,Flink中有两种基本类型的State: Keyed State, Op...详情>>
2022-09-02 16:59:19Flink 内部是基于producer-consumer模型来进行消息传递的,Flink的反压设计也是基于这个模型。Flink 使用了高效有界的分布式阻塞队列,就像 Jav...详情>>
2022-09-02 16:59:16虽说水位线(Watermark)表明早于它的事件不应该再出现,但是接收到水位线以前的的消息是不可避免的,这就是所谓的迟到事件。实际上迟到事件是乱...详情>>
2022-09-02 16:59:00