千锋教育-做有情怀、有良心、有品质的职业教育机构

手机站

千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站

领取全套视频

千锋教育

关注千锋学习站小程序
随时随地免费学习课程

行业头条

哈尔滨选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

哈密选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

呼和浩特选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

呼伦贝尔选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

吴忠选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

吕梁选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

吉安选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

合肥选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

台州选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

厦门选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

400-811-9990 全国咨询热线

首页精品课程

Java

鸿蒙开发

HTML5

物联网

云计算

Python

软件测试

网络安全

大数据

Unity

UI/UE设计

全媒体营销

影视剪辑

游戏原画

区块链

产品经理

商业插画

PMP认证

红帽RHCE

软考认证

华为认证

出国留学

安全认证

更多课程

免费教程
HTML5视频教程 Java视频教程 Python视频教程 UI视频教程云计算视频教程软件测试视频教程大数据视频教程物联网视频教程 Unity视频教程网络安全视频教程全媒体视频教程影视剪辑视频教程
教研实力
教研院师资团队项目大赛
校企服务
企业内训高校合作学科共建
就业服务
就业服务双选会上门招聘人才定制促就业行动
认证考试
PMP®培训软考培训红帽RHCE认证学历提升
千锋问问行业资讯技术干货热点话题
零基础学IT IT培训机构 IT面试题 IT就业前景
关于千锋
千锋简介锋益公益大赛组织品牌活动
联系我们

当前位置：首页 > 应聘面试 > 大数据面试题 > SparkStreaming整合Kafka（重点）

SparkStreaming整合Kafka（重点）

来源：千锋教育

发布人：wjy

时间： 2022-09-02 15:31:45 1662103905

receiver方式 sparkStream启动一个单独的线程receiver定时使用kafka高阶API向kafka拉取数据，并自动地更新zk的offsets。

优点：用户专注于业务，不需要关心偏移量的维护，代码简洁。

缺点：定时拉取数据可能造成sparkStream处理速度跟不上，导致数据丢失。启动wal预写日志后，receiver会额外将数据写一份到本地，数据丢失的情况可以自动到日志中恢复，但是这种方式会重复写数据造成性能大幅浪费。此外，receiver与业务不在同一线程，但两者却又相互依赖，这导致我们在对业务进行高并发高吞吐的优化时不得不受制于receiver。

direct方式sparkStream在业务代码中使用kafka低阶API直接连接kafka拉取数据进行消费。

优点：简化并行：kafka分区与RDD分区一致，可以一对一并行消费;

高效：数据的拉取与消费是顺序关系，不存在数据丢失问题，避免wal预写日志

稳定：处理完才拉取下一批数据，不会造成任务积压导致程序崩溃,强一致语义：可以通过手动维护偏移量的方式自定义实现一致性。

：需要采用checkpoint或第三方平台维护偏移量，开发成本较高;实现监视需要额外人工开发。

tags:

声明：本站稿件版权均属千锋教育所有，未经许可不得擅自转载。

10年以上业内强师集结，手把手带你蜕变精英

请您保持通讯畅通，专属学习老师24小时内将与您1V1沟通

免费领取

今日已有369人领取成功

刘同学 138****2860 刚刚成功领取

王同学 131****2015 刚刚成功领取

张同学 133****4652 刚刚成功领取

李同学 135****8607 刚刚成功领取

杨同学 132****5667 刚刚成功领取

岳同学 134****6652 刚刚成功领取

梁同学 157****2950 刚刚成功领取

刘同学 189****1015 刚刚成功领取

张同学 155****4678 刚刚成功领取

邹同学 139****2907 刚刚成功领取

董同学 138****2867 刚刚成功领取

周同学 136****3602 刚刚成功领取

上一篇

DStream

下一篇

解决数据积压（重点）

免费打包获取

相关推荐HOT

内部表和外部表（重点）

hive外部表是使用external关键字并指定一个hdfs目录创建的表。hive内部表在创建时会在对应hive目录下创建相应的文件夹，外部表则以指定文件夹为...详情>>

2022-09-02 17:21:00

Flink checkpoint和savepoint区别

Checkpoint是为runtime准备的，Savepoint 是为用户准备的。Checkpoint 机制的目标在于保证Flink作业意外崩溃重启不影响exactly once 准确性，通...详情>>

2022-09-02 16:59:22

State：指一个具体的Task/Operator的状态。State可以被记录，在失败的情况下数据还可以恢复，Flink中有两种基本类型的State： Keyed State， Op...详情>>

2022-09-02 16:59:19

Flink反压机制？

Flink 内部是基于producer-consumer模型来进行消息传递的，Flink的反压设计也是基于这个模型。Flink 使用了高效有界的分布式阻塞队列，就像 Jav...详情>>

2022-09-02 16:59:16

大数据面数据：Flink Allowed Lateness & Side OutPut？

虽说水位线(Watermark)表明早于它的事件不应该再出现，但是接收到水位线以前的的消息是不可避免的，这就是所谓的迟到事件。实际上迟到事件是乱...详情>>

2022-09-02 16:59:00

热门推荐

大数据kafka常见面试题——如何搭建kafka？

大数据kafka常见面试题——kafka中如何避免重复消费

大数据面试题之多种方法创建dataframe

大数据Hadoop面试题——Hadoop干什么用的？

大数据行业2年工作经验的面试题有哪些？

大数据kafka面试题——kafka和flume的区别是什么？

大数据部署Kafka面试题解析：实时同步Kafka

大数据部署Kafka面试题：Kafka的部署与管理

大数据面试中关于kafka原理的面试题

揭秘大数据面试必考面试题：快速掌握关键知识！

技术干货更多>>

如何实现服务器负载均衡

2023-12-06

linux有哪些优势和劣势

2023-12-06

linux需要驱动吗

2023-12-06

android与linux的区别

2023-12-06

如何搭建基于容器的深度学习环境

2023-12-06

职场就业更多>>

网络安全软件开发的就业前景

2023-12-09

学会python工程师后的就业前景

2023-12-09

学会java工程师后的就业前景

2023-12-09

云计算技术就业前景以及发展方向怎样？

2023-08-07

快速通道

培训机构
了解培训相关
就业前景
查看就业前景
培训门槛
了解学习门槛
应聘面试
常见面试考题
就业服务
毕业推荐就业
师资团队
了解师资团队

千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站