大数据面试题之多种方法创建dataframe 2023-08-02
在大数据领域的面试中,关于创建DataFrame的问题常常被问到。为了帮助你轻松应对这类问题,本文将介绍多种方法创建DataFrame的技巧。一个常见...详情>
大数据行业2年工作经验的面试题有哪些? 2023-07-28
面试是进入大数据行业或者在该行业发展的重要一步。对于有着2年工作经验的人来说,面试中的问题会更加具体和专业。大数据行业2年工作经验的面...详情>
揭秘大数据面试必考面试题:快速掌握关键知识! 2023-07-21
当今,随着大数据技术的迅猛发展,大数据行业出现了越来越多的就业机会。如果你希望在大数据领域取得成功,面试是不可避免的一步。在这篇生动...详情>
大数据面试题集合:轻松掌握Zookeeper查看集群状态技巧! 2023-07-20
在大数据领域的面试中,对于Zookeeper的理解和使用是一个重要的考察点。作为一个分布式协调服务,Zookeeper在大数据集群中发挥着重要的作用。...详情>
大数据面试题集合:轻松掌握Zookeeper查看集群状态技巧! 2023-07-20
在大数据领域的面试中,对于Zookeeper的理解和使用是一个重要的考察点。作为一个分布式协调服务,Zookeeper在大数据集群中发挥着重要的作用。...详情>
Spark读取MySQL大表超时问题 2022-08-11
场景为Spark读取一张MySQL表(innodb引擎), 数据量8000万,无自增ID,业务中一个字段为(订单ID)主键。要将该表数据读取后写入到HDFS。详情>
大数据面试题:ProducerRecord和消息发送到broker 2022-08-09
如果 key 不为 null,那么默认的分区器会对 key 进⾏哈希(采⽤ MurmurHash2 算法,具备 ⾼运算性能及低碰撞率),最终根据得到的哈希值来计算分...详情>
大数据面试题:原理、消费者、文件分布分别是什么? 2022-08-09
可以订阅多主题,可以订阅指定分区,可以暂停和重新启用某个分区消费,指定offset消费。在旧消费者客户端中,消费位移是存储在 ZooKeeper 中的...详情>
大数据面试题:MapReduce的join过程及hive的SQL解析过程 2022-06-29
利用DistributedCache将小表分发到各个节点上,在Map过程的setup()函数里,读取缓存里的文件,只将小表的连接键存储在hashSet中。利用Distribu...详情>
大数据面试题:经典面试题答疑集合 2022-06-29
kafka优缺点,答案:1)只能支持统一分区内消息有序,无法实现全局消息有序2)会丢失数据和重复消费数据;3)对于一个窗口来说,Flink先增量计算...详情>