hadoop可以解决什么问题 2022-09-08
hadoop可以解决什么问题?Hadoop用处主要有两方面,其一是把单机的工作任务拆分,将之变为协同工作的集群;其二是可以用来解决逐渐增加的文件存...详情>
怎么才能学好hadoop 2022-09-07
怎么才能学好hadoop?Hadoop是学好大数据必不可少的一环,它几乎和大数据是相互绑定的,谁也离不开谁。那么怎么学Hadoop,其实就是Hadoop如何入...详情>
Spark SQL 结构化数据处理流程及原理是什么? 2022-09-05
在兼容 Hive 的早期版本的 Spark 中,我们可以在查询中使用某些关键词,这样做是完全可行的。然而,这在 Spark SQL 3 中是不允许的,因为它有...详情>
Apache Spark与 Apache Hadoop数据科学工具有哪些区别? 2022-09-05
与 Apache Spark 一样,它的安全性可以通过其他 Apache 实用程序进一步提高。如果您是需要大量数据科学实用程序来存储和处理大数据的数据科学...详情>
大数据的核心架构层是哪些 2022-09-05
这种即席查询通常是现有的报表和数据共享层的数据并不能满足他们的需求,需要从数据存储层直接查询。数据同步任务需要等数据分析任务完成后才...详情>
Kafka Partition 如何保证副本数据的一致性 2022-08-31
为了保证可用性,Kafka 的分区是多副本的,可以在创建分区时通过 replication-factor 参数指定该分区的副本数,某一副本丢失并不会造成实际数...详情>
Kafka如何在数据一致性和可用性做平衡的 2022-08-31
如果Leader失败了,一个未完全同步数据的Replication被选择为了Leader,数据是否会丢失呢这种情况下,数据会丢失,可以保证可用性,但是不能保...详情>
Kafka ACK机制 2022-08-31
Producer只要收到一个分区副本成功写入的通知就认为推送消息成功了。这个副本必须是leader副本, 只有leader副本成功写入了,Producer才会认为...详情>
消息系统Kafka笔试题:Kafka底层的文件存储结构 2022-08-29
如何根据Offset来查找一条消息: 根据指定的偏移量,使用二分法查询定位出该偏移量对应的消息所在的分段索引文件和日志数据文件。然后通过二分...详情>
hiveSQL的分组topN问题 2022-08-29
大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助...详情>