ClickHouse为什么快? 2022-10-08
ClickHouse实现了向量执行引擎(Vectorized execution engine),对内存中的列式数据,一个batch调用一次SIMD指令(而非每一行调用一次),不仅减...详情>
CK的高表与宽表是什么? 2022-10-08
宽表:列多行少,高表:列少行多,一般我们在HBase中会讨论宽表和高表的设计,在clikchouse中一般不这么讨论详情>
ClickHouse劣势 2022-10-08
不支持真正的delete/update操作,不支持transactions(事物)* OLAP引擎一般都不支持事物,ClickHouse的定位也是分析性数据库,而不是严格的关系...详情>
SparkRDD之核心原理知多少 2022-10-08
即如果某个节点上的RDD partition,因为节点故障,导致数据丢了,那么RDD会自动通过自己的数据来源重新计算该partition。RDD的lineage特性。5...详情>
linux下mysql的yum源安装/配置/卸载 2022-10-08
加参数启动mysql:/usr/bin/mysqld_safe --skip-grant-tables & 然后就可以无任何限制的访问mysql了,注意:在开启mysql前,首先执行/usr/bin/my...详情>
在搭建大数据集群(以windows作为客户端),制作本地yum源时,如何同时挂载DVD1和DVD2? 2022-10-08
1.在理解这个知识点前,要保证单个DVD的挂载你是会的.2.这里以CentOS6.5为例.他的镜像有两个DVD1和DVD2.DVD1中包括linux系统和主要的软件安装包...详情>
OLAP和OLTP区别 2022-10-08
比如在银行的一笔交易记录,就是一个典型的事务。联机分析处理OLAP(On-Line Analytical Processing)是数据仓库系统的主要应用,支持复杂的分析...详情>
Redis的持久化? 2022-10-08
Redis重新启动时读取这个文件,重新执行新建、修改数据的命令恢复数据。推荐(并且也是默认)的措施为每秒持久化一次,这种策略可以兼顾速度和安...详情>
Redis的缓存穿透、缓存雪崩、缓存击穿 2022-10-08
缓存穿透是指查询一个一定不存在的数据。由于缓存命不中时会去查询数据库,查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到...详情>
Hive数据倾斜 2022-10-08
MapReduce任务中,Map输出数据按Key Hash分配到Reduce中,由于Key分布不均匀、业务数据本身的特性、建表时考虑不周、某些SQL语句本身就有数据...详情>