行转列和列转行(重点)
行转列(split + explode + laterview)
列转行 ( concat_ws + collect_list/set )
Hive排名函数
row_number不并列不跳过: 1 2 3 4
dense_rank并列不跳过: 1 1 2 3
rank并列跳过: 1 1 3 4
Hive分析函数:Ntile
效果:
排序并分桶 ntile(3) over(partition by A order by B) => {1,2,3}->1,{4,5,6}->2,{7,8,9}->3 可用于取前50%数据统计、取中间三分之一统计等需求。