千锋教育-做有情怀、有良心、有品质的职业教育机构

手机站
千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站

领取全套视频
千锋教育

关注千锋学习站小程序
随时随地免费学习课程

当前位置:首页  >  技术干货  > 大数据面试题-大数据技术问答(一)

大数据面试题-大数据技术问答(一)

来源:千锋教育
发布人:wjy
时间: 2022-06-20 17:32:00 1655717520

  1.hive SQL的分组topN问题

  成绩表S,字段sid,cid,score

  求每门课程的前2名与后2名sid

  下面是我的做法,求个更好的

  select sid from

  (select sid,

  rank() over(partition by cid order by score) as RA

  from S) as A

  union

  (select sid,

  rank() over(partition by cid order by score DESC) as RB

  from S) as B

  where RA<3 and RB<3

千锋教育

  2.ES中游标和快照有什么区别?

  它们两个没有什么可比性, 在深分页场景下我们不能使用(from+size)的方式查询ES,因为性能太低(from+size 方式会从每个分片取出from+size大小的数据,让后在协调节点做Merge返回,分页越深协需要处理的数据量越大)。一般使用scroll方式解决深分页问题,scroll在初始化阶段会对查询数据生成快照(不可变的数据集,不受索引的更新,删除的影响,单维护这个快照是需要耗费资源的),之后的查询都会对快照数据根据scroll_id进行遍历查询。

  更多关于大数据培训的问题,欢迎咨询千锋教育在线名师。千锋教育拥有多年IT培训服务经验,采用全程面授高品质、高体验培养模式,拥有国内一体化教学管理及学员服务,助力更多学员实现高薪梦想。

tags:
声明:本站稿件版权均属千锋教育所有,未经许可不得擅自转载。
10年以上业内强师集结,手把手带你蜕变精英
请您保持通讯畅通,专属学习老师24小时内将与您1V1沟通
免费领取
今日已有369人领取成功
刘同学 138****2860 刚刚成功领取
王同学 131****2015 刚刚成功领取
张同学 133****4652 刚刚成功领取
李同学 135****8607 刚刚成功领取
杨同学 132****5667 刚刚成功领取
岳同学 134****6652 刚刚成功领取
梁同学 157****2950 刚刚成功领取
刘同学 189****1015 刚刚成功领取
张同学 155****4678 刚刚成功领取
邹同学 139****2907 刚刚成功领取
董同学 138****2867 刚刚成功领取
周同学 136****3602 刚刚成功领取
相关推荐HOT