千锋教育-做有情怀、有良心、有品质的职业教育机构

手机站

千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站

领取全套视频

千锋教育

关注千锋学习站小程序
随时随地免费学习课程

行业头条

哈尔滨选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

哈密选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

呼和浩特选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

呼伦贝尔选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

吴忠选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

吕梁选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

吉安选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

合肥选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

台州选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

厦门选择鸿蒙培训机构要注意些什么？选择千锋的理由？ 查看详情>>

400-811-9990 全国咨询热线

首页精品课程

Java

鸿蒙开发

HTML5

物联网

云计算

Python

软件测试

网络安全

大数据

Unity

UI/UE设计

全媒体营销

影视剪辑

游戏原画

区块链

产品经理

商业插画

PMP认证

红帽RHCE

软考认证

华为认证

出国留学

安全认证

更多课程

免费教程
HTML5视频教程 Java视频教程 Python视频教程 UI视频教程云计算视频教程软件测试视频教程大数据视频教程物联网视频教程 Unity视频教程网络安全视频教程全媒体视频教程影视剪辑视频教程
教研实力
教研院项目库师资团队项目大赛
校企服务
企业内训高校合作学科共建
就业服务
就业服务双选会上门招聘人才定制促就业行动
认证考试
PMP培训软考培训红帽RHCE认证学历提升
千锋问问行业资讯技术干货热点话题
零基础学IT IT培训机构 IT面试题 IT就业前景
关于千锋
千锋简介锋益公益大赛组织品牌活动
联系我们

当前位置：首页 > 技术干货 > 按照query的频度排序文件

按照query的频度排序文件

来源：千锋教育

发布人：wjy

时间： 2022-09-14 15:49:35 1663141775

　　有10个文件，每个文件1G，每个文件的每一行存放的都是用户的query，每个文件的query都可能重复。要求你按照query的频度排序?

　　方案1:

　　hash映射: 顺序读取10个文件，按照hash(query)%10的结果将query写入到另外10个文件(记为a0,a1,..a9)中。这样新生成的文件每个的大小大约也1G(假设hash函数是随机的)。

　　hash_map统计: 找一台内存在2G左右的机器，依次对用hash_map(query, query_count)来统计每个query出现的次数。注: hash_map(query,query_count)是用来统计每个query的出现次数，不是存储他们的值，出现一次，则count+1。

　　堆/快速/归并排序: 利用快速/堆/归并排序按照出现次数进行排序，将排序好的query和对应的query_cout输出到文件中，这样得到了10个排好序的文件(记为)。最后，对这10个文件进行归并排序(内排序与外排序相结合)。

　　方案2:

　　一般query的总量是有限的，只是重复的次数比较多而已，可能对于所有的query，一次性就可以加入到内存了。这样，我们就可以采用trie树/hash_map等直接来统计每个query出现的次数，然后按出现次数做快速/堆/归并排序就可以了。

　　方案3:

　　与方案1类似，但在做完hash，分成多个文件后，可以交给多个文件来处理，采用分布式的架构来处理(比如MapReduce)，最后再进行合并。 ¶ 给定a、b两个文件，各存放50亿个u

tags:

声明：本站稿件版权均属千锋教育所有，未经许可不得擅自转载。

10年以上业内强师集结，手把手带你蜕变精英

请您保持通讯畅通，专属学习老师24小时内将与您1V1沟通

免费领取

今日已有369人领取成功

刘同学 138****2860 刚刚成功领取

王同学 131****2015 刚刚成功领取

张同学 133****4652 刚刚成功领取

李同学 135****8607 刚刚成功领取

杨同学 132****5667 刚刚成功领取

岳同学 134****6652 刚刚成功领取

梁同学 157****2950 刚刚成功领取

刘同学 189****1015 刚刚成功领取

张同学 155****4678 刚刚成功领取

邹同学 139****2907 刚刚成功领取

董同学 138****2867 刚刚成功领取

周同学 136****3602 刚刚成功领取

上一篇

海量数据分布在100台电脑中，想个办法高效统计出这批数据的TOP10？

下一篇

有哪些基本的垃圾回收算法？

免费打包获取

相关推荐HOT

怎样投抖加不花钱？别人能看出来吗？

抖音一些视频为了获取更多点击，一些博主机会投抖加。其实抖加的投放没有绝对正确的方法，而不同账号和视频投放的策略都是不一样的，不过一般情...详情>>

2023-09-19 08:00:10

抖店入驻收费多少？开抖店费用是多少？

如果要开通抖音小店，需要先把抖音账号开通商品橱窗功能。入驻之后，可以选择头条账号、抖音账号、火山账号任一类型注册或登录。那开个抖店要多...详情>>

2023-09-19 07:50:26

想做直播带货的货源哪里来？怎么找货源？

现如今直播推广的方式是非常火的，有着非常多的卖家都是利用直播推广店铺产品，效果也是非常不错。但很多卖家想要了解现在直播带货的话什么产品...详情>>

2023-09-19 07:47:16

适合三农领域的名字？有何技巧？

现在在抖音上很多博主会选择直播来赚取更多的流量以及利润，直播间的东西也有很多让消费者信任并且喜欢的，而且随着越来越多人直播，很多农产品...详情>>

2023-09-19 07:06:05

抖店商品发布违规怎么申诉？有何规则？

抖店服务市场服务商发布违禁信息如何处理?情节严重程度判定原则：违规严重等级主要通过服务商违规次数、造成后果的严重程度、获利或导致损失的...详情>>

2023-09-19 06:59:55

快速通道更多>>

课程介绍
点击获取大纲
就业前景
查看就业薪资
学习费用
了解课程价格
优惠活动
领取优惠券
学习资源
领3000G教程
师资团队
了解师资团队
实战项目
获取项目源码
开班地区
查看来校路线

开班信息

北京校区

北京校区
大连校区
广州校区
成都校区
杭州校区
长沙校区
合肥校区
南京校区
上海校区
深圳校区
武汉校区
郑州校区
西安校区
青岛校区
重庆校区
太原校区
沈阳校区
南昌校区
哈尔滨校区

热门推荐

新手直播带货怎么做起来？有何技巧？

做视频创作者怎么赚钱？个人怎么靠流量赚钱？

怎样投抖加不花钱？别人能看出来吗？

抖店怎么拦截快递？线下结算是什么？

抖店平台商户被退店还能退货吗？如何提高评分？

抖店入驻收费多少？开抖店费用是多少？

想做直播带货的货源哪里来？怎么找货源？

抖店没有营业执照怎么办？类型有哪些？

女孩子拍什么最容易火?拍视频怎么赚钱的？

怎样投抖加不花钱，有哪些技巧？

技术干货更多>>

如何实现服务器负载均衡

2023-12-06

linux有哪些优势和劣势

2023-12-06

linux需要驱动吗

2023-12-06

android与linux的区别

2023-12-06

如何搭建基于容器的深度学习环境

2023-12-06

职场就业更多>>

网络安全软件开发的就业前景

2023-12-09

学会python工程师后的就业前景

2023-12-09

学会java工程师后的就业前景

2023-12-09

云计算技术就业前景以及发展方向怎样？

2023-08-07

千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站