爬虫分类有哪些? 2022-09-05
通用网络爬虫从互联网中搜集网页,采集信息,这些网页信息决定着整个引擎系统的内容是否丰富,信息是否即时,因此其性能的优劣直接影响着搜索...详情>
什么是网络爬虫 2022-09-05
网络爬虫,英文名为Spider,又称为网页蜘蛛,网络机器人,在数据分析应用中,更多的将爬虫称为数据采集程序,是一种按照一定的规则,自动地抓取...详情>
2022年it行业的就业方向及前景分析 2022-09-05
在2022年it主流就业方向包括前端开发、数据库管理、大数据开发、后台开发、嵌入式开发、AI智能和UI设计这七大方向,每个方向所需要的技能都会...详情>
云计算很难学吗?工资高吗 2022-09-05
云计算很难学吗?工资高吗?云计算是近几年的热词,大家都在讨论要不要学云计算技术。云计算技术主要学习计算机网络技术、Mysql数据库、Linux...详情>
大数据面试题:行转列和列转行、hive函数 2022-09-02
Hive分析函数:Ntile.排序并分桶 ntile(3) over(partition by A order by B) => {1,2,3}->1,{4,5,6}->2,{7,8,9}->3 可用于取前50%数据统计、取...详情>
大数据面试题:4个人过桥,最短需要多长时间? 2022-09-02
4个人过桥,只有1个手电筒(没有手电摔死人哦),只能同时2人同时过。4人过桥时间分别为1 2 5 10,问最短需要多少时间详情>
布隆过滤器原理? 2022-09-02
将字符串用哈希函数转换为一个或多个整型值,将bit型数组中对应位置上的0改为1。判断该字符串是否存在时,只需要判断这些位置上的值是否都为1...详情>
实时数仓和离线数仓比较?你怎么看? 2022-09-02
离线数据仓库主要基于sqoop、hive等技术来构建T+1的离线数据,通过定时任务每天拉取增量数据导入到hive表中,然后创建各个业务相关的主题维度...详情>
什么是维度建模? 2022-09-02
Kimball推崇数据集市的集合为数据仓库,同时也提出了对数据集市的维度建模,将数据仓库中的表划分为事实表、维度表两种类型。详情>
什么是ER模型? 2022-09-02
将事物抽象为“实体”、“属性”、“关系”来表示数据关联和事物描述。- 实体:通常为参与到过程中的主体,客观存在的,比如商品、仓库、货位...详情>