大数据从入门到精通,一套专业的学习路线是必不可少的,尤其是对于想要自学的同学来说,这个至关重要。千锋老师经过第五次迭代更新,整理了一套专业前沿的大数据学习路线,从零基础开始的同学,可以作为自己的学习参考。
大数据学习路线图是分为五个大的阶段的:
第一阶段 Java语言基础阶段
1.1 Java编程语言基本概述
1.2 Java基础语法
1.3 面向对象编程
1.4 面向对象高级编程
1.5 Java中的常用类库
1.6 枚举和异常类
1.7 Java数据结构和集合框架泛型
1.8 Java中的IO流
1.9 Java中的多线程
1.10 Java中网络编程和反射
1.11 Java8新特性
1.12 Java基础加强
第二阶段 Linux系统&Hadoop生态体系
01 Linux入门
02 常用基本命令
03 系统管理
04 Linux操作增强
05 Linux shell编程
06 Hadoop生态
07 分布式系统概述
08 Hadoop入门
09 Hadoop伪分布式
10 Hadoop全分布式
11 HDFS基本概念
12 HDFS的应用开发
13 HDFS的IO流操作
14 NameNode工作机制
15 DataNode工作机制
16 Zookeeper入门
17 Zookeeper详解
18 HA框架原理
19 Hadoop-HA集群配置
20 MapReduce框架原理
21 Shuffle机制
22 Mapreduce案例一
23 Mapreduce案例二
24 Hive入门
25 Hive DDL数据定义
26 Hive分区表
27 Hive分桶表
28 Hive查询
29 Hive的高级查询Join与排序
30 Hive的函数
31 Hive DML数据管理
32 Hive文件存储
33 Hive企业级调优
34 Hive企业级调优二
35 Hive企业级项目实战
36 Flume详解
37 Sqoop详解
38 Hbase概念
39 Hbase的操作
40 Hbase整合
41 Hbase的实战和优化
第三阶段 分布式计算框架
3.1 scala
3.2 Spark Core
3.3 Spark SQL
3.4 Spark Streaming
3.5 kafka
3.6 ElasticSearch
3.7 Logstash
3.8 Kibana
3.9 Kibana
第四阶段 大数据实战项目
4.1 互金领域-广告投放
项目介绍:构建广告投放平台,进行广告投放业务,吸引潜在客户,推广产品,包含投放微服务平台、竞价模块、客户群体画像、 千人千面推荐产品。
4.2 电商平台
项目介绍: 埋点业务,进行用户细分画像、建立信用体系、进行线上各类活动。
4.3 共享单车
项目介绍: 依据用户行为轨迹构成出行规律,根据用户群体出行规律、区域情况等动态调度用车情况。
4.4 工业大数据
项目介绍:国家电网_省级输/变电监控项目:监控线路的传感设备,确保设备安全、降低故障成本,动态监控线路、变电站二次设备工作情况、报警自动化。
4.5 交通
项目介绍:贵州交通厅,交通离线/实时监控项目:通过交通卡口采集实时数据,动态监控全省各道路通行和事故状况,避免拥堵、避免交通事故、 精准测速、防止套牌和提供便捷最佳出行方案、 预测拥堵系数,为各级提供最优道路规划方案。
4.6 旅游
项目介绍:安顺智慧旅游,整合各类旅游相关应用系统及信息资源,在公安、交通、工商等相关领域实现信息共享、协同合作,共同打造良性的旅游云生态系统。
4.7 医疗
项目介绍:某市人民医院,随着老年化的持续增加,患病率越来越高。增加大数据平台,采集医疗相关数据,提高诊断的准确性,预防一些疾病的发生,监控相关病情康复进展,真正实现解决看病难,降低发病率等。
第五阶段 大数据分析
5.1 Data Analyze数据分析基础
5.2 工作环境准备
5.3 数据可视化的概念与准则
5.4 Python机器学习
5.5 选择模型
5.6 构建树的过程
5.7 网格搜索
5.8 sklearn中有三类朴素贝叶斯算法
5.9 颜色特征
5.10 手写数字识别
5.11 文本的基本组成
5.12 文本的基本组成
学习大数据开发,可以参考千锋提供的大数据学习路线,该学习路线提供完整的大数据开发知识体系,内容包含Linux&&Hadoop生态体系、大数据计算框架体系、云计算体系、机器学习&&深度学习。根据千锋大数据培训提供的大数据学习路线图可以让你对学习大数据需要掌握的知识有个清晰的了解,并快速入门大数据开发。