初识Python语言
第一周
主要内容
Python语言概述和环境安装丨变量、数据类型和进制丨运算符和分支结构丨循环结构入门丨循环结构的应用
可解决问题
了解Python,搭建Python开发环境,编写简单的Python代码
可掌握的核心能力
Python开发环境的安装(3.6+) | Pycharm的安装和使用 | Markdown软件的安装和使用 |
分支结构的应用场景 | for循环和while循环应用场景区分 | break和continue关键字的使用 |
穷举法(暴力破解法)的应用 |
常用数据结构和函数
第二周
主要内容
字符串丨列表的应用丨元组和集合丨字典类型的应用丨函数使用入门
可解决问题
掌握Python中常用数据类型,实现常用的业务逻辑
可掌握的核心能力
列表的运算 | 创建列表的生成式(推导式) | 元组的应用场景(打包解包、变量值交换) |
集合类型的特点(无序性、互异性、确定性) | 集合的运算 | 字典中键和值的特点 |
字典的索引运算和循环遍历 | 函数的定义和调用 |
函数和面向对象编程
第三周
主要内容
包和模块丨函数的高级用法丨装饰器和生成器丨面向对象编程基础丨面向对象编程进阶
可解决问题
掌握Python中模块的使用,导入三方模块,数据作用域,了解Python高级特性,面向过程,面向对象的编程思维
可掌握的核心能力
包和模块的概念 | Python标准库中的常用模块 | 安装和使用第三方模块(pip命令详解) |
Python中的作用域(LEGB、闭包) | Python内置函数中的高阶函数 | 装饰器函数的工作原理 |
普通函数到生成器的转变 | 面向对象的核心概念(类和对象) | 常用的魔法方法 |
多重继承和MRO问题 |
Python网络数据采集
第四周
主要内容
爬虫概述和页面抓取丨解析页面的方式丨爬取数据的持久化和商业IP代理丨获取页面动态内容-1丨获取页面动态内容-2
可解决问题
掌握爬虫技能,主流的数据抓取,自动化浏览器操作,竞品研究。
可掌握的核心能力
爬虫的作用和分类 | 爬虫合法性的探讨 | 三方库requests的安装和使用 |
三方库beautifulsoup4的安装和使用 | 通过浏览器开发者工具获得元素的选择器 | 使用XPath语法实现页面解析 |
将爬取到的数据写入CSV文件 | 将爬取到的数据写入Excel文件 | 修改请求头Cookie信息 |
破解目标网站封禁IP的方法 | Ajax技术和页面动态内容 | 抓包工具的介绍和使用 |
通过数据接口获取JSON数据 | 使用打码平台破解文字验证码 |
数据分析概述和Excel的应用
第五周
主要内容
数据分析和数据分析师概述丨指标和指标体系建设丨Excel的安装和快速上手丨Excel中的函数和公式计算丨Excel透视表和、透视图和商业数据看板
可解决问题
数据分析岗位认知,入门受众面最广的数据分析工具Excel
可掌握的核心能力
数据分析在各行各业的应用 | 互联网产品的定义和商业模式认知 | 互联网产品类型和盈利模式分析 |
互联产品的指标分类和常见指标 | 如何为企业搭建指标体系 | 数据采集的埋点设计和规范 |
Excel中函数的应用场景和分类 | 透视表的本质和应用场景 | 添加和定制切片器 |
制作商业数据看板 |
关系型数据库和SQL
第六周
主要内容
数据库概述和MySQL的安装使用丨表关系和SQL的应用丨SQL数据查询详解丨窗口函数和JSON类型丨Python程序接入MySQL数据库
可解决问题
掌握数据库的核心内容,掌握SQL的使用,掌握使用SQL进行数据分析
可掌握的核心能力
关系型数据库的特点 | 关系型数据库产品介绍 | MySQL图形化工具Workbench的使用 |
投影、别名和运算 | 数据筛选和空值处理(where子句) | 分组和聚合函数(group by子句和having子句) |
嵌套查询(子查询) | 连接查询(内连接、左外连接、右外连接) | 使用窗口函数解决排名和TopN查询问题 |
使用数据库持久化网络爬虫采集的数据 |
商业智能(BI)工具
第七周
主要内容
MySQL其他相关知识丨从Excel到Power BI丨Power BI中的数据清洗和建模丨Power BI中的数据可视化和报表制作丨认识和使用Tableau
可解决问题
掌握主流BI工具PowerBI,Tableau等工具的使用
可掌握的核心能力
从Excel升级到Power BI的理由 | Power Query编辑器的使用 | 事实表和维度表 |
DAX函数 | 高阶视觉对象的应用 | 数据的钻取 |
Tableau Desktop功能区介绍 | 基础可视化图表的应用 | 饼图、折线图、树状图、堆积柱状图、直方图、散点图、气泡图 |
商业智能(BI)工具
第八周
主要内容
深入探索Tableau丨Tableau数据分析项目实战丨认识和使用fineBI丨数据思维和分析模型-1丨数据思维和分析模型-2
可解决问题
掌握主流数据分析思维,使用模型对项目进行分析。
可掌握的核心能力
数据分箱和数据桶 | 相关分析和回归分析 | LOD表达式的应用场景 |
仪表板的布局和样式 | RFM模型 | AIPL模型 |
AARRR模型(海盗模型) | RARRA增长模型 | 渠道和运营分析 |
A/B测试的应用闭环 | 产品生命周期和迭代流程 | 用户生命周期和运营策略 |
数据分析报告撰写原则 | 数据分析报告撰写要素 | 优质数据分析报告解读 |
Python数据分析
第九周
主要内容
Python数据分析工具介绍丨使用NumPy实现批量数据处理丨使用Pandas进行数据分析-1丨使用Pandas进行数据分析-2丨使用Pandas进行数据分析-3
可解决问题
掌握使用Python进行数据分析,掌握Python数据分析三剑客。
可掌握的核心能力
新建和使用Notebook | ndarray对象的索引和切片 | 广播机制 |
读取CSV和Excel文件创建DataFrame | DataFrame对象的数据筛选 | DataFrame对象的数据拼接和合并 |
数据清洗的概念 | 数据的分箱(离散化) | DataFrame对象的数据分组聚合操作 |
生成透视表和交叉表 | 计算协方差和相关系数 |
Python数据分析
第十周
主要内容
使用Matplotlib绘制统计图表丨Seaborn和Pyecharts的使用丨电商项目相关业务知识介绍丨项目实操
可解决问题
掌握数据可视化的多种库,结合项目进行可视化,进行数据分析
可掌握的核心能力
Matplotlib的配置参数 | 定制坐标系 | 柱状图和堆叠柱状图 |
饼图和环状饼图 | 加载Seaborn自带的数据集 | Pyecharts常用图表举例 |
电商产品的生命周期 | 电商用户的生命周期 | 电商产品核心指标和指标体系解析 |
电商产品运营活动概述 | FAST模型和KISS复盘 | 用户画像和用户标签 |
电商产品用户购买预测 | 电商产品用户评论情感预测 |
统计思维和机器学习的数学基础
第十一周
主要内容
线性代数丨微积分丨概率论丨统计学丨信息论
可解决问题
掌握统计思维,为机器学习做准备
可掌握的核心能力
矩阵和行列式 | 特征值和特征向量 | 导数的概念和意义 |
空间函数和偏导数 | 贝叶斯定理 | 正态分布详解 |
假设检验 | 主成分分析 | 联合熵和条件熵 |
机器学习算法
第十二周
主要内容
机器学习概述和kNN算法丨回归算法丨逻辑回归丨朴素贝叶斯丨决策树
可解决问题
掌握机器学习的主流算法,掌握分类,回归,树模型
可掌握的核心能力
机器学习三大要素:模型、策略、算法 | 模型评估方法概述 | 机器学习中的概念解析 |
一元线性回归和多元线性回归 | 线性回归算法原理 | 回归模型评价标准MSE、R^2、RMSE、MAE等 |
Sigmoid函数 | 似然函数、极大似然估计 | 决策树算法概述及学习过程 |
特征依据:香浓熵、信息增益、GINI系数 | 随机森林集成算法 |
机器学习算法
第十三周
主要内容
支持向量机丨聚类算法和轮廓系数丨集成算法丨特征工程和评价指标丨机器学习项目实战
可解决问题
掌握集成学习的主流算法,掌握非监督学习,掌握模型评估及优化策略。
可掌握的核心能力
SVM算法数学推导过程 | 最大几何间隔、拉格朗日乘子法、对偶性质 | KMeans聚类算法原理及应用 |
DBSCAN聚类算法原理及应用 | Bagging思想、Boosting思想、Stacking思想 | 特征工程 |
建模流程规范 | 数据量纲处理:归一化、标准化、缺失值处理 | WOE、IV值意义及特征转换 |
特征重要性评估 |
数据仓库和大数据挖掘
第十四周
主要内容
数据仓库、数据湖和Hadoop生态圈丨ETL工具丨数据仓库丨Hive丨数仓搭建和数据分析项目
可解决问题
了解大数据生态,使用大数据工具进行数据分析,数据挖掘。
可掌握的核心能力
Hadoop生态圈概述 | 数据的预处理 | 数据仓库建模 |
Hive的数据定义语言 | Hive的数据操作语言 | Hive的数据查询语言 |
Hive数据抽样(随机抽样、块抽样、分桶抽样) | 用户行为分析和购买预测 |
就业指导和模拟面试
第十五周
主要内容
就业期的技术和心理准备丨如何制作一份优质的简历丨面试流程和注意事项丨一对一模拟模式丨一对一模拟面试
可解决问题
就业冲刺,掌握面试技巧,如何表达出自己的能力
可掌握的核心能力
数据分析师的硬实力和软技能 | 数据挖掘工程师简历要点 | STAR法则的应用 |
高频面试题回答技巧 | 面试后的总结和复盘 | 简历文字问题剖析 |