机器学习中,有哪些特征选择的工程方法 2022-09-07
1. 特征工程是什么?有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么...详情>
逻辑回归相关问题 2022-09-07
逻辑回归的基本概念:这个最好从广义线性模型的角度分析,逻辑回归是假设y服从Bernoulli分布。其实稀疏的根本还是在于L0-norm也就是直接统计参...详情>
RF与GBDT之间的区别与联系 2022-09-07
相同点:都是由多棵树组成,最终的结果都是由多棵树一起决定。不同点:a 组成随机森林的树可以分类树也可以是回归树,而GBDT只由回归树组成;b ...详情>
线性分类器与非线性分类器的区别以及优劣 2022-09-07
线性和非线性是针对,模型参数和输入特征来讲的。比如输入x,模型y=ax+ax^2那么就是非线性模型,如果输入是x和X^2则模型是线性的。详情>
谈谈判别式模型和生成式模型 2022-09-07
判别方法:由数据直接学习决策函数 Y = f(X),或者由条件分布概率 P(Y|X)作为预测模型,即判别模型。生成方法:由数据学习联合概率密度分布函...详情>
说说你知道的核函数 2022-09-07
内核方法是一类用于模式分析或识别的算法,其最知名的使用是在支持向量机(SVM)。模式分析的一般任务是在一般类型的数据(例如序列,文本文档,...详情>
LR和SVM的联系与区别 2022-09-07
LR和SVM可能是面试中问到的非树模型中很常见的一个问题了,主要的是推公式以及说明求解过程如SVM。笔者在面美团的时候就要求推了LR和SVM,过程...详情>
逻辑斯蒂回归为什么要对特征进行离散化 2022-09-07
1、非线性!!!!逻辑回归属于广义线性模型,表达能力有限,单变量离散化为N个后,每个变量有单独的权重,相当于为模型引入了非线性,能够提高模...详情>
请简要说说一个完整机器学习项目的流程 2022-09-07
完整的机器学习项目主要步骤:1、明确问题,首先要划定问题:监督或者非监督,还是强化学习?这是个分类任务、回归任务还是其他的?详情>
哪些机器学习算法不需要做归一化处理 2022-09-07
在k-means或kNN,我们常用欧氏距离来计算最近的邻居之间的距离,有时也用曼哈顿距离,请对比下这两种距离的差别 欧氏距离,最常见的两点之间或...详情>