线性回归是一种用于建立输入变量(自变量)和输出变量(因变量)之间线性关系的模型。它是统计学和机器学习中最基本和常用的回归方法之一。
线性回归模型假设因变量和自变量之间存在线性关系,并尝试使用一个线性方程来近似这种关系。线性回归的目标是找到最佳拟合直线,以最小化观测值与预测值之间的差异,即使残差平方和最小。
线性回归方程的一般形式为:
y = b0 + b1 * x1 + b2 * x2 + ... + bn * xn
其中y是因变量,x1,x2,...,xn是自变量,b0,b1,b2,...,bn是线性回归方程的系数(也称为回归系数),表示y对应于每个自变量的贡献。b0表示截距,它是在所有自变量等于0时,因变量的预测值。
线性回归方程的目标是找到最佳的系数b0,b1,b2,...,bn,使预测值y'尽可能接近真实值y。为了找到这些系数,通常使用最小二乘法来拟合线性回归模型,即通过最小化残差平方和来选择最佳系数。
简单线性回归是一种特殊的线性回归,它只涉及一个自变量和一个因变量。其方程形式为:
y = b0 + b1 * x
其中y是因变量,x是自变量,b0是截距,b1是自变量x的系数,表示y对x的影响程度。