Wang Haihua
🍈 🍉🍊 🍋 🍌
单变量线性回归,又称简单线性回归(simple linear regression,SLR),是最简单但用途很广的回归模型。其回归式为:
$$ y=\alpha+\beta x $$为了从一组样本$\{\left(x_{i}, y_{i}\right)|i = 1,2,\cdots,n\}$之中估计最合适的参数$\alpha$和$\beta$,通常采用最小二乘法,其计算目标为最小化残差平方和:
$$ \min \sum_{i=1}^{n} \varepsilon_{i}^{2}=\min \sum_{i=1}^{n}\left(y_{i}-\alpha-\beta x_{i}\right)^{2} $$我们不加推导,直接给出最小二乘估计的结果
$$ \begin{aligned} \hat{\alpha}&=\bar{y}-\bar{x} \hat{\beta}\\ \hat{\beta}&=S_{x y} / S_{x x} \end{aligned} $$其中,
$$ \bar{y}=\frac{1}{n} \sum_{i} y_{i} $$$$ \bar{x}=\frac{1}{n} \sum_{i} x_{i} $$$$ S_{x x}=\sum_{i}\left(x_{i}-\bar{x}\right)^{2} $$$$ S_{y y}=\sum_{i}\left(y_{i}-\bar{y}\right)^{2} $$$$ S_{x y}=\sum_{i}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right) $$在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。
在实际经济问题中,一个变量往往受到多个变量的影响。例如,家庭消费支出,除了受家庭可支配收入的影响外,还受诸如家庭所有的财富、物价水平、金融机构存款利息等多种因素的影响,表现在线性回归模型中的解释变量有多个。这样的模型被称为多元线性回归模型(multivariable linear regression model)
$$ y=\beta_{0}+\beta_{1} x_{1}+\beta_{2} x_{2}+\cdots \beta_{m} x_{m} $$多元性回归模型的参数估计,同一元线性回归方程一样,也是在要求误差平方和最小的前提下,用最小二乘法求解参数。
$$ \min \sum_{i=1}^{n} \varepsilon_{i}^{2}=\min \sum_{i=1}^{n}\left(y_{i}-\left(\beta_{0}+\beta_{1} x_{1i}+\beta_{2} x_{2i}+\cdots \beta_{m} x_{mi}\right)\right)^{2} $$参考文献