简单相关分析 (bivariate) 是最简单也是最常用的一种相关分析方法,共基本功能是可以研究变量之间的线性相关程度并用适当的统计指标表示出来。
两个随机变量 $(X, Y)$ 的 $n$ 个观测值为 $\left(x_i, y_i\right), i=1,2, \cdots, n$, 则 $(X, Y)$ 之间的相关系数 计算公式如下: $$ r=\frac{\sum\left(x_i-\bar{x}\right)\left(y_i-\bar{y}\right)}{\sqrt{\sum\left(x_i-\bar{x}\right)^2 \sum\left(y_i-\bar{y}\right)^2}} $$ 其中 $\bar{x}=\frac{1}{n} \sum_{i=1}^n x_i, \bar{y}=\frac{1}{n} \sum_{i=1}^n y_i$ 分别为随机变量 $X$ 和 $Y$ 的均值。 可以证明: $-1 \leqslant r \leqslant 1$, 即 $|r| \leqslant 1$, 于是有:
(1)先建立原假设 $H_0$ 利备择假设 $H_1$
$H_0: r=0$, 相关系数为 0
$H_1: r \neq 0$, 相关系数不为 0
(2) 建立统计量 $t=r \sqrt{n-2} / \sqrt{1-r^2}$, 其中 $r$ 为相关系数, $n$ 为样本容量。
(3) 给定显著水平,一般为 $0.05$ 。
(4) 计算统计量的值。
在 $H_0$ 成立的条件下, $t=r \sqrt{n-2} / \sqrt{1-r^2}$, 否定域 $\theta=\left\{|t|>t_{e / 2}(n-2)\right\}$ 。
(5) 统计决策
对于给定的显著性水平 $\alpha$, 查 $t$ 分布表得临界值 $t_{\alpha / 2}(n-2)$, 将 $t$ 值与临界值进行比较:
参考资料