假设我们希望比较两个不同总体的平均值。如下图每个总体都有一个均值和一个标准差。
我们的目标是利用样本中的信息来估计两个总体均值的差异$\mu_1-\mu_2$,并就此作出统计上有效的推论。
下面直接给出置信度为$100(1−\alpha)\%$的两个独立总体均值差值的置信区间: $$\left [\bar{x_1}-\bar{x_2}-z_{\alpha/2}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}},\bar{x_1}-\bar{x_2}+z_{\alpha/2}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}\right ]$$
(这里要求样品必须是独立的,且每个样品必须大:$n1\ge 30,n_2 \ge 30$。)
关于两个总体平均值相对大小的假设,使用与在单个总体中使用的相同的临界值和p值程序进行检验。所需要做的就是知道如何表达原假设和备选假设,以及标准化检验统计量的公式及其分布。 原假设和备择假设总是用两种总体均值的差值来表示。原假设:
$$H_0 = \mu_1-\mu_2=D_0$$备选假设可以采取三种形式之一 $$H_a = \mu_1-\mu_2<D_0$$ $$H_a = \mu_1-\mu_2>D_0$$ $$H_a = \mu_1-\mu_2\neq D_0$$
只要样本是独立的且两者都很大,则标准化检验统计量的以下公式是有效的,并且它具有标准正态分布。(当总体标准差$\sigma_1$和$\sigma_2$都已知的情况比较少见时,就用样本标准差$s_1$和$s_2$代替。)
检验统计量服从标准正态分布。
为了比较两家相互竞争的有线电视公司的客户满意度水平,随机选择公司1的174名客户和公司2的355名客户,并被要求在一个五分制的量表上给他们的有线电视公司打分,1分最不满意,5分最满意。调查结果汇总如下表:
公司 1 | 公司 2 |
---|---|
n1=174 | n2=355 |
$\bar{x_1}=3.51$ | $\bar{x_2}=3.24$ |
s1=0.51 | s2=0.52 |