什么是统计学

统计是一门收集、整理、描述、显示和分析统计数据的方法论的科学, 其目的是通过大量观察研究, 消除特殊性和随机性, 探索事物的内在数量规律性, 以达到对客观事物的科学认识。

根据统计学的研究目的不同, 将统计学分为理论统计学和应用统计学; 根据统计方法在研究统计数据的过程中的作用不同, 将统计学分为描述统计学和推断统计学。

数据的收集

统计数据的收集主要是通过统计调查取得。统计调查的方式有普查、抽样调查、重点调查、典型调查以及统计报表制度等。

在统计调查实施前, 需要制定统计调查方案, 统计调查方案的内容包括:

统计数据整理是根据统计研究的目的, 将统计调查所得的数据进行科学地加工, 使之系统化、条理化, 并成为能反映总体数量特征的综合资料的工作过程。

统计数据整理的步骤:

图表展示

统计表和统计图形是显示统计数据的两种方式, 它们可以概括描述数据的基本特征。

数据描述之概括度量

统计数据经过整理后, 通过统计表或统计图基本 上可以展示数据的次数分布特点, 但是, 需要找出数据的分布规律和本质特征, 还需研究次数分布的集中趋势和离中趋势。

概率与分布

在相同条件下进行 $\mathrm{n}$ 次随机试验,事件 $A$ 出现 $m$ 次,则 $m / n$ 就被称为事件 $A$ 发生的频率,随着 $\mathrm{n}$ 的增加, 该频率会越来越接近某一常数 $p$, 最终趋向于稳定, 频率的稳定值 $p$ 就被看作是事件 $\mathrm{A}$ 的概率。记为: $P(A)=m / n=p$ 。

事件的概率是一次试验某一个结果发生的可能性大小, 如要全面了解试验, 还必须知道试验的全部可能结果及各种可能结果发生的概率, 即随机试验的概率分布。概率分布根据随机变量的取值是否具有连续性, 可 分为离散分布和连续分布。

参数估计

参数估计是根据从总体中抽取的样本统计量对总体参数量进行估计的方法。样本统计量是对样本特征的某个概括性的度量。

参数估计的方法有点估计和区间估计。

用抽样指标估计总体参数有三个标准, 即无偏性、 有效性以及一致性, 只有满足这三个要求, 估计才是合理、 优良的估计。

点估计就是直接以样本统计量的实现值来近似于相应的总体参数。常用的点估计有: 用样本均值估计总 体均值, 用样本比例估计总体比例, 用样本方差估计总体方差。

区间估计就是根据估计可靠程度的要求, 利用随机抽取的样本的统计量值确定能够覆盖总体参数的可能区间的一种方法。

置信度, 又称置信水平或置信系数, 是作出某种推断时正确的可能性(概率)。 父置信区间, 也称置信间距, 是指在某一置信度时, 总体参数所在的区域距离或区域长度。

假设检验

假设检验是推断统计的另一个重要组成部分。它是对末知的总体参数或分布形式提出某种假设, 然后利用样本信息和相关统计量的分布特征去检验这个假定,

假设检验的一般步骤 :

  1. 根据题设建立原假设 $\mathrm{H}_0$ 和备择假设 $\mathrm{H}_1$;
  2. 构造适当的检验统计量;
  3. 确定显著性水平 $\alpha$ 和对应的临界值;
  4. 计算检验统计量;
  5. 作出统计决策并加以解释。

几种常见的假设检验: 考虑下面三种类型的假设检验:

  1. $\mathrm{H}_0: \mu=\mu_0 \quad \mathrm{H}_1: \mu \neq \mu_0$ (双边检验 )
  2. $\mathrm{H}_0: \mu \leqslant \mu_0 \quad \mathrm{H}_1: \mu>\mu_0$ (右侧单边检验)
  3. $\mathrm{H}_0: \mu \geqslant \mu_0 \mathrm{H}_1: \mu<\mu_0$ (左侧单边检验)

常见的假设检验方法有 $\mathrm{Z}$ 检验法和 $\mathrm{t}$ 检验法等。

相关系数与回归分析

统计上对现象之间的数量关系的研究主要是从相关分析和回归分析两个方面进行。相关关系是一种不确定的关系, 即当一个现象发生变化时, 另一个现象也相应地发生变化, 但其变化的数值是不固定的, 往往会出现几个不同的数值与其对应。衡量相关关系的有相关图和相关系数。回归分析是确定两种或两种以上变量 间相互依赖的定量关系的一种统计分析方法。

回归分析通常用回归方程描述变量之间的关系。 回归分析和相关关系有着密切的联系, 但又不同于相关关系。相关分析是回归分析的基础和前提, 回归分析是相关分析的深入和继续。在分析问题时, 只有将二者结合起来, 才能使得分析更有效、更科学。二者的区别体现在以下几个 方面:

参考资料