数据预处理方法¶
一般情况下,在综合评价指标中,有的指标比较重要,有的影响微乎其微,另外各指标值可能属于不同类型、不同单位或不同数量级,从而使得各指标之间存在着不可公度性,给综合评价带来了诸多不便。为了尽可能地反映实际情况,消除由于各项指标间的这些差别带来的影响,避免出现不合理的评价结果,需要对评价指标进行一定的预处理,具体包括
- 指标的筛选
- 一致化处理
- 无量纲化处理
- 定性数据定量化
评价指标的筛选¶
要根据综合评价的目的,针对具体的评价对象、评价内容收集有关指标信息,采用适当的筛选方法对指标进行筛选,合理地选取主要指标,剔除次要指标,以简化评价指标体系。
常用的评价指标筛选方法主要有专家调研法(Delphi method)、最小均方差法、极大极小离差法等。
专家调研法¶
专家调查法分为德尔菲法和头脑风暴法。德尔菲法也翻译为德尔斐(Delphi)法。Delphi是古希腊传说中阿波罗神殿所在地,美国兰德(Land)公司首先于1964年把德尔斐法用于技术预测中。它是在专家个人判断和专家会议方法的基础上发展起来的一种直观预测方法,特别适用于客观资料或数据缺乏情况下的长期预测,或其它方法难以进行的技术预测。
专家调查法或称专家评估法,是以专家作为索取信息的对象,依靠专家的知识和经验,由专家通过调查研究对问题作出判断、评估和预测的一种方法。
工作程序:
- 确定主持人,组织专门小组。
- 拟定调查提纲。所提问题要明确具体,选择得当,数量不宜过多,并提供必要的背景材料。
- 选择调查对象。所选的专家要有广泛的代表性,他们要熟悉业务,有特长、一定的声望、较强的判断和洞察能力。选定的专家人数不宜太少也不宜太多,一般以10~50人为宜。
- 轮番征询意见。通常要经过三轮:
- 第一轮是提出问题,要求专家们在规定的时间内把调查表格填完寄回;
- 第二轮是修改问题,请专家根据整理的不同意见修改自己所提问题,即让调查对象了解其他见解后,再一次征求他本人的意见;
- 第三轮是最后判定。把专家们最后重新考虑的意见收集上来,加以整理。有时根据实际需要,还可进行更多几轮的征询活动。
- 整理调查结果,提出调查报告。对征询所得的意见进行统计处理,一般采用中位数法,把处于中位数的专家意见作为调查结论,并进行文字归纳,写成报告。从上述工作程序可以看出,专家调查法能否取得理想的结果,关键在于调查对象的人选及其对所调查问题掌握的资料和熟悉的程度,调查主持人的水平和经验也是一个很重要的因素。
专家调查法的特点是:
- 函询。用通讯方式反复征求专家意见,调查人与调查对象之间的联系是通过书信来实现的。
- 多向。调查对象分布于不同的专业领域,在同一个问题上能了解到各方面专家的意见。
- 匿名。调查对象通过调查组织者的整理,可以了解到其他专家的意见。但他们是背靠背的,不记名的,互不了解对方为谁。这有助于他们发表独立的见解。
- 反复。有控制地进行反馈的迭代,使分散的意见逐步趋向一致,以发挥集体智慧。
- 集中。用统计方法集中所有调查对象的意见,把每个专家的个人判断尽可能反映在最后归纳的集体意见中。从上述特点可知专家调查法是比较科学的,有广泛的用途,但是交换信件费时间,不能面对面讨论,所提问题很难提得很明确而不需要进一步解释,最后得出的一致意见具有一定程度的人为强制性。若与其他调查方法配合使用,就能取得更好的效果。
适用条件¶
在下列3种典型情况下,利用专家的知识和经验是有效的,也是唯一可选用的调查方法。
数据缺乏:数据是各种定量研究的基础。然而,有时数据不足,或数据不能反映真实情况,或采集数据的时间过长,或者付出的代价过高,因而无法采用定量方法。
新技术评估:对于一些崭新的科学技术,在没有或缺乏数据的条件下,专家的判断往往是唯一的评价根据。
非技术因素起主要作用:当决策的问题超出了技术和经济范围而涉及到生态环境、公众舆论以致政治因素时,这些非技术因素的重要性往往超过技术本身的发展因素,因而过去的数据和技术因素就处于次要地位,在这种情况下,只有依靠专家才能作出判断。
此外,由于原始信息量极大,决策涉及的相关因素(技术、政治、经济、环境、心理、文化传统等等)过多,计算机处理这样大的信息量,费用很高。这时,从费用效果考虑,也应采用专家调查法。
最小均方差法¶
对于$n$个评价对象$S_{1}, S_{2}, \cdots, S_{n}$,每个评价对象有$m$个指标,其观测值分别为
$$
a_{i j}(i=1,2, \cdots, n ; j=1,2, \cdots, m)
$$
最小均方差法的出发点是: 如果$n$个评价对象关于某项指标的观测值都差不多,那么不管这个评价指标重要与否,对于这$n$个评价对象的评价结果所起的作用将是很小的。因此,在评价过程中就可以删除这样的评价指标。
最小均方差法的筛选过程如下:
$$
\mu_{j}=\frac{1}{n} \sum_{i=1}^{n} a_{i j}
$$$$
s_{j}=\sqrt{\frac{1}{n} \sum_{i=1}^{n}\left(a_{i j}-\mu_{j}\right)^{2}}, \quad j=1,2, \cdots, m
$$
$$
{S}_{j_{0}}=\min _{1 \leq j \leq m}\left\{{s}_{j}\right\}
$$
- 如果最小均方差$S_{j_{0}} \approx 0$,则可删除与$S_{j_{0}}$对应的指标 。考察完所有指标,即可得到最终的评价指标体系。
极大极小离差法¶
对于$n$个评价对象$S_{1}, S_{2}, \cdots, S_{n}$,每个评价对象有$m$个指标,其观测值分别为
$$
a_{i j}(i=1,2, \cdots, n ; j=1,2, \cdots, m)
$$
极大极小离差法的筛选过程如下:
$$
d_{j}=\max _{1 \leq i,k \leq n}\left\{\left|a_{i j}-a_{k j}\right|\right\}, j=1,2, \cdots, m
$$
$$
d_{j_{0}}=\min _{1 \leq j \leq n}\left\{d_{j}\right\}
$$
- 如果最小离差$d_{j_{0}} \approx 0$,则可删除与$d_{j_{0}}$对应的指标$x_{j_{0}}$,考察完所有指标,即可得到最终的评价指标体系。
参考文献