数据包络分析法的思想和原理

一个经济系统或一个生产过程可以看成一个单元在一定可能范围内, 通过投人一定 数量的生产要素并产出一定数量的“产品”的活动。虽然这些活动的具体内容各不相同, 但其目的都是尽可能地使这一活动取得最大的 “效益”。这样的单元被称为决策单元 (decision making units, DMU)。可以认为每个 DMU 都代表一定的经济意义, 它的基本 特点是具在一定的输人和输出, 并且在将输人转换成为输出的过程中, 努力实现自身的决策目标。

DMU 的概念是广义的, 可以是一个大学, 也可以是一个企业, 也可以是一个国家。 在许多情况下, 我们对多个同类型的 DMU 更惑兴趣。所谓同类型的 DMU, 是指具有以 下特征的 DMU 集合:具有相同的目标和任务;具有相同的外部环境; 具有相同的输人 和输出指标。另外, 在外部环境和内部结构没有多大变化的情况下, 同一个 DMU 的不同 时段也可视为同类型 DMU。

在评价各 DMU 时,评价的依据是决策单元的“输人”数据和“输出”数据。根据输人 和输出数据来评价决策单元的优劣, 即所谓评价部门 (单位)间的相对有效性。由经验可 以断定:每个决策单元的有效性将涉及两个方面。

数据包络分析 (data envelopment analysis, DEA) 是著名运筹学家 A. Charnes 和 W. W. Copper 等学者以 “相对效率”概念为基础, 根据多指标投人和多指标产出对相同类型 的单位(部门) 进行相对有效性或效益评价的一种新的系统分析方法。它是处理多目标决 策问题的好方法。它应用数学规划模型计算比较决策单元之间的相对效絑, 对评价对象 做出评价。 通常应用是对一组给定的决策单元, 选定一组输入、输出的评价括标, 求所关心的特 定决策单元的有效性系数, 以此来评价决策单元的优尒, 即被评价单元相对于给定的那组 决策单元中的相对有效性。也就是说, 通过输入和输出数据的综合分析, DEA 可以得出每个 DMU 综合效率的数量指标。据此将各决策单元定级排阶, 确定有效的决策单元, 并 可给出其他决策单元非有效的原因和程度。即它不仅可对同一类型各决策单元的相对有 效性做出评价与排序, 而且还可以进一步分析各决策单元非 DEA 有效的原因及其改进 方向,从而为决策者提供重要的管理决策信息。 这是一个多输人一多输出的有效性综合评价问题。多输人/多输出正是DEA 重要 而引人注意的地方, 这是它自身突出的优点之一。可以说, 在处理多输人一多输出的有效 性评价方面, DEA 具有绝对优势。DEA 特别适用于具有多输人多输出的复杂系统, 这主 要体现在以下几点。

DEA 最突出的优点是无须任何权重假设, 每一输入输出的权重不是根据评价者的主观认定, 而是由决策单元的实际数据求得的最优权重。因此, DEA 方法排除了很多主观 因素,具有很强的客观性。

DEA 是以相对效率概念为基础,以凸分析和线性规划为工具的一种评价方法。这种 方法结构简单,使用比较方便。自从 1978 年提出第一个 DEA 模型 $C C^2 R$ 模型并用于 评价部门间的相对有效性以来, DEA 方法不断得到完善并在实䏡中被广泛应用, 诸如被 共服务部门, 如学校、医院,某些文化设施等的评价方面被认为是一个有效的方法。现在, 有关的理论研究不断深人, 应用领域日益广泛。应用 DEA 方法评价部门的相对有效性 的优势地位,是其他方法所不能取代的。或者说, 它对社会经济系统多投人和多产出相对 有效性评价, 是独具优势的。

数据包络分析法的模型和步骤

模型介绍

在社会、经济和笪理领域中, 常常需要对具有相同类型的部门、企业或者同一单位不同时期的相对效率进行评价, 这些部门、企业或时期称为决策单元。评价的依据是决策单 元的一组投人指标数据和一组产出指标数据。投人指标是决策单元在社会、经济和管理 活动中需要耗费的经济量; 产出指标是决策单元在某种投人要素组合下, 表明经济活动产出成效的经济量。指标数据是指实际观测结果。根据投入指标数据和产出指标数据评价决策单元的相对效率,即评价部门、企业或时期之间的相对有效性。

$\mathrm{C}^2 \mathrm{R}$ 模型是 DEA 的第一个模型。我们主要来介绍它。

设某个 $\mathrm{DMU}$ 在一项生产活动中的输人向量为 $x=\left(x_1, x_2, \cdots, x_m\right)^{\mathrm{T}}$, 输出向量为 $\boldsymbol{y}=\left(y_1, y_2, \cdots, y_2\right)$ 。我们可以用 $(x, y)$ 来表示这个 DMU的整个生产活动。

现设有 $n$ 个 $\mathrm{DMU}_j(1 \leqslant j \leqslant n), \mathrm{DMU}_j$ 对应的输人、输出向量分别为: $$ \boldsymbol{x}_j=\left(x_{1 j}, x_{2,}, \cdots, x_{m j}\right)^{\mathrm{T}}>0 \quad j=1,2, \cdots, n $$ $\boldsymbol{y}_j=\left(y_{1 j}, y_{2 j}, \cdots, y_{x j}\right)^T>0 \quad j=1,2, \cdots, n$ 而且 $x_{i j} > 0, y_{r j} > 0, i=1,2, \cdots, m ; r=1,2, \cdots, s$ 即每个决策单元有 $m$ 种类型的“输人”以及 $s$ 种类型的“输出”。 $x_{i j}$ 为第 $j$ 个决策单元对第 $i$ 种类荊眚人的投人量; $y_{i j}$ 为第 $j$ 个决策单元对第 $r$ 种类型辑出的产出量。 $x_{i j}$ 和 $y_{r i}$ 为已知的数据, 可以根据历史资料得到, 也即是实际观测到的数据。

由于在生产过程中各种输人和输出之间的地位与作用不同, 因此要对 DMU 进行评价, 须对它的输人和输出进行“综合”, 即把它们看作只有一个总体输人和一个总体输出的生产过程,这样就需要赋予每个输人、输出恰当的权重。

问题是, 由于我们在一般情况下对输入、输出量之间的信㿝结构了解较少或者它们之间的相互代替性比较复杂, 也由于我们想尽量避免分析者主观意志的影响, 我们并不事先给定输入、输出权向量: $\boldsymbol{v}=\left(v_1, v_2, \cdots, v_m\right)^{\mathrm{T}}, \boldsymbol{u}=\left(u_1, u_2, \cdots, u_{\varepsilon}\right)^{\mathrm{T}}$, 而是先把它们看作变向量。然后在分析过䅣中再根据某种原则来确定它们。 在这里, $v_i$ 为对第 $i$ 种类型输入的一种度量 (权); $u_r$ 为对第 $r$ 种类型输出的一种度量(权)。

每个决策单元 $\mathrm{DMU}_j$ 都有相应的效率评价指数: $$ h_j=\frac{u^{\mathrm{T}} y_i}{v^{\mathrm{T}} x_j}=\frac{\sum_{r=1}^s u_r y_{rj}}{\sum_{i=1}^m v_i x_{i j}}, j=1,2, \cdots, n $$

我们总可以适当地取权系数 $v$ 和 $u$, 使得 $h_j \leqslant 1$ 。 对较少的输人而得到相对较多的输出。这样, 如果我们要对 $\mathrm{DMU}_{j_0}$ 进行评价, 看 $\mathrm{DMU}_{j_0}$ 在这 $n$ 个 DMU 中相对来说是不是最优的。我们可以考察当尽可能地变化权重时, $h_{j_0}$ 的 最大值究竞是多少。以第 $j_0$ 个决策单元的效率指数为目标, 以所有决策单元 (含第 $j_0$ 个 决策单元)的效率指数为约束, 就构造出如下的 $\mathrm{C}^2 \mathrm{R}$ 模型: $$ \max h_{j_0}=\frac{\sum_{r=1}^{\prime} u_r y_{j_0}}{\sum_{i=1}^m v_i x_{i_{j_0}}} $$ s. t. $\frac{\sum_{r=1}^j u_{,} y_{r j}}{\sum_{i=1}^m v_i x_{i j}} \leqslant 1 \quad j=1,2, \cdots, n$ $$ v=\left(v_1, v_2, \cdots, v_m\right)^{\mathrm{T}} \geqslant 0 $$ $$ u=\left(u_1, u_2, \cdots, u_1\right)^T \geqslant 0 $$ 其中 $v \geqslant 0$ 表示对于 $i=1,2, \cdots, m, v_i \geqslant 0$, 并且至少存在某 $i_0\left(1 \leqslant i_0 \leqslant m\right), v_{10}>0$ 。对 于 $u \geqslant 0$ 含义相同.

上式是一个分式规划问题, 使用 Charnes-Cooper 变化, 即令: $$ t=\frac{1}{v^{\mathrm{T}} x_0}, \quad \omega=t v, \quad \mu=t u $$ 可变成如下的线性规划模型: $$ \text { (P) }\left\{\begin{array}{l} \max h_{j_0}=\mu^{\mathrm{T}} y_0 \\ \text { s. t. } \omega^{\mathrm{T}} x_j-\mu^{\mathrm{T}} y_j \geqslant 0 \quad j=1,2, \cdots, n \\ \omega^{\mathrm{T}} x_0=1 \\ \omega \geqslant 0, \quad \mu \geqslant 0 \end{array}\right. $$

用线性规划的最优解来定义决策单元 $j_0$ 的有效性。

不难看出, 利用上述模型来评价决策单元 $j_0$ 是不是有效是相对于其他所有决策单元 而言的。

对偶模型

我们注意到 $\mathrm{C}^2 \mathrm{R}$ 可用线性规划 $P$ 来表达。而线性规划一个极重要的、极有效的理论 是对偶理论,通过建立对偶模型更易于从理论上及从经济意义上作深人分析。

该线性规划的对偶规划为: $$ \left(D^{\prime}\right)\left\{\begin{array}{l} \min \theta \\ \text { s. t. } \sum_{j=1}^n \lambda_j x_j \leqslant \theta x_0 \\ \sum_{j=1}^n \lambda_i y_j \geqslant y_0 \\ \lambda_j \geqslant 0 \quad j=1,2, \cdots, n \\ \theta \text { 无约束 } \end{array}\right. $$

应用线性规划对偶理论, 我们可以通过对偶规划来判断 $\mathrm{DMU}_{j_0}$ 的有效性。 为了讨论及应用方便, 进一步引入松弛变量 $s^{+}$和剩余变量 $s^{-}$, 将上面的不等式约束变为等式约束,则可变为: $$ \text { (D) }\left\{\begin{array}{l} \min \theta \\ \text { s. t. } \sum_{j=1}^n \lambda_j x_j+s^{+}=\theta x_0 \\ \sum_{j=1}^n \lambda_i y_j-s^{-}=y_0 \\ \lambda_j \geqslant 0 \quad j=1,2, \cdots, n \\ \theta \text { 无约束 } s^{+} \geqslant 0, s^{-} \geqslant 0 \end{array}\right. $$ 以后直接称线性规划 $(D)$ 为规划 $(P)$ 的对偶规划。 下面给出几条定理与定义, 目的是为以后模型的应用做准备。

定理 1 :线性规划 $(P)$ 和其对偶规划 $(D)$ 均存在可行解, 所以都存在最优值。假设它 们的最优值分别为 $h_{j_0}^*$ 与 $\theta^*$, 则 $h_{j_0}=\theta^* \leqslant 1$ 。

定义 1 :若线性规划 $(P)$ 的最优值 $h_{j_0}=1$, 则称决策单元 $\mathrm{DMU}_{j_0}$ 为弱 DEA 有效。

定义 2 若线性规划 $(P)$ 的解中存在 $\omega^*>0, \theta^*>0$, 并且其最优值 $h_{j_0}^*=1$, 则称决策 单元 $\mathrm{DMU}_{t_0}$ 为 $\mathrm{DEA}$ 有效 $\left(\mathrm{C}^2 \mathrm{R}\right)$ 。

弱 DEA 有效即具备了有效性的基本条件。DEA 有效则表明各项投人及各项产出 不能置之一旁, 即这些投人及产出都对其有效性作了不可忽视的贡献。

定理 2 (1) $\mathrm{DMU}_{j_0}$ 为弱 DEA 有效的充分必要条件是线性规划 $(D)$ 的最优值 $\theta^*=1$ 。 (2) $\mathrm{DMU}_{j_0}$ 为 DEA 有效的充分必要条件是规划 $(D)$ 的最优值 $\theta^*=1$, 并且对于每个 最优解 $\lambda^*, s^{*-}, s^{*+}, \theta^*$, 都有 $s^{*+}=0, s^{*+}=0$ 。

下面进一步说明一下 DEA 有效性的经济意义。即我们能够用 $\mathrm{C}^2 \mathrm{R}$ 判定生产活动是否同时技术有效和规模有效。结论如下:

另外, 通常我们还可用 $C^2 R$ 模型中 $\lambda_j$ 的最优值来判别 DMU 的规模收益情况。结论 如下:

检验 $\mathrm{DMU}_{j_0}$ 的 DEA 有效性时, 可利用线性规划, 也可利用对偶线性规划。无论哪种方法都不方便, 通过构造一个稍加变化的模型可使这一检验简化。这就是具有非阿基米德无穷小的 $\mathrm{C}^2 \mathrm{R}$ 模型(详见有关文献)。利用此模型可以一次性判断出决策单元是 DEA 有效, 还是弱 DEA 有效, 或者是非 DEA 有效。如果某个决策单元不属于 DEA 有效, 一 个很自然的问题就会产生: 它与相应的DEA有效的 “差距”有多大, 或者说, 与同类型的 其他决策单元相比, 需要在哪些方面作何等程度的努力, 才可达到 DEA 有效? 这是我们 需要考虑的问題。

另外, 由于实际生产过程中积极活动的多样性, 或决策者在评价活动中的作用不同, 在基本模型 $\mathrm{C}^2 \mathrm{R}$ 的基础上,又发展、派生出一些新的 DEA 模型。限于篇蝠问题,这里不做详细介绍。