熵权法模版
熵权法的目的是客观赋予每一个评价指标权重,而非主观判断或依靠所谓问卷调查
熵:是描述混乱程度的量纲.
信息熵:平均而言发生一个事件我们得到的信息量大小.(得到的信息越多,已掌握的信息越少)
熵权法:是一种可以对多对象、多指标进行综合评价的方法,其评价依据来源于数据本身,几乎不受主观因素的干扰.
它的基本思想是:信息熵小→得到的信息少,掌握的信息多→这组信息更靠谱→权重大.
step1 正向化处理
- 某个指标越小越好:极小型转极大型 max − x
或1/x -
某个指标越接近某个值越好: $$M=\max\left\{|x_i-x_{\mathrm{best}}|\right\},\quad\tilde{x}_i=1-\frac{|x_i-x_{\mathrm{best}}|}M$$
- 落在某个区间最好
区间型转极大型:数值不要太大也不要太小,落在某个区间最好,如人体温度值落在36~37°C最好.
设对于一组区间型指标{xi}其最佳区间为[a, b]那么可以这样正向化:
先算最值到边界的最大距离M = max {a − min {xi}, max {xi} − b},再令各元素x̃i $$\begin{aligned}&\tilde{x}_i=\begin{cases}1-\frac{a-x_i}M&,x_i<a\\1&,a\leq
x_i\leq
b\\1-\frac{x_i-b}M&,x_i>b&\end{cases}\end{aligned}$$
step2标准化处理
已有正向化处理之后的矩阵 $\begin{aligned}& X=\begin{bmatrix}x_{11}&x_{12}&\cdots&x_{1m}\\x_{21}&x_{22}&\cdots&x_{2m}\\\varvdots&\varvdots&\ddots&\varvdots\\x_{21}&\cdots&x_{2m}\end{bmatrix}\end{aligned}$
设标准化的矩阵为Z,那么Z中的每一个元素:$\tilde{z}_{ij}=\frac{x_{ij}}{\sqrt{\sum_{i=1}^nx_{ij}^2}}$
得到标准化矩阵 $$\tilde{Z}=\begin{bmatrix}\tilde{z}_{11}&\tilde{z}_{12}&\cdots&\tilde{z}_{1m}\\\tilde{z}_{21}&\tilde{z}_{22}&\cdots&\tilde{z}_{2m}\\\vdots&\vdots&\ddots&\vdots\\\tilde{z}_{n1}&\tilde{z}_{n2}&\cdots&\tilde{z}_{nm}\end{bmatrix}$$
step3计算信息熵和熵权
计算信息熵 $$e_j=-\frac1{\ln n}\sum_{i=1}^np_{ij}\ln\left(p_{ij}\right)(j=1,2,\cdots,m)$$ 求出每一个特征的信息效用值 dj = 1 − ej 归一化求得熵权 $$W_j=d_j/\sum_{j=1}^md_j\left(j=1,2,\cdotp\cdotp\cdotp,m\right)$$