文章快速检索  
  高级检索
基于AHP和PCA的多指标评价建模方法及应用
刘爽1,2, 吕永波1, 张仲义1    
1. 北京交通大学交通运输学院, 北京 100044;
2. 教育部科技发展中心, 北京 100080
摘要: 提出一种多指标评价建模方法,并以学术期刊核心竞争力评价为例对该方法进行说明验证.本建模方法针对底层指标和上层指标的特点,将主成分分析法和Softmax回归相结合用于底层评价指标权重的确定,应用层次分析法对上层指标的权重进行确定.在方法应用验证中,在分析学术期刊核心竞争力的内涵、特征和表现形式的基础上,构建了学术期刊核心竞争力评价指标体系;然后应用本方法对学术期刊核心竞争力进行评价.经验证分析可知,本评价建模方法在多指标评价情况下,具有求解简便、精确度高的优点.
关键词: 学术期刊     多指标评价     主成分分析法     Softmax回归     层次分析法    
Multi-index Evaluation Modeling Method Based on AHP and PCA and Its Application
LIU Shuang1,2 , LÜ Yongbo1, ZHANG Zhongyi1     
1. School of Traffic and Transportation, Beijing Jiaotong University, Beijing 100044, China;
2. Science and Technology Development Center, Ministry of Education, Beijing 100080, China
Abstract: This paper proposes a multi-index evaluation modeling method, and evaluation of the core competences of academic journals is used to verify the feasibility of this method. According to the characteristics of the underlying and upper indices, this modeling method is used to determine the weights of the underlying index by combining principal component analysis (PCA) and Softmax regression, and by using an analytic hierarchy process (AHP) to determine the weights of the upper index. In the application and validation of the method, which is based on analysis of the connotation, characteristics, and manifestations of the core competences of academic journals, this paper constructs an evaluation index system for such core competences. Through validation analysis, it is shown that the proposed evaluation modeling method provides the advantage of obtaining simple and highly accurate solutions in multi-index evaluation cases.
Key words:
academic journal     multi-index evaluation     principal component analysis (PCA)     Softmax regression     analytic hierarchy process (AHP)    

1 引言

评价建模方法是科学决策的基础,其重要性越来越得到人们的广泛认同,并逐渐形成了一套庞大的方法体系.

目前,评价建模方法主要以统计分析和层次分析法为主[1]. 统计分析的主要优点是可以较为直观地比较不同指标对学术期刊核心竞争力的影响,容易理解,但其只是宏观统计,提供的信息量受到限制,无法具体到某种期刊进行微观量化分析. 层次分析法是目前应用最为广泛的期刊评价方法,它可以有效简洁地对非定量事物做定量分析,避免评价中的主观影响,但当评价指标过多时,会出现数据统计量大、权重难以确定的缺点.

因此,本文提出了一种多指标评价建模方法. 该方法采用层次分析法进行学术期刊的上层指标的权重确定,而在底层指标的权重确定方面,引入机器学习的方法,先用主成分分析法对底层指标进行降维,再采用Softmax回归算法对降维后的指标进行权重学习. 该方法有效地解决了层次分析法在多指标情况时,出现的方法操作复杂、权重难以确定的问题,而且综合有效地利用了多指标信息,提高了评价精度.

层次分析法(analytic hierarchy process,AHP)是一种定性和定量相结合的多目标决策方法,它把一个复杂问题分解成若干组成因素,并按支配关系形成层次结构,然后应用两两比较的方法确定各因素的相对重要性,计算各因素的权重[2, 3].

主成分分析法(principal component analysis,PCA)是目前应用很广泛的一种代数特征提取方法,是一种基于变量协方差矩阵对数据中的信息进行处理、压缩和抽提的有效方法[4]. Softmax回归是机器学习中的一种分类算法,可以对已有样本进行多特征学习[5]. 采用主成分分析法与Softmax回归相结合的方法对底层指标进行评价,可以有效消除底层指标之间的相关性,提高评价精度.

学术期刊评价是评价建模方法的一个重要应用,而学术期刊的核心竞争力评价作为学术期刊评价的一部分,在评价过程中往往需要以多个指标为准则,又由于指标之间的重要程度有差异,因此需要对影响学术期刊核心竞争力的多个指标进行建模,客观、综合地进行评价. 因此,以学术期刊核心竞争力评价对本文提出的多指标评价建模方法进行应用说明.

2 学术期刊核心竞争力评价指标体系的构建

目前,评价指标体系的构建方法主要有基于层次聚类的方法和基于专家经验的方法. 基于层次聚类的方法,其主要思想是将所有的评价指标放在一个统一的框架中进行聚类学习,形成自底向上的多层指标体系[6]. 而基于专家经验的方法,则是依赖领域知识构建评价指标体系. 基于层次聚类的评价指标体系构建方法的优点在于可以聚类学习到评价指标之间的隐含关系,但其评价精度一般低于基于专家经验的方法[7]. 因此,本文采用基于专家经验的评价指标体系构建方法.

对于学术期刊核心竞争力的定义,学术界有不同的理解. 吴照云认为: “学术期刊核心竞争力,本质上是指学术期刊获取稀缺资源和充分利用稀缺资源的创新能力”[8]. 伏春兰认为: “期刊的核心竞争力就是指该期刊在市场竞争的条件下,以价值创造为核心,在经营和发展中保持独特竞争优势的核心资源和能力的组合”[9]. 于华东认为: “期刊的核心竞争力是该刊所独有的特色竞争力和创新性的竞争力”[10].

上述定义均是从学术期刊的内在出发,对学术期刊核心竞争力进行解释. 但在对学术期刊核心竞争力进行评价时,评价指标的选取多依赖于其外在表现. 故本文从学术期刊的外在表现出发对学术期刊核心竞争力做出定义.

学术期刊核心竞争力是期刊组织经过长期积淀且在一定规模和实力后才具备的,能够带来持续竞争优势的综合能力. 这种能力以其独特的资源为基础、以强大的品牌效应为外在表现,使期刊组织能够长期地吸引、拥有和控制作者与读者,使选题与策划、组稿与审稿、编校与排版、发行与营销等环节实现有机融合. 基于此,提出并构建了学术期刊核心竞争力评价指标体系.

2.1 评价指标的选择

评价指标的选择是由评价目标与实际情况共同决定的. 建立评价指标体系时,要将评价目标层层分解,各指标既要能够全面反映评价对象的特征与状态,又要考虑数据的收集和获取能力[11, 12]. 因此,综合考虑学术期刊核心竞争力定义及特征,参考传统纸质期刊竞争力的特点,学术期刊的核心竞争力主要表现在其学术影响、期刊发展和社会影响3个方面,本文从这3个方面入手对学术期刊的核心竞争力进行评价.

1) 学术影响

学术期刊的学术影响是指以学术期刊的学术水平、学术特色为根本所体现出来的一种影响力,本文从论文质量、作者水平和收录状态3个方面来评价[13, 14].

2) 期刊发展

期刊发展主要是指从人力资源角度看待期刊的规模以及增长状况. 本文从期刊的规模要素、增长因素和效率因素3个方面来评价期刊发展.

3) 社会影响

学术期刊作为一种媒体,能传播学术信息,发表学术研究成果. 学术期刊的存在依据是其社会价值,它源于学术期刊本身的内在价值功能[15]. 本文主要从用户对期刊的认知度、满意度及忠诚度3个方面来评价学术期刊的社会影响.

构建学术期刊核心竞争力评价的详细指标分类体系如表 1所示.

表 1 学术期刊核心竞争力的评价指标体系Tab. 1 Core competitiveness of academic journals evaluation index system
2.2 评价指标的获取

本文中学术期刊核心竞争力的评价指标体系由3层组成. 评价指标的获取方法共分为3种:

一、二级指标为领域知识,通过专家打分方式获取. 按照层次分析法的原理设计一个打分表,这个表中要对打分的原则做必要的解释以帮助专家合理地区分层次. 为了增强评价的客观性,这个环节应有多个专家打分,最后通过计算平均值,获得每一项的最后得分.

三级指标主要为量化信息,可从统计数据获取,如总被引次数、影响因子、是否被SCI(science citation index)收录等指标可以借助SCI、SSCI(social sciences citation index)、JCR(journal citation reports)以及我国的引文索引书库获得或者直接由网站提供. 三级指标中的部分主观认知数据,如服务水平、易用性等,可通过问卷调查方式获取. 综合汇总调查结果,计算各项平均值,可获得各指标的最终得分.

3 基于AHP和主成分回归的多指标评价建模方法

由于学术期刊核心竞争力评价指标体系具有底层指标多、上层指标非定量的特点,故本文提出了基于层次分析法和主成分分析法的多指标评价建模方法.

多指标评价建模方法是指根据指标体系中各影响因素(指标)的作用赋予不同大小的权重,最后用加权等方法将各指标组合成一个综合指标. 因此,在多指标评价建模方法中,主要目的是确定各指标值的权重,即量化第2.1节中构建的指标体系中各层次的权重. 常用的确定权重的方法有: 常权综合法、变权综合法、层次分析法等[16, 17, 18, 19]. 这些方法适用于较高层次、抽象的评价,即本文中的一级指标和二级指标的权重确定. 对于三级指标中的多变量且变量间高度相关的情况,会造成评价结果差,不能准确反映竞争力的情况. 因此,本文采用主成分分析法和Softmax回归对三级指标的权重进行确定,一级指标和二级指标的权重则采用层次分析法来评价学术期刊的核心竞争力. 评价框架如图 1所示.

图 1 综合评价整体框图Fig. 1 The overall diagram of comprehensive evaluation diagram
3.1 三级指标权重确定

在本评价指标体系的三级指标中,存在的主要问题是,指标值太多且相互之间具有一定的相关性,容易造成使评价结果过拟合,使结果不能正确评价学术期刊的核心竞争力. 因此,本文先采用PCA算法对2.1节中的评价指标体系的三级指标进行降维,然后采用Softmax回归方法对降维后的指标进行权重确定.

在PCA中,数据从原来的坐标系转换到了新的坐标系,新坐标系的选择是由数据本身决定的. 第1个新坐标轴选择的方向是原始数据中方差最大的方向,第2个新坐标轴的选择和第1个坐标轴正交且具有最大方差的方向. 该过程一直重复,重复次数为原始数据中特征的数目. 而大部分方差都包含在最前面的几个新坐标轴中. 因此,可以忽略余下的坐标轴,即对数据进行了降维处理[20, 21, 22].

其具体步骤如下:

1) 对原始数据进行归一化预处理.

2) 计算归一化之后的数据的协方差矩阵,然后计算该协方差矩阵的特征值和特征向量.

3) 将特征值从大到小排序,并保留最大的N个特征值所对应的特征向量.

4) 将原始数据转换到上述N个特征向量构建的新空间中.

在对原始数据降维之后,需要确定新空间中的N个特征的权重,在本文中,采用Softmax回归法进行权重确定. Softmax回归是机器学习中的算法,主要用于解决多分类问题,其得到的结果是每一种分类结果的概率.

其具体步骤如下:

1) 请专家就原始数据中的各学术期刊的二级指标打分,打分一般采用5级打分制,即表现最好的评价对象得5分,最差的打1分(如某期刊的论文质量较好,可打4分或5分),即评分向量为

Q=[1, 2, 3, 4, 5]T

2) 将经过PCA降维后的新特征作为输入向量X,步骤1)中的专家打分作为类别标签y,训练Softmax回归模型,得到打分类别权重向量W1W2W3W4W5.

3) 将这些权重向量代回Softmax回归中,在得到待评价的期刊的输入向量后,即可求得该期刊属于各打分级别的概率P.

4) 根据式V=PTQ,即可得到该期刊对应的二级指标值.

3.2 一、二级指标权重确定

本文采用层次分析法确定一、二级指标权重. 层次分析法的基本思想就是将组成复杂问题的多个元素权重的整体判断转变成对这些元素进行“两两比较”,然后再转为对这些元素的整体权重进行排序判断,最后确立各元素的权重[23]. 其具体步骤如下:

1) 建立递阶层次的评价指标体系. 即本文2.1节中的学术期刊核心竞争力的评价指标体系.

2) 构建各层次中的判断矩阵. 请领域专家对表 1中的同一层次(即一级指标、二级指标)的指标进行两两比较,其比较结果以1-9标度法表示,各级标度的含义见表 2.

表 2 1-9标度的含义Tab. 2 Meanings of 1-9 mark degree
标度含义
1两个因素重要性相同
3前一个因素比后一个因素稍重要
5前一个因素比后一个因素明显重要
7前一个因素比后一个因素强烈重要
9前一个因素比后一个因素极端重要
2,4,6,8为上述相邻判断的中值

3) 对于同一层次的n个指标,可得到判断矩阵A=(aij). 判断矩阵中的值应满足下列条件:

4) 计算指标权重. 求出判断矩阵的最大特征根λmax及相应的特征向量W0. W0即为各指标的权重.

5) 一致性检验. 计算随机一致性比率:

其中IR为平均随机一致性指标,IC=(λmax-n)/(n-1),为一致性指标. 若RC小于0.1,则认为判断矩阵具有满意的一致性,所确定的权重较为合理,否则返回步骤2)重新调整.

4 方法应用验证

学术期刊核心竞争力模型由相应的指标体系及其权重系数组成,在确定评价指标体系的基础上,本文在第1层、第2场采用层次分析法确定权重系数. 底层指标的权重系数的确定,则先采用层次分析法进行降维,然后通过Softmax回归进行权重系数学习. 故实际应用部分包括层次分析法实际应用和主成分分析法实际应用两部分.

4.1 层次分析法实际应用

层次分析法中,请相关专家对一、二层指标进行两两比较后,得到判断矩阵. 经过专家分析打分,得到3个一级指标的判断矩阵为

由上可以看出,在评价学术期刊核心竞争力的3个一级指标中,学术水平对其的影响最大,社会影响次之,期刊发展较弱.

求出上面判断矩阵的最大特征根及相应的特征向量为

经计算,可得

经查表知,当n=3时,IR=0.58,得

故判断矩阵通过一致性检验. 对特征向量进行归一化处理,即可得到一级指标的权重向量为

同理可以得到二级指标相对于一级指标的权重向量. 具体结果见表 3.

表 3 评价指标及其权重Tab. 3 The evaluation indexs and weights
4.2 主成分分析法实际应用

本部分数据来自于中国科学技术信息研究所出版的2013年版《中国科技期刊引证报告》(扩刊版)和中国科学评价研究中心和武汉大学图书馆出版的《中国学术期刊评价研究报告(2013-2014)》.

由于不同学科期刊之间不具有可比性,故本文选取两书中“临床医学”类期刊数据进行分析,共387种期刊.

在《中国科技期刊引证报告》中,共给出了17项期刊的评价指标数据,对387种期刊的数据进行主成分分析,可得这些数据所对应的贡献率百分比和累积贡献率百分比如表 4所示.

表 4 各主成分贡献率及累计贡献率Tab. 4 The principal component contribution rate and the cumulative contribution rate
主成分特征值贡献率/(%)累计贡献率/(%)
11.04e+0793.393.3
27.28e+056.5399.83
31.29e+040.1299.95
44.41e+030.0499.99
174.68e-034.19e-08100

对降维后的数据通过Softmax回归进行学习,得到降维后的特征权重向量. 其中,评价等级采用《中国学术期刊评价研究报告(2013-2014)》中的数据.

对387个样本进行交叉验证可得,主成分个数与评价准确率如图 2所示.

图 2 主成分个数与准确率Fig. 2 The number of principal components and accuracy

图 2可以得出,当选择前4个主成分为Softmax回归的特征时,评价准确率最高,为83.5%.

若采用层次分析法对三层指标进行权重确定,由于原始评价指标数据为17维,采用层次分析法进行权重确定时,构造的判断矩阵即使多次校正,仍然不能通过一致性检验. 在该情况下,只能先降低评价准确率,再对主要指标进行期刊评价,若选取4个特征运用层次分析法,评价准确率仅为76.6%. 由此可见,采用PCA与Softmax回归相结合的权重确定方法的评价效果更好.

在本例中,继续增加特征个数,则评价准确率反而降低,主要是因为样本中存在噪声数据,若特征数目过多,Softmax回归模型对样本中的噪声也进行了学习,对样本形成了过拟合. 而之所以评价准确率无法再提高,主要原因是: 在样本的评价等级确定上,存在人为因素影响,部分样本评价等级与评价指标值相悖,影响Softmax回归模型的学习过程以及评价结果;另一方面,Softmax回归属于线性回归模型,无法有效地学习到评价指标与评价等级之间的非线性关系. 因此,实际应用本方法时,如果让多位专家对期刊评价等级以及评价指标值进行校正,可继续提高评价准确率.

5 结论

本文构建了学术期刊核心竞争力三层评价指标体系,基于此,提出了一种多指标评价建模方法. 该方法在一、二级指标中,采用层次分析法进行权重确定;在底层指标中,先采用PCA降维,然后对新指标采用Softmax回归方法进行权重学习.

由于该模型引入了PCA和Softmax回归,有效地解决了层次分析法在多指标情况下评价结果差的问题,且模型求解简单. 但该模型的不足之处在于噪声点对评价准确率的影响较大,下一步的工作主要是寻找方法降低噪声点对评价准确率的影响.

参考文献
[1] 靖飞, 俞立平. 一种新的学术期刊评价方法: 因子理想解法[J]. 情报杂志, 2012, 31(10): 22-26. Jing F, Yu L P. A new method to evaluate academic journals: Factor ideal solution[J]. Journal of Intelligence, 2012, 31(10): 22-26.
[2] 刘雨微, 王永骥, 刘磊, 等. 基于层次分析法的控制系统性能评估[J]. 计算技术与自动化, 2014, 33(4): 6-10. Liu Y W, Wang Y Y, Liu L, et al. Performance evaluation of control system based on the analytic hierarchy process[J]. Computing Technology and Automation, 2014, 33(4): 6-10.
[3] 高起蛟, 严凤斌, 池斌. 层次分析法(AHP)在数据质量评估中的应用[J]. 信息技术, 2011(3): 168-173. Gao Q J, Yan F B, Chi B. Application of AHP in data quality appraising[J]. Information Technology, 2011(3): 168-173.
[4] 朱明旱, 罗大庸, 易励群. 一种广义的主成分分析特征提取方法[J]. 计算机工程与应用, 2008, 44(26): 38-40. Zhu M H, Luo D Y, Yi L Q. Generalized PCA algorithm for feature extraction[J]. Computer Engineering and Applications, 2008, 44(26): 38-40.
[5] 王晟. 基于Softmax回归的电力仪表分类[J]. 现代计算机, 2014(6): 25-28. Wang S. Classification of electric instruments based on Softmax regression[J]. Modern Computer, 2014(6): 25-28.
[6] Lou T C, Tang J. Mining structural hole spanners through information diffusion in social networks[C]//International World Wide Web Conference. Berlin, Germany: Springer, 2013: 837-848.
[7] Song J P, Zhu Z L, Chris P. Availability, reliability, and security in information systems[M]//Lecture Notes in Computer Science. Berlin, Germany: Springer-Verlag, 2014.
[8] 吴照云. 关于中国学术期刊核心竞争力的思考[J]. 西南农业大学学报: 社会科学版, 2006, 35(5): 513-520. Wu Z Y. Some ideas about the core competitiveness of Chinese academic journals[J]. Journal of Southwest Agricultural University: Social Science Edition, 2006, 35(5): 513-520.
[9] 伏春兰. 人文社科期刊核心竞争力解读[J]. 吉林省经济管理干部学院学报, 2008, 22(6): 73-76. Fu C L. The core competitiveness of humanities and social sciences journal[J]. Journal of Jilin Province Economic Management Cadre College, 2008, 22(6): 73-76.
[10] 于华东. 略论学术期刊的评比与核心竞争力[J]. 江西财经大学学报, 2005(5): 117-120. Yu H D. Discussion on the appraisal and the core competence of academic journal[J]. Journal of Jiangxi University of Finance and Economics, 2005(5): 117-120.
[11] 自然科学学术期刊评价指标体系研究课题组. 自然科学学术期刊综合评价指标体系研究[J]. 中国科技期刊研究, 2001, 12(3): 165-168. Natural Science Academic Journals Evaluation Index System Research Group. Study on indicators for comprehensive appraisal of natural science journals[J]. Chinese Journal of Scientific and Technical Periodicals, 2001, 12(3): 165-168.
[12] 张积玉. 论人文社科学术期刊综合评估指标体系的构建[J]. 现代传播, 2010(12): 40-46. Zhang J Y. Construction of comprehensive evaluation index system of academic journals of humanities and social sciences[J]. Modern Communication, 2010(12): 40-46.
[13] 曹艳. 《情报资料工作》2008—2012年发文被引情况分析[J]. 科技情报开发与经济, 2014, 24(15): 128-131. Cao Y. The citation analysis of the papers published in in 2008-2012[J]. Sci-Tech Information Development and Economy, 2014, 24(15): 128-131.
[14] 许新军. h指数在期刊网络传播力评价中的应用[J]. 情报杂志, 2012, 31(11): 66-70. Xu X J. Application of h-index in evaluating journal network transmission power[J]. Journal of Intelligence, 2012, 31(11): 66-70.
[15] 魏晓萍, 杨思洛. 基于CNKI的期刊网络学术影响力研究[J]. 情报科学, 2010, 28(5): 747-750. Wei X P, Yang S L. The web academic influence of journal base on the CNKI[J]. Information Science, 2010, 28(5): 747-750.
[16] 陈敬全. 科研评价方法与实证研究[D]. 武汉: 武汉大学, 2004. Chen J Q. Study on evaluation method and empirical research[D]. Wuhan: Wuhan University, 2004.
[17] 李超. 国内期刊评价及其方法研究的进展与实践[J]. 情报科学, 2012, 30(8): 1232-1237. Li C. Research on development and practice of journal evaluation and its method in China[J]. Information Science, 2012, 30(8): 1232-1237.
[18] 邱均平, 李爱群. 国内外期刊评价的比较研究[J]. 重庆大学学报: 社会科学版, 2007, 13(3): 60-65. Qiu J P, Li A Q. Comparison of periodical evaluation both at home and abroad[J]. Journal of Chongqing University: Social Science Edition, 2007, 13(3): 60-65.
[19] 李爱群. 中、美学术期刊评价比较研究[D]. 武汉: 武汉大学, 2009. Li A Q. Comparative study on academic journals evaluation between America and China[D]. Wuhan: Wuhan University, 2009.
[20] 张弘, 赵惠祥, 刘燕萍, 等. 基于主成分分析法的科技期刊评价方法[J]. 编辑学报, 2008, 20(1): 87-90. Zhang H, Zhao H X, Liu Y P, et al. Evaluation method on Sci-Tech journals based on principal component analysis[J]. Acta Editologica, 2008, 20(1): 87-90.
[21] 于成龙. 基于PCA的特征选择算法[J]. 计算机技术与发展, 2011, 21(4): 123-125. Yu C L. Features selection algorithm based on PCA[J]. Computer Technology and Development, 2011, 21(4): 123-125.
[22] 韩小孩, 张耀辉, 孙福军, 等. 基于主成分分析的指标权重确定方法[J]. 四川兵工学报, 2012, 33(10): 124-126. Han X H, Zhang Y H, Sun F J, et al. The method of determining index weights based on principal component analysis[J]. Journal of Sichuan Ordnance, 2012, 33(10): 124-126.
[23] 邓雪, 李家铭. 层次分析法权重计算方法分析及其应用研究[J]. 数学的实践与认识, 2012, 42(7): 93-100. Deng X, Li J M. Research on computation methods of AHP wight vector and its applications[J]. Journal of Mathematics in Practice and Theory, 2012, 42(7): 93-100.
"http://dx.doi.org/10.13976/j.cnki.xk.2015.0416"
中国科学院主管,中国科学院沈阳自动化研究所、中国自动化学会共同主办。
0

文章信息

刘爽, 吕永波, 张仲义
LIU Shuang, LÜ Yongbo, ZHANG Zhongyi
基于AHP和PCA的多指标评价建模方法及应用
Multi-index Evaluation Modeling Method Based on AHP and PCA and Its Application
信息与控制, 2015, 44(4): 416-421.
INFORMATION AND CONTROL, 2015, 44(4): 416-421.
http://dx.doi.org/10.13976/j.cnki.xk.2015.0416

文章历史

收稿日期:2015-04-30
录用日期:2015-06-16
修回日期:2015-06-24

工作空间