HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0
首页 精品范文 评价指标论文

评价指标论文

时间:2022-10-08 11:26:05

评价指标论文

评价指标论文范文1

摘要:企业业绩评价是指运用数理统计和运筹学方法,采用特定的指标体系,对照统一的评价标准,按照一定的程序,通过定量和定性对比分析,对企业一定经营期间的经营效益和经营者业绩,作出客观、公正和准确的综合评价。包括评价主体、评价客体、评价目标、评价指标、评价标准、评价方法、评价程序和评价报告等要素。

关键词:企业;业绩;业绩评价;企业业绩评价体系

1企业业绩评价的概念

业绩一词,也有将其称作绩效或效绩的,反映的是人们从事某一活动的过程和结果的集合;评价是人们对这一过程和结果进行价值判断的过程;业绩评价作为企业管理中频繁提到的一个概念,则是指企业的不同利益相关者如政府、股东、债权人、财务分析师、供应商和客户、社会公众等为达到特定的目的,选择特定的标准,设定特定指标,并采用特定方法对企业在一定期间内的经营管理活动过程及结果作出客观、公正和准确的综合判断。

企业业绩评价也称为企业绩效评估或企业效绩衡量,在现实工作中也常常被称为“考核”、“考评”,而对于其书面解释更是“百花齐放,百家争鸣”,不同学者给出了不同定义,笔者认为,企业业绩评价是指运用数理统计和运筹学方法,采用特定的指标体系,对照统一的评价标准,按照一定的程序,通过定量和定性对比分析,对企业一定经营期间的经营效益和经营者业绩做出客观、公正和准确的综合评价。包括对企业经济效益的评价和对经营者业绩的评价。通过对企业经营绩效的评价,可以为企业各利益相关者提供决策依据,有利于促进企业改善经营管理,提高经济效益,增强企业核心竞争力。

2企业业绩评价的内容

一个完善且有效的企业业绩评价体系所涵盖的内容通常应包括评价主体、评价客体、评价目标、评价指标、评价标准、评价方法、评价程序和评价报告等要素。

2.1评价主体

评价主体指与评价对象的利益密切相关的利益相关者,主要包括投资者、债权人、管理者及职员、政府管理部门、供应商以及顾客等。

(1)投资者。投资者投入资本的目的是为了实现资本最大化的保值增值。一方面,投资者从投资决策角度对于企业业绩进行评价以决定其应否投资,这种评价也叫企业价值分析。另一方面,投资者从委托人角度会对其所投入企业的资源的保值增值情况予以充分关注,对作为人的企业经营者在企业价值创造中的贡献进行评价。

(2)债权人。债权人尽管通过契约享受固定收益,明确了其自身权益,不承担留剩风险和留剩收益,但如果企业破产、倒闭,债权人同样也会遭受损失。

(3)管理者和职员。企业管理者和职员的人力资本价值实现和薪水高低在很大程度上取决于企业的经营业绩。当企业经营失败时,他们就可能面临价值降低甚至完全丧失的风险,所以企业的各项决策所带给职员的人力资本的风险和财务资本投资者所承担的风险是相同的。对这些人力资本价值的保护要求企业在决策过程中应充分考虑职员利益。

(4)政府管理部门。政府一方面要考虑企业交纳的税金,另一方面要考虑整个社会的可持续发展。而这种可持续发展要求企业从整个社会的利益出发,合理利用资源,保护环境,在短期内这一要求可能会与企业的自身利益相冲突。因此,政府将采取相应的措施把对社会可持续发展的破坏纳入企业的经营成本当中,制定相应的评价体系来约束企业的行为。为此,政府管理部门应从行政管理和社会公众利益代表的角度对企业进行社会贡献评价,评价的内容包括企业所提供的税金、就业机会以及对职工的社会福利保险、环境保护等责任义务的履行情况。

(5)供应商。供应商是企业的长期合作伙伴,是企业价值链的重要环节。供应商通过对企业经营的可持续发展和企业信誉的评价来决定是否与企业建立长期合作关系。

(6)顾客。顾客是企业产品和服务的购买者,是企业实现价值增值的有力保障。顾客对企业进行评价的目的在于决定是否购买企业的产品和服务。

2.2评价客体

评价客体是指评价活动实施的对象。任何客体都是相对于特定的主体而言的,它由主体的需要而定。因此,评价客体的选择有赖于评价主体的确定,不同的评价主体决定了不同的评价对象,评价指标和标准也有差异,对评价对象的影响也不尽相同。

企业业绩评价的对象包括企业和经营管理者。评价结果对业绩评价对象必然会产生影响,势必关系到评价对象今后的发展。一般来说,以企业为评价对象,着重反映包括盈利能力、偿债能力、资产的管理水平、发展能力和综合竞争能力四个方面,评价的结果关系到企业的扩张、维持、收缩、转向或退出;以经营管理者为评价对象,则着重反映经营者对企业的经营、成长、发展的贡献和成果等方面,评价的结果则关系到管理者的选聘、职务的升降和报酬等问题。

2.3评价目标

企业业绩评价的目标是整个评价系统运行的指南和目的。没有明确的目标,整个业绩评价系统将处于无序状态。基于财务契约主体的多元性,业绩评价的目标也各不相同。例如:债权人在进行信贷或赊销决策时,要对企业的资信状况进行评价,业绩评价能够很好地评价企业的偿债能力,降低债权人的风险;投资者对企业进行业绩评价的目的则是进行投资决策,业绩评价能提供经理人的努力程度的信息等,让投资者更好地决定是否聘请该经理人;资源提供者对企业经营者进行的经营业绩评价,其目的主要是用于经营者聘任决策、报酬计划、公司治理结构的构建。

企业业绩评价的目标应当与企业总体战略目标相协调。业绩评价应当为企业战略的调整提供有用信息,并通过业绩评价引导人们的行为,使企业管理者和员工自觉地为实现企业的战略目标而努力。一般来说,企业业绩的评价目标主要体现在财务目标、价值目标和平衡目标三个方面。

2.4评价指标

评价指标是指根据评价目标和评价主体的需要而设计的、以指标形式体现的能反映评价对象特征的因素,是实施企业业绩评价的基础和依据。有财务方面的,如投资报酬率、成本利润率、销售利润率、每股收益率等;也有非财务方面的,如产品市场占有率、顾客满意程度、售后服务水平、产品质量、创新速度和能力等。可见,如果没有这些评价指标,业绩就无从展开,评价也不可能进行。因此,如何将反映企业生产经营状况的关键因素准确地体现在各具体指标上,是业绩评价系统设计的重要问题。

设计业绩评价指标通常的做法是,由社会公认的机构或行业部门设计共性指标,企业根据不同发展阶段的需要进行取舍,并适当补充一些个性指标。由于企业是社会的企业,经营环境的变化使越来越多的个人和群体的利益受到企业业绩的影响,在选择评价指标时则更要注意评价指标的规范性、通用性和可比性。需要说明的是,不同行业、不同性质的企业以及企业发展的不同阶段,评价指标的设置以及各指标的重要程度也不尽相同。

目前,业绩评价的评价指标由财务业绩定量评价指标和管理业绩定性评价指标两大体系构成。确定各项具体指标之后,再分别分配以不同的权重,使之成为一个完整的指标体系。

2.5评价标准

评价标准是指判断评价对象业绩优劣的基准。它是对企业的业绩进行价值判断的标尺,一般是根据数理统计方法经测试和调整后确定的。常用的标准有年度预算标准、资本预算标准和竞争对手标准等。具体选用标准时,一般应与评价客体相联系,评价标准的选择对评价结果有重大的影响。对比的标准不同,判断业绩好坏的标准也不同,得出的结论将有很大的区别。而且,按照不同的标准得出的业绩评价信息,所起的作用不同,它们是从不同的角度来满足企业战略性业绩管理的需要。此外,评价标准的选择还取决于评价的目的。

实务中,业绩评价标准分为财务业绩定量评价标准和管理业绩定性评价标准。财务业绩定量评价标准包括国内行业标准和国际行业标准两方面。国内行业标准根据国内企业年度财务和经营管理统计数据,运用数理统计方法,分年度、行业、规模统一测算。国际行业标准根据居于行业国际领先地位的大型企业相关财务指标实际值,或者根据同类型企业相关财务指标的先进值,在剔除会计核算差异后统一测算。财务业绩定量评价标准按照不同行业、不同规模及指标类别,划分为优秀、良好、平均、较低和较差五个档次。管理业绩定性评价标准根据评价内容,结合企业经营管理的实际水平和出资人监管要求等统一测算,并划分为优、良、中、低和差五个档次。

应该指出的是评价标准选定后并非一成不变,随着社会的快速发展,经济和技术环境等外部条件的不断变化,业绩评价的目的、评价的范围和出发点也会随之发生改变,评价标准也应相应地作出调整。从这种意义上来说,评价标准是发展变化的。然而,在一定时期和范围内评价标准应该具有相对的稳定性。

2.6评价方法

评价方法是根据评价指标对照评价标准进行价值判断,得出最终业绩评价结果的手段。它是将评价指标与评价标准联系在一起的纽带,因为在选择了评价指标和评价标准之后,还需要采用一定的评价方法,从而实施对评价指标与评价标准的运用,以获取客观公正的评价结果。显然,没有科学、合理的评价方法,评价指标和评价标准就成了孤立的评价要素,因而也失去了存在的意义。评价方法包括以下三方面的内容:

2.6.1财务业绩定量评价方法

财务业绩定量评价是运用功效系数法的原理,以企业评价指标实际值对照企业所处行业(规模)标准值,按照既定的计分模型进行定量测算。其基本步骤包括:①提取相关数据,加以调整,计算各项指标实际值;②确定各项指标标准值;③按照既定模型对各项指标评价计分;④计算财务业绩评价分值,形成评价结果。

2.6.2管理业绩定性评价方法

管理业绩定性评价是运用综合分析判断法的原理,根据评价期间企业管理业绩状况等相关因素的实际情况,对照管理业绩定性评价参考标准,对企业管理业绩指标进行分析评议,确定评价分值。其基本步骤包括:①收集整理相关资料;②参照管理业绩定性评价标准,分析企业管理业绩状况;③对各项指标评价计分;④计算管理业绩评价分值,形成评价结果。

2.6.3计算综合业绩评价分值,形成综合评价结果

根据财务业绩定量评价结果和管理业绩定性评价结果,按照既定的权重和计分方法,计算出业绩评价总分,并考虑相关因素进行调整后,得出企业综合业绩评价分值。综合评价结果是根据企业综合业绩评价分值及分析得出的评价结论,分为优、良、中、低和差五个等级。

2.7评价程序

业绩评价程序主要包括六个步骤,即第一步:明确战略目标;第二步:确定评价对象;第三步:寻找关键成功因素;第四步:设计评价指标并确定评价标准;第五步:进行业绩评价,得出评价结论;第六步,编制业绩评价报告。

2.8评价报告

评价报告是企业评价系统的输出信息,也是评价系统的结论性文件。它是根据业绩评价结果编制、反映被评价企业业绩状况的书面文件,由报告正文和附件构成。其中,评价报告正文应当包括评价目的、评价依据与评价方法、评价过程、评价结果以及评价结论、需要说明的重大事项等内容;评价报告附件应当包括企业经营业绩分析报告、评价结果计分表、问卷调查结果分析、专家咨询报告、评价基础数据及调整情况等内容。

评价主体以业绩评价对象为单位,通过会计信息系统及其它信息系统,获取与评价对象有关的信息,经过加工整理后得出业绩评价对象的评价指标数值或状况,并将该评价对象的评价指标的数值状况与预先确定的评价标准进行对比,然后通过分析找出产生差异的原因、责任及影响,从而得出评价对象业绩优劣的结论,形成企业业绩评价报告。

参考文献

1王化成.企业业绩评价[M].北京:中国人民大学出版社,2004

2张蕊.企业经管业绩评价理论与方法的变革[J].会计研究,2001(12)

3财政部统计评价司.企业业绩评价工件指南[M].北京:经济科学出版社,2002

评价指标论文范文2

(一)营销资源评价指标

企业营销资源来源非常的广泛,由企业对其进行统一配置,从而形成营销竞争力。营销资源具有双面性特点,并非每种营销资源都对营销战略发挥作用。,而有些营销资源对企业来说闲置无用,这些资源就是无效资源。在市场营销中,需及时掌握信息动态、收集市场情报,利用渠道商、卖场等信息反馈渠道,了解市场行情和竞争对手的现状。作为营销基础资源,人力资源也非常重要,竞争环境的不断变化要求企业不断优化和调整竞争力。衡量人力资源指标时,需根据人员流动率,人力资源优化配置的合理性等于(流动人员数/企业总员工)×100%。在产品市场上,品牌是以建立优势品牌的方法,引起消费者们的注意。企业营销过程中,资源增值能力的不断提高,可用品牌价值、企业知名度以及美誉度,对其进行衡量。

(二)营销创新评价指标

首先,营销理念的创新。在全球化经济发展背景下,国内企业面临着严峻的调整,所处环境开发度也不断增大。从企业长期的发展视角来看,每位员工都有创造性的想法和潜能,所谓管理人员,其责任就是要激发和挖掘员工们的潜力。以企业营销策略决策能力为例,又可以分成四个具体的指标。产品决策能力是衡量企业产品种类、包装以及样式和风格的决策能力。价格决策能力是产品定价能力;渠道决策能力主要是指衡量企业管理渠道、新营销渠道决策能力;促销决策能力主要是指市场竞争中根据需要采用促销手段吸引消费者能力。

(三)营销运行评价指标

对于目标完成能力而言,即在市场竞争中能够完成预期目标的能力;营销执行能力,则是通过企业资源的优化配置,来完成营销任务的能力。其中,目标完成能力评价指标中的经济效益指标达成率等于效益指标实际完成量与效益指标预期完成量的百分比。企业渠道资源的扩大能力主要有以下衡量指标:产品市场覆盖率=(产品覆盖市场/同类产品市场)×100%;客户增加量=现有客户保有量-原来客户保有量;供应商增加量=现有保有量-原来保有量;营销渠道投资力度=(现有营销渠道投资额-原来同时期营销渠道投资额)/原来同时期营销渠道投资额×100%。

二、市场营销竞争力评价步驟

对于企业而言,营销策略具体可分为:市场定位,该策略是锁定当前潜力市场,并且根据竞争者产品在现代市场上所处的位置,消费者需求来确定;产品策略,主要包括产品包装、商标以及颜色的合理安排,产品策略与整个企业营销活动成功与否,存在着非常密切的关联性;价格策略,即对企业生产的产品价格制定,其中包括产品成本、市场需求分析等内容;渠道策略,即产品流通渠道,其执行效果直接将决定着市场的开拓情况,以及营销目标能否实现。本文所研究的市场营销竞争力评价体系,在确定评价指标基础上,在企业营销竞争力评价指标权重确定时采用了德尔菲法,有效地克服了头脑风暴法之弊端,确保了各指标测评客观性、准确性。在此过程中,企业可根据市场竞争对手的情况,对其营销竞争力进行预测和评价,基于对结果的分析和考虑,不仅可以得到企业营销竞争力现状,而且有利于企业制定对于策略。在市场营销竞争力评价过程中,主要采取以下步骤。

(一)明确目标,构建适合企业的层次结构模型

实践中,根据实际情况,确定评价指标,然后依据评价指标的相互关系和内在逻辑关系,构建由各指标组成的评价结构体系。

(二)建立比较式判断矩阵

在判断矩阵建立过程中,根据企业营销竞争力评价体系各层次隶属性,基于对于数据资料的分析结论、专家意见,两两比较各指标因素。

(三)确定营销方向

在此过程中,企业还需根据实际情况,收集到的信息数据,估测出企业竞争对手的竞争力,然后将其反馈到战略运营管理体系之中,通过战略性决策的实施,来提高企业的营销水平和市场竞争力。

三、结束语

评价指标论文范文3

关键词:物流产业现代化评价指标体系构建

关于物流产业现代化的概念诠释

现代化是一个模糊、动态和综合的概念。实现现代化是一个永无终结、涉及政治、经济、社会等各方面的过程,是人类依靠先进的科学技术,从工业革命开始,经济社会不断向更高阶段发展的过程。

物流产业现代化的概念可以理解为:相对传统物流而言,借助计算机网络技术和信息技术等一系列先进技术的支撑,将原本分离的商流、物流、信息流和采购供应、生产、销售、回收等环节紧密联合起来,形成一个以全新的、速度更快、规模更大、效率更高、效益更好为特征的现代物流系统,以实现物流的系统化、信息化、自动化、网络化、智能化、柔性化、标准化等目标。其中,系统化是现代物流与传统物流的根本区别,强调了物流功能的整合;信息化是现代物流发展的必然要求,是自动化的基础,而智能化更是信息化和自动化的更高层次应用;网络化旨在打破物流信息“诸侯分割”局面,将物流结点连接在一起,实现商流、物流、信息流“三流”的统一;标准化是适应物流产业的社会化和国际化而对物流技术提出的新要求——实现全球标准化。

物流产业现代化评价指标体系构建原则

(一)科学性原则

物流现代化评价指标体系建立的目的,是能够对中国物流业现代化水平有一个客观的反映和评价。因此,要求指标体系客观地反映物流现代化的内涵、各子系统和指标间的相互关系,并能较好地量化流通现代化的目标实现程度。

(二)前瞻性原则

由于电子商务的飞速发展,引起了企业销售范围的不断扩大和销售方式及最终消费者购买方式的转变,从而促使了物流行业的兴起,并呈现出新的发展趋势。为了能更好地适应这些发展趋势的变化,在构建物流产业现代化评价统计指标体系时,应该充分考虑到随着物流业的发展而被赋予的新时期的含义和内容,做到具有前瞻性。

(三)综合性与系统性原则

现代化是一个广泛、综合、系统的范畴。现代化标准必须体现这种综合性与系统性,各个指标之间,要形成有机、有序的联系,从多方面反映现代化建设的进展情况。

(四)可操作性原则

过去,在构建统计指标体系时,往往只注重了统计工作的全面性、系统性的要求,将统计指标体系设计得过于繁琐,而对其可操作性考虑得较少,这样,通常会导致统计数据搜集的难度加大,统计成本增加。因此,在构建物流产业现代化评价统计指标体系时,应从易操作的角度出发,将物流统计建立在现有的统计基础之上,采取循序渐进的方式,从有条件的指标先起步,逐步推进。

(五)相对独立性原则

由于物流现代化的内涵与外延非常丰富,描述物流业发展状况的指标之间常常存在信息重叠的现象。因此,在选择指标时,应尽可能选择具有相对独立性的指标,以具有纵向、横向可比性的相对指标为主,以增加评价的准确性和科学性。

(六)简明实用原则

构建物流产业现代化评价指标体系的基本目的,就是要把复杂的物流产业现代化建设目标变为可以度量、计算、比较的数字、数据,以便为制定物流产业现代化建设的总体规划及方针政策提供定量化的依据。在建立物流产业现代化评价指标体系过程中,所选择的指标不可能面面俱到,否则会使指标体系十分繁杂,不便操作,甚至操作失灵。因此,合理、正确地选择有代表性、可比性、独立性、信息量大的指标是构建高效、系统的指标体系的关键。

(七)国际可比性原则

在物流产业现代化研究中,做一些适当的国际与地区间的比较是必要的,也是有利的。为便于进行国家与地区间的比较研究,应尽量使指标和资料的口径、范围与国际上常用的指标相一致。物流产业现代化评价指标体系设置

建立物流现代化评价指标体系的目的是为了全面描述和综合评价我国物流现代化的程度和进程,并提供必要的尺度。根据物流产业现代化的含义和建立指标体系应遵循的原则,本文从物流产业现代化保障和物流产业现代化成就两个方面设置指标体系。

(一)反映物流产业现代化保障方面的指标

物流产业基本情况指标。该指标反映了物流业在人、财、物等方面的基本概况,也是其他系统评价指标的基础。主要包括:物流产业就业人员、物流产业资本规模、物流产业固定资产投资总额、物流产业基础设施等指标。其中,基础设施又包括自有仓储面积、货运车辆数、租用仓储面积、普通货车数、装卸设备台数、专用货车数、物流计算机信息管理系统套数、铁路专用线条数、集装箱专用车数等。

物流环境指标。该指标反映了影响与制约物流活动的外部因素和条件。这些因素与条件十分繁多,但应当主要选取国民待遇程度、市场开放程度、市场规范程度和社会诚信程度等4项指标。其中,又以研究、制定诚信指标及信用等级评价体系最为迫切。

物流组织化程度指标。发展现代化的物流产业,需要培育经营规模大、实力雄厚的骨干企业,以提高流通效率,取得规模效益。为此,选取、设置了“排名前10家、50家、100家大型物流企业的年销售额、利润额分别在社会商品零售总额、利润总额中所占比重”的指标,以便比较和了解我国物流企业规模和市场集中度。同时,由于目前在物流产业领域中,仍然存在大量的中小型企业,而且它们有着自身的优势,能够适应当今激烈的市场竞争的潮流。基于此,还应专门选取、设计“中小物流企业发展程度”这一指标,以关注我国中小物流企业的发展与成长。

物流信息技术手段利用指标。该指标是指物流企业在进行物流业务时利用信息技术的情况,包括电子商务总量、电子商务总量占总营业额的比重、自动化设备数量、自动化设备占总资产的比重等指标。电子商务总量就是指物流企业通过电子商务贸易方式完成的营业总量。电子商务总量占总营业额的比重就是物流企业在一定时期内通过电子商务贸易方式完成的营业总额占该企业总营业额的比重。这两个指标可反映物流企业利用信息技术手段所产生的效果。

(二)反映物流产业现代化成就方面的指标

1.物流产出总量指标。设置该类指标的目的在于反映物流业生存、发展的状态,反映物流产业在国民经济增长中的产出水平。应当选取的指标包括社会物流总值、物流产业增加值、货物运输周转量等指标。

社会物流总值。该指标反映全社会物流发生的总规模。物流总值增速越快,表明经济增长对物流需求越大,经济发展对物流的依赖程度也越高。

物流产业增加值。它是一定时期内物流业生产的产品和提供的劳务价值总量(总产出)中,扣除所消耗的外购产品和劳务价值量(中间消耗)以后的余额。货物运输周转量。货物周转量是指在报告期内实际运送的货物重量乘以其运送里程的综合数。该指标反映货物运输量和运输规模。货物运输周转指标由货物运输量、货物仓储量、货物装卸搬运量、货物包装量、货物流通加工量、货物配送量、货物信息处理量等构成,用以衡量物流规模,反映物流的全貌。

2.物流产业国民经济贡献指标。由于物流产业在国民经济中的地位日益提升,已由原来的末端产业上升为先导行业,其对国民经济的发展起着十分重要的作用。因此,需要设置物流产业对国民经济贡献类指标,主要包括国民经济贡献率、就业贡献率和税收贡献率。

国民经济贡献率是指物流产业增加值的增长量与同期国内生产总值增长量的比率。该指标是评价物流产业对国民经济发展所作贡献的重要指标,也是衡量一国物流产业发展和实力的重要指标。

就业贡献率是指物流企业的就业人数与全社会就业人数的比重。该指标反映物流产业对社会就业所作的贡献。税收贡献率是指物流企业上缴的税收与全社会所上缴税收的比重。该指标反映物流产业对国家税收所作的贡献。

3.物流效率指标。根据企业的不同角度,衡量物流效率的指标可分为:经济性指标、技术性指标、社会性指标。

经济性指标。该指标要涉及到成本和效益两个方面,能够全面反映企业实施第三方物流经济性,主要有固定成本(包括基建投资及车辆、仓库、办公用房等固定资产占用等)、可变成本(包括人员薪金如工资、津贴、奖金等,营运消耗如燃油、材料消耗、物流设备折旧与维修等,物流企业外付费用如港口费、养路费等,还包括事故损失、管理费开支及其他临时性物流费用支出等)、采用第三方物流服务模式后的直接经济收益、时间节约的经济效益、物流运作能力加强的经济效益,等等。

技术性指标。主要从技术上衡量第三方物流实施后各项指标的表现程度,主要包括快速性、便利性、直达性、安全性、舒适性和灵活性等指标。快速性,指物流过程的迅速程度;便利性,指企业实施第三方物流后利用物流手段的方便程度;直达性,货物从起点出发,无需办理中转而直接抵达目的地的特性,它包括单一物流方式的单运直达和多种物流方式的联运直达;安全性,指在物流过程中不发生意外,正常运达目的地的特征;舒适性,特指企业在接受物流服务过程中所感受到的舒适程度,这主要取决于物流方式、运载工具设备、运行时间长短及服务水平;灵活性,指运载工具对物流线路的非依赖程度及采取某种临时性紧急措施的可能程度。

社会性指标。主要从宏观的角度来衡量第三方物流的出现对整个社会的影响程度。主要包括社会节约程度、社会综合发展程度和提高物流的整体服务质量等指标。社会节约程度,指社会全部资源的整体优化配置程度;社会综合发展程度,指第三方物流的出现与发展对社会整体综合发展状况的贡献程度;提高物流的整体服务质量,指第三方物流的出现与发展对整个物流行业服务水平的提升程度。

4.物流服务质量指标。该指标反映物流企业的客户服务水平和服务质量,包括客户服务水平、客户满足程度、交货水平、交货期质量、货物损耗率等指标。其公式表示如下:

客户服务水平=满足需求次数/需求次数

缺货率=缺货次数/需求次数

客户满足程度=满足需求数量/需求数量

交货水平=按期交货次数/总交货次数

评价指标论文范文4

本科教育应当使学生具有从事本专业实际工作和研究工作的初步能力。由于就业率作为高等院校的重要评价指标,高校多把注意力集中在就业上,学者的研究也多是以企业需求为主进行教学体系研究。毕业论文是本科生在校期间持续时间最长的动态教学过程,是总结和检验学生的学习成果,培养学生综合运用所学基础理论、专业知识和技能,独立分析和解决问题的能力,是探究、研究和发现的最重要的表现方式。但本科毕业论文制度的建立和运作问题近年来呈现出“两极化”的认知态势,国家教育部门的高度重视和一些专家学者的质疑态度形成鲜明的对比,根本原因就在于本科毕业论文质量的下滑。

从形式上讲,国外的很多大学在本科阶段没有毕业论文,也没有毕业论文答辩,但这不代表对学术论文没有要求。实际上,国外的许多大学,每一门课都要写许多小论文,每门课程的成绩往往是由多个小论文成绩组成,从某种意义上讲,课程的学习过程就是研究与写作学术论文能力的训练过程。需要写毕业论文的国家也会给予足够的教学延伸、时间、政策等方面的支撑,澳大利亚的大学将学术研究与写作纳入课程体系,日本留给大学生一年的时间专门用来写论文,德国的论文答辩只有一次机会。国内有相当数量的学者在研究毕业论文质量不高的原因以及提升措施,归纳影响论文质量的原因主要有学生的不重视、缺乏写作时间、师资不足以及教学管理方面的不完善等方面,也提出了许多提高论文的方法和措施,如加强过程监管、增加指导经费、增加撰写时间、改革评定方法、改革教学模式等。但针对物流管理专业,特别是广西的物流管理专业进行的论文质量研究还很少见。加强对本科毕业论文的管理,从而形成一套强而有效的管理制度,已经成为各高校目前需要解决的问题1。

我国还没有形成以物流科技创新型和知识型物流人才为核心的物流教育目标体系,随着中国一东盟自由贸易区的深入发展和广西北部湾经济区经济地位的提升,广西在区域经济发展中的物流通道和交通枢纽作用越发突出,广西政府在近年来对公路、铁路、港口、机场以及物流园区等物流硬件设施建设上不断加大投资,物流业的规模也随着传统物流企业的壮大、新兴专业物流企业的发展以及物流企业装备和技术水平不断提高而不断扩大,但物流业的进一步发展也受到了诸多因素的影响,其中最重要的制约是在物流业硬件提升的同时也急需解决物流人才方面的软件配备。在广西物流产业飞速发展的形式下,从物流管理专业的本科毕业论文入手,构建论文质量评价指标体系,为广西物流产业的发展提供人才支撑。

2.物流管理专业毕业论文评价体系的建立

本文通过对2010级物流管理专业毕业论文开题答辩、论文写作以及论文答辩过程的调查分析,总结出影响毕业论文质量的五个方面。

第一,学生对毕业论文不够重视,即使进行第二次答辩也肯定会通过。这样导致了学生在做毕业设计的过程中没有认真地去完成,极少数学生到了论文提交时才着手去做,从而严重降低了毕业论文的质量。

第二,由于物流业在国内的发展时间短暂,许多高校的物流管理专业教师只是从其他专业中转化过来,缺乏足够的物流活动实践经验。造成了在选题过程中为了向物流方面靠而牵强地将相关理论生搬硬套。因此导致论文选题狭窄,过于追求论文的创新点以及追求论文的层次,而没有考虑论文与实际应用相结合,以及与自身能力相结合,导致最终脱离实际。选题应结合学生兴趣与特长、体现专业特色、难度适宜和选题可与科技创新活动相结合2。

第三,时间不够,本科毕业论文工作不能等同于某一门课程或传统意义上的某一个教学环节,而应视为一个必须谨慎规划的、长期的、动态的教学过程。但实际情况是,毕业论文的撰写时间与求职、备考研究生等学生认为更为重要的事是冲突的。造成了真正用到毕业论文的时间很少。

第四,学生与导师之间的交流也是比较重要的部分,很多学生在做毕业论文期间与导师没有任何交流,最终的方向也可能与之前的方向相差较大,论文的质量在撰写期间没有控制。导师指导风格对于学生创造力的发展是有一定影响的。

第五,评阅者给出的评价和导师给出的评价是基本一致的,在论文质量特别是跟研究方法方面评阅者往往会给出比导师低的分数。

本科毕业论文的实施包括三个关键环节,即选题阶段、实验阶段和论文撰写阶段。因此建立的指标体系需要在这三个阶段的不同时期,通过阶段性小组答辩的形式进行评价,根据评价的成绩对学生的毕业设计状态进行追踪,通过成绩的反馈及时调整学生的工作状态,从而使毕业设计的质量最终得到整体性的提高。

为了评估学生的毕业论文质量,结合前文的分析,本研究设计了毕业论文评价指标体系,分别为重视度、选题质量(难度)、论文工作量、互动性、导师评价成绩、答辩成绩。其中选题质量这一指标是为了改善物流管理专业论文选题与实际的偏差而提出的,与专业结合越紧密则分数越高;互动性指学生与指导教师之间的交流,交流越多、效果越好则互动性的得分也越高;导师评价成绩为该轮答辩中,导师对学生毕业论文质量的评价;答辩成绩为答辩小组在该轮答辩中给出的学生答辩分数。各准则层和指标的重要性由参与教授物流管理专业课程的老师共同制定。而制定的原则是从教师以往教学、指导毕业设计中的经验中总结。

3.评价指标体系的实现

对于学生每次论文阶段性答辩成绩的评价,考虑使用专家调查法进行评判,通过反复汇总不同教师的意见,得到六项指标的权重分别为0.1,0.1,0.1,0.2,0.3,0.2]。从成绩结果来看,学生A的总分在三轮之后有所提高,从原来的平均分之下提高到了平均之上,说明提高了重视程度以及导师的指导力度。学生B的总分在第二轮答辩中有所下降,从分值来看,是与导师的互动性降低了,实际原因是该生在第一轮与第二轮答辩周期中忙于找工作,因此减少了论文工作的投入,在第三轮答辩中又恢复到了正常的毕业设计中了,所以总分又提高了。学生C的总分一直低于平均,从分值来看该生对于毕业设计的重视程度比较低,工作量也不够,需要在后面的阶段加强进行管理。

评价指标论文范文5

关键词中医学博士学位论文质量评价指标体系

中图分类号:G420文献标识码:A

研究生教育是高等教育的最高层次,担负着培养具有前沿知识、创新能力以及掌握高水平技能人才的重任,对国家经济和社会发展具有战略意义。纵观我国研究生教育工作的发展,其重点逐步经历了由教育制度完善到提高研究生质量的转变。《学位与研究生教育发展“十三五”规划》提出六大发展改革任务,其中一项重要任务就是“稳步发展博士研究生教育”,博士研究生教育最重要的指标是博士学位申请者在获得博士学位时的质量。目前对博士生培养质量及其评价的研究,近年来已成为学术界与舆论关注的热点。

1研究背景

博士教育的关键在于培养质量,博士学位论文作为博士研究生在学期间所学知识的综合体现,很大程度上反映出博士教育所取得的成果与存在的问题。博士学位论文质量评价是改进和完善博士研究生培养模式及管理方式的有效途径和检验指标,对博士生培养质量评价展开研究,具有十分重要的价值和意义。

2研究方法

2.1资料来源及方法

通过调研国内具有中医学博士学位授权点的高等中医药院校,选取其中已有中医学博士毕业生的14所中医药院校的“中医学博士学位论文评阅意见书”(以下简称“评阅意见书”),对其评价指标进行归纳整理分析。

2.2评价指标名称统一化

对各中医药院校“评阅意见书”中评价指标名称描述的统一性问题,参照湖北中医药大学博士学位论文评阅意见书,对同义的名称信息进行统一。“论文选题、选题价值、选题”统一名称“论文选题”;“论文的创新点、论文的创新性、论文成果的创新性、创新性”统一名称“论文的创新点”;“科学态度和写作水平、论文写作能力与总结提炼、写作表达能力、写作水平、写作能力”统一名称“科学态度和写作水平”;“科研能力、科学研究的能力、科研作风”统一名称“科学研究的能力”;“理论基础、基础理论与专门知识”统一名称“基础理论与专门知识”;“论文综述、文献综述、综述”统一名称“论文综述”;“论文价值、实用价值”统一名称“论文价值”;“设计思路与方法研究、研究方法和技术水平”统一名称“设计思路与方法研究”。

3中医学博士学位论文质量评价指标的权重比较和分析

将14所中医药院校“评阅意见书”中的评价指标进行统一处理后,归纳整理分析比较各评价指标的权重。

指标权重满分比从高到低依次为“论文选题”(92.86%)、“论文的创新点”(85.71%)、“科学态度和写作水平”(85.71%)、“科学研究的能力”(71.43%)、“基础理论与专门知识”(71.43%)、“论文综述”(64.29%)、“论文价值”(14.29%)、“设计思路与方法研究”(14.29%)、“实验数据处理与文献资料引录”(7.14%)、“工作难度和工作量”(7.14%)及“论文规范性”(7.14%)。

指标重要性赋值从高到低依次为“论文的创新点”(28.75€?3.6)、“科学研究的能力”(26.2€?.69)、“基础理论与专门知识”(21.37€?.23)、“实验数据处理与文献资料引录”(20€?.92)、“论文价值”(18.4€?.43)、“设计思路与方法研究”(18.4€?.34)、“论文综述”(17.967€?.467)、“论文选题”(17.438€?.166)、“科学态度和写作水平”(12.725€?.41)、“工作难度和工作量”(10€?.71)及“论文规范性”(10€?.70)。

权重满分比大于50%的指标有6个,包括“论文选题”、“论文的创新点”、“科学态度和写作水平”、“科学研究的能力”、“基础理论与专门知识”及“论文综述”。根据评价指标权重满分比值可以看出,50%以上的中医药院校对中医学博士学位论文的质量评价时都选用“论文选题”、“论文的创新点”、“科学态度和写作水平”、“科学研究的能力”、“基础理论与专门知识”及“论文综述”等常用指标,这些常用指标中“论文的创新点”、“科学研究的能力”、“基础理论与专门知识”赋值均比较高,是影响中医学博士学位论文质量的关键。

权重满分比小于50%的指標有5个,包括“论文价值”、“设计思路与方法研究”、“实验数据处理与文献资料引录”、“工作难度和工作量”及“论文规范性”。说明在制定评价指标体系时各院校也有一些特异性的差异,根据评价指标权重满分比值可以看出,部分院校尤其看重博士学位论文的“实验数据处理与文献资料引录”和“设计思路与方法研究”两个指标。

4中医学博士学位论文质量评价指标体系的探讨

4.1中医学博士学位论文质量评价指标体系的特点

4.1.1指标体系的可靠性

本研究收集的中医学博士学位论文质量评价体系是来自于国内具有中医学博士学位授权点且国内普遍认为培养质量较高的高等中医药院校。基本涵盖目前国内中医药类高校对中医学博士学位论文质量评价的各个标准。具(下转第69页)(上接第67页)有较高的权威性,协调程度较高,充分显示了评价的可信性和可靠性。

4.1.2指标体系侧重中医学学术学位型博士培养特点

相比中医专业学位型博士,学术学位型侧重于中医学学术理论水平和实验研究能力,以培养中医学科学研究人员为目标,其学位论文应更注重研究创新性,对中医学领域在知识和认识上能作出独特而有意义的贡献。指标“论文的创新点”和“科学研究的能力”在该各评价体系中给予了较高的权重,这也充分显示了学术学位型博士培养特点。

4.2问题与建议

4.2.1采取多元模式,分类构建评价指标体系

把握住研究生学位论文质量也成为保障研究生教育质量的关键,各高校须以博士学位论文评价的目的为出发点,针对不同学位类型博士研究生,分类构建学术学位型和专业学位型质量评价指标体系,以适应对不同学位类型研究生学位论文的要求。

4.2.2進一步探索描述性评价与量化评价相结合的评价模式

针对现有博士学位论文评价缺陷,突出量化评分作用,有利于更清晰、更精确有效地评价博士学位论文水平,这也是评价制度更加成熟、更加科学的重要标志之一。但就评价博士学位论文整体质量和创新性而言,描述性评价仍是最基本、最重要的方法,其评审意见的指向性和主导性仍是显著的、有价值的,对培养单位改进博士生培养工作,提高培养质量起着不可替代的作用。为此,我们认为以描述性评价为主,发挥量化评价的有益作用,将两方面结合起来,有利于全面客观地评价博士学位论文的质量和水平。

4.2.3鼓励专家及导师参与,不断完善评价指标体系

评价指标论文范文6

关键词:极效率数据包络分析绩效评价指标

改革开放20多年来,随着金融体制改革的深入,我国保险体系发生了深刻变化,一个以国有商业保险公司为主、中外保险公司并存、多家保险公司竞争的多元化市场格局已经初步形成。随着国内保险业的竞争日益剧烈,迫切要求国内保险公司加强自身管理,提高经营绩效。因此,能否科学合理地衡量保险公司的经营绩效水平并据此分析经营管理中的优势与不足变得十分关键。目前国内对保险公司绩效的考察主要是从定性的角度出发,多是采用一些常规单因素指标,存在极大的局限性。本文采用极效率DEA模型,有效区别出有效决策单元(绩效值=1)之间的绩效差别,对我国9家保险公司经营绩效做出有效排序,并对各保险公司经营绩效简单评价,为其进一步发展提出自己的建议。

一、极效率DEA模型

数据包络分析方法(DEA)是Charnes和Cooper等学者在“相对效率评价”概念基础上发展起来的一种新的系统分析方法,其功能是进行多个同类样本间的相对优劣性的评价。利用数学规划技术,该方法可以较好的解决具有多输入多输出特征的同行业企业生产率评价问题。学者魏权龄也证明了相对有效的决策单元就是在相同情况下采用多目标规划解出的Pareto有效解。

假设有n个决策单元DMUj(j=1,2,Λ,n)的输入输出向量分别为xj=(x1j,x2j,Λ,xmj)T>0yj=(y1j,y2j,Λ,ymj)T>0

极效率模型是以CCR模型为基础,利用极效率来甄别有效DMU的效率差异,从而可以给出所有DMU的效率排序。极效率模型如下:minθsups.t.

二、保险公司经营绩效的评价指标分析

指标的选择必须满足评价的要求,能客观反映评价对象的竞争力水平,在技术上尽量避免投入产出指标具有较强的线性关系。从全面性、客观性、代表性、可得性的原则出发,本文把各个保险公司作为决策单元,选取投入指标为逆费用率、逆赔付率、资金运用率、逆资产负债率、流动比率,而产出指标则选取资本利润率、营业利润率。其中,费用率为营业费用与保费收人的比率,反映保险公司在一定时期内经营保险业务发生的成本费用;赔付率则是赔款支出与保费收入之间的比率,可以用来衡量保险公司的经营效益;而资金运用率是指保险公司在一定时期内投资总额占企业全部资产总额的比例;资产负债率为负债总额与资产总额的比率,主要用来衡量保险公司在清算时保护债权人利益的程度;最后,流动比率为流动资产与流动负债的比率,衡量保险公司的流动资产在某一时点可以变为现金用于偿付即将到期债务的能力,表明保险公司每一元钱流动负债有多少流动资产作为支付的保障。另外,作为产出指标的资本利润率为利润与实收资本的比率,说明一定时期内利润总额与全部资本金的关系,表明保险公司拥有的资本金的盈利能力;而营业利润率则是利润与保费收入的比率。

实证研究

由于数据来源的限制,本文选取我国9家主要保险公司作为决策单元,分析的样本容量为9,投入产出指标为7,很明显样本容量大于指标个数,满足DEA分析的要求。首先采用DEA对偶模型对保险公司绩效进行评价,结果θ列。华泰、太保、天安、大众、永安的相对绩效为1。再利用极效率DEA模型对这五个保险公司进行相对效率评价,结果华泰最优效率,永安紧随其后,接着是太保、天安和大众。最终的效率排序结果在最后一列。

从结果可以发现,华泰、太保、天安、大众、永安相对于人寿、平安、新华、新疆而言,是有效的。其中,人寿、大众可以看作弱有效,天安、太保则是比较有效,华泰、永安是非常有效,表明它们的投入产出指标值比较平衡。具体分析,华泰、永安在营业利润率、资产负债率的指标值上较其他保险公司高出许多,反映综合盈利能力较强。虽然,天安资产负债率是所有保险公司中最高的,但其在营业利润率方面表现较差,从而导致其在综合盈利能力方面低于华泰和永安。另外,新疆虽然在营业利润率方面表现较好,但是其资产负债率却只有1.064,低于平均水平,从而使其综合盈利能力下降。在费用率和赔付率方面,华泰、永安及天安、大众远远高于人寿、平安、新华。这也从一个方面反映出它们经营效益的差异。在资金利用率方面,无疑华泰、永安显得尤为突出。最后,流动比率是人寿最高,达到10.014,说明其流动负债,包括应付手续费、应付工资、应付福利费、未交税金等项目,在所有保险公司中最少。资本利润率最高是平安、新疆,分别达到0.637和0.538。不过,从本质上而言,虽然资本利润率可以衡量盈利能力,但是其反映的是创造单位盈利所需资本金数量,即盈利的成本。

三、相关建议

从以上分析可以看出,人寿、太保、平安、新华、天安在营业利润率方面都较低,一方面与其保费收入投资渠道狭窄有关,另外,也受金融机构分业经营、利率下调等市场化因素影响较大。为此,应当注意增强综合盈利能力,提高经营绩效。可以通过开发新险种和产品,培育新的利润增长点,裁减冗员并控制人员过快增长,加强理赔工作,以此控制赔款支出。资金运用方面的不足。此外,国家也应采取措施为保险公司资金运用提供良好的外部环境,例如放宽投资限制、丰富投资品种等。而对于新疆兵团保险公司,虽然其综合盈利能力表现尚好,但是其流动负债相对其经营规模和收入情况而言,显得不合理,究其原因在于成本控制较差,资源浪费严重。为此,新疆兵团保险公司应当注意提高成本控制能力,在公司内部实施严格的预算管理,以此控制费用降低成本。人寿、大众、新华的资金运用盈利率都比较低,因此,对于这三家公司来说,除了努力拓展保险业务以便扩大投资资金来源的规模外,更重要的还在于对保险投资进行科学管理与高效运作。这包括科学的可行性研究、正确的投资方式、选择合理的投资结构和有效的执行与控制。对于华泰、永安而言,虽然综合绩效排名最前,但是它们在流动负债方面表现均不理想,而且永安在体现效益的指标赔付率上也存在不足,所以,它们应根据自己的实际情况,采取相应措施,充分利用现有资源对自身经营状况进一步加以改进,以至发挥最大效益。

参考文献:

1.魏权龄.评价相对有效性的DEA方法[M].中国人民大学出版社,1988

评价指标论文范文7

关键词:可拓评价;毕业设计;教学改革

作者简介:董非(1982-),男,江苏常州人,江苏大学汽车与交通工程学院,讲师;尹必峰(1975-),男,江苏泰州人,江苏大学汽车与交通工程学院,副教授。(江苏镇江212013)

基金项目:本文系江苏大学教学改革与研究项目(项目编号:JGY2007051)的研究成果。

中图分类号:G642.477     文献标识码:A     文章编号:1007-0079(2012)11-0099-03

本科毕业设计(论文)是高校本科教学过程的最后一个实践教学环节。通过毕业设计(论文)环节,不仅可以检验学生综合运用所学知识解决实际问题的能力,同时也是对高校本科实践教学质量水平的检验。[1]目前,国内高校在对毕业设计(论文)成绩评定时大多仍采用传统方法进行,即学生毕业设计(论文)成绩是由指导老师、评阅人和答辩小组三方面成绩简单加权平均得到,对于一些很难量化的定性指标,评价时主观性过强,缺乏科学统一的评价依据;此外,在对学生毕业设计(论文)成绩有疑义时往往是由几位专家讨论确定,缺乏说服力。因此,对毕业设计(论文)质量进行科学、客观、统一的评价是当前我国各高校教育教学研究的一个重要课题。

在此背景下,本文根据工科毕业设计(论文)的特点,建立工科毕业设计(论文)质量多级评价体系,提出一种基于多级可拓的工科毕业设计(论文)质量综合评价方法,并结合具体实例阐述该方法的应用过程,并对该方法的可行性、有效性进行分析。

一、工科毕业设计(论文)质量评价体系

1.工科毕业设计(论文)的特点

工科专业不同于其他学科专业,其毕业设计(论文)的特点通常表现[2]为“一人一题”,以工程实际或模拟设计为主要研究内容,采用常规或现代设计方法和手段展开研究,研究内容紧密围绕学校、生产企业、科研院所以及指导教师的科研项目,主要成果形式包括工程设计图纸、三维CAD软件建立的参数化模型和虚拟装配结果以及用CAE软件进行的工程设计分析等。

2.工科毕业设计(论文)质量多级评价体系

针对工科毕业设计(论文)的特点,结合江苏省普通高等学校本专科优秀毕业设计(论文)评选标准,笔者制定了与其研究方法和成果形式相应的质量评价细化指标,并综合考虑指导教师、评阅教师和答辩小组三者对毕业设计(论文)质量审视角度不同,建立了如图1所示的工科毕业设计(论文)质量多级评价体系。

二、毕业设计(论文)质量评价多级可拓模型

可拓评价[3]是以可拓学和物元理论为基础,将要评价的对象视为物元,通过物元分析确定评价的不同等级,然后利用关联函数计算和划分各待评价对象隶属等级,相对客观地实现待评价对象的分类排序,进而明确待评价对象的质量水平。可拓评价与层次分析法[4]、灰色聚类法[5]等其他评价方法相比,能够减少人为因素对评价预测结果的干预,规范性好,具有简捷、严密的特点。经查阅大量资料发现,可拓评价方法在教学质量管理、命题质量综合评判等方面得到了一定的应用[6],但鲜有将可拓评价运用到毕业设计(论文)质量评价中的报道。

1.物元可拓模型

在物元分析中,任何事物都可以由事物M、特征C和量值X组成,记为R=(M,C,X)。[3]

(1)待评物元矩阵的建立。对于待评毕业设计(论文)质量评价系统,将待评指标的相应数据用物元模型来描述,记事物P0为待评对象;Xi为P0关于Ci的量值(i=1,2,…,m,m为指标个数)。

(2)经典域物元矩阵的建立。假设毕业设计(论文)质量评价等级分为n级,记Moj为第j级别的事物,令表示级别为j第i个指标Ci的量值域(j=1,2,…,n)。

(3)节域物元矩阵的建立。节域为各指标对应的所有取值范围,记Muj为物元系统中级别的全体,令表示第i个指标Ci全部等级的量值范围。

(4)关联度函数的构造。根据物元理论,定义待评毕业设计(论文)评价指标i关于等级j的关联度函数为:

(1)

其中

式中,为关联度,为第i个评价指标关于等级j的关联度。

(5)各级指标权重的确定。由图1可知,工科毕业设计(论文)质量评价体系包含多个层次,且每个层次所含的评价指标很多,为此在进行综合评价时低一层指标对其上一层指标的影响作用(即权重)是不相同的。本文在确定各级指标权重时采用了不同的处理方法,具体为针对子指标层中各项指标,由于其数据丰富,可充分挖掘原始数据本身蕴涵的信息,采用熵权法;对于其余各级指标,由笔者任教学校多年的教学经验和优秀毕业设计(论文)评选标准加以确定,详见表1所示。熵权法是指根据各子指标提供的有用信息量确定各子指标的权重。

第i项子指标的熵权计算公式为:

(2)

其中

式中,为第i项子指标的熵权,m为指标个数,n为等级数。

2.多级可拓综合评价思路

多级可拓评价基本思路为:首先计算子指标层各指标的关联度矩阵,根据熵权法确定子指标层对于指标层中各指标的权重系数ω,将ω与相乘得到指标层关联度矩阵,再由表1给定的指标层对准则层的权重α与相乘得到准则层关联度系数,依次类推,逐级计算直至目标层,得到目标层关联度矩阵。

若满足,则认为毕业论文质量综合评价属于等级j。

(3)

其中

式中,j*为目标层即毕业设计(论文)质量总评的级别特征值,即属于某评价等级的程度。

三、案例分析

以笔者任教学校2010级某学生毕业设计为例,介绍其多级可拓综合评价过程,并对评价结果进行分析。

1.经典域、节域和待评物元的确定

本文将毕业设计(论文)综合评价质量分为优秀、良好、中等、合格、不合格五个等级,依次赋值为1、2、3、4、5;与各等级对应的经典域分别为[0.9,1]、[0.8,0.89]、[0.7,0.79]、[0.6,0.69]和[0,0.59],指标对应的节域均为[0,1]。该学生子指标层下各指标得分见表2所示。为了方便,将子指标层下各指标得分进行归一化处理。

2.子指标层指标对指标层指标权重系数的确定

在确定子指标层指标对指标层指标权重时采用的是熵权法。下面以“指导教师评分”子指标层指标对指标层指标权重为例。

由式(5)和式(6)计算得知,“指导教师评分”下子指标层指标对指标层指标权重向量分别为:

注:表示指标层第i个指标下各子指标的权重向量。

3.多级可拓评价

通过计算,该学生子目标层及目标层评价结果如表3所示。由表3可见,该生毕业设计指导教师评价为1级,属于优秀;评阅教师和答辩小组评价均为2级,属于良好;最终该生毕业论文质量总评成绩为2级,属于良好。表中数据为负,表示关联度不属于该质量等级以及不属于该质量等级的程度;数据为正,表示关联度属于该质量等级以及属于该质量等级的程度。进一步,由式(8)计算可知,该生质量总评综合关联度特征值j*为2.029,数值更趋向于2,表明该生毕业论文成绩更偏向良好级别。

四、结语

本科毕业设计(论文)质量评定是衡量高校人才培养质量的重要参考依据。本文将多级可拓综合评价的方法引入工科毕业设计(论文)质量评价中,建立了基于可拓评价理论的毕业设计(论文)质量评价指标体系,并根据各级指标的特点采用不同方法确定指标权重,逐级计算,直至确定目标层与各评价等级的关联度,明确评价结果。实例计算表明,该方法不但能评定出毕业设计(论文)质量等级,而且能从不同的审视角度反映毕业设计(论文)质量的优劣,提高了评判结果的可靠性和准确性,故该方法在评价毕业设计(论文)质量方面是有效且可行的,具有较强的推广和实用价值。

参考文献:

[1]孟梅等.高校毕业设计(论文)论文质量管理的研究[J].武汉理工大学学报,2007,(1):83-86.

[2]徐晓美,张永辉.工程设计类毕业设计(论文)质量评价研究[J].中国电力教育,2010,(27):42-43.

[3]蔡文,杨春燕,林伟初.可拓工程方法[M].北京:科学出版社,1997.

[4]韩瑞娜.模糊层次分析法与大学生毕业设计(论文)质量评价的数学建模[J].科技信息,2011,(5):186,401.

评价指标论文范文8

[关键词]毕业论文 质量评价 AHP 模糊综合评价方法

中图分类号:G642.4 文献标识码:A 文章编号:1009-914X(2017)01-0244-02

大学生毕业论文是教育与生产劳动和社会实践相结合的重要体现,是培养大学生的创新能力、实践能力和创业精神的重要实践环节[1]。毕业论文的质量除了检验学生的专业水准和各种能力外,也是衡量整个教学环节的质量乃至学校的总体教学质量的重要方面。由于多种主客观因素对高等院校的影响,本科毕业论文质量评价工作进行得十分困难。如何克服评价过程中的不确定和模糊性问题成为解决毕业论文质量评价难题的关键之所在。

1 研究背景

对毕业论文质量评价,众多学者提出了不同的解决方法。许骏提出了静态评价和动态评价方法相结合的毕业论文质量评估方法,将针对毕业论文管理工作的抽查与对论文撰写过程的管理质量评价结合起来,实现了面向过程与面向结果相结合的评价[2];余嘉元等在建立包含选题意义、研究现状、技术路线等10个涉及论文写作全过程的指标体系的基础上,提出了基于VPRS和证据理论相结合的毕业论文综合评价方法[3];也有学者实现了AHP和FCE两种方法的结合,提供了一种具备良好操作性的评价方法[4]。除了传统的学校评价、主管部门评价等方式外,第三方评价也成为解决毕业论文质量评价的重要手段[5]。

目前,各大高校主要运用直接打分法、加权求和法、经验评估法对本科毕业论文进行评价。但是,这些方法却普遍存在着操作性难,主观性太强等不可避免的缺点。模糊综合评价法有效解决了评价过程中评价因素的复杂性、评价对象的层次性、评价标准中存在的模糊性等一系列问题,因此,该方法对于毕业论文质量评价具有较好的适用性。

2 毕业论文质量评价指标体系构建

毕业论文质量主要反映在选题的合理性、专业理论知识的扎实程度与研究能力、成果的创新水平以及行文写作的规范性等方面[5],其评价要素主要包括以下几方面的内容。

(1)选题质量

论文选题是毕业论文撰写过程的第一步,它将决定论文工作是否具有必要性和现实意义。一般可从专业相关性、选题难度、、可行性、应用价值、选题范围、新颖性等方面进行考察。

(2)能力水平

能力水平是毕业论文质量评价最重要的一个因素,可以从文献综述、外文翻译和知识水平三大方面进行考察。

(3)成果质量

成果质量指标是评价学位论文质量的重要尺度,是论文成果的一种评价。主要由三方面内容所构成:①成果水平;②写作能力;③论文规范。

3 毕业论文质量的模糊综合评价

3.1 毕业论文质量评价指标权重确立

结合毕业论文质量评价指标大都难以定量的特点,本研究采用AHP法求指标权重[6]:

(1)构造判断矩阵

在层次结构中,比较其对于准则的重要程度,将比较结果按重要程度以1至9级进行量化标度,构成判断矩阵。以一级指标为例,一级指标a=(a1, a2, a3),其判断矩阵A={bij},i, j=1, 2, 3,bij=ai/aj。本文综合几位教授意见及参考相关的文献资料对于毕业论文质量评价指标的研究分析,采用Saaty的1-9标度法给出bij,得到判断矩阵A。

(2)求解判断矩阵的特征根和特征向量

计算判断矩阵A的最大特征根?和特征向量Wa。[Wa,λ]=eig(A)

Wa=( 0.1460,0.8540,0.4994 ),λ=3.0246。

(3)一致性检验

通过两因素比较得到的两两比较矩阵在有些情况下可能会得到一些不一致性的结论,只有通过一致性检验的结果才能进一步进行分析,一般我们通过计算一致性比例(CR)进行检验:CR=CI/RI。当CR≤0.1 时,两两比较矩阵的一致性是可以接受的;当CR>0.1 时,两两比较矩阵应做适当修正。

本文中,随机一致性比率CR=CI/RI=0.0212

(4)求指标a的权重

归一化处理特征向量Wa,得到指标a的权重Wa=(0.0974,0.5696,0.3330)。

(5)重复步骤(1)至(4),计算各级指标的权重

设B是指标a中第i个指标对应的下一级指标b的判断矩阵,指标b由m个指标组成。Wb(j)是矩阵B的第j个特征向量,则第j个指标的权重为:

计算判断矩阵A的最大特征根?和特征向量Wa。按[Wb λ]=eig(A)的方法进行计算,获得结果:Wb=(0.2123,0.3993,0.2123,0.0644,0.8016,0.8600)λ=6.1995。归一化处理特征向量Wb,Wb’=(0.1160,0.2182,0.1160,0.0352,0.0446,0.4700),由于选题质量a1=0.0974,则Wb(a1)=(0.0113,0.0213,0.0113,0.0034,0.0043,0.0458)。同理可得到论文质量评价体系各个指标权重值如表1所示。

3.2 毕业论文质量的模糊综合评价过程

(1)获得模糊评价矩阵方法

首先,制定论文质量的评语集{优秀、良好、中等、及格、不及格}。假设共有W名评审委员,对第Xij项指标因素合计有kijt个人在第t个评语上划“√”,那么可以认为整个评审委员会对该评价对象企业在第Xij项指标因素的评价中划“√”的概率(第Xij项指标因素属于第t个评语的程度,即频率分布)为rijt=kijt/w。根据评审委员在该项指标因素的5个评语划“√”的频率统计数据,可以写成一个单项指标评价的行向量,即:

Rij=(rij1,rij2,…,rij5)=(kij1/w,kij2/w,…,kij5/w)

其中rijt表示某指艘蛩夭慵吨械牡ij个因素xij在第t个评语上的频率分布,一般将其归一化,使之满足。

由此可以得到某一单因素模糊综合评价矩阵Ri=(Ri1,Ri2,…,Rit。)。

如可得到c1,c2这两个指标模糊评价矩阵:

获得b1b2b3b5b6指标的模糊评价矩阵:

同理,对所有外层的指标用到的模糊评价矩阵都可通过该方法获得。

(2)数据处理

将指标因素权重向量A和与其相对应的指标模糊评价矩阵进行复合运算,其中B=AR,在多级模糊综合评价模型中,当得出下一层级的综合评价Bi后,把Bi归一化得到Bi’,以作为上一层级指标因素的单因素评价,于是得到上一层级的模糊评价矩阵,进而可以求得此层级的综合评价结果[7]。类似地,可逐级计算,最终得出毕业论文质量模糊综合评价的结果。以指标b4为例,它的下一层级指标为c1,c2。

(3)计算综合评价值

为了更好更直观的表现某生的毕业论文成绩,可以将评语集数量化。对于评语集引入百分制,显然,评语集中优秀、良好、中等、及格、不及格这5个等级的分数重心依次为:95、85、75、65、55,于是可用算出毕业论文质量的综合得分。

从而,我们可以确定这篇论文的得分为79.9095。

4 结束语

针对毕业论文质量评价中存在的主观性过大、随意性太强的问题,本文在建立了毕业论文质量评价指标体系的基础上,应用层次分析法和模糊数学方法建立的模糊综合评价模型实现了对大学生毕业论文质量的科学评价。该方法全面考虑了影响毕业论文质量的各种因素,将定性和定量的分析有机地结合起来,既能够充分体现评价因素和评价过程的模糊性,又尽量减少个人主观臆断所带来的弊端。

参考文献

[1] 张晓帆.新形势下应用型高校毕业设计改革实践与探索[J].人民论坛, 2015,(33):151-152.

[2] 许骏.本科经管类毕业论文质量静态与动态评价研究[D].东华大学硕士学位论文,2007.

[3] 余嘉元,汪存友.基于VPRS和证据理论的毕业论文综合评价研究[J]. 计算机工程与应用,2007,43(14):230-232.

[4] 李敦东.基于AHP-FCE的外语专业毕业论文综合评价系统设计与应用[J].中国教育信息化,2015,(9):79-82.

[5] 刘任熊,杨财根.引进第三方评价:高职毕业设计(论文)改革研究――以旅游管理专业为例[J].职教论坛,2015,(32):91-96.

评价指标论文范文9

关键词 自媒体 人文社会科学学术评价 学术质量评价 altmetrics指数

分类号 G250.73

Academic Quality Evaluation of Humanities and Social Sciences under “We Media” Environment

Xue Yan

Abstract The traditional academic quality evaluation of humanities and social sciences has the limitation that it is purely based on article references and journal impact factors, which are often time-lag. In order to make up for such limitations, this paper proposes and constructs a weighted fuzzy operation model which is based on citation index for academic influence and altmetrics index for network influence to make academic quality evaluation of humanities and social sciences under “we media” environment. This model is considered from a number of different dimensions to reflect the real situation of academic quality of humanities and social sciences.

Keywords We media. Academic evaluation of humanities and social sciences. Academic quality evaluation. Altmetrics index.

0 引言

自媒体的出现,使得学术研究与学术交流的环境发生了很大的变化,不再完全受制于学术出版机构,在学术评价方面也不再完全取决于同行评议,而获得了更多的空间与自由度。

传统的媒介环境中,学术交流和学术出版的流程围绕“作者―编辑―评审者”这一过程运行,这一学术生产流程基本保障了学术研究内容的公信力和安全性。而在自媒体环境下,作者通过网络平台,可以较为自由地自己的研究、认识,以及对他人研究的理解和评价。从论坛、社区到博客,再到微博,在媒体越来越个性化与多元化的同时,研究者发表看法的空间自由度和评论宽松度也在相应扩大。

特别是人文社会科学领域的研究者,他们利用自媒体更为频繁,也更普遍。一方面,互联网已经成为人文社会科学领域研究者获取信息、成果和交流的重要平台。另一方面,互联网已经从Web网站和BBS发展到包括博客、微博、贴吧、百科、社交网站和邮件列表服务器等多种类型的网站;在这一过程中,人文社会科学的网络信息资源日渐增多,例如:越来越多的人文社会科学领域的研究者习惯于随时将学术思想、信息在博客、微博或个人网站上,接受大众的评价,收获追捧、批评或激发讨论。目前国内知名度最高的自媒体“罗辑思维”就是资深媒体人罗振宇[1]打造的一个发表自己认识社会和学术研究的自媒体平台,在该平台上他以貌似轻松的风格来探讨具有严肃性的学术和社会话题,在优酷上收获了累计超过1.9亿次的点击,其微信公众账号以及微博上,也积聚了大量的粉丝。

不可否认,网络已经成为同行评议之外最有力,同时也是最为广泛的评价力量,正如“自媒体”这个概念的定义所指出的那样,普通大众借助数字科技手段,可以像媒体一样生产、传播并评价内容[2]。由此,也产生了一个新的学术评价的领域――altmetrics①,即所谓的“替代计量学”或“社媒影响计量学”。维基百科中对于altmetrics这一词条做了如下定义:作为广泛采用的期刊影响因子和个人引用指标如H指数的替代。通过追踪类似Twitter,Facebook等社交网络和新闻网站提到和分享某篇论文的次数以及被评论的次数等,然后根据网站的重要性给予不同的权重处理,即可得到对于某一研究成果的测度[3]。简言之,altmetrics的提出就是针对在学术引文之外的社会媒体对于研究成果的评价,以此作为传统指标“引文”的补充。

通过网络数据共享,altmetrics指数能够被迅速收集,可以让研究者近乎实时地看到某一论文、专著、报告、网页、演讲,简而言之“作品”被人们关注,包括引用、浏览、下载、被提及的次数和程度,以及哪些人对哪一类研究有兴趣。因此,这一指标在一定程度上弥补了在传统学术交流领域中仅仅通过文章引用和期刊影响因子进行学术质量评价的局限性和时滞性。

1 人文社会科学学术文献质量评价的主要指标类型

目前在人文社会科学评价中,影响最大的单一指标仍然是影响因子[4]和H指数[5]。影响因子虽然一直备受质疑,但它仍然是学术评价特别是学术期刊评价中最为常用的指标。被引频次是学术评价中最为人所看重的客观指标,但被引频次在用于实际评价的过程中也存在很多例外情况。例如:如果某人曾经发表过一两篇被引次数很高的论文,即使其他论文被引次数低,他的总体成就也会因此被夸大;修正的做法是总被引用次数除以总论文数,得到平均被引次数。但是这种做法对论文少的人有利,而对论文多的人不利。H指数克服了这两个方面的弊端,能够对一个科研工作者学术能力作出的综合评价。但H指数自提出伊始,就被认为存在局限性,不适用于年轻的研究者。后续的文献计量学家们对H指数作了种种修正,如Leo Egghe提出了G指数[6]:将按被引次数降序排列,当被引次数累计量大于或等于排序位次平方的最大排序时,该位次即是G指数。综合现有研究成果来看,尽管有种种不足,H指数也仍然是学术评价最常用的指标之一。

除了上述两个影响力最大的指数之外,还有依据Elseiver引文数据库Scopus产生的声望指数SJR(SCImago Journal Rankings,SJR),即一种期刊越多地被高声望(或影响力)期刊所引用,则该刊的声望或影响力就越高。在某种意义上,SJR弥补了影响因子为人所诟病的先天性缺陷,即对所有施引期刊都赋予同等的重要性。

1.1 传统学术性评价:引文指标

传统学术性评价主要是通过编辑审稿和同行评议来实现的,是建立在主观的专家评议基础上的定性方法。就人文社会科学领域的研究而言,专家评价的主要考察点大致可以概括为以下四个方面:某一学术文献所反映出作者知识积淀的多少,作者所做研究的方法是否有创新性,观点上是否有独到见解,以及所用材料是否有突破和创新。对这四方面的判断主要依据评审专家的学术眼光和学术经验,因而是主观与不可控的;同时,此类质量评价控制方式必然导致评审周期长,时滞严重。另外,评价成本因素也是影响学术文献评价的重要因素。因此,目前学术文献的质量评价主要依托出版机构、索引机构以及用户的反馈性评价,在此基础上结合专家的审读评议开展进行。

由此不难看出,学术文献的质量评价很大程度上直接相关于学术文献的被引用、被下载、被关注情况的统计和测度,核心的评价指标大致可以包括:他引量(Ct)、年均他引量(Ca)、H指数、刊物IF值(IF)、施引期刊种类(Ck)和施引期刊最大影响因子(Cfm)等;近年来人们开发出了一些用于衡量论文质量的替代指标,如特征因子(Eigenfactor)和IFPA指数。特征因子以5年为周期进行计算,将“引文质量”纳入测评范围,以类似于PageRank的算法迭代计算出期刊的权重影响值,实现了引文数量与价值的综合评价。其计算思想也与社会网络分析中用于描述节点在关系网络中权力和地位的特征向量中心度相似。此外,还有影响因子平均值IFPA指数(Impact Factor Point Average),IFPA指数综合考虑了学科的平均影响因子、期刊的影响因子、一个期刊的影响因子在本学科中的排序等,意在消除由于学科领域不同产生的影响因子和期刊数量的差别[7]。计算公式如下:

IFPA=(Ij/IA)(1-R/(N+1))n

式中: Ij为某刊的影响因子;IA为学科平均影响因子;R为某刊在本学科的影响因子排序;N为某学科的期刊总数;n为某机构发表的论文数量。

这些指标所做出的评价基本都是相对客观的,但仍然是一种学术文献发表后的反馈评价,是一种反馈性的滞后型学术评价方法。虽然引文分析被用于解释人文社科研究的学术质量和学术影响,在一定层面上已经被证明是可行的,但也一直存在争议,撇开有关学术管理部门对这些指标的误读和误用因素之外,学界对于目前的学术文献质量评价其实有一种较为清晰的认识,即认为目前的论文评价只是一种以期刊评价来代替论文评价,这是学术文献质量评价中无法回避的问题。

1.2 媒介补充性评价: altmetrics指数

面对这一问题,针对学术文献质量评价的补充性或者说替代性指标的筛选和挖掘日益成为学术评价领域学者研究和关注的热点。随着网络的发展,E-science环境日趋成熟,在线学术文献发表不断增加,开放的学术出版被广泛使用,学术研究者也越来越习惯于在网络数字环境中开展工作,并成为网络上的学术部落,相应有关的学术评论和学术交流和分享也广泛地在科学博客、社交网络、BBS论坛等展开,因此,网络时代对于学术文献的质量及其影响力的判断已经不仅仅局限在传统学术交流环境中文献间正式的引用上了,仅仅采用基于引文的指标也无法精确评估某以学术文献对于社会和学术界所产生的影响力,网络的媒介功能使得网络逐渐成为传统同行评议之外最广泛的社会评价力量。所谓的altmetrics指数[8],就是由网络媒体对于研究成果的评价而来的。借助数字和网络技术,人们可以追踪学术社区和学术网站,获取对某篇论文的被提到、被转发、被分享以及被评论次数的数据等,由此形成对于某一研究成果的测度。

Altmetrics指数的优点正好可以弥补传统引文指标的不足。首先,altmetrics可以获得对于学术文献的即时反馈,而不再是一种滞后的评价,不需要像计算期刊影响因子一样,需要滞后两年时间,这种文献计量需要花很长时间来计算,altmetrics提供的是对于学术文献的质量和影响力的即时反馈。而且,这一反馈不仅包含学术研究人员,也包括了非专业读者。传统引文一定是来源于学术研究人员的,因为学术期刊的主要受众是研究人员,相应的对于研究成果的评论、分享和批评也只会在与研究密切相关的群体间进行。但是,在网络环境中,这一期刊发生了改变,在线讨论的不仅是研究者,也可能包含学生、决策者、业内代表和非专业人士等,这一点对于人文社会科学研究而言是极其宝贵的,并且是迫切需要的,因为人文社会科学所关注的研究问题是来自于人的精神和社会的,altmetrics指标极其充分的弥补了传统引文指标的不足。

Altmetrics指数并不是一个单一的指标,而是衡量某一研究透过在线平台(如:Twitter,Blog)被引用、喜爱、分享、收藏、下载、提及、评论或讨论的次数,这些数据是透过各式各样的开放式网路服务搜集而来,包含开放存取期刊、学术引用数据、学术社区以及社交平台。通过网站和ImpactStory在线申请,就能追踪所关注的某一研究或学术文献,或学者自己的影响力。

以Plum Metrics[9]为例,该站点是由Andrea Michalek和Mike Buschman共同建立的,目的是为了跟踪研究的分享收录和引用情况。Plum Metrics的评分主要基于社会化媒体和分享,一般包括以下几方面测度内容指标:(1)使用(Usage):Abstract Views、下载、浏览、馆藏、馆际互借、文献传递;(2)抓取(Captures):喜欢、书签、保存、阅读器、分组;(3)提及(Mentions):博文、新闻专题、维基百科条目、评论;(4)社会媒体(Social Media):喜欢(Facebook,Vimeo, YouTube)、+1(Google+)、Ratings(SourceForge)、赞(Figshare,SourceForge)、分享(Facebook);(5)引用(Citations):Cited by CrossRef、PubMed、Scopus、专利(USPTO)等。

Plum Metrics不仅针对期刊论文,还包括很多其他的内容,如博客、书籍章节、访谈、案例、图表、数据集、会议文献以及网页、多媒体、专利等等,因而Plum Metrics可以说是面向的是一个真正意义上的学术文献。

PLOS Article-Level Metrics[10]的影响指标同样也包含了相类似的指标:(1)使用:PLOS浏览、PDF下载、XML下载,PMC浏览、PDF下载;(2)引用:PubMed Central、CrossRef、Scopus、Web of Science;(3)社会书签与活动:CiteUlike、Mendeley、推特、脸书;(4)媒体与博客覆盖:Nature博客、ScienceSeeker、研究博文、维基百科、引用通告(trackbacks);(5)讨论活动与评级:PLOS的评论、注释、评级。

由于中国网络部分限制以及语言隔阂等原因,对于我国论文的altmetrics 指数统计的客观性会受到一定程度影响。Altmetrics最近已经开始在数据统计中支持新浪微博,鼓励中国的研究者在微博上更多的分享自己的研究成果。但是,国内尚未有知名社交媒体主动申请加入altmetrics的数据统计,如科学网、小木虫、丁香园、爱思想等。

随着人们对altmetrics关注度的日益提高,将会有越来越多的研究者习惯于在网络中跟踪和关注其他研究者的活动,并发表自己的观点和评论,进而产生在线影响力。因此,altmetrics指数的统计范围也会越来越广泛,未来将有可能扩展到国内所有知名学术论坛和网站。

2 网络环境下学术文献质量评价模型构建

2.1 网络学术文献质量评价模型构建

Altmetrics目前是文献计量学领域的关注热点,引起了研究人员与学术出版界的广泛关注。尽管有用altmetrics替代引文指标的看法,但更多的研究者和研究人员还是认为引文指标与altmetrics指标互成互补性,诚如德国斯普林格《神经系统科学》期刊出版编辑Martijn Roelandse所说,altmetrics不是要取代传统指标,而是附加于其上,因为它涵盖了传统指标专注于引用而漏掉的其他影响力指标。

无论是传统的引文指标,还是媒介替代指标,这些评价指标所指向的其实都是单一性的,是源自于人们看待学术研究的某一视角,影响因子是基于期刊的,H指数是基于科学家绩效和成长历程的,SJR是基于期刊影响力的,altmetrics指数是基于网络影响力的,这些单一指标对于评价事物的某一方面无疑都是适用的,可以很快地发现和揭示出评价对象的主要特点,但与此同时也限制了人们认识事物本质和真相的视角,应该构建指标体系从多维视角去评价学术研究。因此,本文认为有必要建立一个网络学术文献质量评价模型,形成多维化的学术文献评价方案,通过评价的反馈作用,把握学术发展的状况,从而达到提高学术质量的目的。

基本的研究思路是以“学术文献被引统计基准线”及“学术文献网络水平基准图”为基础,结合引文评价和网络媒介评价两种方法,建立一个符合学术研究特点的,重视学术文献质量和影响力的学术表现评价坐标体系(如图1所示)。

图1 学术表现质量评价模型

由此,可以形成四个象限的不同学术文献质量评价,以论文为例,A区论文可以被认为是学术质量高,但有可能曲高和寡,网络社会影响力较弱;B区论文则无论学术质量和社会影响力都很强;C区论文是学术质量和社会媒介影响力双低的论文;D区是学术质量一般,但具有社会轰动时效的论文;图中的虚线是通过某一时间段的平均值划定的质量评价基准线,由此可以得到三类不同质量的论文区分和界定。

通过这一评价坐标体系,在一定程度上可以更全面地获得对于人文社会科学学术文献的基本判断和认识。

2.2 学术文献质量评价模型的加权模糊运算

本文提出的论文评价模型,是基于加权的模糊综合运算法[11]。拟根据各指标的重要程度,分别赋予不同的权重。至于引文指标和altmetrics指数的具体选取不是本文讨论的范畴,本研究所关注的是学术文献质量表现评价体系,评价的最后总分拟采用如下公式进行计算:

S=■λi■λijSij

式中:S为学术文献质量表现评估的最后总分;

λi为一级指标的权重;i=1,2,…,m,m为一级指标的个数;

λij为二级指标的权重;j=1,2,…,n,n,为二级指标的个数;

Sij为二级指标的得分。

本文的论文评价模型中,λi即为所选取的第i个一级评价指标(网络影响力和学术影响力的各个评价指标)的重要度;λij为第i个指标下的第j个二级指标的Sij重要度。首先,基于网络影响力和学术影响力的各个判断指标对人文社会科学文献进行详细的分析;然后运用模糊加权算法来分析评判文献的质量水平高低。

但是,该评价方法也有一定缺陷,例如,图中小矩形中所示为基准线论文,却被误判断为质量很高的论文,主要原因是其网络社会影响力很高,被广泛传播转发,从而可能也会被很多学术研究者引用,从而导致其被误判为高质量论文。例如:“大数据”是当下的一个研究热点,大数据相关的文章在网络上很多,但是仔细分析会发现,网上流传度较为广泛的都是那些对大数据的介绍性的文章,但是并不能说明这类文章的质量就高。因为这类文章通俗易懂,所以被广泛阅读和传播,从而网络影响力特别高。而那些讨论大数据的具体研究内容和方法类的文章,由于其专业性太强,算法太复杂,关注和点击率并不是很高,即其在网络上似乎并没有太大影响力。

3 结语

人文社会科学研究本身就具有很大的复杂性、多元性和模糊性,对于以学术文献为主体的人文社会科学研究成果的评价往往容易受到各种因素的影响和干扰,导致在一定程度上无法真实反映学术成果的影响和效用。

判别一项自然科学的研究,其质量和对于社会生产力的影响都是较为中立客观,有被验证的可能,因而比较清楚;而对于人文社会科学研究成果的评价则要模糊的多。一方面,人文社会科学的成果,其学术影响并不是即刻现时显现的,有时甚至是相当滞后的。不仅如此,在人文社会科学领域,往往经常会出现学术界的认识和社会大众的理解相左,研究被误读,或存在与现时舆论相反的颠覆性价值判断等复杂情况。因而,在人文社会科学领域,一些极具价值的理论、思想或观点,往往会出现认识上的几经周转,需要经过长期社会实践和历史检验之后,才可能慢慢为人所理解,因此对人文社会科学领域学术影响的探讨,除了应关注同行学者外,还应在更广阔的社会与空间范畴内对其进行深度审视。

面对多样性、复杂性的情况,在人文社会科学学术文献的具体评价中,选定和构建不同的评价指标与维度,确定评价标准,并运用科学的、合适的评价方法是非常必要的。本文所构建的自媒体环境下的学术文献质量和影响力的学术表现评价坐标体系有助于完善人文社会科学学术文献质量评价,以引文评价法为主导,以媒介替代性计量指标作为适当补充、校验,在一定程度上能够相对真实的反映学术文献质量和影响,避免出现过多被片面夸大、抬升,或贬低、忽视,甚至遮蔽的情况,从多个维度反映学术文献的真实状况和水准。

参考文献:

[ 1 ] 张贞.从“罗辑思维”看自媒体传播特质与生长空间[J].传媒观察,2014(10):21-23.

[ 2 ] 胡吉明.社会网络环境下的信息传播机制[J].情报科学,2015(1):15-18.

[ 3 ] 余厚强;邱均平.替代计量指标分层与聚合的理论研究[J].图书馆杂志,2014(10):13-19.

[ 4 ] 邱均平;胡小洋.庆发文和被引双增,贺质量和影响齐升:1980―2013年《情报理论与实践》载文的计量研究[J].情报理论与实践,2014(12):2-8.

[ 5 ] 方丽,崔雷.利用双聚类算法探测学科前沿及知识基础:以h指数研究领域为例[J].情报理论与实践, 2014(11):55-60.

[ 6 ] 隋桂玲.G指数与H指数、e指数的关系及其文献计量意义[J].图书情报工作.2013(23):90-94.

[ 7 ] 俞立平,潘云涛,武夷山.基于分位数回归的期刊影响因子影响因素研究[J].图书情报工作,2010(16): 143-149.

[ 8 ] 顾立平.论文级别计量研究:应用案例分析[J].现代图书情报技术,2013(11):1-7.

[ 9 ] 由庆斌,汤珊红.不同类型论文层面计量指标间的相关性研究[J].图书情报工作,2014(08):79-84

[10] 黄金霞,陈雪飞,沈东婧.开放资源的利用评价研究[J].图书情报工作,2013(21):18-23.

[11] 沙秀艳,王贞俭.基于快速二维熵的加权模糊C均值聚类图像分割[J].计算机工程与应用,2012(10):183-187.

评价指标论文范文10

摘要:基于低碳目标的城市轻轨内部空间评价研究是实现低碳轨道交通的基础。以城市轻轨内部空间低碳化为目标,按照“目标层——准则层——指标层”的层次结构提出低碳型城市轻轨站点内部空间评价指标体系,运用信息熵评价法,建立了基于低碳目标的城市轻轨站点内部空间评价方法。利用该方法对城市轻轨站点内部空间进行评价,为基于低碳目标的城市轻轨站点内部空间设计提供新的视角和依据,是对城市低碳轨道交通研究的有益探索。

关键词:低碳 内部空间 评价

在能源危机及生态环境不断恶化的现实背景下,节能减排成为了各国政府的中心议题,构建高效低能耗的低碳交通体系能缓解交通拥堵以及降低能耗和减少有害气体排放量[1]。城市轻轨所具备的低碳属性促使其进入发展高潮期,尤其近年来我国的城市轨道交通发展迅猛,随之带来巨大的城市轻轨建设量。而轻轨内部空间是整个轻轨枢纽主要的能源消耗载体,也是有害气体排放的来源,通过科学合理的评价方法对内部空间进行评价,从而为轻轨站点内部空间设计提供新的视角和理论依据,达到城市轻轨站点低碳化的目标。

在对轻轨站点评价研究上,张向科、刘浪[2]提出了基于AHP(层次分析法)的模糊综合评判方法,设立了评价指标,构建了评判方法和评判模型,并将模型应用到一个轻轨站点上。对其安全性、便捷性、舒适性、智能性进行综合评估。刘琪和晏克非(2005)[3]在确立评价指标体系的基础上,采用熵值法和广义效用函数法相结合的方法对站场规划方案进行综合评价。本研究是在已有相关研究的理论基础上对轻轨站点内部空间进行低碳评价,进而为其优化设计提供理论依据。

1.轻轨站点内部空间低碳评价指标体系的构建

1.1低碳指标体系建立原则

评价是通过一定的规则、方法利用归纳出来的指标对评价对象的某一方面或全面综合状况做出优劣的评定。评价轻轨站点内部空间状况时,要想得到真实、客观、合理的评价结果,必须先选取合适的指标,建立评价指标体系,选取评价指标时应遵循一定的指标选取原则[4]。如表1-1所示:

1.2评价指标体系的选取

轻轨既要满足旅客的中转,又要满足旅客的集散,它在整个城市交通运输网络中起到了一个连接的作用,并直接影响整个交通系统。轻轨内旅客聚集密度最大、停留时间最长的地方就是轻轨站点内部空间;同时,内部空间是主要的能源消耗载体,也是有害气体排放的来源,通过全面评价轻轨站点的内部空间,构建轻轨站点内部空间低碳评价指标体系。按照“目标层——准则层——指标层”的层次结构提出评价指标体系[5]。由此得出低碳型城市轻轨站点内部空间评价指标体系,如表1-2所示。

2.评价方法的选取与评价模型的建立

2.1评价方法的选取

轻轨站点内部空间评价体系中的评价指标数量众多、定性与定量相结合,需要采用适合的评价方法进行综合评价。目前用于轨道交通内部空间评价的方法种类繁多,并且各种评价方法又各有优缺点。选取合适的评价方法对评价指标体系进行综合评价至关重要,选取评价方法的关键是要选择适用于评价对象的评价方法。表2-1就各个评价方法做了简单介绍。

本文所建立的轻轨站点内部空间评价指标体系中的指标均可以调査所得或计算可得,不存在缺少统计资料的情况,也没有大量模糊指标,更不是非确定性评价问题,而且评价指标体系中已有很多主观评价指标,评价方法不宜选取受主观因素影响太大的评价方法,所以模糊综合评价法、层次分析法不适合作为本文的评价方法。灰色系统方法的有效性和实用性不够好,处理权重不太容易,所以不适合作为本文的评价方法。主成分分析法能消除指标间的共线性,但需要大量的统计数据,本文所建立的评价指标体系中的指标没有共线性,而且因为时间、环境的局限性得不到大量的统计数据,所以也不适合作为本文的评价方法。信息熵评价法是根据已知指标不同轻轨站点的差异度确定指标权重进行评价,故选取信息熵评价法作为本文轻轨站点内部空间评价指标体系的评价方法。

2.2评价模型的建立

基于信息熵理论构建本文的轻轨站点内部空间评价模型,设有m个轻轨站点需要进行

评价,m个轻轨站点用n个评价指标进行综合评价,则指标矩阵X可表示为:

各评价指标的概率Pij为:

当j一定且x1j=x2j=...=xmj时,即某一个指标所有轻轨站点的得分完全一样,此时Pij= l/m ,令Pi= 1/m;因Pij≥0,Pi≥0(i=1,2,...,m;j=1,2,...,n)且 则指标Xj相对强度熵Hj的计算公式为:

当某个指标对所有要评价的轻轨站点来说值相同时,信息熵值达到最大,此时Hj=1即对所有要评价的轻轨站点来说该指标完全一致,该指标的存在不影响最终评价结果。因此,某个指标的重要性取决于该指标的信息熵值Hj与1的差值,设其为指标的差异度Dj其计算公式为:

Dj=1-Hj (4)

根据归一法,所有指标的熵权和应为1。则指标的熵权Wj为: (5)

综合评价结果为指标的熵权与指标值的简单加权和,其计算公式为: (6)

式中, (7)

为m个轻轨站点综合评价结果的水平矩阵,其中Ri(i=1,2,...,m)表示第i个轻轨站点的综合评价结果[6]。

对综合指标评价水平矩阵R中的元素进行排序,确定最终的评价结果。矩阵元素越小,则对应的轻轨枢纽内部空间低碳性越好;矩阵元素越大,其对应的轻轨枢纽内部空间低碳性越差。

3.结束语

低碳型城市轻轨站点内部空间是新时期城市轨道交通低碳化发展的重要目标之一。低碳交通的迅速发展是在全球环境危机和能源危机的基础上发展起来的,它的实施效果可以被看作是节能减排、降低碳排放实现的一个方面,促进了城市交通发展观的变革。本研究建立了基于低碳目标的城市轻轨内部空间评价指标体系,利用信息熵综合评价法,对城市轻轨站点内部空间进行低碳评价,以指导轻轨站点今后进行空间结构调整与优化,为轻轨站点内部空间设计提供了新的视角和依据,是城市低碳轨道交通发展研究的新的尝试和探索。

参考文献:

[1]罗湘蓉.基于绿色交通构建低碳枢纽——高铁枢纽规划设计策略研究[D],北京交通大学,博士论文,2012.

[2]张向科、刘浪.模糊层次分析法在轻轨站点综合评价中的应用[J].《特种结构》增刊第十一次全国城市道路交通学术会议论文集.2011:225-227.

[3]刘琪,晏克非.公路站场规划布局方案综合评价方法研究[J].公路交通科技,2005,22(11):159一162.

[4]李静.客运枢纽内部环境评价方法研究[D].北京交通大学,硕士论文,2012.

评价指标论文范文11

关键词:科研立项;评价;h指数

中图分类号:G250.252 文献标识码:A 文章编号:1008-0821(2012)07-0074-03

高校范围的科研立项评价主要指根据相关科研评价、科研评价方法,综合评价高校科研员人员或者以科研团队的科研水平和科研成绩等。目前的立项评价主要是采用定性与定量相结合的模式,评价中产生了积极的效果,促进了高校教师科研水平的不断提升,但也存在不少问题。本文针对目前高校科研立项评价中存在的主要问题,进行了剖析,并提出了一种以h指数为全新的改进对策,为高校科研项目的立项建立了公正、科学的新方法。

1、科研立项评价概况

1.1 科研项目评价的基本原则

在科研管理领域,科研项目立项的选择和评价需要我们深入的探索研究,虽然出现了很多经验型或规范型的方法,但应用的较少,其主要问题在于指标体系没有得到科学性的证实。科学研究是一种十分复杂的高级脑力劳动,无论是从事这一劳动的科技人员,还是项目本身,都包含有许多模糊的因素。所以评价科研项目时一般应遵循的原则:即全面性原则、科学性原则、客观性原则、可比性原则和简易可行性原则,这里的科学性原则和客观性原则分别从质和量的不同侧面,反映科学研究的客观规律。可比性原则指是要能把某一事物进行绝对或相对的比较,这才能真正确认事物的优劣。如果指标体系过于简单,反映不出事物的本质,所评出的项目显然是不可靠的。

1.2 传统立项评价简介

传统的科研立项评价方法及模型,基本上都是上世纪60~70年代的产物,都存在着一定的局限性。最主要的局限性在于主观因素太强。科研项目评价体系的设计必须做到科学和客观,最大限度地反映科研项目的创新性和可应用性。最初使用的评价方法是同行评议,由学科内的权威专家对科研项目的立项作出评价。但是,这种方法有一定的局限性,有时不能正确地反映出科研项目的真实水平。

1.3 传统科研评价存在的问题

传统科研项目评价主要是评价中存在“名人效应”,从而影响其公正性,在实际评价中,评审专家对名人的科研项目存在拔高的现象;一般专家也会受到权威专家评价结果的影响,从而很难做到公平、公正。可能出现学术不端行为,有的评价专家与参评项目申请者有着相同、相似的研究方向,将申请者的项目排斥在应有的评价之外等。论文数、引文数量和影响因子等评价指标都能从不同角度对科研人员或科研群体的成就和贡献做出正确评价,但是也都具有不同程度的缺陷。多年来,科研管理机构一直在寻求能比较客观反映项目本身的量化指标或方法,目前较普遍的一种方法是用传统的文献计量指标即论文数量和论文被引频次来定量评价。这种方法克服了同行评议主观性强、评价结论存在着随机性和不稳定性的缺点,但由于所采用的论文数量和论文被引频次两项指标彼此独立,实际评价时也难以取舍。例如无法回答发表100篇论文被引用50次的作者与发表50篇论文被引用100次的作者谁的科研项目哪个更为突出这样的问题。

2、利用h指数对科研立项可行性分析

2.1 h指数的基本含义

2005年美国物理学家Hirsch提出了测评学者成就的指标h指数,该指数将数量指标和质量指标结合在一起。他认为,某一文献的引用频率并不能作为衡量该文献学术影响力的指标,因为有些文献的引用完全是“自我引用”。而h指数,是指一个人发表的论文中,有h篇被引用了至少h次。即一个人发表的所有论文,按被引次数从高到低排列,往下核对,直到某篇论文的序号大于该论文被引次数。例如。某教授的h指数是10,表明他已发表文章中有10篇文章每篇至少被引用了10次。评价科研人员的学术成就,仅凭其发表的论文总数并不妥,还要看这些论文的质量。h指数巧妙地将数量指标(发表的论文数量)和质量指标(被引频次)结合在一起,同时对论文产出力和论文影响力进行测量。克服了以往各种单项指标的缺点与不足。如论文数量很多,但论文被引频次不高的作者,指数一定不高;被引频次很高,但论文数量不多的作者,h指数也会被论文数量所限,而不能得到高h值,只有当论文数量多,而且多数论文具有高被引频次时,能获得较高的h指数。

2.2 H指数能同时兼顾论文数量和论文质量

h指数的提出以及短时间内在文献计量学界所产生的广泛影响,表明这一指标对于完善个人科研评价体系非常有意义,对科研立项的评价指标也有很大的启示作用。但是,利用h指数的基本思想方法,并在充分广泛调研的基础上,对这个问题作了一些探讨,提出了独特的评价科研项目的可行性定量标准,h指数巧妙地将数量指标(发表的论文数量)和质量指标(被引频次)结合在一起,为科研立项的最终结果提供了重要性参考。h指数作为一个科研评价的新指标,在诸多领域得到了广泛的应用。h指数在一定程度上能够解决传统的文献学指标在科研立项评价中的局限性,能够同时对论文产出力和引文影响力进行测量,提高科研立项评价的科学性、完整性和公平性。在评定高校科研项目时也是非常有效的。

2.3 H指数对科研立项指标建立的指导意义

应用h指数作为科研立项评估中的一项量化指标,其突出优点是把学术成果的数量与质量联系起来,同时对学术成果的累积效用有所反映,克服了传统立项评估方法的一些缺陷。h指数最初是用于评价科学家个人成就,随后逐步扩展至对科研团体、期刊、学科、大学甚至国家的学术影响力的评估。科研机构h指数的高低与其论文总量、总被引频次密切相关,也与机构的规模大小、方向任务密切相关。机构的规模越大、历史越悠久、学科越全,其积累的学术产出就越多,所产生的学术影响就越大,机构的h指数也就越高;因此,h指数能够较好地反映科研机构学术产出和学术影响力,一定程度上可以降低误差,提高准确度。在应用h指数评价科研项目时,我们会判断出研究项目成员的研究实力,准确计算出本项目核心研究力评价数量指标和综合研究实力评价指标,认为把项目组的核心研究力指数和项目组综合研究实力指数作为科研评估中的一项量化指标,可以在一定程度上克服传统评价方法的一些缺陷。用h指数评价高校科研项目,能够指导激励科研人员积极开拓前沿科学领域、探索深层次科学问题。

3、h指数对科研立项评价的计算法概述

3.1 项目范围及使用数据库的选择

本项目以选取山东科技大学校级申报的项目为基础,复印有典型的同类项目,然后对这些项目进行比较核对,计算出项目组成人员的h指数数值;有了项目组的研究h指数数量指标之后,这为科研立项工作提供了有力的依据,该种方法公正客观,具有切实可行的操作性。本文选择中国知网(CNKI)的中国期刊全文数据库作为数据源,利用项目组成人员所发表的论文及其被引数据,计算出各成员的h指数’,并利用组成人员的不同权重求出平均值,从h指数的角度评价项目的质量高低。将中国期刊全文数据库作为数据源是因为该库是目前世界上最大的连续动态更新的中国期刊全文数据库。检索途径和策略:期刊年限不限定,来源类别限定为“核心期刊”,关键词为山东科技大学,匹配模式为“模糊”,统计第一作者单位为山东科技大学的被引论文数量,从而确定某人的h指数。

3.2 科研立项时项目组成员的h指数定量计算法

如科研项目:高校图书馆信息资源建设中存在的问题及决策研究

一般科研项目组成人完成人在某学科都有数量不等的成果,如论文、著作等成果,把从事该项目的所有组成人员都一一列出来,算出每位作者的个人h指数,然后计算出总的H值,并根据权值不等算出平均值,即可简单确定项目质量高低的定量指标,并以此重要指标来作为项目立项的重要依据。

需要强调的是项目主持人权重为0.6,其他成员的权重总和为0.4,这里说明了项目负责人的重要性程度,这样的权重比较科学合理,符合科研立项的合理性原则。权重表示在评价过程中,是被评价对象的不同侧面的重要程度的定量分配,对各评价因子在总体评价中的作用进行区别对待。事实上,没有重点的评价就不算是客观的评价。打个比方说,一件事情,你给它打100分,你的老板给它打60分,如果平均,则是(100+60)/2=80分。但因为老板说的话分量比你重,所以老板的权重是2,你是1,这时求平均值就是加权平均了,结果是(100*l+60*2)/(1+2)=73.3分,显然向你的老板那里倾斜了。假如老板权重是1,你的权重是3,结果是(100*3+60*1)/(1+3)=90。这就是根据权重的不同进行的平均数的计算。

从表1可以看出,该项目组的综合研究实力指数为:

H=10+7+6+5+5+4+2+1=40

每个人平均指数为:

Ha=10*O.6+(30*0.3)/7=7.3

很明显,前3位成员为项目组核心研究成员,他们具有较高研究水平,对本项目起着非常重要的作用,这也是项目立项中不可忽视的细节。

3.3 h指数对科研立项评价的结果分析

科研项目负责人往往具有最高或较高h指数的成员之一,他的研究实力影响到整个科研项目组的研究水平。项目组成员的数量对项目的综合研究能力有一定影响。但对主要核心研究力影响不大。一个成功的项目组成人员往往不在于其成员的数量,而在于项目组成员的质量。主要核心研究力指数重点反映项目组核心研究实力的人数,而综合研究实力指数则反映项目组成员的研究实力的算术和。如果某个科研项目成员的平均个人指数越高,说明该项目的研究力越强,反应出所研究的项目水平越高;反之说明项目研究力相对较弱,该项目水平不是很高。

4、H指数评价项目时存在的问题及改进对策

4.1 H指数存在的问题

评估专家用h指数进行评价,前提是要了解该学科有哪些主要研究人员。科研项目在进行立项评估时,有时要确定某一学科某一研究对象的组成人员的h指数情况。需要说明的是,h指数是对于已有的科技成果的计量,是一种事后的反映。而科技项目的立项工作是面向未来、推动科技创新的工作。项目的选题策划具有科研导向的作用。因此,有关人员在项目立项评估时要考虑研究人员取得新成果的可能性。通过上述方法确定的项目只是具有取得新成果的可能性,而不等于具备了取得新成果的现实性。那些有高h指数的研究人员往往是功成名就的专家,评估专家对项目进行立项时不仅要考虑那些已成功的研究人员。而且要关注那些发文量不多、h指数居中,却有发展潜力的研究人员,因为他们可能有更强的研究动力。

4.2 给评估专家充分的评审时间

针对在科研立项评审中普遍存在时间紧、任务重,评价时有走过场的情况,建议学校统筹安排,给参评专家足够的时间来审阅科研项目,从而得出更为客观真实的结果。为了减少评审结果的误差,可适当增加评委的数量,实行少数服从多数的原则确定结果。要以项目的综合研究实力H指数和平均个人h指数为基本定量标准,这样可以降低简单评价的不公正性,从而真正提高评审结果的可信度与有效度。

4.3 建立统一的专家数据库

评价指标论文范文12

关键词 综合评价 赋权 多指标

中图分类号:C81 文献标识码:A

0 引言

广义地讲,一切基于多个因素来综合判断评价对象水平或状态或类型的认识过程,都可认为是综合评价活动。现阶段主要研究的是多指标综合评价。所谓多指标综合评价概指对以多属性体系结构描述的对象系统做出全局性、整体性的评价。其基本思想是:建立多个评价指标,并确定与该指标体系相对应的权重系数,将多个指标转化为一个能够反映综合情况的指标来对有限的被评价对象(或系统)的运行状况进行排序或分类的问题。另外,我们生活在一个评价的社会里,我们随时随地都在评价(或评估)一些经济热点问题。因为在平时的科研工作中,经常面临各种(有限方案)的决策问题,而在决策之前,需要对各个备选方案进行综合评价。可见,没有科学的评价,就没有正确的决策。①

1 国内外研究研究回顾

综合评价的研究历史久远,1888年,Edgeworth在英国皇家统计学会的杂志上发表的论文“考试中的统计学”,提出了对考试中的不同部分如何加权,该文中用到了综合评价最常用的方法之一“加权”。20世纪70-80年代,是现代科学评价研究鼎盛的年代,在此期间,产生了很多种有效的综合评价方法和模型。这些研究都具有开创性的贡献,为综合评价结果的优良性分析提供了指导。

20世纪80年代以后,是综合评价模型发展的年代。1994年陈述云和张崇甫在《多指标综合评价方法及其优化选择研究》中提出用等级次序检验解决多种综合评价方法的优化选择,该方法虽然具有一定的局限性,但为评判各种评价方法的优劣提供了一条新思路。②杭州商学院省自然科学基金课题组于1996年在《“序号总和理论”及其在综合经济效益排序中的应用》一文中提出了“序号总和理论”。“序号总和理论”给出了准确的综合评价排序方法,但在实际应用中却有一定困难。当评价方法足够多时会使大体准确的评价方法数目相当大而很难实现,也无法判断所采用的某种评价方法的结果是否大体准确。③

2000年以来是多指标综合评价理论与方法高速发展的一个阶段,许多学者围绕着评价方法优选比较问题开展了一系列的研究。2003年尚卫平在《多指标综合评价方法的优选》中提出在建立了合理等级排序依据的前提下,可以根据各综合评价方法所做的等级排序与合理等级排序的“差距”或“相关度”来进行综合评价方法的优选。④2005年桂文林、舒晓惠等实证研究了评价方法择优的最小均方误差决定机制和评价方法优劣的股价传导决定机制,并进一步给出了各方法孰优孰劣的实证结论。⑤2007年张卫华和勒翠翠在序号总和理论、众数理论、集值统计研究成果的基础上,提出了一种区间综合评价合成技术,并给出针对综合评价方法选优问题的量化检验标准。⑥

近几年来综合评价方法代表性成果有:2010年郭亚军等研究了基于TOWA算子的动态综合评价问题模型,给出了一种确定时间权重的方法——最小方差法。⑦2011年郭亚军等分析了几种常用无量纲化方法对拉开档次法的评价结果的影响,并据此给出了在拉开档次法中如何科学合理地选择无量纲化方法的依据和建议。⑧2013年苏为华等提出了一种基于函数型数据的综合评价方法,并针对由函数型数据表支持的综合评价问题的特殊性,提出了一种新的确定权重系数的“全局”拉开档次法,“全局”拉开档次法是“纵横向”拉开档次法的推广和发展,该方法不仅可以比较出不同时刻的评价函数值的大小,而且可以清楚地看到各个评价函数在一段时间内的动态发展过程。因此该方法优良性得到论证,不足之处是理论证明有待完善。⑨

2 对综合评价回顾分析

综合前人的研究成果,国内的学者将研究的注意力往往放在评价的方法与模型的改进上,但却没有深入理论论证综合评价方法的优良性,数理统计学中点估计的优良性有无偏性、一致性、有效性和相合性,综合评价方法的优良性研究却处于起步阶段,当前评价实践中的一个认识误区是,把排序或归类当成综合评价直接最终目标,常常是“一排了事”,方法的优良性缺少理论论证。另外综合评价方法近年来在解决经济管理问题时仍然是最有效的方法之一,因此综合评价方法及其优良性标准研究是值得探讨的问题之一。⑩

3 综合评价优良标准可以继续完善的部分

3.1 综合评价中指标选择优良标准研究

为了削弱综合评价结论的主观性,提高评价结论的客观性、合理性,需要特别慎重设计评价指标体系。因为指标体系的设计直接影响到综合评价的结果。当前综合评价研究问题通常奉行“一排了事”,忽视了综合评价的统计指标体系中的各项指标的统计测度属性,导致综合评价结果中所包含的丰富统计信息遗失。本题基于综合评价的思想,将综合评价结果可以看作统计量,它是各个统计评价指标的线性组合(使用线性评价模型),它仍然是一个随机变量,那就意味着它的取值可以根据一定的概率分布来判断是否具有合理性。当然,也可以对综合评价结果进行各种统计假设检验(不同类型评价单元之间是否存在显著性差异),也可以利用相关分析和回归分析或通经分析,研究指标体系中各个指标对评价节的影响是否符合实际和给定的标准。之前,在综合评价理论界,有不少学者提出了采用定量手段筛选指标体系的思想,目前比较受欢迎的做法两类:一是基于指标之间的相关性,二是基于指标数值的变异性。前者的理论假设是:指标之间高度相关意味着信息重叠因而是可以删除的;后者的理论假设是:无区分度或区分度太低的指标是不重要的因而是可以忽略的。但我们认为这两种定量筛选方法宜慎用,应该以不影响综合评价指标体系的“全面性”与“代表性”为前提。

3.2 综合评价中赋权方法优良标准研究

在综合评价方法中,可归结为“赋权方法”的常用评价方法有层次分析法(AHP)、数据包络分析(DEA)、灰色关联分析、主成分分析法、专家意见法以及模糊综合评判法等。这些方法都有各自的适用范围、赋权依据和基本特性,有的适用于定性评价,有的则适用于定量评价,有的可以在定量与定性分析中同时使用。如果采用了不适合的赋权方法可能得出不正确的结论,从而影响评价结果的准确性。我们认为,赋权方法的优良标准取决于评价结果的优良标准,无论什么赋权方法只要能够获得优良的评价结果,那么该赋权方法就是理想的赋权方法,否则该赋权方法就是不理想的赋权方法。常用的组合评价方法有平均值法、Borda法、Copeland法和模糊Borda法等。此外,综合评价中的赋权方法优良标准还应该体现综合评价中的核心指标的重要性。然而,纵观以上所有参考文献和方法介绍中,对指标赋权时,都忽略了核心指标作用。如何体现核心指标的重要性是综合评价问题中赋权优良标准的重要体现。提出核心指标重点赋权的优良标准是当前研究的方向和特点。

4 结论

本文通过梳理综合评价技术的研究文献,对前期的研究成果作了回顾与分析,提出了综合评价有待研究的部分新问题。

注释

① 苏为华.我国多指标综合评价技术与应用研究的回顾与认识[J].统计研究,2012(8).

② 陈述云,张崇甫.多指标综合评价方法及其优化选择研究[J]. 数理统计与管理,1994(5).

③ 杭州商学院省自然科学基金课题组.序号总和理论及其在综合经济效益排序中的应用[J].数量经济技术经济研究,1996 (1).

④ 尚卫平.多指标综合评价方法的优选[J].南京经济学院学报,2003(3).

⑤ 桂文林,舒晓惠.上市公司经营业绩综合评价方法的比较与实证研究[J].经济管理,2005(3).

⑥ 张卫华,勒翠翠.多指标综合评价方法及方法选优研究[J].统计与咨询,2007(1).

⑦ 郭亚军,唐海勇.基于最小方差的动态综合评价方法及应用[J].系统工程与电子技术,2010(6).

⑧ 郭亚军,马凤妹.无量纲化方法对拉开档次法的影响分析[J].管理科学学报,2011(5).