HI,欢迎来到学术之家,期刊咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0
首页 精品范文 教育测量与评价论文

教育测量与评价论文

时间:2022-04-14 08:55:41

教育测量与评价论文

第1篇

刘 尧

提要 本文针对教育评价相关关系不清的总是从多角度对此进行了辨析,并对教育评价学科群的建设,提出了许多有益的建议。

关键词 教育测验 教育测量 教育评价

作者 刘尧 浙江师范大学教科所副研究员(金华 321004)

教育评估、教育评价是20世纪30年代在美国兴起,60 年代兴盛于西方世界并传入我国。这些学科虽然在我国大力发展已有20余年,但理论

研究的进展不大,学科的成熟度不高,与我国广泛开展的教育评价活动很不适应.我国各省市都有考试院(中心),也成立了许多评估、评价机构,广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟.尤其值得重视的是教育评价与教育研究和发展,以及对教育评价实践的指导.鉴于此,本文对与教育评价相关概念进行简述和辨析.

一.关于教育评价相关概念简述

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为社会考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生学习的潜在能力、发展倾向,如音乐能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、总结性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理,准确地掌握教育

情况,为制定教育方针、政策提供科学依据,为开展教育科学研究,探索教育规律,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育问题的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标计算法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要内容包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的历史、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于意识形态范畴,可见教育评论家属于研究意识形态和揭示教育评论活动的本质规律,建立完整的教育评论学学科体系。所以,教育评论学也属于基础理论学科。再次,教育评论学的研究对象决定了教育评论学涉及整个教育领域,内涵十分丰富。也可从不同视角,针对不同范畴建立多部门、多层次的分支学科(如:教育理论评论学、教育史评论学、教育行政评论学、教育家评论学等),所以教育评论学又是一门综合性的学科[6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有参考价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据影响教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和规律为对象的,它探讨客体“是怎样的“、”是什么“,探讨事物的现象、本质和规律等实体属性,即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象,它探讨客体的价值属性,即客体的社会意义------对社会需要意味着什么,它以多种意识形式-----认识(价值与事实判断)、情感(对价值的态度体验)、意志(对价值的自觉保证)等诸种形式的综合来反映客体与主体需要的关系。

从前面的分析可以看出,教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析,而且要进行质的分析,

把所有考查绩效的材料和分析综合起来,在多大程度上达到了预期的目的作出价值判断。从这里可以看出,教青评价行为是建立在事实判断基础上的价值判断.教育评价中的事实判断在于诊断与鉴别教育的性状,价值判断则是对诊断鉴别而得的结果或结论,按其价值取向进行合乎目的的推断和判断;事实判断是价值判断的基础,价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向,对教育的一种价值判断。从教育测验到教育评论是一个由事实判断向价值判断的变化过程,我们不能说教育测验丝毫没有价值判断,如在测验什么不测验什么的问题上是有价值判断的;同样,我们也不能说教育评论就无点滴的事实判断,教育评论需要通过事实判断的真凭实据作论据。

四、对教育评价学及其学科群研究的建议

教育评价学经过几十年的发展已初步形成了学科体系,尽管概念、体系有待完善,但已为下一步的研究打下了坚实的基础。与此相应的考

试学(研究教育测验的学科)、教育统计学、教育测量学、教育评估学、教育评论学都已有相应的发展,形成了一个共生的教育评价学科群。21世纪,要使这个学科群得到良好的发展,我认为首先对各个学科的研究范围有个明确的划分,尤其是对教育评价学要有合理的定位,不要再把考试学、教育统计学、教育测量学的内容纳入自己的努力范围,要让它们以独立的学科更好地为教育评价学服务。另外,教育评价学还要把属于教育精神文化、制度文化类的抽象的,教育评价无力评价的范围还给教育评论学,让教育评论学更快地发展.同时,要把教育评估与教育评价的关系处理好,可将两者合二为一,形成统一的学科.其次,各学科要明确自己的研究对象,形成概念体系和学科体系,把一些已成熟的概念和理论约定俗成稳定下来,逐步形成相对稳定的学科知识和概念体系。第三,要处理好理论与实践的关系,加强理论研究,使其适应实践的要求,要积极总结实践经验并升华为新的理论,丰富和发展教育评价学学科体系.第四,要处理好引进与消化吸收的关系问题。无论是从国外引进的教育评价学理论,还是从教育科学界以外引人教育的评价理论都要结合我国的教育理论和教育实践,进行修正使其“本土化”和“教育化”。

综上所述,搞清教育评价相关概念的关系,对理清教育评价学科群内各学科的关系,促进该学科群的发展,为丰富和发展教育科学,加快

教育事业的发展有重大的理论和实践意义。

第2篇

关键词:教育评价;课程评价;价值;目标

20世纪的学者围绕着“如何合理地衡量‘预期目标’和‘实际结果’的存在的差异”的问题展开研究, 30年代来自泰勒“目标达成评价”奠定了美国教育评价的基础。随着联邦政府对教育的投入,教育评价取得了繁荣和昌盛,对“目标达成评价”的批评来自两个方面:一是针对教育目标本身的攻击。反对该次课程改革的人们开始质疑课程改革本身是否能满足社会需要,也就是质疑教育目标自身的合理性问题,这就使得原本“中立”的目标评价对自身的价值产生了反思。二是针对教育目标实施过程的关注。这时人们关注的并不仅仅是目标的达成,而是在过程之中所具有的繁复情境,关注在各种情境下的参与者特有的价值立场。教育研究者对教育改革实施过程的关注使得参与者的价值立场凸现出来。这些批评带来了教育评价革命性的发展。与此同时,评价研究配合联邦政府的教育渗透政策,展开新的评价视阈的开拓。

一、屏蔽价值:目标达成的“科学”评价

20世纪30年代,美国俄亥俄州立大学教授泰勒 (Ralph W.Tyler)站在课程研制的管理者立场,将评价拓展到教育方案质量的评价。不过,这种拓展受到当时科学管理思想的影响,所谓的方案质量的评价指:将课程视为目标的存在。泰勒宣称评价是“测定教育目标在课程与教学的方案中究竟被实现多少的历程”,而评价的核心就是长存于历史当中的“学习经验(learning experience)的发展”。为此,课程评价的重点工作就是确立客观可信的标准和测量的工具,而工具应该能够囊括“教育目标所期望的行为的任何有效证据”,如纸笔测验(paper-and-pencil tests)、观察(observation)、交谈(interview)、问卷(question-naires)、收集实际作品(actual products)等。30年代早期,泰勒的评价方法在俄亥俄州得以实践。

经济大萧条时期(The Great Depression),学校和其他公众组织遭受资源短缺的困扰。此时,罗斯福总统(Roosevelt)开始进行政治上的新改革(New Deal Program)。在这个背景下,进步主义运动沸沸扬扬,泰勒参与了进步主义的运动,1932年开始领导著名的“八年研究”,并在卡内基机构(Carnegie Corporation)资助下,尝试比较不同学校教育的有效性。泰勒的教育评价(education evaluation)开始将评价拓展到教育方案质量的评价,“八年研究向全美的教育学者们介绍了更加广泛的教育评价,而不只是局限在学生的有效性和测验的范围”。而且,评价确定了预定的目标规范,关注预期目标的实现。泰勒以其研究的结果告诉我们,在预期目标和实际结果之间存在着巨大差异。早期的评价倾向于关注结果的测量,而把作为课程实施的重要环节——课堂和学校屏蔽起来,这种过程“黑箱”很快就引起了学者的反思。20世纪40年代以后,泰勒也对自己的工作进行了反思,其论著在以后的25年中产生了持续的影响。

20世纪40年代到50年代中期,美国城乡里弥漫着贫穷和失望,充满种族偏见和隔离,是一个资源浪费而人们熟视无睹的时代,是工业发展而危害环境的时代。但在经济的带动下,新的学校形式出现,学区的教育形成各种服务系统。社会和教育对教育的需求无限膨胀,但是人们很少关注教育的效率和有效性。不过,评价技术却得到了很大的发展,1947年成立的教育测验服务机构(Educational testing service)。20世纪50年代,联邦资金鼓励并支持专业研究活动,标准化测验已经得到广泛传播,专业组织建立了一系列规范测验指标。1954年,美国心理学家协会(American psychological association)提供《心理测量和诊断技术的具体建议》(Technical Recommendations for psychological tests and diagnostic techniques,简称APA)的报告。1955年,美国教育研究协会 (American education research association,简称AERA)和国家教育测量委员会(National council on measurement used in education,简称NCME)发布了《成就测验的技术建议》(Technical Recommendations for Achievement Tests)。1966年,前面三个机构联合发布了“教育和心理测量的标准手册”(Standards for Education and Psychological Tests and Manuals)并于 1974年进行了修订。

此时,标准化测量风靡一时,专家根据可接受的目标或目的建构测验,预先设定不同年龄或年级的常模或标准,用以管理、评级和解释分数的意义。包括性向测验(Aptitude tests)、成就测验(Aptitude tests)以及兴趣、个性和态度测验(Interest,Personality and attitude inventories)。这些标准测验方法看起来满足了科学化的要求,但在实际上却与泰勒规则相矛盾,因为泰勒认可并鼓励目标的差异性。不过,这些技术性的发展为未来评价的拓展奠定了技术的基础。

二、价值渗透:关注过程的“方案”评价

进入20世纪50年代,评估已经拓展到学生学习、课程设计的有效性之外,进入到教育系统、国家发展计划甚至是政策系统。评价者并没有遵照课程评价领域的前辈们的已有研究范围,而是将自己的研究领域拓展到公众领域的政策问题范围。50年代后期,教育领域资源的重组,随之产生了各类课程发展与教育的问题,评价的价值及其伦理问题已经成为评价领域的重要问题。

1957年苏联卫星发射成功的事件之后,联邦政府制定了《国防教育法》(National Defense Education Act,1958)。整个时期,联邦政府开始关注到教育的质量问题,开始资助大规模的评价计划,评价开始从“作为行业(industry)的评价到依靠税收的职业(profession)”。学科专家组织了科学和数学的课程发展计划(curriculum development project),不过很快人们就发现这些课程没有发挥其真正的力量,而且评价者的论著既无助于课程研制,也不对有效性的检测负责。1963年,心理测量专家克龙巴赫(Lee J.Cronbach)针对人们的抱怨,批评评价缺乏相关性和应用性,主张《通过评价提升课程》(Course improvement through evaluation),认为测验项目的分析和汇报有利于教师的教学,并建议课程评价必须聚焦于课程研制过程中课程专家的决策。但是,这并未引起美国教育评价领域学者的关注。

几年之后,情况变得不同了。1965年,肯尼迪总统智囊团的主席休伯特·汉弗莱议员(Senator Hubert Humphrey)和约翰逊总统(President Lyndon Johnson)对贫穷问题展开争论,人们开始将目光转移到社会福利的改革。20世纪早期积累的财富促使联邦政府开始资助这些福利计划。《初等和中等教育法案》(1964)(The Elementary and secondary education Act of 1964,简称ESEA)首次拨出特定联邦资金用于地区教育系统,教育被视为州的责任。随着联邦资金对地区教育的投入,国家开始干涉资金的运用效果。很多资金投入并未如地方宣称的那么理想,因此这些都要求教育者将教育评价转移到实践等支持性研究,学校开始接受ESEA的定期检测。由于评价可以终止或辅助课程项目,因此课程评价研究变得如此重要。费黛奥塔·卡朋(Phi Delta Kappa)联合会建立了“国家评价研究委员会”(National Study Committee on Evaluation),针对评价存在的问题进行调查。1960年后期,大部分美国教育学者都在着手于教育评价的研究,各类人员从不同的领域开始进入到教育评价领域,重新审视教育评价的本质概念。教育评价研究开始进入概念化(conceptualization)过程,这意味着对评价目标、评价对象、实施建议、服务过程,以及测量预定和非预定的结果等问题展开讨论。

1967年,美国教育研究协会(American Education Research Association,简称AERA)的罗伯特·斯蒂克(Robert Stake)对课程评价的研究引发了公众的关注。此时,评价者大多为心理测验学和实验设计人员,因此被人批评为缺乏教育问题的鉴赏力。其实,在1962年AERA会议之后,随着AERA的专论的出版,评价是教育测验的假设已经逐渐被摧毁。争论由此扩大化,就连泰勒(Ralph Tyler)、斯克里文 (Michael Scriven)和斯蒂克(Robert Stake)也开始批评心理测验手段是否可以用于满足评价的目的。1967年,斯克里文区分了形成性评价和终结性评价,“形成性评价”不仅仅是作为一种评价形式而被提出,它开启对过程与未来目标的重视。评价不再是单纯的心理测量技术,它需要容纳伦理的、政治的各种价值。到了20世纪70年代,就连专门从事测量的学者伯汉姆(Popham)也在提醒学生要关注伦理维度的新问题。接着,课程实施的过程开始容纳进入课程评价的眼帘。斯克里文的《应答性评价》(Responsive Evaluation,1974)、麦克唐纳(McDonald)的《民主的教育》(Democratic Education,1974)、里庇(Rippey)的《交互式评价》(Transactional education,1973)论著发表,这些论著鼓励参与者通过各种表达形式参与到课程改革中来,将课程改革拓展到更广泛的参与层面。

三、重构价值:关注评定的“综合”时代

1973年,评价领域开始成为一个专业研究和测验的领域。教育评价者的计划在20世纪70年代开始凸显,例如专业杂志《教育评价和政策分析》(Educational Evaluation and Policy Analysis)、《评价研究》 (Studies in Evaluation)、《评价和方案计划》(Evaluation and Program Planning)、《评价新闻》(Evaluation News)等陆续产生。专业机构如“五月十二日”(The May 12th Group)、H区域(Division H of AERA)、评价网络(the Evaluation Network)以及评价研究社会(The Evaluation Research Society)专攻评价研究。许多大学也开始设计评价方法的课程(不同于研究方法),例如伊利诺斯州立大学(University of Illinois)、斯坦福大学(Stanford University)、波士顿学院(Boston College)、加利福尼亚大学洛杉矶分校(UCLA)、明尼苏达州立大学(the University of Minnesota)、西密歇根大学(Western Michigan University)。各种形式的专业研究机构开始组建,如UCLA的评价研究中心(Center for the study of evaluation at UCLA)、西北地区教育实验室(Northwest Regional Educational Laboratory)、斯坦福评价联盟(the Stanford Evaluation Consortium)、伊利诺斯州教学研究和课程评价中心(the Center for Instructional Research and Curriculum Evaluation at The University of Illinois)、西密西根大学的评价中心(the Evaluation Center at Western Michigan University)、测验研究中心(the Center for the Study of Testing)、波士顿大学评价和教育政策机构(Evaluation and Educational Policy at Boston College)等。交流会导致各种嘈杂的声音,专业机构之间的合作虽然增多,新的专业组织加强了交流,并降低了评价领域的碎片化。这些机构对评价进行研究,甚至出现了对评价质量进行研究的元研究(meta-evaluation)。学者们在不断寻求适当的方法,增加交流和理解,评价的技术得到发展。

在这个时代,评价者意识到评价技术必满足各种各样的需求,委托人的需求、中心的价值、真实的情况、探究的需要、精确的要求,评价的方法得到了发展,例如,目标游离评价(goal-free evaluation, Scriven,1974,Evers,1980)、支持一对手小组(Adver-sary-advocate teams,Stake & Gjerde,1974)、支持小组(Advocate teams,Reinhard,1972)、元分析(Meta analysis,Glass,1976;Krol,1978)、应答性评价(responsive evaluation,Stake,1975)、自然主义评价(naturalistic evaluation,Guba & Lincoln,1981)等等。此时,更受人青睐的是案例研究(case study),案例分析可以避免破坏其他参与者对潜在事件的透视,它不仅仅作为汇报的方式,更是提供了丰富信息。1980年,12个关心教育评价问题的组织构成了联合委员会,共同发布了文件《教育方案、计划和资料的评价标准》(The standards for evaluation of educational programs,projects and materials),1981由麦格罗·希尔(McGraw-Hill)出版公司出版。

随着联邦政府对教育领域的渗透,评价开始作为政治的行动,评价者以智囊团的方式存在,努力地为相关的政治社区提供信息。克龙巴赫也将评价纳入了政策的领域,认为评价主要是提供信息、思考和决策的材料。20世纪的最后十年,教育评价已经成为一个成熟的专业领域。不过,专业机构之间的合作虽能很好地用于提升行为和提高评价的质量,实际的评价却很少发生变化;而且,人们需要教导评价者如何获得、尝试、反馈和发展新的评价技术。

四、研究发展的两条路径:反思范式的递进

教育投资体系的变革对评价研究的发展提供了物质基础,评价研究问题领域的成熟带来了评价理论的演进。第一,评价对象不断得到拓展,从单纯学生成就评定到教学过程的评定,以课程领域为例,从课程目标的评价到整个课程改革方案(如CIPP模式,即context,input,process,product)的评价。第二,评价目标从单一到多样,从衡量预期目标的达成,到关注实施过程中的即时目标达成。第三,评价标准多元化,随着对实施过程的重视,实践过程的各种参与者的立场开始被评价者关注,这种参与者的价值渗入影响了评价研究的发展。第四,评价方法的宽容,随着评价对象的拓展、评价目标的多样、评价标准的多元,评价方法也发生了相应的转换,从单一的测量方法,到关注实践历程的人类学方法。

对教育目标的攻击、对教育方案实施过程的反思促动了教育评价的发展路向:首先,针对教育目标本身的攻击去除了所谓的客观价值的假象,教育评价的作用从“证明(prove)”走向了“改进(ireprove)”。如1972年,斯克里文提出的目的游离评价(goal-free evaluation,简称GFE)模式,将评价的重点从“课程计划预期的结果”转向“课程计划实际的结果”。他认为一般评价是为了检测“是否能够达成预先存在的目标”,从而忽略了那些积极的非预期的结果。在他看来,评价的原则应该是“有效的结果”而非“目标”,为此评价者必须意识到所有的结果,还要创建一个被评价对象的档案袋。“空白课程”的提出者艾斯特在《教育的想象》一书中提出要以“表现性目标(the expressive objectives)”为标准,进行“启示性评价(illuminative evaluation)”。

其次,为了促进方案的改进,教育评价的对象发生了变化:以课程领域为例,必须针对课程研制的全面过程采取考察。就将课程实施的背景(context)、过程(process)、成果(product)全部纳入评价的范畴,如20世纪60年代的CIPP方案评价模式、60年代后期应用广泛的评价学习中心(Center for the Study of Evaluation,简称CSE)评价模式等。当我们发现课程评价已经转向“教程的决策”、“关于个体的决策”和“行政的调控”的时候,就不得不意识到课程本身所具有的计划性、目的性与组织性。因此,人类学的方法开始作为评价方法的基础,如“应答式评价(responsive)”、“启示性评价(illuminative)”或“案例研究”等。

再次,由于容纳了相当多的评价对象,也就是说将各种时空的人的价值都纳入其中,为此课程的评价标准也发生了变化,从“有效”的功利价值到包含了“生命”原则的伦理价值。故此,人们开始关注课程评价的价值主体、价值主体的需求问题。既然如此,在评价的过程中就需要关注到评价者、被评价者各自的价值立场,注意到评价标准和评价对象之间的匹配,关注到评价手段与评价对象的匹配。现代课程评价研究力图在制定评价标准、收集评价资料、采取评价方法上能够兼顾到更多价值取向。

藉着对评价历史的回顾,我们可以看到直到今天为止,这些变革造就了三个具有差异的评价范式(见图1),每个范式都具有自己的目的、偏好的技术、关注的焦点等等。由此,我们便获得了对研究发展的一种沉思:现代化促使我国的教育研究面临着巨大的危机,我们的学者不得不一边追赶,一边进行着反思,步伐在国际化与本土化之间交替,踉踉跄跄地前进。研究主题的变化代表了一种景况的转变,以及对研究者自身角色和地位的反思。

图1

课程评价范式图解

参考文献:

[1][美]泰勒。课程与教学的基本原理[M].中国台北:桂冠图书有限公司,1981.119.

[2][美]泰勒。怎样评价学习经验的效用[A].施良方译。瞿葆奎。教育评价[C].北京:人民教育出版社,1989.265.

[3]施良方。课程理论——课程的基础、理论与问题[M].北京:教育科学出版社,2000.156.

[4][美]斯塔弗尔比姆。方案评价的CIPP模式[A].陈玉琨译。瞿葆奎。教育评价[C].北京:人民教育出版社,1989. 298.

第3篇

关键词: 爱国主义教育 监测与评价模式 意义 原则 运行

新的历史时期使高校爱国主义教育面临新的挑战,出现新的问题,这就对新时期高校的爱国主义教育提出了新的更高要求,赋予其新的内容与时代特征。为了适应这种新挑战,解决出现的新问题,爱国主义教育者必须首先解放自己的思想、实事求是,变革已经不能很好地适应当今时代特征和实践要求的传统爱国主义思想观念,结合“90后”大学生爱国主义教育面临的新问题和传统教育的经验,树立爱国主义教育的新理念,明确爱国主义教育的原则,既要积极有效地探索加强“90后”大学生爱国主义教育的方法和途径,又迫切需要建立科学、全面、公正的爱国主义教育监测与评价模式进行保驾护航。

一、建立监测与评价模式的意义

(一)建立监测与评价模式是高校加强和改进“90后”大学生爱国主义教育的需要。爱国主义教育是一项具有战略意义的基础性工程。它是基础,是面向全社会、全民族、全国人民的教育,是提高民族素质和加强社会主义物质文明和精神文明建设的基础性工程。爱国主义能极大地调动全民族的力量,增强民族凝聚力,形成全民族的最大合力,推动社会主义现代化建设;爱国主义能够激发每一个人的爱国热情,唤起人们和祖国同呼吸共命运的爱国情怀,使人们为祖国取得的每一个重要成就感到欢欣鼓舞,为国家碰到的灾难和人民受到的损害而伤心忧虑。我国党和政府长期以来都十分关注大学生爱国主义教育工作,推出了一系列举措,各高校也相应地采取了一定措施,对爱国主义教育进行监测的过程,实质上是推动高校提高爱国主义教育质量和效率的过程。

(二)建立监测与评价模式是弥补爱国主义教育不足的需要。我国高校长期以来在爱国主义教育方面偏重于在课堂上对学生的正面灌输教育和日常生活中的严格管理,只关注教师在教学方面的质量如何和学生考试的成绩高低。单纯的衡量标准虽然对教学质量起到了促进作用,但是对于爱国主义教育的真实效果如何却没有一个完善的监测与评价标准。因此建立爱国主义教育的监测与评价模式是促进爱国主义教育全面发展的必然。

(三)建立监测与评价模式是“90后”大学生特点的必然要求。从当前的情况来看,一是“90后”大学生对待爱国主义教育存在模糊性,对待爱国主义教育在态度上存在偏差;二是“90后”大学生的多元性特征导致其爱国主义价值取向削弱,良好的成长经历导致其爱国主义意识淡薄;三是大学爱国主义教育存在着内容缺乏时代性,理论缺乏创新,教育对象缺乏连续性、长期性和针对性,教育方法直接且过于单调等问题。“90后”大学生本身处在一个思想不断发展成熟的时期,承受巨大的学业、心理和就业压力,极易受到外来思想的侵蚀,这就更加迫切需要加强以爱国主义为核心的民族精神和以改革创新为核心的时代精神教育。也迫切需要建立爱国主义教育的监测与评价模式推动高校改革原有的爱国主义教育体系,使之更好地适应“90后”大学生的需要。

二、构建监测与评价模式的原则

(一)坚持社会主义原则。思想政治教育工作需完全服从于政党和阶级的需要,体现了政党和阶级利益。因此在对爱国主义教育进行的监测和评价的过程中要按照无产阶级的立场、观点、方法和党的社会主义初级阶段基本路线对照爱国主义教育工作,坚持用科学的、发展的眼光制定相应的监测和评价模式,同时应结合90后大学生中存在的错误思潮进行批判,帮助学生树立正确的爱国主义思想。

(二)坚持实事求是的原则。新时期的大学生对于新思想、新事物的接受能力非常快,爱国主义教育工作也不能脱离实际情况,要做到理论联系实际。同样作为爱国主义教育重要一环的监测与评价工作也要坚持实事求是的原则,掌握实际情况,了解实际效果,作出实事求是的判断和分析。其根本是为了实实在在地推进爱国主义教育工作,使其能取得显著的效果。

(三)坚持针对性的原则。高校爱国主义教育的监测和评价必须针对爱国主义教育的目标和要求,无论对爱国主义教育的内容、方法还是实现途径,以及实际效果都要契合爱国主义教育的根本目的。此外,由于“90后”大学生的不同特点,要充分考虑到他们不同的成长环境、不同的思想状况和不同的文化背景,同时他们的接受能力和思考能力也已大大超过前人。因此,要始终坚持以学生为本,在进行监测与评价的时候要根据不同层次的学生制定不同的标准,不能以偏概全、以点概面。

(四)坚持系统性原则。高校爱国主义教育的过程是一个规范的系统性过程,这就决定了高校爱国主义教育的监测与评价具有突出的系统性特征。它要求高校爱国主义教育的监测与评价工作立足于全面把握,从整体上真实反映学校爱国主义教育的基本情况与成效。同时要求学校内部各行政机构、教学、教辅部门及各基层院系都明确责任,层次分明,管理有序,各部门做到分工明确,协同合作,做到各个环节紧密相连,环环紧扣,形成爱国主义教育的合力,充分发挥教育、管理这两大要素在爱国主义教育这一系统工作中的巨大作用。

(五)坚持动态性的原则。建立爱国主义的监测与评价模式一方面要充分继承和发扬我国监测公正、评价客观的优良传统,同时充分汲取国外在此领域内的先进经验和优秀的成果,把它们和我国高校爱国主义教育的实际相结合。另一方面时代的发展及互联网的普及应用使爱国主义教育处于不断发展和完善的过程,其教育效果也是一个逐步显现和不断强化的过程,这就决定了爱国主义教育的监测与评价的内容、方式方法要经常性地根据客观条件和具体情况的变化而变化。只有坚持这种动态的变化才能准确及时地反映出高校爱国主义教育的变化和发展。

三、监测与评价模式的运行

(一)明确组织领导机构。设立校级领导机构,建议各高校党委成立由校领导为主要负责人,教务处、学生工作部等部门负责同志,以及各二级学院分管学生工作的党委(总支)书记共同参与的一个直属于高校党委领导的爱国主义教育监测与评价领导小组,负责全校的爱国主义教育监测与评估工作。具体由教务处主导教学监测系统和教学评估系统,校学生工作部主导管理监测系统和管理评估系统,相关职能部门和各二级学院一起协助做好管理监测和评估系统。此外还应建立健全机构的相关管理制度和绩效考核标准。

(二)进行逐阶分级式的监测与评价。“90后”大学生的爱国主义教育是一个具有高度整体性和系统性的工作,它需要学校党委、行政把它作为一个全局性的问题进行考虑和布局,它不是某一个部门或者某一位老师能够组织和实施的。高校应结合“90后”大学生的特点,构建具有现代爱国主义教育特色的监测与评价体系。该体系分为两个主系统,分别是教育系统和管理系统。

1.教育系统。由学校教务处主导,相关的职能部门例如教学设备处、现代教育中心、评估中心等教辅部门协助管理,下设教育监测系统和教学评价系统。其监测与评估的内容主要包括两方面:一是施教者的主体状况,包括他们的政治素质、人格素质和理论修养;二是受教者个人的思想品德情况及受教群体的思想品德的状况。目前各高校的教育评价系统已经相对比较完善,国家也专门进行本科教学水平合格(审核)评估促进高校不断改进教学,完善教学评估。对于教学监测系统,主要包括教学前的准备监测、教学过程监测和教学效果监测与信息反馈三部分职能,由于目前高校职能部门人手有限,往往对于教学监测都是通过教案检查、督导组听课、学生评教等方式进行。

2.管理系统。由校学生工作部主导,相关职能部门例如团委、招生就业处等部门协助管理,下设管理监测系统和管理评价系统。管理监测系统主要通过二级学院进行,以各学院的学生科、团总支为基础,通过辅导员和学生组织对党团组织活动开展情况,学生会和学生社团开展活动情况,校园文化建设情况,以及社会实践活动开展情况进行监测。管理评价系统则通过学生对辅导员和班主任的测评、对学生活动的参与程度、对学生干部的拥护程度等方面进行评价。

3.两个主系统的地位与关系。在系统论的构建原理下,教育系统和管理系统都处于同等重要的地位。学生爱国主义教育监测与评价领导小组可以通过构建这两个系统对学生的理论、实践及评价进行有机整合,两个主系统下的子系统一旦出现问题就可以及时得到协调和解决。

四、监测与评价的结果反馈

对爱国主义教育工作进行监测和评价的最终落脚点是增强爱国主义教育的效果。因此将监测和评价的最终结果对监测和评价的主体和客体进行反馈,促进他们不断进步显得尤为重要。监测和评价必须有结果,不能有头无尾,只有过程,没有结论。如果只有监测和评价的过程而没有结果的反馈,那么整个监测与评价体系的构建也就失去了意义。

对于监测与评价的结果,应当采用恰当的方式表现出来。可以采用评语、等级、数量或者综合以上的表现方式。但是无论采用哪种方式都必须把结果反馈给被评价单位和被评价者。反馈的过程中应当注意方式和方法,可以采用集体讲评、个别谈话的方式,一方面保护了被评价者的隐私,另一方面实现了反馈过程中的思想沟通。在整个反馈中应以表扬为主,批评为辅,重要的不是将被评价人一棒子打死,而是让他通过评价反馈找出不足,寻求解决之道。最终把爱国主义教育的工作提高到新的水平。

爱国主义教育的监测与评价是一个系统的工程,可以对爱国主义教育的效果作出更加真实可信的结论,对于帮助和改善高校“90后”大学生爱国主义教育工作具有非常重要的理论意义和现实意义,值得更多的思想政治教育者关注和研究。

参考文献:

[1]梁建桃.高校大学生健康教育实施监测与评价的研究[J].武汉体育学院学报,2007(9).

[2]乔琳.高校政治理论课教学效果双层监测系统的构建探析[J].中国高等教育评估,2008(4).

第4篇

【关键词】英语专业;测评;高等教育信息化

【作者简介】吴琼(1970.04-),女,汉族,黑龙江哈尔滨人,沈阳师范大学外国语学院教授,硕士学位,研究方向:应用语言学、英语教学;刘昭含(1994.08-),女,满族,辽宁朝阳人,沈阳师范大学外国语言学及应用语言学在读研究生。

一、引言

为了进一步推进新时代教育信息化发展,2018年4月,教育部颁布了《教育信息化2.0行动计划》(以下简称《行动计划》)。《行动计划》将教育信息化作为教育变革的内生变量,支撑和引领教育现代化的发展,推动教育理念的更新和模式变革。在高校英语专业人才培养中,教育信息化已经成为衡量教育教学质量的重要标准之一。因此,树立信息技术与教育教学深度融合的理念,是新的历史时期提高英语专业教育教学质量的需要,也是培养新时代英语专业人才的需要。

测评是教育教学的重要环节,在人才培养过程中起着重要作用。测评对学生学习具有导向作用,学生怎么学,在很大程度上取决于考试怎么考。离开了测试和评价,教学质量便失去了可检测的依据,学习的效果也无从验证。此外,有效的测评会对教师的“教”与学生的“学”产生积极的反拨作用,能够促进教师与学生及时发现教与学过程中的问题,持续改进教学和学习。然而,长期以来,英语专业教育教学改革忽视测评改革的重要性,更多关注的是教学内容、教学方法和教学方式的改革。在高等教育信息化背景下,如何将教育信息技术与英语专业测试改革深度融合,是当今教育教学改革的重要议题之一。

二、英语专业传统测试模式的主要问题

受传统考试观念的影响,高校英语专业测评仍存在以下主要问题:

1.测评形式相对单一,缺乏多样性。目前,高校英语专业测评主要采用期末终结性评价与形成性评价相结合的方式,终结性评价多以闭卷笔试为主,占总评成绩的70%左右,形成性评价主要是针对平时表现的评价,占总评成绩30%左右,由出勤、课堂表现、作业、平时测验等构成。闭卷考试多设置标准答案,教师根据标准答案对学生的答题进行评判。该种形式的测试在一定程度上能够体现考试的公平性,但某种程度上限制了学生的开放性和创造性思维。

2.测评注重语言知识和技能,缺乏创新性。英语专业各门课程测试在很大程度上停留在检测学生的英语语言知识和技能或陈述性知识层面,没有将对语言、内容和思维的考查有机地结合起来。测试往往脱离生活实际,不能有效检测学生应用所学知识解决现实问题的能力。听力、阅读等课程测试多以选择、判断、填空、简述题为主;口语、写作等课程测试多以根据话题进行口头或书面语表达为主;专业知识类课程大多停留在对所学语言学、文学、文化知识进行判断,选择,简答,分析等。长期以来,英语专业学生一直被批评缺乏高阶思维能力,测评内容单一,忽视对思维能力进行考查,是造成英语专业学生思辨能力缺失的原因之一。

3.测评注重结果,缺乏对学生学习的指导性。英语专业测评体系中,终结性评价多占据主导地位,缺乏对学习过程的检测和有效反馈。终结性评价虽然对一个阶段的学习效果具有诊断作用,但因为学生随即进入下一阶段的学习,教师往往忽视对考试结果的深入分析,学生更多关注的是阶段性学习后的测评结果。重结果的测评方式不能很好地起到以考促学的作用,缺乏对学生学习过程的有效指导,这种模式下的测评与教学和学习脱离,三者没有形成有机的整体。

三、教育信息化背景下英语专业考试模式改革探索

基于上述背景及传统测试模式存在的弊端,在当前高等教育信息化背景下,英语专业需要思考如何依托信息技术,对考试模式进行改革。

1.更新测评理念,提高教师的测评素养。教师测评素养在教育教学及测评改革中起到关键作用。教师在教学中需要科学设计测评内容,运用科学有效的测评方法和工具,对学生的学习效果进行评价。但是许多研究发现,英语专业教师的语言测评素养总体上落后于课堂教学等方面的发展,亟需加强评价知识及评价操作能力(潘鸣威,2020)。

教育部提出的一流课程建设为语言教师测评理念和测评素养提出了明确要求。按照教育部《关于一流本科课程建设的实施意见》(以下简称《实施意见》)要求,教师要进行“科学评价,让学生忙起来”,要完善以学生为中心的过程评价制度,加强对学生课堂内外、线上线下学习的评价,要通过科学的测评,提升学生学习的深度和广度,要加强非标准化、综合性等评价,提升学习的挑战性。为了做到科学、有效评价,英语专业教师要掌握必要的语言测评知识(如英语学习、英语语言测试等知识)、测评技能(如何命制及编写试题、如何进行试卷的统计分析等)及测评原理(如何有效使用测试等)。按照《实施意见》的要求,语言教师应改变传统的测试理念,重新思考测评的作用和功能。我国学者罗冠中(2015)将assessment划分为三个方面的意义,分别为assessmentoflearning(对学习结果的测评),assessmentaslearning(对学习过程的测评)和assessmentforlearning(促进学习的测评)。英语专业教师应充分认识到,测评不仅仅是对学习结果的检测,更要关注学生的学习过程,最终促进学生的学习。

在网络和大数据时代,学生的学习环境和学习方式发生了根本性变化,学习观念也发生了颠覆性改变,这些变化意味着测评也不能局限于傳统课堂,靠一张纸和一支笔来完成。线上线下、课堂内外对学习过程的测评和促进学习的测评要随时随地发生,以便对学生的学习进行实时监控、及时发现问题,及时解决问题。

2.依托信息技术,丰富测评形式。随着教育信息技术的广泛应用,线上线下相结合的多样化形成性评价在促进学生学习方面发挥越来越重要的作用。以新冠肺炎疫情期间笔者所讲授的《欧洲历史与文明》课程为例,根据课程目标的要求,课程加大了形成性评价的比例,形成性评价占总体测评的60%,主要对学生课前探究学习(20%)、课上及课下专题讨论(20%)及主题论文(20%)的参与和表现进行评价。在课前探究部分,学生观看课程视频后需要完成课程平台的知识点自我检测,或者按照教师的要求绘制知识点地图,或录制微视频对本章节知识点进行梳理汇报;专题讨论主要检测学生参与讨论的积极性及观点的深度,由教师给出话题,或采用小组负责制,在老师的指导下,每一章节由一个小组发起讨论。该部分测评的目的是帮助学生内化知识点,同时引导学生对所学内容进行深度思考和探究,训练学生的高阶思维能力;完成每一章学习后,学生撰写小论文,要求学生在消化理解本章学习内容的基础上,批判性地评价这一历史时期或某一历史事件,考查学生分析、评价和迁移能力,引导学生要树立以古为鉴、文明互鉴的意识。

依托信息技术,课程所实施的多种形式的形成性评价对学生的学习过程实现了动态监控,将检测与学习探究融为一体,强调了学生在学习过程中的主体地位,改变了以往学生在考试前突击复习的现象。动态的形成性评价引导学生按照学习的规律进行学习,有效帮助学生习得知识,通过研讨、专题论文、汇报等形式将知识转化为能力,最终促成教学目标的达成。同时,课程的形成性评价为教师及时提供诊断,有针对性地为学生布置个性化任务,帮助学生解决学习过程中的问题。

3.合理利用信息技术,改革测评内容。传统的语言测试题型比较单一,多采用选择题、判断题、匹配题、简答题、论述题、段落翻译题、口笔头作文题等题型,考查的内容往往脱离生活实际,且往往根据标准答案进行评判。语言测试研究专家Bachman和Palmer于1996年提出了测试有用理论,用来评价试题任务是否具有高质量的标准。按照测试有用理论,测试内容的真实性和互动性是评价测试是否有效的两个重要指标。真实性指语言测试中的试题任务越接近目标语使用的真实情境,测试越有效。互动性指受试者与测试任务之间的互动,互动性高的测试任务能够激发起受试者的相关知识、策略及情感图式等帮助受试者完成测试任务(刘亭亭,2019)。

在“互联网+”时代,网络信息平台为教师设计具有真实性、互动性、非标准化的测评提供了情境和平台。如应用文写作课上,教师可以结合网上某一国际化企业的招聘启事,让学生写一封应聘信及个人简历;针对高级写作课程考查,教师可以选择2-3个新闻媒体对同一事件的不同报道,让学生进行综述,比较不同观点,并批判性地发表个人观点;高年级听说课上,教师可以指定学生观看英美国家对某一事件的报道,然后学生录制个人对该报道的口头驳斥。借助网络信息技术,测评任务变得贴近实际,帮助学生意识到学习的目的是要解决实际问题,绝非应试。因此,依托信息技术而实现的多维度、非标准化测评能够帮助学生树立正确的测试观,调动学生参与测评任务的积极性。

4.发挥信息技术优势,有效利用测评结果。测评结果的有效使用在语言教学中起着重要作用,它可以帮助教师和学生检测不同阶段教学目标与学习目标的达成情况,诊断“教”与“学”中的问题,并从问题出发,改进教学。借助信息技术,课程平台可以完整记录学生的学习表现,形成学生学习电子档案袋,包括学生在每一次测评中的得分或失分情况、在线答题时间、成绩位次及与平均分数的对比等。一方面,教师可以充分利用后台统计数据,总体分析全班教学目标达成情况,适当调整并持续改进教学;另一方面,教师可以对每位学生个体的学习情况进行分析,有针对性地进行精准的个性化辅导。学生可以清楚了解自己的学习情况,对学习内容、学习过程、学习方法等进行反思,采取有效策略改进学习。

第5篇

论文关键词:高等教育;质量与水平;评价指标

据统计,2008年中国各类高等教育总规模达到2907万人,继续稳居高等教育大国的位置。与此同时,高等教育面临的挑战也相当严峻。挑战的严峻性主要集中在以建设高等教育强国为战略目标的高等教育质量与水平的提升。建设高等教育强国是一个长期而复杂的过程,在这一过程之中,高等教育质量与水平评价指标体系则发挥导向作用,指导高等教育各个方面向前发展。因此,如何构建评价高等教育质量与水平的指标体系,采用何种分析框架,是目前中国高等教育迈向高等教育强国过程中必须正视和急需回答的一系列问题。

一、评价指标体系设计依据

目前,对于评价指标体系设计的依据主要有两个方面,一种是从概念分析出发,通过演绎的方式对被评客体属性有关内涵进行分解进而生成具有相互关联的各项指标,另外一种是根据评价目的来确定评价指标体系。评价目的是指进行评价活动所要达到的目标和要求,对评价指标的设计具有导向作用。不同的评价目的会导致评价指标体系的差异。根据评价目的来确定指标体系的具体步骤为:先从评价目的结构分析入手,认真分析评价目的所包含的各种因素,并将其全部罗列出来,再经过反复的分析、筛选,最终提炼出最能反映目标体系的指标,从而形成指标体系。当然,两种方法并不互相对立,在恰当的情境中两者可以很好地结合。对于高等教育质量与水平评价指标体系构建来讲,其最终目的是建设高等教育强国,所以,评价指标体系的设计既涉及对高等教育质量与水平的概念演绎,也要将其与建设高等教育强国的目的结合起来。

(一)高等教育质量与水平的概念演绎

当将“质量”与“水平”两个概念连接在一起的时候,在不同的场合或语境所表达的意思侧重点不一样,在过程评价中,“质量与水平”的重心放在“质量”上,在结果评价中,重心则放在“水平”。因此,在作为过程的指标体系的构建中,概念的演绎应该将重心放在“高等教育质量”这一概念上。

高等教育质量是个见仁见智的概念,其中尤以联合国教科文组织在考察世界各国高等教育情况基础上所提出的高等教育质量概念最具有代表性和全面性。“高等教育的质量是一个多层面的概念,应该包括高等教育的所有功能与活动:各种教学和学术计划、研究和学术、教学人员、学生、楼房、设施、设备、社区服务以及学术环境等等”,“还应包括国际交往方面的工作:知识的交换、相互联网、教师和学生的流动以及国际研究项目等”。因此,可以根据对高等教育质量概念的演绎,选择有代表性和可行性的指标,共同构成一个完整的指标体系,全面反映高等教育质量的各个方面。

(二)高等教育强国的内涵、特征

高等教育强国的内涵和特征是什么?指标设计如何体现这些内涵和特征?现有文献分析表明,虽然不同的学者对于高等教育强国这样一个复杂概念有不同的分析和解读视角,但是数量、要素、结构、功能、环境、输人、输出却是绕不开的理解维度。具体而言,一个国家之所以可以称得上高等教育强国,关键在于“它拥有较大的高等教育规模和较高的高等教育普及率”(数量、输入);在于“它培养出一大批具有国际影响的高水平的人才”(输出);在于“它建有若干所世界一流的大学或一批世界一流的学科”(要素、输出);在于“它已经形成多样化、多层次、多类型、布局结构合理、开放的高等教育体系”(结构);在于“它的高等教育系统已与本国的社会各子系统已形成功能耦合关系,能够全面适应经济社会发展的需要”(功能);在于“它是世界知识创新、科技创新和高等教育创新的‘集散地”’(输出)。因而,在设计指标体系时必须以上述高等教育强国的特征为依据,进行逐层分解并体现在具体的指标上。

二、评价指标体系构建

(一)指标体系分析框架

在逐层分解出评价指标之后,一定要有贯穿其中的理论分析框架将所有指标组织起来,才能发挥指标体系所具有的功能,使深入分析成为可能,否则,分解出来的指标只是一种教育统计数据的堆积。建设高等教育强国的评价目的一方面使评价指标体系不得不放在国家层面来考虑,另一方面也蕴含着对于高等教育质量与水平的评价不是为了证明,而是为了改进。对于前者,长期致力于教育指标研究的专家约翰斯通(johnstone,james.n.)认为,在建构国家层面的教育指标体系过程中,教育输入、过程与输出这个框架仍是最常用的分析架构;l6对于后者,则与斯塔弗尔比姆(stuflebeam,l.d.)所提出的教育评价的cipp模式具有恰切性。cipp即为背景(context)-投入(input)一过程(process)一结果(product)的评价模式。_7因而,结合高等教育质量概念演绎和评价目的,可将评价指标体系纳人背景一投入一过程一结果的分析框架,并将其列为评价指标体系的一级指标。在一级指标下,确定生源与规模、学术基础设施、教育投入、科研投入、学生类型、教师资源、学生投入、教育资源转化、人才培养结果、学术和科研产出、社会服务、国际影响力等12个二级指标,二级指标之下又设立32个观测点,构成高等教育质量与水平评价指标框架(见表1)。

(二)观测点内涵与重要性说明

1.与高等教育背景(资源基础)相关的观测点

人是教育的出发点和归宿点,在评价一个国家的教育水平时,人口统计上的特征是一个重要要素,对于高等教育来讲也不例外。人均受教育年限反映的是某一国家人口接受教育的总体水平,受教育年限越长则人口中接受教育的水平越高。完成高中教育是青年人进入高等院校学习的基础,因此高中教育的毛入学率直接影响高等教育的毛入学率及其规模。高等教育毛入学率反映的是国家提供高等教育机会的整体水平,实质上是高等教育培养人才能力的一个标志。学生均拥有图书量和在校生计算机普及率是评价国家或地区学术基础设施能力的指标。从高等教育的逻辑起点高深学问来看,对高深学问的保存、共享的方式和手段则对高等教育和研究有着重要的作用。信息社会,互联网时代,个人计算机不仅为身处高等教育领域的人们打开了交流高深学问的新通道,而且也为高等教育找到高校与社会资源相互合作的途径和方式。当然,传统以图书来保存、共享知识的方式也不能丢弃。

2.高等教育投入观测点

合理的教育财政投入比例是教育发展的重要保障。在反映高等教育投入的各个指标中,政府对高等教育的财政支持力度和投向直接影响到高等教育质量的高低。公共教育经费占gdp的比例反映了一个国家对教育投入的总量,也是衡量一国政府对教育努力程度的主要指标;高等教育经费占总教育经费的比例反映一国政府在总体财政资源中如何对各级教育进行分配;高校生均经费指数含义是一个国家用一个gdp支撑了几个学生完成其一年的学习,也可以说相对于一定的经济发展水平,一个国家拿出多少财力支持相关教育的发展。从经费来源结构上看,高等教育的社会效益为政府对高等教育投入并发挥主导作用提供了充分合理性,但是,由于政府对高等教育投入的增长无法满足人们对高等教育日益增长的需求,非公共资金带着满足利益相关者的兴趣、需要的使命介入高等教育的现象开始在全球出现。因此,观测点“公共高等教育经费占gdp比例”与“非政府高等教育经费占gdp比例”在结构上的伙伴关系也会影响一个国家高等教育系统的使命和质量。与扩大高等教育入学机会一样,促进高等教育公平也是提高高等教育质量的一种方式和衡量手段。“学生资助经费(奖学金、贷款等)占高等教育经费的比例”反映了一国政府对弱势学生群体入学机会的关注和资助力度。

通过研究促进知识的发展是高等教育系统的重要职责,研发经费是保证高校实现这一职责的重要保障。“高校研发经费占gdp的比例”反映了一国企业、政府、高等教育部门、私人非营利部门对研发的投入力度;“高校科研经费占总科研经费的比例”反映了研发经费在上述各部门的分配。

3.体现高等教育过程的观测点

对过程的监测也是保证质量的重要手段。与高等教育过程相关的主体主要有学生和教师及两者的比例。观测点“5a类学生比例”、“5b类学生比例” 和“博士生比例”反映了高等教育结构的多样化程度及比例与社会需求的协调性。学生是学习的主体,学习效果既取决于学校的教学安排,也取决于学生课后的自主学习。与其他观测点相关的统计数字不同的是,观测点“学生课后自我学习时间”需要通过抽样调查来获得相关的数据。拥有博士学位是大多数国家高校教师的入场券,因而,拥有博士学位教师比例反映了一个国家高校教师所具有的基础学术训练水平,也体现了师资的质量与水平。教师年薪占人均gdp比例是反映高校教师职业获得经济收入在社会各职业中所占的位置,是教师职业是否具有吸引力的标志。生师比是影响教育质量的重要指标。生师比越低,师生之间互动的机会可能越多,学生得到教师的指导就越多。反之,亦然。

4.高等教育结果观测点

结果是直接体现质量的直接观测点。在高等教育的人才培养结果中,观测点“25—64岁人口接受高等教育的比例”反映以往高等教育培养人才的存量。高等教育所培养的人才必须能够参与经济活动才能体现出其质量和价值,观测点“经济活动人口教育程度构成”中高等教育的比例说明了这一点。

科研产出的具体观测点包括“师均日论文数”、“师均sci论文数”、“师均专利授权数”、“高被引论文数”。虽然科技论文ei、sci收录和被引是一个在国际学术界广为争议的话题,但是在没有更有效的衡量方法出现之前,其对科研质量的度量仍然是主要的方法。由于高深学问只有同行才能理解,高被引论文则通过同行评价体现了科技论文的质量。专利本身的特点之一就是要有新颖性,反映了技术发明创造活动的水平。

根据高等学校的社会服务职能的含义是“以直接满足社会的现实需要的为目的、以教学和研究职能为依托,有目的有计划地向社会提供的具有学术性的服务”,指标体系将“高校年均非学历教育人次”和“师均技术和专利转让收入”作为评价高等学校社会服务的观测点。

正如克拉克·克尔所言,“大学按它对普遍知识的承诺的性质而论,本质上是国际机构”,因而,吸引着来自许多国家的学生与教师。观测点“留学生占全球国际生比例”、“外籍教师占本国教师比例”体现了一国高等教育系统从其他系统获得资源的吸引强度。这种资源在反映本国高等教育质量与水平的同时,也通过交流、理解促进该国高等教育质量与水平的提升。世界一流大学是一国高等教育系统的标杆或高地,在各种不同世界大学排行中,一国的高等教育机构居于何种位置、数量的多少体现了该国高等教育标杆或高地高度。观测点“上海交通大学世界大学学术排行前500的高等教育机构数”和“泰晤士高等教育增刊世界大学排行前20的高等教育机构数”分别从学术排行和声誉排行两方面分别反映一个国家高等教育机构的国际学术地位和社会声誉。

三、指标体系构成特点

高等教育质量与水平评价指标体系构成特点可以参照图1来理解。

(一)反映高等教育质量的本质特征

指标体系从高等教育质量概念的内涵演绎出发,使具体的观测点并不是一种主观判断,而是有着比较充分的依据,反映高等教育质量的本质特征。

(二)以诊断和导向为功能

评价指标体系的构建以建设高等教育强国为目的,因而,具有诊断和导向的功能。通过观测指标观照高等教育,诊断发展过程中所存在的质量问题,找出解决问题的对策,进而发挥其导向作用,指导高等教育各个方面向前发展,最终达到高等教育强国的目的。

(三)反馈性与可塑性的统一

一方面,指标体系的构建不仅遵循着输入——过程——结果的分析框架,而且在体系内存在着反馈回路,体现为结果评价不仅可以夯实高等教育的基础,而且可以刺激高等教育投入。另一方面由于高等教育职能的多样化,指标体系可以根据研究的需要变换组合,具有可塑性。

(四)过程考察与结果考察的统一

针对以往评价指标体系注重结果评价的弊端,该评价指标体系在重视结果评价的同时增加了反映教育过程的指标。

(五)与社会、经济发展密切相关

第6篇

第一节 化学教学测量和评价的意义

为了全面地检查、评估化学教学质量,不断改进教学工作,从教与学的动态活动及相互作用的结果中获取供决策用的反馈信息,化学教学测量和评价在教学中是起核心作用的一环。

化学教师的教授活动效果如何,教学目的和目标的达成度怎样,教学决策中有哪些 成绩和缺陷;学生的学习水准和准备状态如何,学习能力养成得如何,学习的意向和志趣培养得如何,学生在学习中有哪些薄弱环节;以及师生间对教学的目的和目标、教学内容、教学方式等在认识上有哪些不和谐的问题需要调整等等。所有这些问题,都需要借助于化学教学测量和评价,从质与量、从内容、过程与结果,给出科学的检测、判断和结论。

化学教学测量在学校里常见的形式是测验。化学教学测验是指运用科学的测量方法,对学生学习的知识、能力与效果进行检查,然后进行客观比较,以判定教师的教学效果的一种活动。在教育和教学实践中,测量和评价这两个概念是相伴而生的。测量的概念率先产生,但仅仅测量、搜集数据,而不给出价值判断,这样的测量将是徒有其名,不说明任何问题的。应当说,测量①的主要任务是提供客观的数量化及非数量化的信息,这些信息本身并不能自动揭示其教育教学涵义,而评价乃是系统地搜集信息,对客体进行价值判断的过程。化学教学评价,正是从教学目标的角度,对化学教学测量和测验所提供的数量化的资料及通过观察等所获得的质的分析的资料作出解释,从而对教学工作达到预期目标的程度做出价值判断的过程。

换句话说,化学教师总是要以教学测量为手段,经过分析、综合,进行判断,以得知自己的或他人的教授活动与学生的学习行为的状态,进而与教学目标和教学要求相对照,获取准确具体的结构;学生作为积极主动的认识主体,也总是要努力以教学目标和学习要求为标尺来评判自己的学习结果与进展。由此可见,教学测量与教学评价是紧密相连的。仅有测量,不进行评价是没有意义的,而要评价,就必须进行量和质的分析,或称为量和质的描述或记述。

现代的评价,既注重提供数量结果的测量技术,又注重只提供非数量化资料的观察、陈述的技术,使两者做到结合互补。

总之,化学教学测量和评价在化学教学系统中具有编级(或分组)、反馈、诊断、升级和职业指导等多种功能。

第二节 化学测验的类型及其功能

化学测验是检查化学教学质量和教学效果与效率的基本途径。测验与系统观察相比,具有可以从量和质两方面对教学这一客体做出全面评测的优点。

我们都了解,教育教学这一复杂的特殊的社会实践活动,不同于一般的自然事物和对象,它除了具有可以直观地、直接观察和测量的方面(特征、性质),如教学流程中的时间、空间以及师生形体活动等以外,师生间的信息、情感交流,以及师生交互作用在心智里产生的增益效应等等,均难以直接测量。这就需要我们确定并把握测量教育教学这一客体的尺度。一般言之,各种教育教学事物大体上都具有共同的“度”①,即本质(要探求学生能知道些什么事实)、数目(要探求学生能知道多少事实)、组织(要探求学生如何组织这些事实)、时间(教师要时常关注学生的某种行为已历时多久)、速度或速率(学生学习行为的熟练程度的表征)、次数和错误(学生写100个字,错了多少个)。以上是就认知或动作技能领域而论的,对于情感领域的测量,尚应另立标度。

为了测量化学教学可以采用测验、评定量表、观察记录等方 法。这里重点讨论测验这种方法及其功能。

测验的类型很多,从实施的形式上划分,可以分为口头测验、书面测验及实验操作测验;从测验的编制划分,有标准化测验和教师自编测验;从评价的标准划分,有常模参照测验和标准参照测验;从试题的性质划分,有客观测验、论文式测验及实验操作测验;还可以根据测验在教学过程中的作用,划分出准备性测验、形成性测验和总结性测验。

这些测验的名目和功能各异,但均应遵循以下准则①:

(1)要准确、全面地理解化学教学的目的和要求,测验和评价应包括:学生的知识、理解和思维、技能和能力、态度和方法等方面的内容。

(2)要确定一套(按年级、单元)具体的教学目标,按学习进程,循序地实施测验和评价。

(3)要充分认识测验与评价对教学的影响和作用;要重视选择教学测验的环境,帮助学生获得应试的学习经验。

(4)要慎重选择测验的内容和形式,命题要简明严谨,难易适度,题型搭配、编组要恰当。

(5)要拟定评定计划;评定既要适合总的培养目标的要求,又要适合化学学科本身的教学目标。

(6)测验和评价均应有计划地进行;平时宜培养学生自我检查、自我评价的能力。

(7)要严格控制测验次数;要力争校内、校外测验的协调一致。

(8)测验命题宜实行集体编审制,以防止个人决断的偏颇。

以下分4个方面讨论各类测验的基本特征和功能。

一 标准化测验与教师自编测验

标准化测验是一项系统工程,是由专门的测验机构主持的科学化的测量工作。它主要用于测验能力或能力倾向、成就水平或 者用作诊断、预测和监控标准。所谓标准化,包括试题编制的标准化、施测过程的标准化、评分记分的标准化、分数合成的标准化,以及分数解释的标准化等①。推行标准化测验,可以避免测量尺度不明确和对测量结果解释的偏颇不当,从而造成测量失准低效。

标准化测验要有考试指导书,明确规定:考试(测验)的范围、内容、要求、方式、题型以及评分和计分方法;测验命题要标准化,严格遵照考试大纲或教学大纲制定命题双向细目表,规定每一个测试目标与内容在整份试卷中的比重;每一试题要经过预试或调试,选出效度高、信度高、区分度高和难度适当的好题,进行组卷;测验的实施过程要统一而有规范,施测时间、环境和进程必须统一,应试者作答的要求、阅卷步骤和评分标准必须严格规定。由于标准化测验具有试题取样范围大、题量多,覆盖面宽,又经过预测,保证了“四度”的要求,从而能较真实地测出学生的学习成绩。

概括起来,实行标准化测验有四点好处②:

(1)减少无关因素对测验目的的影响,使测量准确可靠;

(2)使不同的测验分数具有可比性;

(3)同一套测验有多个复本可以反复使用,较为经济;

(4)可用来校准其他测验。

美国化学会与美国理科教师协会编订(分年编订)的高中化学测试方案是用于能力测验的标准化测验,我国近几年来开展的高等学校入学考试中的标准化考试,以及高等学校专业基础课程试行的标准化考试,均属于测验学生潜在的学习能力和学习成就水平的测验。

教师自编测验是教师根据教学需要,随时自行设计和编制的测验。这种测验应用范围较窄,仅适用于本校,难以与校外测验相比较,也难以保证达到测验“四度”的要求,但却具有编制简捷、施测手续简便的优点。

二 常模参照测验与标准参照测验

常模参照测验的重要特征是,以学生团体测验平均成绩作为评定学生成绩的参照标准,把学生团体的成绩划分出等级,以该生在群体中所处的等级位置来判定他的成绩优劣。常模参照测验的主要目的是测量考生的个别差异。在上面讨论过的标准化测验,通常是指常模参照测验。实行分组(能力分组)教学时也要用到这种测验。

常模参照测验的基本假设是,学生群体的学业成绩是按正态曲线分布的。

与常模参照测验相对立的标准参照测验,或称目标参照测验,是以教学目标为标准来检测学生的学业成绩。评定方法是把每个学生的成绩与教学目标作比较,而不计较学生个人之间的差异。标准参照测验的标准是根据未来的工作或学习的要求建立起来的。在检验一个学生的成绩是不是合格时,应严格地实施标准参照测验,这是学科学习期末考试和毕业考试的特征。在实践中,许多教师根据自己的教学情况,按照学生的普遍的学习水平来命题,以完成期末考试的做法,是不符合标准参照测验的主旨的,因为,这种降格以求的测验,学生的得分并不能表明他们的真正的学业成绩,自然也不能说明教师教学的效能和得失。实际上,教师又在实施一种常模参照测验。

从1993年起,全国各省、市、自治区(台湾省、西藏自治区除外)开始实行的高中各科的毕业会考,就是由各省代表国家实施的一种标准参照测验。可见,在毕业会考中,那种随意降低命题标准或评分标准的做法是不妥当的。这样,就从根本上损伤了基础教育高级阶段的合格标准,以虚假的成绩向社会各行各业输送不尽合格的人才,影响我国社会主义现代化的前进步伐。

三 准备性测验、形成性测验和总结性测验

准备性测验,或称安置测验,俗称摸底测验,是教师实施教学 前,或接手一个新年级开始教学前实施的一种测验。这种测验的目的,主要是查明学生的学习准备状态,测试学生已经具备了哪些知识和技能,以利于决定施教的基点,或作为分组教学的一种依据。准备性测验以获取学生学习准备状态的多方面的信息为目的,测验后的评分,如不实行分组教学,则无关紧要。这种测验往往在学生不进行测前准备的情况下进行,所获得的信息,不宜随意公开评述。在教学过程中,有针对性地进行分类指导或目标教学,会从准备性测验中受益良多。

随着教学过程的进行,为了及时把握学生的学习水平,多借助于形成性测验。形成性测验是为教学进程直接服务的,主要目的在于检测学生知识和技能的进步与发展,以及时取得教学的反馈信息。随堂检查性的小测验、单元测验等均属于这类测验。教师要善于从中发现问题,以巩固既有成果,针对教与学中的缺陷,采取补救教学,以达到教学目的和教学要求。

化学教学进入一个学习阶段的末尾,或者进入本学科结束阶段,就要进行总结性测验,以检测学习的效果,从而评定学生学习成绩等等。总结性测验多属于标准参照测验,以按照教学目标这一标准来评定学生的学习成绩。

四 客观测验、论文式测验与实验操作测验

客观测验系指测验试题可以客观地评分,不因评分者的不同而影响评定结果。标准化测验中选择题、是非题和匹配(配伍)题等试题,均为客观测验试题。其中,尤以多项选一型的客观试题被广为采用。这种试题的主要优点①是:

(1)能快捷地测试课程的广泛内容;

(2)可以在测试领域内广泛取样;

(3)可用于大型测试,并可以可信地给予评定;

(4)测试的内容、范围和水平是明确的,可以进行统计处理 和分析;

(5)可用于班级、课程研究或整个学校系统的比较研究。

选择题的主要缺陷①是:

(1)仅能测试重现课程内容,难以评定高层次的认知水平;

(2)不能确证学生是怎样推理得出结论的,也不能测试学生的论点是怎样符合逻辑思维而发展的;

(3)使学生完全被动地答卷,且可以猜测,可以胡乱选项。

论文式测验是借助论文试题来测试学生分析问题和解决问题的能力,以及文字表达能力。这类试题可以让学生表述自己的见解,或分析比较、申述说明,或论证评述、畅述己见。论文式测验仅需要组编少量试题,命题工作较易组织实施。正由于此,这类测验的缺点也相伴产生。一是题量小,覆盖面窄,难以对整个课程内容进行测试取样;二是试题往往容易失之于不明确或含糊不清;三是测试的内容深度和范围较难以划定界限;四是评定时难以把握标准答案,评分常因人而异,随意性较大。故而常将论文式测验列入主观测验一类,因这类测验的评定受阅卷人的偏爱、情绪、态度等主观因素的影响甚大。

实验操作测验是化学课程中特色独具的一类测验。一般侧重于测试学生的态度和实验操作技能与水平,如对实验目的、反应原理的理解,使用和组装仪器的技能,以及对实验过程和实验结果的解释等。实验操作测验对于突出和发展化学教学的特征、对于养成学生动手动脑的学习能力,具有重要的导向作用。欧洲诸多发达国家,有近1/4的国家在中学结业前实行化学实验操作测验②,我国少部分重点中学也试行实验操作考,已从多方面发挥出这类测验的教学效益。自然,实施实验操作测验,要有相应的设施条件和评定规范作为保障,尤其需要教师贯彻先进的教学质量观,自愿承受较繁重的工作负担。

第三节 编制化学测验的主要依据——化学教学目标

化学教学目标是编制化学测验的主要依据,而化学教学目标是根据化学教学目的,结合教与学的要求,而具体规定的可供检查、测量的质量指标体系。这些规定,要具体写出学生经过学习最终会完成的任务,向他们指明具体的学习要求;还要结合学生的认识规律,明确规定具有实际可测、具体可行的教与学的质量指标或检查项目。从教育测量学的角度看,教学目标——用作编制测验的主要依据必须满足如下4条标准①:

(1)目标应该叙述清楚;

(2)应该对照评价方案的实施情况检验目标,以编制一份适用的测验;

(3)目标应该反映出方案欲达到的技能掌握的水准;

(4)目标应该具有高度的优先性。

化学教学目标的划分和界定,是化学教育测量和评价专门研究的课题。从国际上看,学术界公认美国心理学家布卢姆(B.S.Bloom)等提出的教育目标分类学最有影响。布卢姆等专家将一般教育目标分为认知、情感与动作技能三大领域②,我国学者主张,化学教学目标一般要体现出知识传授、能力培养和思想教育三个方面的具体要求③。

美国化学教育界采用的按照布卢姆等专家的主张给出的认 知领域的教学目标①为:

(1)知道。包括这样一些行为和情境:强调记忆(再认或回忆)过去学过的信息。

①特定事物的知识。术语和事实。

②方法和手段的知识。处理特定事物:惯例、趋势和顺序,分类和类别、准则、方法论。

③学科领域中普遍原理和抽象概念的知识。原理和概括、理论和结构。

(2)领会。包括了解知识的意义,能够用不同的术语意译来回忆,联系其他经验,解释它的意义和用术语的意义来扩展它的领域和顺序。

①转化。用不同术语意译某种观念的能力,给出实例、解释图表、说明符号的相互关系等。

②解释。了解主要观念和了解它们之间的关系。

③推断。扩展信息以包括其他可能的意义。

(3)应用。应用知识和能力解决新的、不熟悉的情境:用知识去推理,去说明或预测在新情境下将会发生什么。在这一水平上,科学更多地变成学术练习。

(4)分析。将一个观念分解成它的组成并表明了解各组成之间的关系。所有学科都强调分析能力,把它作为该学科功能的重要方面。

①要素分析。利用对恰当的事实和假设的了解。

②关系分析。识别和利用证明与假说之间,证明与结论之间,逻辑谬误、原因与效果之间的关系等。

③组织原理的分析。

(5)综合。将事实、原理、理论等要素组合到新的模式里。

①进行独特的交流。写出一种完全的概括、描述或评价等和(或)进行其他交流。

②制定计划或提出操作定向。选择检验假说的方法。

③推导出一套抽象关系。在现象分析的基础上形成假说。

(6)评价。考察和应用准则去估量证明,得出结论并做出关于理论、技术、研究等的判断。

①依据内在证据来判断。察觉谬误和应用逻辑推理。

②依据外部准则来判断。利用规定的或强加的标准来评价和得出结论。

我国学者在认知领域的学习水平分类已开展了较多的探索。其中,以北京市朝阳区中学化学教学目标课题研究组制定的化学学习水平,及广东省化学标准化考试研究室制定的考试目标较具有代表性。这两者均对布卢姆等人的教育目标分类作了变通调整;国外学者也有类似情况。

例如,英国学者丹尼尔斯(D.J.Daniels)等将认知领域的教学目标改并为回忆、理解、应用、分析和综合。新西兰的一个教育家小组,在制定新学校证书方案时,于每一单元中将教学目标列为3组:(1)科学家取得的重要知识;(2)科学家工作的方法;(3)科学的社会意义。英国学者弗拉泽(M.J.Frazer)教授认为:对化学教师,以下三目标分类方案可能是有感染力的。这些目标是:(1)知道和了解;(2)技能,含智力技能如解释问题和解决问题和操作技能如使用仪器;(3)态度。

我国制订的《九年义务教育全日制初级中学化学教学大纲(试行)》(1992年),对知识和实验技能的教学要求,从教学论和测量的角度作了规定,并具体列述了各知识点和技能项。现将这份教学大纲规定的教学要求录下。

对知识的教学要求分为四个层次,从低到高依次是:

常识性介绍:对所学知识有大致的印象。

了解:知道“是什么”。能够记住学习过的知识的要点,能够根据提供的材料识别是什么。

理解:懂得“为什么”。能够领会概念和原理的基本涵义,能够解释和说明一些简单的化学问题。

掌握:能够“应用”。能够分析知识的联系和区别,能够综合运 用知识解决一些简单的化学问题。

对实验技能的教学要求分为两个层次:

练习:在教师的指导下,进行实验操作。

初步学会:在教师的指导下,能够正确地进行实验操作。

应当指出,以上教学要求是从我国各省市文化教育发展水平相差较大,就当前实施义务教育而规定的必须达到的基本要求,某些省份、某些学校完全可以,也应当“超标”完成上述教学要求,而不应受这些规定的限制。

情感领域的教学目标分类,怎样才能做到既要明确规定具体的教学活动期望达到的行为状态,为教学活动指明方向,又要规定学生在教学活动之后以可测量的方式表现出来的行为标准,这是一个亟待研究的课题。克拉斯沃尔(D.R.Krathwohl)等人提出情感领域可分为:接受、反应、估价、组织、个性化五种水平。但施测不免仍有难度。

我国学者有人认为①:情感教育属于德育的范畴,它既有线性的规律,又有非线性的无序性。从而提出:情感教育目标的检测和评价,应该从可比性和模糊性两方面着手,并设计了这两方面的目标评价系列。应当承认,在这一领域的实践经验仍有待于不断开拓。

化学教学目标的理论框架确定之后,可以按照知识(或技能)内容和学习水平双向分类来设计化学教学目标,以利实施。即(1)划分出适当的教学单元;(2)确定单元内每个知识点(或技能项)的学习水平。表述形式,不拘一格,可以采用文字叙述式或双向表格表示式。

第四节 有效化学测验的条件

化学测验的内容,因评价的目的不同而异。平时的校内测验与达标测验的要求和内容不同,升级(或分班)测验与选拔测验也是如此。但是,无论是上面讨论过的哪种测验,都应当保证测试的科学性,尽量减小测量误差,做到有效、可信,具有一定的难度和区分度。可以说,达到“四度”——效度、信度、难度和区分度的要求是有效测验的必要条件,也是最基本的要求。

一 效度

效度(Validity)是指测验在多大程度上测量了预定所要测量的内容。效度是用相关系数来表明的。在施测后,将测验分数与已举行过的受试者接受的其他测验(如标准化测验)的结果作比较,从而计算出相关系数。

求出的相关系数(γ)值越高,表明所编制的测验准确性越大。一般标准化测验的效度系数在0.4—0.7之间。效度系数最大等于1,表明测试完全反映了所要测验的内容;最小等于-1,表示测验结果与受试者的实际水平完全相反。实际上,这种完全相关(或正、或负)的极端情况是很少发生的。当效度系数等于零的时候,表示测验结果与所要测量的内容无关。

上面讨论的是经常采用的测验的内容效度,即指测验题目对有关课程内容或行为范围取样的适当性。测验是根据教学目标编制的,试题内容涵盖了教师讲授(学生学习)的课程内容,这样,这个测验就具有一定程度的课程内容效度。

一般采取以下办法,以提高测验的效度。

(1)测验的内容和范围,要包含教与学的主要内容;

(2)测验试题中要尽量把跟测验目的无关的成分去掉;

(3)测验试题的难度要适当;

第7篇

关键词:教育质量;学校教育质量评价;教育质量评价指标

中图分类号:G647 文献标识码:A 文章编号:1672-4038(2014)01-0083-06

学校在当今全球化趋势和少子化年代下若要想永续经营,吸引更多的学生就读,就需要维持学校的教育质量。在全球化的背景下,教育质量既是学校得以发展的命脉。也是衡量国家竞争力的标度之一。众多发达国家和地区为改善学校教育质量、提升教育竞争力先后建立基于自身国情的学校教育质量评价指标体系。虽然各地区所建构的评价指标体系有所不同,但这些评价指标都服务于促进学校教育质量的提升和学生的发展。

学校教育质量评价指标体系可以实现国家对学校教育质量的监测与问责,履行学校自我评估的功能,影响学校的发展和学生的学习成绩、学生的升学与辍学等。望全球教育发展动态,美国、新西兰和苏格兰等国家都有比较完整且各具特色的学校教育质量评价指标体系。我国在这个领域尚处于起步阶段,回顾这三个国家学校教育质量评价指标体系的发展历程。对比他们在指标体系上的差异,挖掘学校教育质量评价指标体系的演进逻辑和发展趋势,可以为我国构建相应的学校教育质量评价指标体系提供经验借鉴。

一、学校教育质量评价指标体系的国际经验

1.美国学校教育质量评价指标体系的历史演进

在学校教育质量评价指标体系建构方面,美国是毋庸置疑的领先者。从美国教育部国家教育数据中心(National Center of Educational Statistics,NCES)关于教育指标的报告上看,美国很早就开始对中小学阶段的学校教育质量进行评估,目的是对学校教育质量进行监控,为教育政策提供支持。1966年科尔曼报告对美国学校教育质量的汇报轰动全美,尽管汇报结果对学校不利,却激起许多人对学校教育质量的关注。科尔曼通过“平等教育机会的调查(Equal EducationalOppor-tunity Survey)”,发现学校教育对学生学业成就的贡献不到10%。Ⅲ这个报告以及这一时期其他学者所展开的大规模的调查表明,学校教育过程性指标并不能解释学校教育结果的差异,学校资源和物质上的输入指标,如学校设备等对学校教育输出变量之间不存在很大的关联,即学校教育过程中的检测指标对学校教育结果没有预测作用。

20世纪70至80年代,美国学界主要应用经济学的视角来研究学校教育投入与学校教育结果之间的关系,也试图建立学校教育投入指标与学校教育输出指标之间的函数关系式。这一时期的研究结果显示,学校教育输入对学校教育结果的影响存在差异性。有的研究结果证明学校教育输入对学校教育结果具有预测效果,有的却得到相反的结论。哈努斯科从研究中获得,只有教师经验这一变量对学校教育结果的影响上具有稳定的表现。

20世纪80年代后期,有研究者从学校对学生学习结果的有效性的视角来研究学校教育质量。这一时期的研究者关注学校教育过程的检测指标,他们试图通过学校的有效特征的研究来揭示学校教育过程这一暗箱操作,并归纳出学校组织、学校文化和教育技术等检测指标,并在每个指标下面设计多项可操作性检测变量,如教育领导用校长花在行政和教学事物上的时间比例、在教职工会议上有多少内容是关注教学问题等,学校有序的气氛又可以操作化为学生逃学率、违纪行为等变量。这一阶段的研究由于要揭示学校教育过程的各种暗箱操作的指标,因此采用的研究方法上除了大规模的调查研究之外,更多采用的是案例研究、访谈等方式,采集的数据也是以质化数据为主。

在20世纪80年代后期至90年代,更多的研究者从心理学的视角去探索更微观层面的学校教育――课堂教学的质量,这为学校教育过程指标体系的开发提供了强有力的实证基础。实际上,学校教育质量检测指标的开发最大的难点在于建立学校教育过程的检测指标,而这个微观层面的研究是建立学校教育体系中错综复杂的指标之间联系的关键,同时也是揭开学校教育面纱的关键。至此,美国形成了一个比较完整的、包括情境一输入一过程一输出的学校教育质量检测指标体系(见图1)。

2.新西兰学校教育质量评价指标体系的历史演进

同美国相比,新西兰学校教育质量评价指标体系的历史发展路径有些差异。若将美国学校教育质量评价指标体系的历史演进定性为是一定理论驱动的,如社会公平、经济学、有效学校和心理学驱动的,那么新西兰则体现出国家教育政策和学生学习结果驱动的发展轨迹,但有效学校的理念仍是支配学校教育质量评价指标体系开发的理论基础。

新西兰采用学校内部自我评估、校外机构对学校的评估,以及校外有关人士汇报评估结果来完成学校教育质量的检测和汇报任务。教育评估办(Education Review Office,ERO)是完成学校教育质量评估的非营利性组织,它的建立与新西兰1989年发起的“明日学校的改革”(Tommorrow's School Reform)相关。ERO主要履行学校教育评估的两种功能:第一,检视学校是否达到国家法律法规、国家教育指导方针所规定的教育目标;第二,评估每个学校对学生成就的贡献大小。

从1989年开始,新西兰教育法案就规定新西兰学校董事会一定要依据国家教育指导方针(National Education Guideline)持续不断地开展学校自我评估。ERO强调,学校自我评估只是一个过程,并不是目的本身,评估最终目的是为了促进学校教育质量的改善。这个阶段ERO主要是通过检测学校教学、管理体系和实践的质量来评估学校的教育质量。1996年新西兰教育部向新西兰议会提交学校表现的年度报告时,虽有一些输入和过程指标,但明显偏重于用结果指标来衡量学校教育质量,如大部分中学都收集了学生在大规模测试中的表现、大学升学率、学生逃学和出勤率等来描述学校的教育质量。威利指出,由于缺乏相应的实证研究,这个时期还未形成一套有效的检测指标体系。ERO也认为,新西兰学校教育质量检测指标的开发还处于发展期。总的来说,新西兰到20世纪末在学校教育质量评价指标建构上。还处于如下状态:第一,不论是国家层面还是学校层面,还未出现一个公认的、具体的学校表现指标检测体系;第二,当时国家教育质量检测指标基本上是属于描述型的,而非价值判断型的;第三,有很多关注学校教育过程指标开发的研究,但当时学校表现指标的测量主要关注的是学生的学习结果,忽略了学校教育的输入、情境和过程等因素。

20世纪90年代以来。ERO从学校自我评论、学校教职工的访谈、学校的政策方案和课堂观察等方面收集所需要的数据,以促进学生的学习参与、学习进步和学业成就水平(学校教育输出指标)为目的,建立了学校成功的6个决定性要素:有效管理、专业领导、高质量的教学、学校文化、社区和家长参与,并以此作为学校教育质量的检测架构。该检测架构关注的关键性问题是“学校教育是如何促进学生的学习――参与、进步与成就”,并综合新西兰政府对教育评价的首要需求、强调外部评价与学校内部自我评价相结合,形成一个比较完整的检测体系,而这套评价指标在2006年才首次应用于学校教育质量的报告中。

3.苏格兰学校教育质量评价指标体系的历史演进

苏格兰通过英国教育标准局(OFSTED)和各级督学组织(如皇家督学团HMIE)构建了一整套完整的学校教育质量评估体系。20世纪80年代中后期,随着经济的不断发展,苏格兰人的消费者意识不断增强,投入和产出的经济效益模式成为影响学校教育质量评价的重要模式。在巨额的教育资金投入的同时,苏格兰人开始索求教育投入的回报问题,追问学校教育投入是否与学校教育结果成正比等。教师、学校和教育主管部门也需要对政府、广大的公众、家长和学生提供教育产出的证据,教育问责开始诞生,而学校教育质量的评价也在这种教育理念的转型中成为教育界关注的话题。1988-1989年分别出版的《有效中学》(Effective Secondary Schools)和《有效小学》(Effective Primary Sch001)是这个时期学校教育理念和评价方式的代表。

20世纪90年代,赛门斯指出,学校的教育质量主要体现在它是否促进学生学习结果的提高。这个观点强调学校对学生的发展具有很大的影响,与80年代之前流行的观点“学生的学习结果和学生的家庭经济和社会地位有关,和学校教育并没有多大关系”大相径庭,为后来苏格兰1997年开展“苏格兰学校质量运动”(The QualityInitiative In Scottish Schools)做了很好的铺垫。90年代后,苏格兰开始关注学校教育的内部情况,如学校发展计划在学校管理中的作用,学校的课程设置、教师教学对学生学习成绩的影响等。值得一提的是,1992年,苏格兰公布了《学校表现指标》和《学校道德教育指标》两份重要的文件,1994和1995年分别出版了《苏格兰学校发展规划》和《走向质量保证的苏格兰学校》,虽然这些文件和书籍中所开发的学校教育质量检测指标尚待修订,却为后来形成完整的检测指标体系提供了一个重要的框架。1996年,在前面研究的基础上,苏格兰为学校系统地进行自我评估开发了重要的检测工具,并发表在《我们的学校有多好》这本书中,这也代表着苏格兰较完整地建构了学校教育质量评价指标体系。

苏格兰学校教育质量评价指标体系由学校的成功与成就、学校的生活与工作以及学校的愿景和领导三个方面,包含9个关键领域,基本上涵盖学校教育工作的所有方面。在学校的成功与成就方面主要回答学校已经达到了什么样的教育结果,以及学校在多大程度上满足了学校作为一个共同体的需求;学校的生活与工作主要回答学校通过课程与教学所提供的教育情况如何以及学校在管理规划、资源利用和教职工的配置等领域的详情:愿景和领导方面则主要回答学校的未来发展方向等问题。苏格兰的学校教育质量评价指标体系的发展过程逐渐凸显出学校教育目标、学校教育过程中的课程与教学以及学校教育管理的重要性,从漠不关心学校教育过程到追寻学校教育过程对学校教育结果的影响,也经历了多方面的曲折变化。

对比美国、新西兰和苏格兰这三个国家学校教育质量评价指标体系的历史演进过程及其指标体系的内容,我们发现这些国家在评价指标建构机构、建构目的、建构维度,指标体系中的输出指标以及建构评价指标体系的概念架构上有很大的差异(见表1)。

二、学校教育质量评价指标体系的演进特点

1.学校教育质量评价指标体系的政府扶持与导向化

不管是美国、新西兰还是苏格兰,学校教育质量评价指标体系的建构都体现了以国家和政府扶持和导向的倾向,美国教育部通过NcEs的专门机构、苏格兰通过OFSTED等机构、新西兰虽是非营利性组织ERO,但也是新西兰教育部为监测学校教育质量而设立的评估机构。政府导向的学校教育质量评价指标体系建构一方面体现了学校教育体系的复杂性,同时也体现了学校教育质量评价指标体系需要履行监测和问责的功能,而这样庞大的评价指标体系并非一个学校所能建构起来的。评价指标体系在政府和教育当局的扶持下得以建构,同时也为学校检测和了解自身的教育质量提供了依据,学校也可以据此调整自己的发展方向,促进学校教育水平的提高,改善学生的学习结果。

2.学校教育质量评价指标体系的多层化与多维化

鉴于学校教育的复杂性,以往用经济学来研究学校教育投入与产出的观点已经不再适用于开发学校教育质量检测指标体系。在各国学校教育质量指标体系开发的历史演进中,评价指标系统更倾向用多种理论整合的视角。如整合有效学校和心理学研究的视角去关注学校内部事件。多种理论整合的视角就产生了学校教育质量评价指标体系的多层化和多维化。多层化主要体现在学校教育质量指标关注学校层面和课堂层面上。学校作为一个整体,它的整体文化、管理制度对学生的学习会产生影响,而这个影响很多是间接的,它需要通过学校的课堂教学来作用于学生,因此。将学校教育质量检测指标分化为学校层级和课堂层级。学校教育质量评价指标体系的多维化主要体现在:(1)学校教育结果指标的多维化。学生的学习成绩不再是学校教育质量的唯一衡量标准,美国增加了学校教育对社会的利益、学生的情感技能和价值观念的变化,新西兰增加了学生的学习进展和学习参与。而苏格兰则用达成教育标准的程度、学习体验、学习质量和家长参与程度来检测学校教育质量。(2)学校教育质量评价指标涵盖了以往很少涉及的过程性检测指标和情境性指标、形成了情境一输入一过程和输出的多维指标体系。

3.学校教育质量评价指标体系的核心过程化

从各国学校教育质量评价指标体系的发展脉络上看,最初各国基本上都关注学校教育投入对学校教育质量的影响,但到评价指标体系的完整确立都不约而同地将重点放在学校教育过程上。学校教育质量评价指标体系核心的过程化主要体现在以下两个方面:第一。评价指标体系设计关注学校文化、课程设置、教学材料、课堂教学等过程性指标。在学校教育质量评价指标确立之前,很多研究关注学生的家庭经济背景、学校所在地(农村/城镇)、在每个学生上的经费投入以及教师和学生的比率等因素对学生学习成绩的影响。有些学校根据以上的研究结论作出相应的政策调整,如小班教学、增加经费投入等,但效果并非那么明显。因此,学校教育质量的评估逐渐转向对学生学习具有直接影响的学校教育过程中,特别是学校的课程与教学领域,并通过改善学校的课程、建设师资队伍、提高课堂效率来促进学校教育质量的提高。第二,评价指标体系的数据收集工具多元化。为了能获得更多有关学校教育过程的信息。开发了很多之前没有应用的数据收集工具,除了应用问卷调查收集量化的数据之外,还应用访谈、课堂观察、学生和教师自陈报告来收集质化数据。

三、对我国建构学校教育质量评价指标体系的启示

我国至今还未形成一套有效的学校教育质量评价指标体系,国外学校教育质量评价指标体系的历史演进和发展经验对我国建构学校教育质量评价指标体系具有重要参考与借鉴意义。

首先,学校教育质量评价指标体系的建构需要以政府和教育部门为依托,充分考虑评价指标的监测、监督和问责等功能,充分地反映学校教育质量。学校也应该利用指标体系来诊断和评估自身的教育质量,及时调整学校的教育方针和政策,改善学校的教育水平,当然,由于各国所秉持的建构目的都有差异,我们的目标是建构符合我国国情的学校教育质量的指标体系。鉴于此,我国在多方面考察国外学校教育质量检测指标体系的同时,需要更多地开展本土化的实证研究。

第8篇

关键词:高等学校;校本教学评价;教学质量监控

中图分类号:G642

文献标识码:A

文章编号:1672-0717(2012)06-0058-06

基金项目:湖南省2010年高校教学改革研究项目“以二级学院教学评估为基础的一般本科院校教学质量监控模式研究与实践”(湘教通[2010]257号);2012年高校教学改革研究委托项目“湖南省普通高等教育教学评估制度体系的研究”(湘教通[2012]401号)。

作者简介:刘初生(1955-),男,湖南涟源人,湖南工业大学教学评估处处长,教授,主要从事高等教育管理研究。

高校内部二级院系教学工作评估与教育部本科教学工作水平评估相伴随行。各高校为取得本科教学工作水平评估的优异成绩,积极开展校内的自评自建工作,二级院系教学工作评估是其中的重要组部分。实施以院系教学工作评价为主的校本教学评价模式,从学校实际出发,科学设置评估指标体系,优化评价方法与程序,合理利用评价结果,把评价落实到日常的教学管理之中,是对二级院系教学工作评估的创新与优化,符合我国新的本科教学评估制度体系的要求,是高校内部教学质量保障体系与长效机制得以形成的有效举措。

一、校本教学评价的内涵

20世纪80年代,作为国际经济合作和发展组织(OECD)项目“国际学校改进计划”(ISIP,International School Improvement Project)重要组成部分的校本评价,在挪威、英国、美国、以色列等许多国家开始实施并得到教育研究者们的关注[1](P36-40)。

关于校本评价的涵义,学界众说纷纭。罗伯特·保伦(Robert Bollen)在分析OECD校本评估项目的实践经验基础之上,将校本评估概括为:由一所学校、学校中的一个部门或个人实施的针对学校的实际运行状况的系统检查。从本质上说,校本评估实际上应是学校内部评价与外部评价的结合体,它兼顾了评价的诊断性、形成性和总结性的功能,校本评估的任务之一在于建立学校的评价常驻机制,以供学校随时进行自我反省,并为回复公众对学校教育的问责提供证据,为学校改进与发展提供决策依据[2]。戴林·哈蒙德(Darling Hammond)将校本评估视为一种行动研究的过程,是一种系统的调查过程,其意图是较深入地认识学校教育的条件、过程和结果以及学校发展的可能性之间的相互作用关系[1](P36-40)。台湾学者郭昭佑认为,“学校本位评鉴是学校成员在专家协助下,学习评鉴知能且实地执行学校层级评鉴,以建立学校内部评鉴的常驻机制,并透过内外部评鉴的联结与多元参与的真诚对话,以为学校发展改进负绩效责任”[3]。大陆学者则把校本评价界定为“以学校为中心或以学校为主体,在学校层面充分发挥学校作为评价主体的作用,通过对学校各方面工作的评价,以促进学校发展的一种评价活动”[4],或“由学校的内部评价机构在外部评估专家的协助下,自发地对学校内外部教育环境与教育质量进行民主的、系统的调查过程”等[5](10-12)。

综合起来看,校本评价是以学校为中心的评价机制,是一种科学的管理手段,是学校改进与发展的前提与保障。其主要特点在于:(1)评价主体多元,包括政府与学校、学生与教师等,其中核心的主体是学校,为了学校而评价,在学校评价,基于学校的评价[6];(2)价值取向多维度,受益者包括社会、学校、教师及学生等,其中核心的价值取向在于促进学校的全面发展;(3)评价功能多样,包括诊断性、形成性和总结性等,其中核心的功能在于通过建立常驻的评价机制,优化成人成才过程。

校本教学评价是校本评价在教学领域的贯彻实施, 是高校内部教学质量保障体系的重要组成部分。近年来,国内学者开展了校本评价的研究,并取得了一定的成果。但这些成果多半停留在理论层面,鲜见理论与实践结合的成功范例[7],有关校本教学评价的情况尤其如此,而且多以中小学为实践对象。本文以笔者所在湖南工业大学近年的实践为基础,参照相关理论,拟就以院系评价为主的校本教学评价模式的构建与实践一陈管见。

二、以院系评价为主的校本教学评价模式的构成

评价模式是指建立评价制度和进行评价实践的范式[8]。在近几年的实践中,湖南工业大学以校本评价理论为指导,形成了以院系评价为主的校本教学评价模式,这一模式以学校为主要评价主体,以二级院系为主要评价对象,以教学工作状态为主要评价内容,以数据审核为主要评价方法,以改善和优化人才培养过程为主要目标。下面试从指标体系、评价方式、结果利用三方面详加阐述。

(一)校本教学评价的指标体系

科学设置评价指标体系是提高评价效率,实现评价目标的基础[9]。高校二级院系的教学工作受到学校各种因素的制约,特别是教学仪器设备、实践教学场地、师资队伍结构、图书资料等教学“硬件”的建设往往取决于学校的决策,因此校本教学评价的主要内容着眼于院系的教学管理、教学改革等教学“软件”的建设。此外,高校各二级院系建立的时间有先后,教学基本条件有差异,教学水平的起点也不同,因此把校本教学评价定位于“教学工作评价”,而非“教学水平评价”,主要评价各院系的教学工作状态,以促使各院系在原有的基础上改进教学管理,深化教学改革,提高教学水平和人才培养质量。具体来说是建立“三三一”构架的评价指标体系,即“三类别”、“三层面”、“一附加”。

“三类别”系从横向上划分的,一是“规与管”,包括两个一级指标:教学工作思路与地位、教学管理;二是“教与学”,下辖教师教学、教学效果;三是“建与改”,内含教学建设、教学改革。评价的核心是“教与学”,重点为“建与改”,关键在“规与管”,都是影响人才培养质量的主要教学“软件”。“规与管”中的“教学思路”指标主要考察教学工作思路、教学工作中心地位;“教学管理”指标主要考察教学管理制度、教学秩序、实践教学管理、教学档案管理等。“教与学”中的“教师教学”指标重点考察教授与副教授上本科课、教师教学水平与教学竞赛;“学生学习效果”指标重点考察学科竞赛、英语等级考试通过率、应届毕业生考研情况、大学生创新创业项目与成果等。“建与改”中的“教学建设”指标主要考察教学基本文件建设、专业建设、课程建设、教材建设、实践教学基地建设、教师队伍建设;“教学改革”指标主要考察教研教改活动、教研教改课题、教学研究论文、教研教改成果等。

“三层面”是从纵向上划分的,包括思想层面、制度层面、绩效层面。思想是指南,制度是保障,绩效是落脚点。思想层面的内容主要体现在教学工作的总体设计、教学管理理念、教学建设与教学改革的思路等方面;制度层面的内容主要体现在院系细化和执行学校教学管理制度,重点在于制度的执行情况;绩效层面的内容主要体现在教与学的状态、教学效果及教学建设与改革的成果等。

“一附加”体现各院系教学工作的特色与差异,是对“三类别”评价内容的必要补充,主要包括国家级项目与成果、特色与创新两方面,前者用来鼓励院系师生争创国家级教改项目与成果,后者用来促进院系在教学工作上勇于创新,形成特色。

为了更好地体现校本教学评价的导向功能,在39个观测点中,还设置11个重要观测点:在教学工作思路与地位方面突出人才培养方案与院系领导听课;在教师教学方面突出督导评教结果;在教学建设方面突出专业建设;在教学改革方面突出传统的教研活动;在教学管理方面突出教学事故、学生到课率、考试与毕业设计(论文)以及实习实训管理;在教学效果方面突出毕业生就业率。

(二)校本教学评价的方法与途径

优化评价方法与途径是提高评价效率、实现评价目标的关键。第一要简化程序,易于操作,不加大院系的工作负担,把评估工作落实在平常的教学管理工作中;第二要客观公正,用数据说话,防止造假,以事实为依据;第三要把握标准,不降低要求,把教学工作的质量标准、教学管理的规范要求先行颁布,把评估的要求与标准交给被评单位。在评估操作过程中具体实施“三种方式”,使用“三法赋分”。

“三种方式”指校本教学评价通过听取汇报、审核数据以及实地考察三种评价方式来实施。

一是听取汇报。由各被评院系领导简要汇报本院系教学工作思路与理念、人才培养目标定位、课程体系的构建以及教学工作特色与创新等内容,多属于思想层面的范围。评价专家、校领导及相关职能部门领导听取汇报,帮助其进一步理清思路,并给予客观评价。通过听取汇报,评价2个观测点,占观测点总数的5.1%。

二是审核数据。学校根据评价指标体系建立教学工作状态数据库,将全年教学管理及质量监控过程中所产生的数据及时收集,评价时由专家及相关职能部门核实,并根据观测点的等级标准评定相应等级。这是评价项目的主体部分,以绩效层面的内容为主,体现以“审”代“评”的思想。这种方式能有效防止评价造假,体现常态,减轻院系评估工作负担。用数据审核的方式可以得出26个观测点的结果,占观测点总数的66.7%。

三是实地考察。有少量指标,多为制度层面的内容,需要由专家组深入各院系查阅相关材料、了解工作状态与制度执行情况、感受工作氛围,才能比较准确地做出判断。例如专业建设、实验教学等。考察时除了按照指标标准了解情况、评定等级之外,更重要的是与院系直接交流,进行必要的现场指导。以实地考察的方式可以得出11个观测点的结果,占观测点总数的28.2%。

“三法赋分”指各观测点的评价采用等级制、排名制和加分制三种方法,按照一定的标准和规则评定相应观测点的得分,分别称为等级赋分法、等差赋分法和项目加分法。

等级制是按照观测点的质量标准,来评价被评对象的目标达成度。采用等级制评价的观测点分为A、B、C、D四等,各等级标准值依次设置为1.0、0.8、0.6、0.4,权重为pi的观测点各等级评价得分依次为1.0×pi,0.8×pi,0.6×pi,0.4×pi。

排名制主要用于评价影响教学质量的核心教学环节,如课堂教学、考试、毕业设计(论文)等。对这些环节实施专项检查与评价,评价结果作为重要指标体现在教学督导评教、学生评教、考试试卷检查、毕业设计(论文)检查等观测点中。采用排名制评价的观测点根据专项检查结果、院系排名情况等差确定得分,设置最大值为满分,最小值为满分的60%,第一名取最大分,最后一名取最小分,中间各相邻名次等差取分。

加分制用于附加项目的评价,按加分标准,在权重范围内按项加分。加分制按项累加,设置上限,下不保底。

各被评单位总得分的计算公式为:

++ 附加分

其中:

Z为院系总得分;

pi为采用等级制评价的第i个观测点的满分(权重);

qi为第i个观测点的等级标准值,A、B、C、D各等依次为1.0、0.8、0.6、0.4;

rj为采用排名制评价的第j个观测点的得分。

为提高评价指标的适应性,除尽量设置一些共性指标外,对于个别指标在评价时还需进行必要的处理。当某指标与某些院系无关时,去掉本项指标后统分。如某学院今年没有本科毕业生,二级指标“5.5毕业设计(论文)工作”与该院无关,则去掉该项指标5分,该院95分为满分,其最后得分为X=[+]÷95%+附加分。与每项指标都相关的学院,其最后得分X=Z。

(三)校本教学评价结果的利用

合理运用校本教学评价结果是提高评价效率、实现评价目标的保证。我国目前高等教育教学评估结果大体可分为三类:一是以本科教学工作水平评估为代表的等级制,其结果分为优秀、良好、合格、不合格四个等级,鼓励被评学校办出水平,争创优秀;二是以本科教学工作合格评估为代表的准入制,其结果为通过、暂缓通过、不通过三种,通过的学校准许进入下一轮普通高等学校审核评估;三是以大学排名为代表的排名制,最终结果按照量化分值的大小,对被评对象依次排名。至于评价结果的利用,都还停留在“一定范围内公布结果”这一层面,缺乏后续促进的力度。校本教学评价要加大评价结果的使用力度,采用“排名”、“报告”、“奖惩”相结合的方式。

(1)对被评院系评价结果排名公布。校本教学评价的最终结果之一为一个量化分值,各被评院系的结果具有可比性。将各被评院系的最后评价得分从高到低排名,同时对一些主要指标(例如督导评教、学生评教、试卷检查、毕业设计/论文检查等)实行单项排名,并在学校范围内公布。

(2)建立学校年度教学质量评价报告制度。将评价过程中收集的教学工作的大量材料和状态数据,进行全面统计、比较和分析,形成学校年度教学质量评价报告(白皮书),在全校范围内按年公布。教学质量评价报告客观反映学校教学工作状态、展示院系教学工作亮点、反馈专家评价意见。

(3)建立健全教学工作奖惩制度。在校本教学评价过程中,形成了一系列的评价数据,例如院系教学工作评价最终得分、各项指标的最终得分、督导和学生评教得分,等等。依据这些结果可评选年度教学工作先进单位、课堂教学先进单位、考试工作先进单位等,再将这些评价结果与经费投入、职称评聘、津贴分配等挂起钩来。

三、以院系评价为主的校本教学评价模式实施效果分析

新近颁发的《教育部关于普通高等学校本科教学评估工作的意见》(下称《意见》)明确提出“强化高等学校质量保障的主体意识,完善校内自我评估制度,建立健全的校内质量保障体系”[10],特别强调学校的主体地位,强调学校日常的自我评估工作,强调学校内部质量保障体系的建设[11]。这样的理念与要求在很大程度上是基于追求教学评估实际效果的根本目的。以院系评价为主的校本教学评价模式正充分体现了教育部《意见》(教高[2011]9号)中这些新的理念与要求。对高等学校自身而言,校本教学评价是自主进行的评价,评价的内容、方式由自己决定,评价结果只对校内公布,所以评价活动的目的性强、数据资料真实、评估内容深入、适用范围广泛,通过评价能真正发现问题、找出不足,从而促进高校自我发展、自我完善、自我督促、自我约束[5](P10-12)。这一评价模式,从湖南工业大学连续三年的实践来看,其效果是非常显著的。

(一)引导了院系明确办学方向

校本教学评价要求院系汇报教学工作思路、理念,以及人才培养目标定位等方面的情况,得到专家在教学工作顶层设计方面的直接检查和指导,并提供院系相互交流与学习的平台。同时,专家组在实地考察时,还对院系教学建设的实施、教学过程的管理等方面进行现场指导。这些要求与做法,有助于院系理清教学工作思路,引导其强化本科教学的基础地位,不断提炼自身的办学理念,准确定位人才培养目标,使院系的教学工作不偏离科学发展的轨道,并规范教学管理,促进教学工作特色的形成和教学质量的提高。

(二)促进了校院教学工作的科学决策与有效管理

校本教学评价依托学校教学工作状态数据库、督导评教、学生评教等手段,跟踪教师的教学及院系的教学管理工作,使教学质量保障工作常态化,真正落实到教学工作全过程,确保及时发现问题并持续改进。学校领导和职能部门也能籍此更清晰地了解和把握各院系的教学工作运行状况和成效,从而对学校的教学工作进行科学的决策和管理。就学校管理层面而言,平时靠普通的走访与简单的汇报得来的信息只能留下笼统而模糊的印象,而有了校本教学评价,院系的基本数据与教学工作状态一目了然。一旦真正了解院系教学工作情况,学校教学工作的决策就有据可依,教学质量标准的制订也会更加切合实际。同时校本教学评价也使院系更直观、更全面地认识自我,更清楚地了解自己的长处、短处、与其他院系的差距以及可以挖掘的潜力,从而能科学合理地规划院系的教学工作,正确把握人才质量标准,促进院系的教学建设和改革。

(三)强化了院系教学质量管理的主体责任

校本教学评价以院系为评价的主要对象,把平时对教学质量监控与评价的结果,包括督导评教、学生评教、试卷检查、毕业设计(论文)检查以及反映教学建设、教学运行状态等方面的情况全部体现在校本评价结果中。长期以来,大部分高校在教学管理上实行的是“单一管理”模式,管理重心在校级教学管理职能部门教务处,院系处于被动状态,教务处不仅在管理教学、评价教学,而且也在实施教学。在进入高等教育大众化阶段之后,高校的学科、专业、学生人数都在成倍增加,学生规模一般都在万人以上,“单一管理”模式已经严重不适应新形势的发展。校本教学评价对院系教学管理产生压力和动力,能促进学校教学管理重心的下移,使二级院系成为学校教学实施与管理的主体,校级教学管理职能部门从过程管理转向目标管理,从事务型管理转向服务型管理,保证了高校内部教学管理的高效运行。同时,校本教学评价也使院系对教学工作有了抓手,对于促进广大教师对教学工作的投入,提高教学水平与教学质量起到了重要的激励作用。总之,校本教学评价以数据说话,以预防为主,以激励至上,是院系了解自我、正确定位、自主发展、自律发展的内在动力。

(四)优化了教学质量的形成过程

校本教学评价突出人才培养过程中核心教学环节的质量监控,包括人才培养方案、课堂教学、课程考核、毕业综合训练等,把监测结果作为教学评价的重要指标来体现。具体而言,对人才培养方案从方案制订、方案评价、方案执行三个环节把好关;对课堂教学以专家的角度、学生的角度、管理者的角度,从专家评课、学生评教、教学巡查、信息员监察、学生到课检查、课程调研等六个方面进行监控;对课程考核实行两查:考试过程巡查、考试试卷检查;对毕业综合训练从选题、开题、中期检查、结题与答辩到毕业设计(论文)质量与管理工作质量进行全面检查。

高等教育质量在形成的过程中体现,存在于教育实践中,其质量高低取决于教育实践的丰富度。现代质量管理认为,产品质量包括产品的最终质量和形成产品的工作过程质量,质量不是末端检测与评估出来的,而是依照整体的优化设计和全过程的质量监控来实现的。人才这一高等教育的主要产品质量是由培养过程的工作质量——即教学工作质量来决定的,教育过程质量决定着人才质量,提高人才质量只能靠优化教育过程设计和全过程的质量控制来实现[12]。校本教学评价通过严密监控核心教学环节,优化教学过程,为教学质量的提升保驾护航。

参考文献

[1] 胡咏梅.校本评估理论初探[J].教育理论与实践,2004(10):36-40.

[2] Bollen,R.lmproving the Quality School:Lessons from the OECD,lnternational School lmprovement Project[M].London:Falmer Press,1987.

[3] 郭昭佑.学校本位评鉴的理念与实践——以台北县柑园国中为例[J].Journal of Taiwan Normal University,Vol.46,No.1,2003,21-43.

[4] 黄威,等.校本评价:理念与方法[J].教育理论与实践,2004(4):37-39.

[5] 吴海丽,等.高校校本评估理论初探[J].广东工业大学学报(社会科学版),2006(4):10-12.

[6] 郑金洲.走向“校本”[J].教育理论与实践,2000(6):11-14.

[7] 陈煜,等.基于校本评价的本科教育质量评价研究[J].高等工程教育研究,2008(4):94-97.

[8] 李志义,等.基于审核模式的高等学校教学评估探讨[J].中国高等教育,2009(2):52-54.

[9] 刘初生,等.一般本科院校建立校本教学评估机制探索[J].湖南工业大学学报(社会科学版),2009(3):123-125.

[10] 教育部.关于普通高等学校本科教学评估工作的意见[EB/OL]. http:///modules/wenjianfabu_d.jsp?id=1107.

[11] 季平. 加强质量保障体系建设 扎实搞好合格评估工作[EB/OL].http:///modules/news_detail.jsp?id=1501.

[12] 杨立军,等.过程质量观:大众化高等教育质量管理的必然选择[C].全国高等教育质量保障与评估协作会成立大会暨学术研讨会论文汇编,2010:58-64.

A Study on Department-oriented Internal Teaching Evaluation Mode in Universities

LIU Chu-sheng JIN Ji-cheng CAI Shou-sheng

第9篇

“教育测量”这一名词,最早是由被称为教育测量的鼻祖的美国心理学家桑戴克在1904年提出来的,但作为一门学科,近半世纪才得到迅速的发展。这是因为,随着教育的不断发展,社会需要追究教育质量的优劣,教育本身需要提出办学确有成效的证据。同时随着计算机的普及,统计学、心理学的发展,这门学科也就得以不断发展且日趋成熟了。

教育测量与评价的演变及发展

教育测量起源于古老的考试制度。中国是最早创设考试的国家,可谓教育测量的发源地,但作为一门科学,教育测量学却是西方现代心理学、教育学、统计学等学科理论与实践结合的产物。

19世纪末20世纪初,随着实验心理学和心理测验理论的发展,欧美学者对教育测量的基本形式――学校教育考试进行了积极改革和研究。1909年,行为主义学习论首创者桑代克运用心理测验方法和统计学原理,编制了第一批标准化教育测验,使教育测量走上了科学化的道路。此后,美、英、法等国家的测验运动逐步兴盛,心理测验与教育测验相互影响,并在学校教育背景下不断融合。各种各样基于行为主义学习方式的测验或考试成为检测学生学业成绩、了解教学效果的有效工具。20世纪40年代前后,欧美等国家的一些测验理论专家开展了测验的统计数学模型研究,进一步丰富、完善了教育测量学科内容,并在20世纪50年代前后形成了经典测量理论体系。

测量,通常是指人们对客观事物进行某种数量化的测定。教育测量是对学生的学习能力、学业成绩、兴趣爱好、思想品德以及教育措施上许多问题的数量化的测定。

评价,是指判断某事物的价值或某行为是否值得做的过程。教育评价,是按照一定社会的教育性质、教育方针和政策所确定的教育目标,对所实施的各种教学活动的效果,完成教育任务的情况以及学生学习成绩和发展水平进行科学判断的过程。

由于教育测量的对象,多属于人的心理属性,如记忆能力、推理运算、思维能力等,故我们只能依据人的外显行为,比如通过学生对试题的反应和一些行为表现,运用推理、判断的方法来间接测量出他的知识水平、智力高低和品德好坏。因此,教育测量一般是间接测量。由于教育测量没有统一的量表,各科各次考试试题难易不同,评分标准不同,使得教育测量的度量单位是相对的。但是教育质量客观上确有优劣之分,这种明显的差异完全可以予以数量化。美国测量学家桑戴克与麦柯尔指出:“凡存在的东西都有数量。”“凡有数量的东西都可以测量。”因此,教育测量是可行的。

教育测量的目的在于了解学生的发展变化及其影响因素,为教育评价和教育决策提供依据。学习方式是影响学生发展的主要因素之一。学习方式的演变不断推动着教育内容、教育方式以及教育结果测量范式的改变。可以说,任何教育测量及评价都是基于“学习”概念的理解。教育测量理论作为教育测量的原理和法则,其发展以及在教育活动中的应用,也受到学习方式变革的影响。

进入2l世纪以来,随着学习观念的进一步深化发展,学习概念的各个方面都发生了深刻变化;学习与自然因素、社会环境因素更加密切地交融在一起,影响学习的因素日趋多样化、复杂化。承载学习活动的学习方式亦由具体的单维形式演变成了抽象的多维系统,学习者在学习中的自觉主动性、独立体验性、交互合作性及探索创造性得以充分展现和提升,“学到什么”渐渐在学习的本质中被淡化,“如何学习”、“学会学习”则逐步凸现而成为其核心。学生学习水平的表达已不是某种单维的表征性结果,而成为了一种映射学习主体价值、学习过程与方法以及各种“内在外在”影响因子的多维度、整合性“成就空间”。要实现这种“成就空间”的衡量和解释,至今为止的任何一种测量理论和方法都是无法胜任的,因此,测量理论的发展也必然进入一个多维化、整合化时期。

国外教育质量监测发展

在美国,20世纪90年代以来,为了提高中小学教育的质量,国家在制定全国和各州的课程标准、改善评价体系方面进行了许多改革尝试。美国国内将这种改革称为“基于标准的教育运动”。其中影响最大的是美国国家教育进展评估(简称NAEP),又称为国家教育报告卡,其首要目标是向美国公众报告学生的教育状况。2001年,美国推出“美国中小学教育法案”,即《不让一个孩子落伍》法案,得到了国会两党议员的高度认可。该法案确立了NAEP评估模式。

第10篇

Abstract: The evaluation theory system of moral education of college students is a comprehensive theoretical aggregate, composed of many discipline theories. The basic theory of education evaluation is an important basis for the evaluation theory of college students' moral education, the subject of moral education is the basic content of college students' moral education evaluation theory, evaluation theory is an important theoretical reference for college students' moral education evaluation theory. To construct the theoretical system of college students' moral education, we must absorb, draw and combine the theoretical knowledge of education evaluation, moral education and evaluation to make them interact and combine organically.

关键词:教育评价;德育学科;评价学;德育评价理论

Key words: education evaluation;moral subject;evaluation studies;evaluation theory of moral education

中图分类号:G641 文献标识码:A 文章编号:1006-4311(2016)21-0242-03

0 引言

多年来,我国的一些专家学者对德育评价进行了一定程度研究,德育评价得到了一定的发展。但是到目前为止,我国学界有关德育评价的研究成果,主要还是局限于对德育评价的具体操作问题研究,如德育评价的方法问题、德育评价的指标体系问题、德育评价的操作技术问题等。而对于德育评价的理论研究领域,学者们的研究呈碎片化的状态,鲜有专家对德育评价理论体系建构进行整体性、系统性的思考、分析与研究。

大学生德育评价是一门复杂的学科,它的理论体系是一个综合性的理论集合体。教育评价基本理论是大学生德育评价理论的重要基础,德育学科是大学生德育评价理论的基本内容来源,评价学理论是大学生德育评价理论的重要理论借鉴。

1 教育评价基本理论是大学生德育评价理论的重要基础

教育评价是教育学的一个重要部分,教育包括了德、智、体、美、劳等方面。上个世纪七、八十年代,我国学界对教育评价的理论研究,主要在于引进国外现代教育评价的一些研究成果。进入新世纪以来,我国的教育评价得到了一定的发展。德育作为一门独立的学科,虽然它属于教育的一个重要组成部分,但它有其自身的特点和属性,因此不能简单的将德育评价归结为教育评价的一部分。况且国内外的专家学者对德育本质的理解存在差异,对德育的内容范围也有不同的理解。但是,一个不争的事实是教育评价的发展为德育评价的理论研究奠定了重要的基础。

首先,教育评价学科的发展,为德育评价学科发展奠定了基础。我国从上世纪70年代开始对现代教育评价理论的进行研究。并于1984年加入“国际教育成就评价协会”,同时我国又在中央教科所建立“中国国际教育成就评价中心”,开始在全国开展考试学、教育测量、心理测量、教育评估、教育评价、教育统计学的理论研究和实践工作,这不仅大大促进了我国教育测量、教育评价、教育评估的理论研究和实际工作的发展,同时也体现了“教育测量与评价”学科重要的社会价值和应用领域。[1]可以说,没有教育评价的发展,就没有德育评价的发展。教育评价概念的提出,对其本质、规律、意义的研究,为德育评价奠定了宝贵的理论基础。

其次,教育评价的功能研究,为德育评价价值取向奠定了基础。美国著名学者格兰特・威金斯曾经说过,评价如果不能对学生、教师、学校以及教育管理者有所教益,那评价也就失去了价值。[2]什么评价,评价的根本目的是什么,这就提出了评价的功能问题。教育评价最初对这个问题的研究主要是基于考核和诊断的需要。经过多年的发展,现在大家形成的共识是德育评价具有导向功能、管理功能、激励功能、诊断功能、鉴定功能。这些功能的提出,不但为德育评价的实践开展提供了方法指导,而且也为德育评价价值取向奠定了重要基础。

最后,教育评价实施原则为德育评价的科学实施提供了理论依据。多年来,我国专家学者在归纳、总结和吸收国外关于教育评价理论的基础上,结合我国教育的实际情况,也提出了不少适合我国国情的教育评价实施原则。其中瞿葆奎、陈玉琨等专家学者对教育评价的实施原则提出了一些有见地的观点和理论,他们认为教育评价的实施原则主要包括可行性原则、客观性原则、教育性原则、可比性原则等。在对大学生开展德育评价的过程中,德育评价主体和客体是处在一种相对复杂的关系中,同时德育评价又是由多种要素构成的复合体。因此恰当处理评价主客体的关系和正确分析德育评价各要素之间的关系,便成了一个德育评价工作能否顺利进行的关键问题。为了使这个问题得到妥善处理,也必须把握一些共识性的原则,只有把握了这些原则,才能为德育评价工作在方案设计、指标体系设定、评价材料收集等操作方法技术方面提供理论依据。教育评价的实施原则无疑为德育评价的科学实施提供了强有力的理论依据。

2 德育学科是大学生德育评价理论的基本内容来源

德育学科主要包括思想教育、政治学、伦理学、心理学四个方面的内容,这些学科内容的发展,丰富了德育的内涵,为德育评价提供了丰富的理论内容。

思想教育是德育最为重要的一个组成部分。人类的发展史就是思想的发展史,人区别于动物的主要原因就是人的思想性,人的最高尊严就在于思想。思想属于意识形态的范畴,唯物主义认为社会存在决定社会意识。思想来源于社会实践,是由实践活动到认识,再由认识到实践活动不断重复的过程。正确的思想是符合并促进客观事物发展的,错误的思想阻碍客观事物发展。在《人的正确思想是从那里来的?》一文中说:“无数客观外界的现象通过人的眼、耳、鼻、舌、身这五个官能反映到自己的头脑中来,开始是感性认识。这种感性认识的材料积累多了,就会产生一个飞跃,变成了理性认识,这就是思想。”[3]对德育对象而言,思想教育非常重要,它决定了一个人的人生观、世界观、价值观的形成。随着思想教育工作的开展,思想教育的方法、原则和理论也随之不断发展。在长期的工作实践过程中,人们逐渐掌握了这些方法、原则和理论的发展变化规律,这些规律为德育评价的开展提供了宝贵的理论依据。

政治学是专门研究政治的一门社会科学,主要是研究政治权力、政治行为的实践与理论。纵观人类社会历史的发展,政治在人类社会历史中起到非常重要的作用。不同时期、不同区域、不同文化、不同社会的人们对政治的理解不同,因此,学界对于政治的内涵阐释不同,定义也不统一。马克思主义认为,生产力决定生产关系,经济基础决定上层建筑。政治属于上层建筑,其根本决定于生产力。随着社会经济的发展,人民参与政治生活的意愿越来越强,参与政治的深度和广度不断发展。政治教育是指以提高人们政治觉悟为目的的教育,我国是社会主义国家,政治教育的主要内容是如何进行社会主义建设、增强爱国意识与国防观念和树立共产主义理想等,是德育的重要组成部分。随着国际经济全球化时代的到来,面对变幻莫测的国际形势,政治教育的重要性毋庸置言。以史为鉴、以理服人、以情感人、模范树人、实践育人等政治教育理念大大丰富了德育内涵,为整个德育提供了良好的方法、理论,也为德育评价的完善和发展提供了理论和实践上的支持。

伦理学是关于道德的本质、起源和发展及其发展规律的理论学说。由于意识形态、文化和价值观的差异,对伦理学本质内容,不同的国家、阶级、民族都可能会有不同的认识和理解。如资本主义国家和社会主义国家、资本主义国家之间、同一国家内部的不同阶级和民族之间对伦理的实质内容理解可能不同。马克思主义从辩证唯物主义和历史唯物主义出发研究伦理学,提出了道德现象中存在的普遍性和根本性问题,揭示了道德的社会本质和发展规律,并强调发展道德原则和规范道德行为对塑造人的道德品质具有重要的意义,强调伦理学的重要性不在于传授道德知识,而在于使人们身体力行。在当代,如何有效地开展伦理学教育,提高人们的总体道德素质,成了许多学者专家研究的主要领域。伦理学与德育的关系十分密切,没有伦理学研究,德育就难以发展成为一门真正的科学,伦理学的研究成果,为德育评价理论提供了重要的可靠依据。

心理学是一门专门研究人类的心理活动规律的科学,它包括研究人的心理现象、精神功能和行为,是一门兼具理论性和应用性的学科。受自然科学的启发,19世纪末,德国学者冯特在莱比锡大学建立了世界上第一个心理实验室,这也标志着心理学的诞生。心理学经过一百多年的发展,目前已经成为德育领域不可忽视的一个组成部分,为德育理论的发展提供了重要的理论资源。心理学自诞生之日起,就有心理素质测评理论随之发展,而且心理素质测评的研究成果曾在一定程度上促进了20世纪中期西方教育评价学的发展。今天,随着社会对心理健康教育的重视,各高校纷纷建立了心理教育机制、成立了心理评估中心。心理学的研究成果大大促进了德育评价理论的发展。首先,我们要运用心理学的知识,遵循评价主体和客体的心理活动规律,找出最合理最科学的德育评价方案;其次心理学特别强调思想发展过程及心理变化特征,这就提示我们在开展德育评价工作时,一定要坚持 “发展”的原则,按照“发展”的理念做好评价。我们在开展德育评价时要坚持在发展中观察、研究、分析、判断大学生的思想发展变化情况,以此来评价所开展的德育活动是否符合德育对象成长的内在要求。最后,心理状态评估的一些方法、技巧和理论也是德育评价理论的直接来源。

3 评价学理论为德育评价理论提供了重要的理论借鉴

评价学理论基础由多个学科理论共同组成,包括了计量学、比较与分类理论、信息管理科学理论、信息论与系统论、科学管理与科学决策论、预测学、科技管理等理论。这些理论主要从评价技术、评价工具方面为德育评价理论体系的构成提供了丰富的理论资源,大学生德育评价主要借鉴了评价学理论基础中的计量学理论、分类与比较理论、信息管理科学理论。

3.1 计量学理论

计量学理论是大学生德育评价工作中量化评价方面重要的理论来源和理论基础之一。埃利泽・盖斯勒认为,计量在我们的生活中是无处不在的,我们生活的各个方面都离不开计量。威廉・汤姆逊・开尔文勋爵的“如果某事物不能测度,那么他就不重要”成为经典名言被广泛引用。测度和计量我们身边的物体和事物,不仅在科学上是必要的,也是我们把握自然和社会现象的重要手段。在组织科学和管理科学中,对现象和实践进行测度和计量,对于了解和研究它们至关重要。[4]邱均平、文庭孝等学者认为:“任何计量都要关注三个方面的问题:一是计量什么(即确定和区分计量的对象);二是如何计量(即采用什么标准、尺度、方式、方法、工具来计量);三是计量的效果如何(即怎样检验和改进计量的效果)。”[5]学生德育评价进行量化测评已经成为学界的共识,我们在开展大学生德育评价工作时,需要运用数学、统计学、计算机等来具体量化德育活动及其实际状况,再通过统计分析等方法得出结论,这些方法和理论都是计量学的范畴,因此开展德育评价工作必须运用计量学的相关理论作为指导。

3.2 分类与比较理论

人类认识客观世界,必须从区分认识对象开始的,要区分就得分类和比较。人类要有效区分研究对象,对研究对象进行各种逻辑加工,也应从分类和比较做起。因此,科学评价中常用的思维方式之一便是比较和分类。大学生德育评价是一项综合性的复杂工作,它包括了众多因素,并根据这些因素设计不同的指标体系,采用不同的评价方法,将不同的评价对象放入相应的评价指标体系中进行比较。因此,要想开展好德育评价,就要清晰的区分好评价对象,再进行对象间的比较,这些都需要借鉴分类与比较理论。

分类就是按照事物的属性,将事物区分并归入一定门类的思维方法。分类与比较存在辩证关系,分类是比较的基础,比较产生了新的分类。分类的结果就是将事物区别为具有一定从属关系的不同层次的大小类别,形成各种概念系统,反映了客观世界的事物的区别和联系。德育评价涉及的因素较多,必须做好分类,才能进行比较,最后根据比较结果做出评价。

比较就是对照不同对象和不同时段或不同境况的同一个对象,以便揭示他们的共同点和不同点的思维方法。通过比较方法区分事物的异同点是人们认识客观事物的最基本的方法。事物只有进行了比较,才能鉴别它的优劣。在人们的思想认识中,比较是一种最为普遍的方法。根据不同的标准和角度,比较存在多种类型。如定量比较与定性比较、纵向比较和横向比较、整体比较和部分比较等等。判断价值大小的根本在于比较,所以在德育评价过程中,我们必须采用比较学的理论。在德育评价中最常用的比较方法是前后比较,也就是通过一定的参数,将被德育活动开展前后有关情况进行对比,从中获得评价依据。此外,德育评价也常会采用横向比较、对照比较、定性比较等方法。

3.3 信息管理学理论

信息管理学是由信息学、管理学、计算机科学等多门学科交叉融合而成的一门建新兴学科。其本质是对信息在社会实践活动过程中的管理,具体来说,就是运用计划、组织、管控等手段运用一定的社会资源(人力、物力、财力)对信息收集、整理、储存、交流、分析、研究、处理进行有效组织和调控,以达到特定的目标。科学评价经过实践的发展和理论的日臻成熟,与信息管理之间形成了相互促进、相辅相成的关系。一方面,信息管理为科学评价提供了理论依据,是科学评价发展和改进的前提。另一方面,科学评价是信息管理的拓展和应用,为信息管理提供了新的发展动力。[6]

大学生德育评价需要大量的信息,这些信息主要来源于评价主体的信息、评价客体的信息、评价中介信息三大类。在德育评价活动中,信息管理的科学程度决定了德育评价效率和质量的高低。因此,从某种意义上讲,德育评价过程本质上是一个信息管理的过程,它包含着信息收集、整理、储存、交流、分析、研究和处理等一系列的信息管理活动,信息管理活动贯穿德育评价工作的全过程。进行德育评价需要获取和处理有关评价主体、评价客体和评价中介的信息,同时还要借助大量的信息管理技术、方法和工具来处理相关信息。因此,信息管理科学理论是德育评价的基础理论来源之一,它为德育评价活动中的信息管理提供了理论、技术、方法和工具的支持。

只有科学的吸收、借鉴和融合教育评价、德育学科和评价学的发展成果、理论基础,并科学的协调和处理它们之间的关系,才能构建出大学生德育评价基本理论框架,以这个理论框架为依据,才能科学、客观地开展德育评价工作,真正达到德育评价的目的。

参考文献:

[1]郑海友.大学生综合素质测评存在的问题及对策研究[D].华东师范大学硕士论文,2012.

[2]【美】格兰特・威金斯著,国家基础教育课程改革“促进教师发展与学生成长的评价研究”项目组译.教育性评价[M].北京:中国轻工业出版社,2005,9.

[3]文集(第8卷)[M].北京:人民出版社,1999:320.

[4]埃利泽・盖斯勒.科学技术测度体系[M].周萍,黄军英,刘娅,等译.北京:科学技术文献出版社,2003:368.

第11篇

论文摘 要: 本文在分析教育评价理论发展历程的基础上,借鉴美国、日本等体育教育相对发达国家在体育学习评价方面的先进经验,结合我国高校新的课程目标,从教学评价理论角度,提出关于我国高校体育教学评价发展的新趋向。

1.关于教学评价的理论基础

评价是评定价值的意思。学校体育评价就是对学校体育中的人或事物作出的价值判断。教育评价是指在系统地、科学地和全面地搜集、整理、处理和分析教育信息的基础上,对教育的评价作出判断的过程,目的在于促进教育改革,提高教育质量。评价是整个教育评价的核心,包括学生的学习评价和对教师任课的评价,我们理应把对学生的评价置于中心地位。因为学习评价不仅仅反映了课程的最终结果,更反映了教师的教学效果。体育课程评价必须摆脱应试教育的影响,站在素质教育的新起点,探索评价的新思路。

20世纪30年代前,美国学者桑代克提出了学习能力的客观测定,即标准化学力。其特点是评定学生的成绩用统一标准,把对学生横向优劣的比较置于重要地位;其缺点是忽略了学生在原有基础上的提高,学生个性发展和学习评价的多种目标。

20世纪70年代后,欧美和日本普通接受布鲁纳的过程性评价。过程性评价是在教学活动中进行的,一个单元的结束和一系列教学活动的结束都要进行评价,其评价方式也灵活得多。

过程性评价与终结性评价有很大区别。终结性评价重视的是客观测定与定量分析,强调对学生的最终评分。而过程性评价既重视客观测定与定量分析,同时又重视主观判断(不仅是教师评价,而且包含学生评价)和定性分析,主张把两者结合起来。

新世纪来临之际,世界各国在体育课程的评价方面,几乎沿着一个方向在发展,这就是由终结性评价向过程性评价与终结性评价相结合的方向发展。

2.学校体育发达国家体育教学评价现状分析

2.1美国学生学习评价工具和方法

20世纪80年代后期,美国提出了最佳体适能计划。体适能是指从事那些需要耐力、力量和柔韧性的身体活动的能力。最佳体适能的学习评价是为学生提供有关学习和成绩的关键信息,也能够使学生看到自己的进步,使他们有学习动力。其评价工具的选择充分考虑到学生自我评价能力的培养,为他们走向社会制定锻炼计划,自我评价锻炼效果打下坚实的基础,同时还力求评价真正反映学生进步的实际情况,这就使评价工具呈现多样化特征。其评价工具有教师观察、日记、日志条目、笔试、讨论、投票表决、角色扮演和健康测试等,这些工具可单独使用,也可综合进行评价。评价工具中以角色扮演和健康测验最有特点。角色扮演是对学生的情感方面的评价,展现了学生认识、理解的程度。如:怎样说服一位朋友戒烟、怎样帮助家人制定锻炼计划。健康测试的原则是:一是不把结果作为等级评价的唯一依据;二是不把结果作为衡量计划是否有效的唯一标准;三是不张贴测试成绩;四是根据进步与否而不是成绩高低进行奖励。评价方法有自我评价、同伴评价、教师评价、学习档案评价等。

2.2日本学生学习评价的非成绩评定

日本学生体育学习评价包含体育课的学生成绩评定和体育课的非学生成绩评定两部分。日本对学生体育课学习的非成绩评定采用了四方面三等级标准评定。四方面包括:一是关心、意欲和态度;二是思考和判断;三是技能和表现;四是知识和理解等,并将关心、意欲和态度放在评价内容的首要位置。三等级标准是指:充分满足;大致满足;经过努力可以满足。学生评价包括“评价”和“所见”两大领域。对学生的学习成绩评分,取消小学低年级的评分;小学中年级和高年级采用三级评定,高校对选择必修项目的单元测定采用三级评定。“所见”是指学生的闪光点和关注。总之,提倡对逐个学生开展有针对性的积极评价。

3.高校体育课程目标的重新定位及其与学习评价的关系

2002年8月6日,《全国普通高等学校体育与健康课程教学指导纲要》正式实行。新课程目标包括五个方面,和以前的体育教学大纲有很大的区别,不仅要求学生增强体能,掌握基本的运动知识和运动技能,而且期望学生表现出人际交往的能力,养成坚持体育锻炼的习惯,形成健康的生活方式和积极进取、乐观开朗的生活态度等。这就强调了“健康第一”的指导思想,以身体、心理和社会适应的整体健康为课程目标。

高校新课程目标突破了原来只注重“生物性”健康这一单维度健康标准的局限,给学校体育带来观念上的转变。它力求突破传统体育课注重终结性评价而忽视过程性评价的状况,提出了强化评价的激励、发展功能而淡化其甄别、选拔功能的基本原则,并根据这样的原则对评价提出了相应的建议。新课程标准在构建评价体系的时候,把学生的学习态度、情意表现和合作精神、体能、知识与技能纳入学习成绩评定的范围,并让学生参与评价过程,以体现学生的主体地位,提高学生的学习兴趣。

4.高校体育学习评价发展趋向分析

4.1体育学习过程和学生发展之间密切相关的指标作为评分标准

有人说,学校体育以增强体质为中心,就应当把提高体能作为主要目标。其实,体育课的评价应当是体能与技能并重。体育学习过程能提高体能,同时也能提高技能。但是,提高体能与学习过程的相关程度低,而提高技能与学习过程的相关程度高。一个人的体能与提高和遗传、营养、休息、环境等多种因素有关,而运动仅是其中变量之一。有的学生尽管认真学习,但体能提高幅度很慢;有的学生先天条件好,不用练习也能评优,其原因就是因为体能发展与学习过程相关程度小之故。所以体育课考核,应当技能类优于体能类。

4.2成绩评定标准的可操作性与多样化

体育在学年、学期和单元的学习过程中,其目标往往是抽象的、一般的,其具体的要求往往不明确。因此,在评价过程中要把学习目标具体化,增强评定标准的切实可操作性。同时因各地区和各学校间的差别,也会出现考核的多样化局面,这种多样化有利于结束力和灵活性的结合,也有利于学生的个性、能力及创造性的发展。

4.3定性与定量评价相结合

全面的评价需要各种评价工具。测验是学生评价的重要的也是最常用的工具。但是,仅有测验远不足以评价学生学习的全部结果。观察、访谈、日志等调查技术在学生评价中也应收到重视。此外,在测验中,客观式测验与论文式测验也各有作用,偏爱一种方法而忽视第一种方法是不完善的。

4.4体质测试单列

由于个体的差异,以及发展的非同步性,把体质测试内容作为学生成绩评定指标之一,不公平且不合理,应当单独列出,作为学生非成绩测定内容之一。身体形态、生理机能均反映体育过程中人的身体发展,是一项过程性评价的重要内容。但其评价方式应当和自己的过去比较,和同龄人的平均数比较。当然要先算出各项的标准百分数,这样比较就可知道哪项发展快,哪项发展慢,便于不断调节自己的锻炼方法。

4.5学生测定与教师测定相结合

高校在评价的过程中,缺少学生的自我评价、阶段评价,在评价的目的上,只求评分的最终结果,忽视对学生的鼓励和鞭笞。教师应先了解学生的学习情况,找出学生学习中存在的不足和差距,然后调整教学计划,改进教学。

4.6评价内容的多元化

我国未来的体育课程将会十分强调对学生体育学习的多元评价,评价的主要内容可能主要包括以下五方面:学生的生长发育;体育与健康知识和运动技能;学生的学习态度、积极参与运动的行为,运动习惯等;意志品质、情绪状态、自信心等;交往能力、合作精神。

5.结语

评价的目的是为学生的教育和发展,体育课评价的区分、区别、选拔的目的是次要的。素质教育与终身体育强调的是重视体育课程评价的教育性和发展。评价不是最终目的,仅是手段。评价的最终目的是激励和反馈,通过过程评价,及时向教师和学生提供反馈信息,使双方了解在体育教学中存在的缺陷和不足,并激励教师和学生进一步努力,不断完善,使评价更好地为体育课程和学生的未来服务。

参考文献:

[1]曲宗湖,杨文轩.域外学校体育传真[M].北京:人民体育出版社,1999,10.

[2]顾渊彦.基础教育体育课程改革[M].北京:人民体育出版社,2004,10.

[3]曲宗湖,顾渊彦.大学体育课程改革[M].北京:人民体育出版社,2004,11.

[4]顾渊彦.体育课程的结束力与灵活性[M].北京:人民体育出版社,2002,1.

[5]季浏.体育教育展望[M].上海:华东师范大学出版社,2001,12.

[6]体育课程标准研制.体育(与健康)课程标准解读[M].武汉:湖北教育出版社,2002,5.

第12篇

关键词:培养质量;评价模型;结构方程

中图分类号:G71 文献标识码:A

一、研究背景

职业教育的质量在不断提升,也越来越受到全社会的重视。但是,对培养质量的评价,因评价者的目的、角度、方法、时机各有不同,所以使得质量的评价有所差异。企业、学生对人才培养质量的评价可能与学校的自我评价内容与方式有很大的差别,如很多企业对学校的规模、图书等因素并不关心;毕业生认为,能让我找到满意工作才是好的培养质量……

那么,什么样的质量评价方式对改进培养质量是有效的?

这就是既能评价“教书”质量,又能评价“育人”质量的,能够覆盖培养过程、培养效果的评价;以外部顾客身份为评价主体提供客观的评价;符合行业特点的评价。

二、模型理论假设

为能够准确地构建模型,首先要明确教育服务的顾客。职业学校的产品是教育服务,学生既是顾客又是服务的载体,用人单位是职业教育的最终消费者。将质量评价者设定为毕业生和用人单位这两个外部的终端顾客,所以构建的评价模型既包含了职业教育的形成性评价(毕业生的评价),也包含了终结性评价(用人单位及毕业生评价)。

其次,以公路行业中等职业教育为研究对象,是指为培养从事公路桥梁施工与养护、市政工程施工、筑路机械操作与维护等相关岗位技师、技术工人而提供的职业教育。行业的工作特点有:工程机械更新较快,对操作技能要求较高;工作地点偏僻交通不便,业余生活较枯燥;施工养护工作以团队形式为主等,在设置模型变量时应予以考虑。

再次,评价模型的使用目的不仅在于评价职业教育的质量水平,更重要的作用在于为改进职业教育质量提供依据。

三、模型构建

因培养质量中涉及到许多需要评价的变量(例如职业素养)不能准确、直接地测量,所以需要做一些变通;使用与这些变量有因果关系的能够直接测量的二级观测变量(如学生责任心培养、学生自我学习能力培养、学生的团队合作能力培养、吃苦耐劳精神培养等)去间接测量它们。

(一)质量评价中的影响因素及变量体系

模型构建依然遵循前期建模的理论思路,以顾客期望、感受质量、感受价值、满意等几方面出发构建潜变量、观测变量,研究过程主要由问卷调查获得数据、模型拟合、模型参数估计、模型解释、验证等几个过程组成。潜变量:学校形象、职业技能、职业知识、职业素养、评价质量;对应的观测变量共16个。模型的路径图如(图1)。

(二)模型假设

“学校形象”以获取顾客的预期为目的。企业对行业内的职业教育学校会有一定的了解,如在公路行业内的地位或者在本地区公路行业职业教育中的地位。“学校形象”与“评价质量”存在正相关关系。

潜变量“职业技能”主要获取企业对学校在技能方面的培养质量感受,设备操作X21、工具使用X22和任务作业X23共三个观测变量。因职业技能的岗位特点非常鲜明,为使答题人能清晰理解题意,我们在问卷设计时将这三个变量分专业提问。浙江公路技师学院为公路行业培养的人才专业方向大致分为筑路施工养护类和筑路机电类,问卷问题也按这两大类专业分别提问。设备操作是指典型设备的熟练操作;工具使用的工具是指机械维修工具或制图绘图软件、制备试验件工具等;任务作业是指独立完成任务的能力。“职业技能”与“评价质量”存在正相关关系。

“职业知识”意在通过企业对学生职业知识的结构及掌握情况的感知来获取评价信息。同“职业技能”潜变量一样,问卷问题也按专业分类。筑路养护X31是行业必须掌握的职业知识;术语标准X32是指与专业相关的行业术语及技术标准等知识;公路施工行业中,安全生产始终是占有非常重要的地位,掌握岗位安全操作规程X33应该是基本要求。“职业知识”与“评价质量”存在正相关关系;与职业技能存在正相关关系。

“职业素养”的观测变量有责任心X41、团队合作X42、吃苦耐劳X43、自学能力X44、劳动纪律X45共五个。这个潜变量是企业对职业教育的需求之一,关注的是职业道德培养、职业发展潜力培养等。公路系统的中等职业教育,许多专业是为培养从事公路桥梁施工与养护、市政工程施工、筑路机械操作与维护等相关岗位技师、技术工人而提供的职业教育。公路的施工养护等工作的特点有工程机械更新较快,希望能具备一定的操作技能和自我学习能力;工作地点偏僻交通不便,业余生活较枯燥,能够吃苦是非常重要的;施工养护工作以团队形式为主等。职业素养在职业教育阶段仅仅是打基础,在工作岗位是逐渐养成的,为体现出公路行业的特点,在变量设置中对职业素养仍给予了更多的考虑。“职业素养”与“职业知识”、“职业技能”、“评价质量”均存在正相关关系。

潜变量“评价质量Y ”是企业对培养的质量预期(学校形象)、质量感知(技能、知识等)进行综合比较之后所形成的类似于“满意”的评价信息。总体质量(Y11)测量总体评价;与同类型的职业教育比较(Y12);与理想的质量水平比较(Y13)。

(三)模型表示

培养质量评价结构方程模型包含:测量方程模型(潜变量与观测变量的关系)和结构方程模型(潜变量之间关系)。

(1)测量方程 (1) (2)

(2)结构模型 (3)

四、模型拟合与参数估计

部分拟合指标如下:RMSEA=0.05,NFI =0.72 IFI=0.95,TLI=0.95,CFI=0.95,Chi-square= 120.45,Degrees of freedom=107,Probability level= 0.18。指标中NFI值较低(仍在可以接受的范围内),其他指标均表现很好。可以得到模型假设成立的拟合结论。路径系数及载荷系数见表1,模型的方程表示如下:

五、模型解释

第一,知名度与行业地位均与学校形象(X1)呈正相关且相关系数较高,符合模型假设。

第二,职业技能(X2)与其观测变量相关性由高到低为“任务作业”、“工具使用”、“设备操作”,载荷系数均大于0.6。企业更加重视完成任务的综合能力,符合逻辑。但设备操作排在最后,与我们假设有出入(问题不严重,可以接受)。

第三,职业知识(X3)中“安全规程”系数较高,反应了企业对安全的重视。“术语标准”得分较低。过低的分数可能与样本的大小有关。

第四,职业素养X4得分由高到低为“责任心”、“团队合作”、“吃苦耐劳”、“劳动纪律”、“自学能力”。其中“自学能力”系数值较低(

第五,因同在公路行业内,企业对学校的知名度以及学校在行业中的地位了解的比较多,所以培养质量(Y)与学校形象的相关性较高是可以理解的。

第六,职业技能(X2)、职业素养(X4)均与评价质量(Y)呈正相关关系,符合模型假设。职业技能的路径系数较高,说明企业对操作技能的重视,也符合职业教育的特点;职业素养的形成与学生的人生观、价值观、道德品质等因素密切相关,是长期形成的。职业素养的路径系数微高于“学校形象”合乎逻辑。

六、结语

对毕业生及企业不同的模型设计两种调查问卷,两个模型经多次修正后拟合指标良好,模型的理论假设得到验证。构建的模型克服了质量评价的主观随意性,模型中的变量较全面表达职业教育服务顾客的评价意见,是更为准确地反映评价要素与评价目标的评价模型。实证分析结果表明,该模型误差小、客观性强,是科学合理的。

在研究中发现,有些问题虽然没有影响研究的结果,但仍是需要解决的。我们将其列出以作为进一步研究的方向:

扩大模型的适用范围,公路行业的许多学校培养的专业已延展到汽车、管理、物流等。应将评价模型适度覆盖这些专业,使得对学校的评价结论更加完整。

随着学生毕业年限的增加,对培养过程的评价信息逐渐失去改进的指导意义。确定最佳的样本组成是下阶段评价模型应用方面的研究重点。

评价模型应覆盖职业教育的所有顾客,在校生的意见虽然不能作为完整的培养质量评价结论,但是对教学阶段的评价是有非常重要的意义的;学生毕业后,有继续深造的,有在非公路行业就业的,有自主创业的,他们作为顾客有权利评价培养质量,学校也应该获取这部分学生对培养质量的评价。

随着我国职业教育改革的不断深化,社会和学校的人才观、教育观、质量观、评价观等随之发生改变,更重要的是顾客的需求的改变。这些变化要求教学质量评价要素、标准不断地变化。因此,培养质量评价模型不是一成不变的,应随着评价主体(学生)和环境(社会和学校)的变化而变化。因此,研究教学质量评价模型的变迁、有效性、可信度等方面是教学质量评价将来需解决的重要问题。

参考文献

[1]赵富强,张磊,陈钒.基于PLS路径模型的顾客满意度测评研究[J].北京理工大学学报(社会科学版),2010,(4).

[2]宁禄乔,刘金兰.Stone―Geisser检验在顾客满意度中的应用[J].天津大学学报(社会科学版),2008,(3).

[3]唐启义,唐洁.偏最小二乘回归分析在均匀设计试验建模分析中的应用[J].数理统计与管理,2005,(5).

[4]钟嘉呜,李钉芳.粗糙集与层次分析法集成的综合评价模型[J].武汉大学学报(工学版),2008,(3).

[5]包含丽.基于顾客满意度的成人高等教育教学质量评价模型研究[J].温州大学学报(自然科学版),2007,(3).

[6]李香华.构建科学的课堂教学质量评估体系[J].中国大学教学,2000,(2).

[7]威廉维尔斯曼.教学研究方法导论[M].北京:教育科学出版社,1997.

[8]胡惠君,何泳生.影响高等职业教育质量的主要因素分析[J].浙江水利水电专科学校学报,2006,(2) .

[9]李季.素质教育运行机制的建立[J].教育导刊,1992,(1).

[10]吴亚萍,任爱珍.基于学生、学校发展的高职教育质量评价观[J].教育与职业,2009,(2).