| 网站首页 | 文章中心 | 下载中心 | 视频中心 | 图片中心 | 雁过留声 | 
最新公告:     欢迎各位同仁能将你们的成果(教学设计、课件、编制的试卷、撰写的论文等)通过“网上投稿指南”与大家一起共享!  [xchxjy  2009年7月23日]        
您现在的位置: 宣城化学教研网 >> 文章中心 >> 专家论坛 >> 正文
专题栏目
更多内容
最新推荐 更多内容
相关文章
没有相关文章
更多内容
[组图]如何评价科学探究能力         ★★★
如何评价科学探究能力
作者:罗国忠 文章来源:本站原创 点击数:1908 更新时间:2010-4-2 7:59:30

如何评价科学探究能力

罗国忠

广西教育学院

   我国基础教育课程改革启动以来,科学探究能力的评价成为科学教育界的研究热点和难点。纸笔测量成本低,可以大规模使用,但其效度却倍受质疑;现场观察效度高,但高成本制约了其大规模使用,这种两难境地一直困扰我国科学教育界。本研究在考察国际研究基础上,结合笔者的一些研究,试图为教师们提供一种兼具成本和效度平衡的评价方式。

一、纸笔测验和现场观察

   在起源于20世纪60年代的国际科学课程改革中,把科学探究能力当成一系列分离的探究要素成了一种趋势。探究要素思想起源于加涅对科学过程的描述,他认为科学家的科学过程包括诸如观察、分类、描述、操作定义、假设、控制变量、实验、解释数据、形成结论等探究要素或探究子过程。加涅把这些过程直接和学习过程联系起来,并声称学生掌握了这些探究要素,就能逐渐掌握复杂探究能力,直至从事复杂的科学探究。[1]一些科学课程如SAPAscience——a process approach)就是按照这些科学探究过程进行设计的,不同的章节涉及不同的探究要素。不仅科学过程被分解成各个探究要素进行教学,科学探究能力也同样分解成相应的各种探究要素进行评价。例如,Mcleod等人(1975)开发的纸笔测量工具就是针对 SAPA课程的,用来评价控制变量、解释数据、形成假设和操作定义四个探究要素。[2]由于针对具体课程的测量工具无法迁移到其他课程,因此一些研究者开发了与具体课程无关的通用测量工具,如Dillashaw等人(1980)开发了TIPSthe test of integrated process skills),后来Burns等人(1985)把它进一步升级为TIPS II,它的评价目标如表1[3]

   2中的两道题目都是评价TIPS II4目标,其中第9题要从图中读出变量之间的关系,第25题要找出描述表格中数据的图。

 

  

  目前,我国对科学探究能力的评价基本上处在这个阶段,不同的是没有专门的探究能力测量工具,而是在一套试卷中设计一两道试题来考查某个或几个探究能力。这些纸笔测量工具之所以受到青睐,是因为其具有成本低、评分者信度高等优点。

   然而,随着时间的推移,人们并未发现学生在这种要素分离的纯化情境中表现出的探究能力与在真实情境中表现出的探究能力有多少关系,这使人们开始质疑这些纸笔测量工具的有效性。Hodson1993)认为,真实情境中的科学探究过程是一个统一、流动的活动,探究要素是相互影响的、依赖于情境的,学生的每一步探究都会以某种方式改变情境,下一步的决策和行动将建立在新情境中。[4]因此,如果硬把科学探究分解成一个个不相干的探究要素或步骤,将使科学过程失去本来面目。在真实情境中,专家比新手表现出更高水平的探究能力,这种能力被描述成“缄默知识”,而这种“缄默知识”不可明确地教,提高探究能力的有效途径就是在真实情境中做探究,并由一个有经验的教师提供支持、批评和建议。[5]woolnough1990)则认为,科学探究不是这些探究要素的线性集合,而是一个不太整齐的过程;要成功地进行科学探究,未必有一种方法,可能有多种方法,这与研究者的灵感、质疑、创造等主体特征有很大关系,而这些特征是不能轻易地以分离的探究要素来评价的,只能整体性地评价。[6] Baxter等(1992)的研究表明:对于科学探究能力的整体性评价,现场观察是最有效的,它一般采用一(教师)对一(学生)甚至二对一的观察。[7]

   尽管现场观察评价最有效,但其所需的人力、物力、时间等成本也最高,这无疑影响了它的广泛使用。因此,在国外的一些大规模评价中,只是观察一些花时间少的部分过程,很少观察完整的探究过程。例如,在以色列和英国,都有大规模评价科学探究能力的传统,但也主要是通过观察来评价学生低水平的操作和观察技能。[8][9]目前,我国某些地区初中、高中会考的实验操作技能考试以此类似。

二、工作单

   如何通过低成本方式,既可靠又有效地评价科学探究能力?很多研究者一直在寻找现场观察的替代方式,工作单就是其中一种替代方式。所谓工作单方式,就是让学生实际动手探究,同时把探究过程和结果写在工作单上,然后教师只对工作单进行评分。由于这种方式可以让整个班同时进行探究,并且是延迟评价,因此时间和人力成本大大减小。

   按照所给的提示程度或结构性强弱,有三种工作单。第一种工作单是开放性工作单,只要求学生把探究过程和结果写在工作单上,没有其他限制。评分者根据整体性评分标准进行等级评分,等级数目可根据实际情况而定。第二种工作单是结构性工作单,要求学生按照工作单的提示结构写上过程和结果,评分者根据相应评分标准对这几部分进行等级评分。第三种工作是引导性工作单,它针对具体探究任务一步步地引导学生探究并写在工作单上。这三种工作单在国际上都各有用场,如①英国Nuffield A-level physics课程就是让学生在开放性工作单上描述过程和结果,评价学生的整体过程能力;但从1988年开始,工作单的结构性有所增强,整体性有所减弱。[10]②国际教育成就评估协会(IEA)在20世纪708090年代分别进行的三次大规模国际科学研究、美国的国家教育进步协会(NAEP)等都采用结构性工作单来评价学生的科学探究能力。[11]③美国密苏里州根据学生探究水平较低的状况,采用了引导性工作单来评价科学探究能力,即在学生每进行一步探究之前,教师几乎都给学生提供上一步骤的参考答案,以引导学生完成探究。[12]

    尽管这三种工作单在国际上都有用场,但却很少有人研究它们的评分可靠性以及有效性(Woolnough1990)。[13]因此,为了进一步检验这三种工作单评分的可靠性(评分者信度)、以及有效性(工作单与现场观察的相关系数),笔者让学生动手探究“影响单摆周期的因素”(学生尚未学过这部分内容),采用二对一的现场观察、评分。预先把学生分成三部分(每部分学业成绩相当),要求每部分学生在动手探究时把探究过程和结果写在预先布置的每种工作单上,然后还是由现场观察的两个评分者评分。本研究所用的开放性工作单没有任何提示,只要求学生把探究过程和结果如实写下来;表3为本研究设计的结构性工作单,包含科学探究的一般要素,没有涉及该探究的具体内容;引导性工作单考虑到学生的探究能力较差,给出较详细的引导,涉及了该探究的具体内容和步骤。表4给出引导性工作单的结果部分,它是在学生设计了实验方案后给出的。这种引导与传统的菜单式实验不同,给学生预留了一定的空间。例如,从表4可以看出学生是否控制了相关变量、自变量的改变次数是否足够、自变量的取值范围是否合理、自变量的间隔是否合理等。

  

  

    关于评分者信度,本研究得出现场观察、开放性工作单、结构性工作单、引导性工作单的评分者信度分别为0.870.720.770.81。该结果表明:①评分者经过适当的培训,现场观察和工作单均可满足评分者信度要求。②三种工作单的评分者信度比现场观察稍低,主要原因是少数学生表达能力较差,并且不适应这种评价方式,难以明确把探究过程描述在工作单上,以至评分者出现歧义。③随着工作单结构性程度不断提高,评分者信度也不断提高,这是因为工作单的要求不断明确,学生可发挥的余地变小,有利于评分者可靠地评分。

    关于工作单的有效性,本研究发现开放性工作单、结构性工作单、引导性工作单与现场观察的相关系数分别为0.750.810.63,与Woolnough等人(1990)的研究结果基本一致(相关系数越大,意味着工作单的有效性越大)。[14]这些结果表明:①结构性工作单的有效性最大。这可能是其适度的提示结构有助于学生把关键的探究过程和结果描述在工作单上。②引导性工作单的有效性居中。这可能是引导性工作单类似于分离的探究能力评价,其一步步的引导限制了学生的灵活性,以至于学生难以把这些分离的探究能力迁移到真实的探究情境中。③开放性工作单的有效性最低,这与人们的预期似乎是矛盾的,既然开放性工作单体现了真实完整的科学探究,那么开放性工作单最有效。但是,教学理论和实践反复表明,学生有不同的认知风格,一些学生动手能力强,但文字能力未必强。与一些学生的个别访谈也证实了这一点,他们不知道怎样把探究过程真实地描述在空白的工作单上,以至描述时抓不住关键。

   从以上可看出,三种工作单各有利弊。开放性工作单更开放,对学生没有限制,保持了科学探究的整体性,有利于高水平学生发挥创造性和灵活性,但对中下水平学生可能不利,同时评分者也难以准确把握评分标准;引导性工作单把科学探究过程分解,分散了难点,让中低水平学生有章可循,也可提高评分者信度,但其过度的引导性限制了学生创造性和灵活性的发挥;结构性工作单的有效性和评分可靠性则处于两者之间,其适度的开放性也适合于大多数学生。

三、结论

   我们看到,纸笔测量成本低,可以大规模施测,但这种分离的探究能力评价有效性低,长期使用无异于鼓励教学中冒牌的科学探究;现场观察有效性高,但高成本使其目前只能局限于小规模的研究中。解决这一困境的办法是使用替代现场观察的各种工作单,其中结构性工作单在可靠性、有效性和成本等方面具有较好的平衡,不失为我国目前的较好选择。但是,其结构性究竟到什么程度才算是适度呢?很难拿出定量的尺度去度量,实际上也没必要统一规定。在实际运用时,可根据学生情况进行调整结构性程度。如果学生的总体水平高或探究任务不难,不妨降低工作单的结构性程度,增大开放性;反之,可以提高工作单的结构性程度,减小开放性。

 

  参考文献

   [1][5]Millar R, Driver R. Beyond process. Studies in Science Education, 1987,14:33-60.

   [2]Mcleod R J, Berkheimer G D, Fyffe D W, et al. The development of criterion-validated test items for four integrated science process. Journal of research in science teaching, 1975,12:415-421.

   [3]Dillashaw F G, Okey J R. Test of the integrated science process skills for secondary science students. Science Education,1980,64:601-608.

   [4]Hodson D. Re-thinking old ways: towards a more critical approach to practical work in school science[J]. Studies in Science Education,1993,22:85-142.

   [6][10][13][14]Woolnough B E, Toh K A. Alternative approaches to assessment of practical work in science. school science review, 1990, 71:127-130.

   [7]Baxter G P,  Shavelson R J, Goldman S R, et al. Evaluation of Procedure-Based Scoring for Hands-On Science Assessment.  Journal of Educational Measurement, 1992,29:1-17.

  [8]Tamir P, Nussinovitz R, Friedler Y. The design and use of practical tests assessment  inventory. Journal of biological education, 1982,16:42-50.

  [9]Buchan A S, Jenkins E W. the internal assessment of practical skills in science in england and wales,1960-1991 some issues in historical perspective. International journal of science education, 1992, 14:367-380.

   [11]Kind P M. Performance Assessment in Science--What Are We Measuring? Studies in Educational Evaluation1999,25:179-194.

   [12] Germann P J. Student performance on asking questions, identifying variables, and formulating hypotheses. School Science and Mathematics, 1996,4:192-201.

文章录入:ahxchxjy    责任编辑:xchxjy 
  • 上一篇文章:

  • 下一篇文章:
  • 【字体: 】【发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
      网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)

    | 设为首页 | 加入收藏 | 联系站长 | 友情链接 | 版权申明 |
    Copyright © 2009-2017 edu.ngedu.net Inc. All rights reserved. 宣城化学教研网 版权所有
    站长:宣城化学 皖ICP备05011793号