二、美国ECERS-R的中国文化适宜性研究
(一)研究方法
1.样本
本研究采用分层随机抽样的方式,选取了浙江省杭州市两个市辖区16所幼儿园的105个班级作为观察测量的样本。样本幼儿园的选取主要根据浙江省目前的办园等级评价标准(由高到低分别为省一级、省二级、省三级),高、中、低等级的幼儿园数量大致相当(其中省一级5所,省二级6所,省三级5所);同时考虑到办园性质,涵盖了教育部门办园(5所)、其他部门办园(4所)、民办园(7所)三种性质。样本班级的选择主要考虑班级的幼儿年龄组,从每个年龄组随机选取2个班级作为观察对象,一共获得了105个班级样本,其中托班(2~3岁)12个,小班(3~4岁)35个,中班(4~5岁)33个,大班(5~6岁)25个。
2.工具
本研究中的托幼机构教育质量评价工具是1998年版的ECERS-R。ECERS-R是一个班级观察量表,适用于对2.5~5.5岁的幼儿班级总体质量进行观察评价。为增强评分者对量表理解的准确性和一致性,提高评分的效度,我们还同时为评分者提供了该量表的繁体中文翻译版以供参照。[18]从量表的结构上看,ECERS-R包含7个子量表、43个评价项目,分别为:(1)空间与设施(8个项目);(2)保育(6个项目);(3)语言推理(4个项目);(4)活动(10个项目);(5)互动(5个项目);(6)作息结构(4个项目);(7)家长与教师(6个项目)。ECERS-R采用李克特式7点评分模式:1分代表“不适宜”,3分代表“最低可接受”,5分代表“良好”,7分代表“优秀”。在量表的内部一致性信度上,根据作者们在量表出版前的试测研究报告,量表总体的Cronbach’s α系数为0.92,7个子量表介于0.71~0.88。[19]
3.数据采集
2010年6月,研究者对25名学前教育相关专业的硕士研究生进行了ECERS-R的培训。培训包括一周的量表内容学习和一周的实地班级观察测量,最终每位受训者与培训者在项目水平上获得0.85及以上的一致性。2011年3—6月,研究团队进行了105个班级的观察数据采集。每次班级观察过程大约4小时(一般为上午儿童入园至午睡,另外还包括对班级教师和家长的访谈,以获取无法直接观察的部分信息)。每个观察班级有2位评分员同时进入,各自独立进行观察和评分,最终给出小组一致的评分。这一做法被研究证实能够有效提高观察测量的信度。[20][21]
(二)研究结果
1.量表的内部一致性信度
根据105个班级的观察评分数据,我们分析了ECERS-R的内部一致性(internal consistency)信度,结果见表2-1。
表2-1 ECERS-R的内部一致性信度
由表2-1可见,整个量表的Cronbach’s α系数为0.83,7个子量表介于0.49~0.86;无论是量表总体还是7个子量表,在内部一致性信度上均明显低于量表作者在美国本土试测中报告的结果。从子量表的层面来看,在7个子量表中,有2个子量表(“互动”“家长与教师”)的α系数在0.80以上,具有较好的内部一致性;2个子量表(“空间与设施”“活动”)的α系数处于0.70~0.80,达到可接受水平;有1个子量表(“保育”)的α系数低于但接近可接受临界值0.70。必须注意的是,有2个子量表(“语言推理”和“作息结构”)的α系数明显低于可接受水平(分别为0.60和0.49)。这意味着,在我国情境中运用这两个子量表可能难以得到可靠的测量结果。
从内部一致性最低的子量表“作息结构”来看,该子量表共包含4个评价项目:一日活动时间规划、自由游戏、团体时间、满足特殊需求。该子量表在ECERS-R中的Cronbach’s α系数为0.77,[22]具有不错的内部一致性,但为何在我国内部一致性大幅降低了呢?通过对评价项目的内容分析,研究者认为,有两个可能的原因带来了这一结果。第一,在我国幼儿园教育情境中,幼儿在园一日生活一般以集体活动为主,自由游戏时间有限;而ECERS-R在“团体活动”和“自由游戏”方面的高质量定义与我国刚好相反,强调以自由游戏为主,必须有效控制团体活动的时间。第二,“满足特殊需求”这一项目在我国幼儿园中目前基本上是无法适用的。
2.量表得分的总体情况
首先,我们对ECERS-R在105个班级测量结果的总体得分情况进行了初步的描述性统计。7个子量表和总量表的得分情况见表2-2。
表2-2 ECERS-R及子量表得分的描述性统计
表2-2显示,本次测量的样本班级ECERS-R总量表得分的均分为3.71,根据原量表作者对量表总得分的界定:3分以下为“低质量”,3~5分为“中等”,5分以上为“高质量”,样本幼儿园的总体质量处于中等偏低的水平。
在7个子量表中,两个子量表(“互动”“家长与教师”)的平均得分超过了5分,达到“良好”水平;一个子量表(“保育”)得4.08分,处于“合格”与“良好”之间;但其余4个子量表得分均在3分,显示较低的质量水平。另外,在7个子量表中,得分最高的是“家长与教师”。这一结果与ECERS-R已有的相关研究结果一致。[23][24]可能的原因是,一方面,相对于其他子量表对教师专业水平的高要求而言,该子量表中的评价项目和指标相对容易达到;另一方面,该子量表依据访谈进行评分,访谈者与被访谈者的主观性均可能对评分结果产生一定的影响。
3.对“活动”子量表的进一步分析
从表2-2可见,“活动”子量表得分最低,尚未达到3分(最低可接受水平),得分高度集中在低端。这一结果显然值得关注和进一步分析。因此,我们计算了各等级幼儿园班级在“活动”子量表及其各个项目上的得分,结果见表2-3。
由表2-3可见,各等级幼儿园班级在“活动”子量表的10个项目上得分都偏低,绝大部分项目得分都在3分以下,且有1个项目(“鼓励和接纳差异”)均分仅1.24分;省一级(最高等级)幼儿园班级仅有2个项目得分刚刚达到3分。进一步对“活动”子量表评价内容的分析发现,该子量表主要考察幼儿主动发起的活动,尤其是自由游戏。几乎每个项目都要求“一天中大部分时间”(除去生活环节以外的大部分时间,如果一天按8小时计算,要求至少2.6小时以上)幼儿能够进行自由游戏活动。[25]通过我们的观察发现,绝大部分样本幼儿园班级以集体活动为主,一天中幼儿真正可以用于自由游戏的时间不足1小时。因此,“活动”子量表中的评价内容和标准,尤其是其中对自由游戏时间的规定,对于我国幼儿园教育评价来说在适宜性上存在明显的问题。
表2-3 各等级幼儿园班级“活动”子量表及项目得分的描述性统计
续表
经过进一步思考,研究者认为,样本幼儿园班级在ECERS-R的“活动”子量表上得分偏低,更为深刻的原因是中美两国在托幼机构教育模式上的差异。总体而言,目前我国的幼儿园教育以教师主导的活动为主,集体教学占有重要的地位;[26]而美国的托幼机构教育以幼儿主导的活动为主,自主游戏占有重要的地位。[27]尽管我国的《幼儿园工作规程》和《幼儿园教育指导纲要(试行)》中也指出幼儿园教育应该“以游戏为基本活动”,但仅要求“保证幼儿每天有适当的自主选择和自由活动时间”[28],并非ECERS-R所要求的“一天中大部分时间”幼儿都能进行自主的游戏活动;由于种种现实因素的制约,国家的幼儿园教育指导性原则在实践中的贯彻执行情况未必尽如人意,不同地方和幼儿园之间千差万别。基于我国的历史文化传统和教育现实,研究者认为,一方面,我国幼儿园教育中教师主导的高结构的集体活动过多,这是一个有待改进的问题;另一方面,我国的幼儿园教育总体上也很难放弃以教师为主导的集体教学模式,而走向以幼儿为中心、以自由游戏为主的课程模式。[29][30][31][32]这意味着,使用ECERS-R来评价我国的托幼机构教育质量,特别是课程教学的过程质量,在很大程度上将偏离靶心。从这一角度而言,ECERS-R无法对集体教学的质量进行评价,也无法适应以集体活动为主的教育形态,这是ECERS-R在中国文化适宜性上的最大障碍。
4.ECERS-R得分与幼儿园等级之间的相关性
在该研究中使用的浙江省幼儿园等级评定办法和标准是自2008年起施行的,并得到了各地良好的反馈。[33]由于这一标准是本土文化的产物,所以,ECERS-R评分结果(包括总量表得分和子量表得分)与样本幼儿园的办园等级之间的相关系数,可以在一定程度上反映ECERS-R的同时效度及其对我国的文化适宜性程度,分析结果如表2-4所示。
表2-4 ECERS-R得分与幼儿园等级之间的相关系数
从表2-4可见,ECERS-R总体得分与浙江省的办园等级之间呈现了中等程度的显著正相关 (r=0.58),说明ECERS-R总分趋势与浙江省等级评价结果基本一致,但同时也存在一定程度的差异。在7个子量表中,有两个子量表(“空间与设施”和“家长与教师”)与办园等级相关程度中等;在反映班级保教过程的4个子量表(“保育”“语言推理”“活动”“作息结构”)上相关系数较低(均在0.5以下),其中“语言推理”得分与办园等级之间相关系数较低(r=0.22)。值得注意的是,在反映保教过程中一个重要的维度“互动”上,两者之间没有显著相关性。这一结果意味着,运用“语言推理”和“互动”子量表,尤其是后者,将很难或无法对不同等级的幼儿园教育质量进行有效区分。
结合表2-4我们发现,“语言推理”均分较低(仅3.49),而“互动”得分却相对较高(达到5.05)。从具体的评价内容来看,“语言推理”子量表要求班级要有丰富多样、几乎随处可取的图书,幼儿一天中有大量的自由阅读时间,倡导教师每天多次读书给孩子听或者和幼儿一起阅读,专门设计和组织促进不同发展水平的幼儿沟通活动,日常生活中随时和幼儿进行个别化交流,以及随时支持幼儿的推理活动,帮助幼儿发展概念。[34]这些要求显然适用于班级规模小、生师比小、以自由游戏为主的模式,而难以适用于中国大班额、高生师比、以集体活动为主的幼儿教育模式。
在“互动”子量表中,前3个项目(对大肌肉活动的导护、对一般活动的导护、纪律)强调的是对幼儿活动的安全监护与对幼儿行为的有效管理,这可以说是中国式幼儿教育的特征之一,[35][36][37][38]无论幼儿园等级高低,显然都非常重视这一点;后两个项目(“师幼互动”“同伴互动”)中强调的是教师对待幼儿的温和态度、尊重和爱,以及对幼儿建立良好同伴关系的指导与支持,这些应该说是我国幼教领域中一直倡导的理念和相对普遍的做法。因此,样本班级在“互动”子量表上得分较高且没有区分度就不难理解了。
需要指出的是,对ECERS-R的试用研究具有一定的局限性。在取样上,样本幼儿园数量少且仅限于城区,缺乏农村样本,代表性存在一定的不足;由于是跨文化的测量,限于所使用的测量工具的版本、语言,培训者和观察者对量表内容的理解可能有一定程度的偏差。在未来的相关或类似研究中,有必要扩大样本量,增加样本的代表性;在使用ECERS-R的同时,需要运用不同的但具有类似功能并经过信效度检验的测量工具,以更好地验证其同时效度。另外,研究者还可结合儿童发展评估,验证ECERS-R的效标关联效度和预测效度等。