汉语学习者汉字构形意识的诊断性评价研究

2013-11-08 08:06刘婷雁
中国考试 2013年10期
关键词:构形测验部件

刘婷雁

1 引言

汉字一直是对外汉语教学的一个重点和难点。调查表明,“字形困扰”是汉字难学的主要原因之一(石定果等,1998)。研究发现,汉字构形意识作为一个包含了汉字部件意识、汉字部件位置意识、汉字部件组合规则意识等微技能①此 处用“微技能”虽不妥当,但因目前没有更合适的定义,本研究中暂且将汉字构形意识所包含的汉字部件意识、汉字部件位置意识和汉字部件组合规则意识称为“微技能”。的多维构念(multidimentional construct),在汉字习得过程中有重要作用。

汉字构形意识的形成和发展也越来越受到研究者的关注。江新(2001a)发现:零起点美国学生学习五个月汉语后对上下结构汉字已形成了明显的正字法意识②笔者认为“汉字正字法意识”也指对汉字部件表音表义的意识。但一些研究者也用“汉字正字法”来指代“汉字构形意识”。为了转述的方便,在文献评述中,仍使用“汉字正字法”这一术语。。鹿士义(2002)发现:母语为拼音文字的成人形成正字法意识需要两年左右时间。王建勤(2004)发现:零起点欧美学生学习三个月汉语后已开始萌发汉字正字法意识。Wang M.etal(2003)发现汉语学习者部件意识的形成要早于部件位置意识;而郝美玲(2007)则发现汉语学习者部件位置意识的形成要早于部件意识。这两项研究结果相左,我们认为主要是因为:1)被试性质不同。前者的被试为在美国每周学习6学时汉语的学生,他们接受的汉字刺激较少;后者的被试为在北京每周学习10学时汉语的学生,他们接受的汉字刺激较多。2)测量方法不同。虽然二者的测验材料均为真假非字判断,但前者采用反应时测量法,后者采用纸笔测验法。因此,关于汉语学习者何时开始对汉字部件的位置信息有所意识,他们的部件意识和部件位置意识的发展是否存在一个先后顺序,纸笔测验的构想效度如何,纸笔测验能否借鉴为汉字构形意识诊断性评价的题型等问题都还需要进一步的验证和研究。

本研究希望能在实现语言测试与第二语言习得研究、认知心理学研究接口方面做出一次尝试。为此,我们编制了一套针对汉语学习者汉字构形意识的诊断性评价测验来考查学习者的汉字构形意识。同时,我们应用概括诊断模型(GDM)对所编制的诊断性测验进行了效度验证,以探讨纸笔测验应用于汉语学习者汉字构形意识研究中的可行性。

2 概括诊断模型(GDM)简介③Davier M.von.A general diagnosis models applied to language testing data[R].Princeton,NJ,US:Educational Testing Service,2005,September:RR-05-16.

概括诊断模型(Class of General Diagnosis Models,GDMs)是Davier M.von&Yamamoto(2004)提出的一个可定义和整合以往各种认知诊断模型的模型组。

2.1 概括诊断模型的对数线性形式(loglinear class of GDM)

GDM的对数线性形式是由一个离散的、多维的潜在变量 θ定义的,θ=(a1,…,aK)。其中,当ak∈{0,1}时,ak被定义为掌握型能力(1)和未掌握型能力(0)。当θ=(a1,…,aK),即θ为一个包含多维能力水平ak(k=1,…,K)的K维能力时,被试对某一题目i的反应x的对数形式可定义为:

其中:

qi为Q矩阵元素,qi.=(qi1,…,qiK),

βxi为难度参数;

γxi为k维斜率参数,对每个非零反应 x∈

采用一个特殊映射hi()可将GDM与多元IRT模型结合起来,该映射关系为:

其中:

映射h的第k个值为hk(qi.,a)=qikak;

只要Q矩阵中只有0或1两种元素,无论能力水平是多级的(即:)还是二分的(即 ak∈(0,1)),都可使用这一映射hi()。

2.2 概括诊断模型的逻辑斯蒂形式(logistic class of GDM)

GDM的对数线性形式可转化为逻辑斯蒂(logistic)形式:

其中:

a=(a1,…,aK)为K维能力;

βxi为难度参数;

γxi为K维斜率参数,对每个非零反应 x∈

其中:

a=(a1,a2,…,aK)是包含了K个离散特质的潜在能力;是一个二分值的Q矩阵。

βxi为难度参数;

γxi为K维斜率参数,对每个非零反应 x∈服从约束

2.3 小结

本研究选取GDM检验我们所编制的诊断性测验主要是因为:

本研究所考察的汉字构形意识(θ)是一个包含了部件意识、部件位置意识和部件组合规则意识三个维度的潜在能力(ak,k=3),GDM可对多维能力进行诊断。

本研究的诊断性测验将采用二值计分法,每一个维度的潜在能力都只有两个水平,即Q矩阵元素为qik∈{0,1},适用于最简单的0/1矩阵概括诊断模型。

GDM可采用标准EM算法的边际极大似然估计法(Marginal Maximum Likelihood Estimation,MMLE/EM),计算成本较低。

3 实验研究

3.1 研究目的

(1)编制一套针对汉语学习者汉字构形意识的诊断性评价测验。

(2)应用GDM对我 们所编制的汉字构形意识诊断性评价测验进行效度检验。

(3)为进一步设计开发汉字构形意识测验提供参考依据,为对外汉语汉字教学实践提供反馈信息。

3.2 被试

本研究被试包括了来自辽宁大学和福建师范大学的汉语学习者,共116人④全体被试视力或矫正视力正常,且均未被告知实验目的。。被试的具体情况如表1所示:

表1 被试基本情况表

3.3 测验的编制

本测验所测的汉字构形意识包含了学习者对汉字部件形体特征的意识、对汉字部件位置信息的意识、对汉字部件之间组合规则的意识(如图1所示)。

图1 汉字构形意识结构示意图

我们设计了三种题型对学习者汉字构形意识的不同层面进行考查(表2)。

第一部分判断汉字,60题。其中,非字1(其中一个部件是在正确的部件上增加或减少一笔而成的,如:“ ”;或将其中一个部件用线条图代替,如:“ ”)、非字2(将真字的一个部件用另一部件代替,但此部件的位置不符合汉字部件构字规则,如:“ ”;或将真字的两个部件对调,如“ ”)、假字(将真字的一个部件用另一部件代替,但符合部件构字规则的字,如“ ”)各10题,填充真字⑧30题。被试判断正确计1分,错误计0分。假字和非字均使用Windows XP系统自带的TrueType造字程序制作,与真字印刷体无差别。

第二部分补全汉字,20题。每题给出一个部件,要求被试添加另一个或几个部件,构成一个新的汉字。补全的汉字正确计1分,只添加单一笔画或添加的部件书写错误均计0分。

第三部分组合部件,20题。要求被试使用每题给出的四个部件中的两至三个组合成一个汉字。组合正确计1分,组合错误或部件抄写错误均计0分。

4 结果与分析

4.1 利用概括诊断模型(GDM)进行效度检验

为比较真假字判断测量作业和我们所自行编制的测量作业的优劣,我们将全卷分为测验1(判断汉字)、测验2(书写汉字)两份平行测验进行效度检验。

4.1.1 数据整理

第一步,根据各测验题所测的微技能建立各题的0/1微技能Q矩阵。

第二步,根据被试在测验中的作答情况,建立被试的0/1反应矩阵。

4.1.2 模型公式

本研究采用概括诊断模型(GDM)的公式(4),即:

其中:

a=( )

a1,a2,…,aK是包含了K个离散特质的潜在能力;是一个二分值的Q矩阵。

βxi为难度参数;

γxi为K维斜率参数,对每个非零反应x∈

在本研究中,a为汉字构形意识;k=3,a1为部件组合规则意识,a2为部件意识,a3为部件位置意识。能力水平数SK=2,我们将能力水平赋值为掌握型(1)和非掌握型(0)两种数据,即

表2 汉字构形意识测验试题结构与题型表

4.1.3 参数估计

我们使用Davier M.von(2005)开发的GDM软件mdltm,应用EM算法的边际最大似然法进行参数估计,结果显示(表4-1):全卷及测验1、测验2所估计出的整体难度值都小于0,说明测验偏易。但三种微技能a1、a2、a3的斜率参数γxi均值均大于0且小于3,这说明全卷对三种微技能都有较好的区分度。其中,测验1估计出的a1、a2、a3斜率参数γxi均大于2,说明测验1对三种微技能的区分度均较高;测验2估计出的a1斜率参数γxi大于a2、a3,说明测验2对部件组合规则意识的区分度高于对部件意识、部件位置意识的区分度。

4.1.4 模型拟合度检验

我们以IRT双参数逻辑斯蒂模型(2PL-IRT)为参照⑨当k=1,即a为一个单维能力时,IRT模型可作为GDM的一个特殊形式。,对GDM的模型拟合度(model fit)进行检验发现:GDM拟合度指标⑩包括LogPen绝对值、Deviance(G)和AIC指标这三个拟合度指标。均小于2PL-IRT(表4-2),即实测数据与GDM的模型拟合度较好。

4.2 汉字构形意识各微技能与总技能的关系分析

根据GDM估计出的三种微技能的掌握概率(probability of mastery)以及2PL-IRT估计出的总技能的掌握概率,我们对部件组合规则意识(a1)、部件意识(a2)、部件位置意识(a3)与总的汉字构形意识(θ)之间的关系进行了分析⑪为了避免有界概率数据(bounded classification)对皮尔逊(Person)相关分析的误导,我们将汉字构形意识(θ)的掌握概率进行了logit转化,即:l=log。。

GDM对测验1的估计结果显示(表5):在测验1中,a1、a2、a3的掌握概率之间存在中度相关(.575,.622,.657),说明测验1所测的不同微技能之间有一定区别。另外,a1、a2、a3的掌握概率与θ两两间存在高度相关(.857,.855,.878),说明测验1具有较高的同质性。因此,我们认为测验1测到了构成汉字构形意识的不同微技能。方差分析⑫本研究中的方差分析均采用Bonferroni调整系数的事后多重比较。结果显示:a3的掌握概率显著高于a2(p=.040);a2的掌握概率显著高于a1(p=.001)。也就是说,对于被试而言,部件组合规则意识最难掌握,而部件位置意识最容易掌握。

表3 汉字构形意识测验题目参数估计结果表

表4 GDM和2PL-IRT模型拟合度指标表

表5 汉字构形意识微技能与总技能相关关系表(测验1)

GDM对测验1的估计结果显示(表6):在测验2中,a1、a2、a3之间以及它们和θ之间均存在高度正相关,进一步的方差分析发现a1、a2、a3的掌握概率差异均不显著(p=1.00,p=.146,p=.109)。因此,我们认为,与测验1相比,测验2更倾向于考查被试对三项微技能的综合运用,从整体上考查被试的汉字构形意识。

表6 汉字构形意识微技能与总技能相关关系表(测验2)

GDM对全卷的估计结果显示(表7):对于全卷而言,a1、a2、a3之间以及它们和θ之间均存在显著的高相关。这一方面说明全卷具有很高的同质性,各分测验均对被试的总的汉字构形意识进行了有效测量,也说明部件组合规则意识、部件意识和部件位置意识可以很好地预测汉字构形意识。但就全卷来说,我们对三个微技能的考查没有很好地区别开来。我们认为,这主要是受测验2的影响。方差分析结果显示:a3的掌握概率显著高于a2(p=.039)和a1(p=.001);但a2和a1的掌握概率的差异不显著(p=.871)。这说明全卷未能很好地把部件意识和部件组合规则意识区分开来。但与GDM对测验1的估计结果一致的是,全卷估计结果也说明部件位置意识最容易掌握。

同时,GDM在测验1和测验2中分别估计出的a1、a2、a3两两之间存在中度相关(.497,.662和.590)(表8)。但2PL-IRT模型在测验1和测验2中对总技能θ的估计结果却有相对较高的一致性(.726)。因此,我们认为测验1和测验2都测到了汉字构形意识。但测验1是通过对部件组合规则意识、部件意识和部件位置意识的分项评价来测量汉字构形意识的。而测验2是通过考查被试对三种微技能的综合运用能力来整体测量汉字构形意识的。

表7 汉字构形意识微技能与总技能相关关系表(全卷)

表8 测验1与测验2所估计的汉字构形意识微技能与总技能的相关关系表

5 讨论

5.1 对汉字构形意识各微技能发展情况的讨论

首先,我们所定义的汉字部件位置意识表现为能够判断部件的位置是否正确。实测数据分析结果显示:对于汉语学习者而言,汉字部件位置意识最容易获得。我们认为,这是因为具有位置信息的基础部件具有很强的构字能力,在学习者汉字习得初期的出现率较高。根据邢红兵(2005)的统计,具有位置信息的基础部件“扌”、“艹”、“氵”和“亻”的构字数均在100个以上。另外,汉字部件的位置信息在汉字构形系统中也是有限的。在邢红兵(2005)所划分的515个基础部件中,只有206个基础部件具有位置信息,占总部件数的40%,且这206个具有位置信息的基础部件在HSK甲乙级字中均已出现。这样,学习者在汉字习得的初期阶段就能够较好地归纳和总结出这类部件的共性和规律,较快地掌握这些部件的位置信息。因此,我们认为部件位置意识在汉语学习者汉字习得的初期,有重要作用。

其次,我们所定义的汉字部件意识表现为能够判断部件是否真实存在,能够对部件的形体特征进行分析和加工,能够正确书写汉字部件形体。实测数据分析结果显示:与部件位置意识相比,学习者较难获得汉字部件意识。我们认为,这主要是因为汉字部件形体特征较为复杂,不像汉字部件位置信息特征那样具有有限性和较强的系统性,汉语学习者的部件意识需要在汉语学习的过程中慢慢积累。特别是对于非汉字文化圈的初级学习者而言,他们首先需要建立汉字笔画和结构的心理图式(schema),才可能有效地掌握汉字部件的形体特征。汉语学习者在初级阶段的汉字部件意识常处于一个较弱的水平,仅限于对汉字形体和图形的识别(王建勤,2004)。其次,汉字形似部件较多(如“氵”和“冫”,“辶”和“廴”,“末”和“未”等),这给汉语学习者构建较为清晰的汉字部件意识带来了很大困难。以往的偏误分析研究也发现这类形似错误在汉语学习者的汉字偏误中占有很大的比例(孙清顺等,1985)。因此,我们认为只有在汉语学习者的汉语达到一定水平,积累了一定的识字量后,才有可能获得较强的汉字部件意识。

最后,我们所定义的汉字部件组合规则意识表现为能够判断部件的组合关系是否合法,能够将部件组合为正确汉字。实测数据分析结果显示:较之部件意识和部件位置意识,部件组合规则意识是最难获得的。我们认为,具有较为清晰的部件位置意识和部件意识是汉语学习者能够判断汉字部件组合关系合法性的前提。有时,当某一部件与一个具有位置信息的部件组合时合法,但它与另一个具有同样位置信息的形似部件组合时却不合法,如“进”与“”,前者为真字,后者为假字。汉语母语者在判断这类假字时,也可能出现错误。对于汉语学习者而言,这无疑是更大的困难。因此,我们认为,汉语学习者部件组合规则意识的获得,一方面,与他们的汉字识字量有着密切联系;另一方面,也与他们对汉字部件构字理据的掌握有关。这无疑对他们汉字能力提出了更高的要求。

5.2 对汉字构形意识测验三种测量作业的讨论

“判断汉字”测量作业通过要求被试对三种类型的错字进行判断来分别考查被试能否判断某一部件的形体特征是真实存在的、能否识别某一部件的位置信息、能否判断汉字部件组合关系的合法性。也就是对汉字构形意识的三项微技能一一进行考查。从整体上看,该题型对被试而言最为容易。从GDM估计出的三项微技能的参数来看,真假字判断作业能够较好地区分出汉字构形意识中的各项微技能,也能够有效地反映被试总的汉字构形意识。

但该测量作业也存在一定的问题。首先,由于该测量作业为正误判断,容易受到猜测因素的影响。只有增加题量才能有效地降低猜测因素的影响。但由于该测量作业需要加入与测验用字相等数量的填充真字,这在一定程度上,又增加了测量的成本。

“补全汉字”和“组合汉字”两项测量作业都是考查被试输出汉字的能力,要求被试综合运用他们的部件意识、部件位置意识和部件组合规则意识。从整体上看,这两项测量作业都能很有效地反映被试的汉字构形意识,但对微技能的反映有限,这是因为对于初级汉语学习者而言,各项微技能的掌握还不完全,综合运用各微技能的能力有限,而高级汉语学习者的各项微技能已发展得相对完善,已具备综合运用的能力。因此,我们认为该测量作业适用于考查中、高级汉语学习者的汉字构形意识。

6 结论

(1)我们所编制的汉字构形意识诊断性评价测验能够用来考查汉语学习者汉字构形意识的发展状况。

(2)真假字判断测验能够较好地诊断汉语学习者的汉字部件意识、汉字部件位置意识和汉字部件组合规则意识,可以作为用来诊断评价学习者汉字构形意识。

(3)补全汉字和组合汉字测验能够较好地诊断汉语学习者的汉字构形意识以及汉字部件意识、汉字部件位置意识和汉字部件组合规则意识的综合运用能力,但对这三种微技能的独立的、区别性的诊断还不理想。

(4)对于汉语学习者而言,汉字部件位置意识最容易获得,汉字部件组合规则意识最难获得,汉字部件意识居中。

(5)我们可以通过对汉语学习者的汉字部件意识、汉字部件位置意识、汉字部件组合规则意识以及三者的综合运用能力的考查来评价他们总体的汉字构形意识。

[1]郝美玲.汉语作为第二语言的学习者汉字正字法意识的萌芽与发展[J].世界汉语教学,2007(1).

[2]江新.初学汉语的美国学生汉字正字法意识的实验研究[C].见:赵金铭,主编.对外汉语研究的跨学科探索——汉语学习与认知国际学术研讨会论文集.北京:北京语言大学出版社.2001.

[3]鹿士义.母语为拼音文字的学习者汉字正字法意识发展的研究[J].语言教学与研究,2002(3).

[4]石定果,万业馨.有关汉字教学的调查报告[C].见:吕必松,主编.汉字与汉字教学研究论文选.北京:北京大学出版社.1998.

[5]孙清顺,张朋朋.初级阶段汉语作为第二语言的学习者错别字统计分析[C].见:北京语言学院第三届科学报告会论文选.北京:北京语言学院出版社.1985.

[6]王建勤.欧美学生汉字部件认知效应的实验研究[J].汉语研究与应用,2004(2).

[7]邢红兵.基于统计的汉语字词研究[M].北京:语文出版社.2005.

[8]Davier M.von&Yamamoto K.Partially observed mixtures of IRT models:An extension of the generalized partial credit model[J],Applied Psychological Measurement,2004(28),389-406.

[9]Davier M.von.A general diagnosis models applied to language testing data[R].Princeton,NJ,US:Educational Testing Service,2005,September:RR-05-16.

[10]Wang M.,Charles A.Perfetti&Ying Liu.Alphabetic readers quickly acquire orthographic structure in learning to read Chinese[J].Scientific Studiesof Reading,2003(2).

猜你喜欢
构形测验部件
双星跟飞立体成像的构形保持控制
加工中心若干典型失效部件缺陷的改进
奥迪e-tron纯电动汽车的高电压部件(下)
基于BP与GA对非标部件结构对比研究
汉字构形系统的发展与六书“转注”
《新年大测验》大揭榜
两个处理t测验与F测验的数学关系
你知道吗?
分布式卫星合成孔径雷达系统编队与自主保持技术
甲骨文构形法研究