汉语复句关系的特征结构

2015-06-09 23:45冯文贺
中文信息学报 2015年6期
关键词:复句语义分类

冯文贺

(1. 河南科技学院 中文系,河南 新乡 453003;2. 武汉大学 计算机学院,湖北 武汉 430072)



汉语复句关系的特征结构

冯文贺1,2

(1. 河南科技学院 中文系,河南 新乡 453003;2. 武汉大学 计算机学院,湖北 武汉 430072)

通常复句关系分析基于分类机制,由于缺乏统一逻辑,面临不少分歧。该文提出基于特征结构描写复句关系。复句关系的特征结构由[特征: 值]元组构成,该文初步构拟汉语复句关系的特征结构系统,并用于具体分析。较之分类机制,特征结构对复句关系的描写深刻,且分析判断准确、易行。目前特征结构系统开放,但特征调整,可以完善而不大量更改已有特征描写结果。特征结构可用于复句关系的深度语义分析资源构建与计算研究。

复句关系;特征结构;语义分析

1 引言

关系分析是汉语复句研究的重点。复句关系分析中有两个一般性难题: 第一,分类分歧,复句关系分多少个类,至今没有统一的分类体系(表1);第二,归类分歧,给一个复句,按照既定的分类系统它应该属于哪一种关系,具体判断往往面临选择分歧(如例1~例3)。

例1 干相同的活,别人记十个工分,他却只能得七分。(转折?对比?并列?……)

例2 设立重庆直辖市的议案若获得通过,重庆将成为中国继北京、上海、天津之后,设立的第四个直辖市。(假设?条件?……)

例3 上海浦东近年来颁布实行了涉及经济、贸易、建设、规划、科技、文教等领域的七十一件法规性文件,确保了浦东开发的有序进行。(条件?因果?顺承?目的……)

两个难题的根源均在逻辑标准不统一。逻辑标准不统一在分类上的表现主要有:

第一,不同的分类体系,分类标准与方法不一。表1显示,有的关系体系分层级[1-4],有的关系体系不分层级[5],具体的小类数目、名目也不尽相同。同样是分层级,在第一层有的二分[1-3],有的三分[4]。这些差异根本在于分类标准和方法的不一致。如大类二分法分类标准主要是语义轻重(“联合”复句内分句间意义平等,而“偏正”复句内分句间则有主从之分),三分法的分类标准则主要是逻辑联系性。

第二,同一分类体系内部,不同类的立类标准不一。这从关系命名上可以直观看出来,有的着重分句及关系的时间现实性(假设),有的着重分句的时间先后性(顺承),有的着重分句间的意图性联系(目的),有的着重分句语义的地位或等次(并列、递进),有的强调分句关系的双向性(因果),有的则突出分句关系的单向性(条件、目的)。

同理,对于复句归类,分析者对于同一个复句,着眼点不同或所依据的标准不同,就可能归为不同的关系类别。如例1,侧重于“干相同的活,别人记十个工分(都应该记十个工分)”而“他却只得七分”的前后事理逆转性,则可能判断为“转折”。侧重于共同背景下“干相同的活”的前后事件差异性“别人……十个……”,而“他……七个……”,则可能建立并分析为一个新的类别“对比”(表1中没有的类别)。而从另外角度,也可能分析为“并列”。例2,例3的归类分歧同然。

表1 常见复句关系分类系统

分类与归类分歧的根本原因在于,分类系统认为复句关系间不同视角特征之间是一种非此即彼的排斥关系,而事实上这些不同特征在复句关系中可能共生共存,一个复句关系具有不同的关系特征。

根本而言,采用分类方法,不同视角特征理应有不同的分类系统。但通常任何一家之言的分类系统,都仅有一个分类系统,而不是多个系统。由于只有一个分类系统,这个分类系统往往不得不容纳各种特征,并为各具某一不同鲜明特征的关系分别立类。如此就使得通常的复句关系分类系统并不是一个严格的逻辑统一的分类系统。

这就导致,一方面,分类系统内部各个类之间不具备逻辑上的排他性,由此具体关系归类时必然不可避免分歧。另一方面,分类系统不具备完备性,各种分类系统一般仅给出常见分类,而不是完整分类。相关的一些分类系统宣称,分类系统是开放的,可以增删或调整分类,原因正在于此。但分类系统若调整会带来较大的代价,即所有的已归类结果一般均需按照新的类别系统重新归类。所以,通常尽管理论上说分类系统是开放的,但一旦确定下来分类系统,应用实践,特别是资源建设中便很少再进行调整。

一般来看,复句关系主要是语义关系,具有一定客观复杂性和主观随意性,由此不一定适合用单纯的分类方法来解决。也许,可以换另外的思路来解决复句关系问题。基本的考虑是,既然人们一般可以认识到复句关系的某些特征,并以某个突出特征作为某类关系的命名,说明这些特征是人们认知复句关系的一般理解事实。由此,不妨仍从这些特征入手来分析复句关系,所不同的考虑是,也许这些特征是普遍的,而并不一定仅为某种关系所特有。在具体复句关系中,这些特征虽有不同但并不矛盾,它们共生共存,从不同侧面反映复句关系。

通常在某个关系中,只看到某种特征,客观的事实可能是,相对而言,某特征比较突出,而其他特征不怎么突出而已,但不突出并不意味着没有,更不意味着不重要或没有分析价值。

这种分析复句关系的另类思路就是特征结构。第二部分介绍特征结构的一般特点,并论证用特征结构分析复句关系的可行性;第三部分初步构拟复句关系的特征结构系统;第四部分将特征结构系统应用于具体的复句分析;第五部分比较特征结构与分类机制在复句关系分析中的差异;第六部分介绍相关研究工作;最后,总结全文并展望下一步工作。

2 特征结构与复句关系

2.1 特征结构

在语言学上,特征结构的方法并不陌生,语音分析中最早运用[6],后来语义、语法研究中也有一定运用。在不同领域,分别称为语音特征、义素[1]、语法特征等。

特征结构一般表示为一个[特征: 值]元组。如普通话元音一般由[发音部位: 舌面/舌尖/卷舌]、[舌位前后: 前/央/后]、[舌位高低: 高/半高/半低/低]、[唇形: 圆唇/不圆唇]四组特征及其取值构成的特征结构描写。

一个具体对象的特征结构分析表示为一组赋值的特征结构集合。如/a/:[发音部位: 舌面]、[舌位前后:前]、[舌位高低:低]、[唇形:不圆唇]。更换任何一个特征值,都会得到另一个音素或音位。为了简便,具体对象的特征结构也往往简略为特征值的集合,如/a/:[舌面]、[前]、[低]、[不圆唇]。这个时候,也常常把“特征值”直接称为“特征”。

很多时候,特征结构的一个重要取值特点是偶分性。例如,语音特征有“元音性/非元音性”、“辅音性/非辅音性”、“浊音性/非浊音性”、“突发性/延续性”等。这种偶值选择特点,可以减少分析分歧,也适合计算机二进制编码要求,便于和现代科学技术结合。

一定对象的特征结构,人们对其认识并不一定一样。例如,对于语音,有的特征以生理发音分析为主,有的特征以声学分析为主,等等。甚至一些公认的特征,不同流派对其解释也不同。不过根本而言,不同的特征或不同的解释之间只是角度或性质的互补,而不是矛盾。

2.2 复句关系的特征结构分析可行性

首先,从分析对象看,特征结构适合于相对封闭、小量的对象系统。相比语义分析,特征结构在语音分析上比较成熟,正是因为语音单位(音素或音位)相比语义单位(义项)要封闭和量小得多。而在语义研究中,特征结构最先应用于亲属称谓系统,也是因为亲属称谓相当封闭而量小。复句关系是语义系统,具备一定复杂性,但相比一般语义系统而言,它整体是相对封闭、小量的系统,特征结构应该可以较好应用于复句关系分析。

其次,从复句关系的研究基础看,传统分类方法中往往蕴含了某些直观的特征认识,通常一些关系类的建立即依据某些特定的关系特征。只不过囿于分类思想,特征往往是个别的,因类而异的。从这一基础出发,通过系联并推广一些关系特征,不难建立一个有一定现实及认知基础且适用广泛的复句关系特征结构系统。

3 复句关系的特征结构系统

复句关系特征结构系统的建立是复句关系特征结构分析的基础。构建这一特征结构系统有两种不同策略: 其一,从宏观的语言哲学基础出发,由上而下构建一个相对完备的特征结构系统;其二,从一般认识实践出发,构建一个有一定实践基础的特征结构系统,这一特征结构的一次性构建不一定完备,但可以不断完善。

目前,我们采用第二种策略。主要考虑是,一方面,至今对于复句关系还没有成熟的语言哲学基础,难于据此建立特征结构系统;另一方面,在现有复句关系系统中,并不乏直观的特征认识,很方便从这些特征入手,推演而获得有一定普遍性的关系特征。

以下给出的一些复句关系的特征结构,主要就是从传统复句关系分类抽象而来。与传统类别不同的是,这些特征一般并不仅仅为某种关系所有,而是具有一定普遍性。

3.1 [因果性]

从传统因果关系抽象而来,有[因果性+]、[因果性-]两个特征值。[因果性+]指两个分句所述事件具有引起和被引起关系,[因果性-]指两个分句所述事件不具有引起和被引起的关系。具有[因果性+]的复句都可以加上“因为……所以……”、“以致”等因果关联词明示这种性质,而[因果性-]的复句则不能。

下列一组句子,可以证明为[因果性+]。为方便与传统类别有所比较,均为示例标明其传统关系分类(传统分类系统均依据黄伯荣、廖序东[1],下同)。

例4 A. 因为饿,她已经没有力气跑跑跳跳。(因果)

B. 如果你不表态,大家会失望的。(假设) →你不表态,以致大家失望。*对客观范畴的语义关系分析验证时,通常去掉情态范畴的语义词。这里去掉了表现实性情态的“如果”、“会……的”等字眼。其他客观范畴的语义分析与此同。

C. 除非再打几眼井,才能解决北坡干旱的问题。(条件) →打几眼井,以致解决北坡干旱的问题。

D. 为了买一辆进口汽车, 他省吃俭用了好几个月。(目的) →他省吃俭用好几个月,以致买一辆进口汽车。

E. 她学习刻苦,但是成绩并不好。(转折) →她学习刻苦,(所以成绩好)——成绩并不好。

下列一组句子,可以证明为[因果性-]*篇幅所限,这里对于取值为负的关系,略去验证过程,有兴趣的读者可以自行验证。。

F. 她摇摇头,接着打起我无论如何也不明白的手势。(顺承) G. 说假话的人会得到这样的下场,即他说的真话也没人相信。(解说) H. 我们一边喝酒,一边吸烟,一边畅谈。(并列) I. 不光铁会生锈,就连铜铝等金属也会生锈。(递进) J. 星期天,或者你来,或者你让圆圆来。(选择) K. 小王喜欢古典音乐,而小李喜欢流行音乐。(转折)

这里比较有意思的是对于传统转折关系(E、K)的分析。分析发现,E的转折关系蕴含了[因果性+],后分句(“成绩并不好”)之所以可以和前分句(“她学习刻苦”)构成转折,根本上是因为后分句可以和前分句引起的常规结果(成绩好)构成相反关系(成绩好——成绩并不好)。由此,可以认为这种转折关系蕴含了[因果性+]。和一般[因果性+]复句不同的是,转折关系中[因果性+]所带的结果项是隐含的,而一般[因果性+]复句中结果项是显现的。

不过,并非所有转折关系都蕴含[因果性+]。例K中,前一分句“小王喜欢古典音乐”并不引起“小李喜欢古典音乐”,以与后一分句“小李喜欢流行音乐”构成相反关系。事实上“小李喜欢流行音乐”可以直接和“小王喜欢古典音乐”构成相反关系。由此可以认为该转折关系为[因果性-]。于转折关系中看到[因果性],又于其一般同类中看到[因果性+/-]的差异性,这正是特征结构用于复句关系分析的深刻之处。

3.2 [现实性]

从传统假设关系抽象而来,有[现实性+]和[现实性-]两个特征值。[现实性+]指分句所指事件及事件间的关系已经成为事实。[现实性-]指分句所指事件及事件间的关系尚未成为事实。[现实性]本质上并不是一种关系语义,而是关系的模态。[现实性]通常可以通过一些词汇表现出来(见例5中下划线所示),也可以通过完成式问答验证。

下列一组句子,可以证明为[现实性+]。

例5 A. 因为饿,她已经没有力气跑跑跳跳。(因果) →她饿了吗?是的。她没有力气跑跑跳跳吗?是的。

B. 我们一边喝酒,一边吸烟,一边畅谈。(并列) →我们喝酒了吗?是的。我们吸烟了吗?是的。我们畅谈了吗?是的。

C. 不光铁会生锈,就连铜铝等金属也会生锈。(递进) →铁会生锈吗?是的。铜铝等金属会生锈吗?是的。

D. 她摇摇头,接着打起我无论如何也不明白的手势。(顺承) →她摇头了吗?是的。她打了我无论如何也不明白的手势吗?是的。

E. 她学习刻苦,但是成绩并不好。(转折) →她学习刻苦吗?是的。她成绩不好吗?是的。

F. 说假话的人会得到这样的下场,即他说的真话也没人相信。(解说) →说假话的人会得到这样的下场吗?是的。下场是他说的真话也没人相信吗?是的。

下列一组句子,可以证明为[现实性-]。

G. 如果你不表态,大家会失望的。(假设) →你不表态了吗?没有。大家失望了吗?还没。

H. 除非再打几眼井,才能解决北坡干旱的问题。(条件) →打几眼井了吗?没有。解决北坡干旱问题了吗?没有。

I. 为了买一辆进口汽车, 他省吃俭用了好几个月。*对比: 为了买这辆进口汽车,他省吃简用了好几个月。“这辆汽车”通常可以解读为已为她所买所有。(目的) →买了一辆进口汽车了吗?没有。他省吃俭用了好几个月了吗?是的。

J. 星期天,或者你来,或者你让圆圆来。(选择) →你来了吗?没有。你让圆圆来了吗?没有。

3.3 [反转性]

从传统转折关系抽象而来,有[反转性+]和[反转性-]两个特征值。[反转性+]指分句所指事件间有相反或逆转关系。[反转性-]指分句所指事件间没有相反或逆转关系。[反转性+]可以通过分句间反义词语明示,也可以通过“但是、然而”等关联词明示。[反转性-]的分句间没有反义词语,也不能用“但是、然而”等连词连接。

下列一组句子,可以证明为[反转性+]。

例6 A. 星期天,或者你来,或者你让圆圆来。(选择) →星期天,或者你来(而圆圆不来),或者你让圆圆来(而你不来)。

B. 她学习刻苦,但是成绩并不好。(转折) →她学习刻苦,(所以成绩好,)但是成绩并不好。

C. 虚心使人进步,骄傲使人落后。(并列)

D. 他不但没有逃走,反倒直奔边防站而来。(递进)

下列一组句子,可以证明为[反转性-]。

E. 我们一边喝酒,一边吸烟,一边畅谈。(并列) F. 不光铁会生锈,就连铜铝等金属也会生锈。(递进) G. 因为饿,她已经没有力气跑跑跳跳。(因果) H. 她摇摇头,接着打起我无论如何也不明白的手势。(顺承) I. 如果你不表态,大家会失望的。(假设) J. 除非再打几眼井,才能解决北坡干旱的问题。(条件) K. 为了买一辆进口汽车, 他省吃俭用了好几个月。(目的) L. 说假话的人会得到这样的下场,即他说的真话也没人相信。(解说)

3.4 [具体性]

从传统假设和条件关系抽象而来,有[具体性+]和[具体性-]两个特征值。[具体性+]指分句所指事件有确定的动作主体,[具体性-]指分句所指事件不限定确定的动作主体。[具体性+]的复句中动作主体一般明确显现或可明确添加,而[具体性-]的复句中动作主体一般不出现,也不能明确添加。[具体性]是复句关系的模态语义。

下列一组句子,可以证明为[具体性+]。

例7 A. 为了买一辆进口汽车, 他省吃俭用了好几个月。(目的) B. 因为饿,她已经没有力气跑跑跳跳。(因果) C. 如果你不表态,大家会失望的。(假设) D. 她学习刻苦,但是成绩并不好。(转折) E. 我们一边喝酒,一边吸烟,一边畅谈。(并列) F. 星期天,或者你来,或者你让圆圆来。(选择) G. 她摇摇头,接着打起我无论如何也不明白的手势。(顺承) H. 不光铁会生锈,就连铜铝等金属也会生锈。(递进) I. 说假话的人会得到这样的下场,即他说的真话也没人相信。(解说)

下列一组句子,可以证明为[具体性-]。

J. 除非再打几眼井,才能解决北坡干旱的问题。(条件) →(我们他们……)除非再打几眼井,才能解决北坡干旱的问题。

K. 既要有克服困难的信心,又要有克服困难的办法。(并列) →(你我们……)既要有克服困难的信心,又要有克服困难的办法。

L. 与其平庸苟且一生,不如轰轰烈烈一场。(选择) →(我你我们你们……)与其平庸苟且一生,不如轰轰烈烈一场。

3.5 [兼容性]

从传统选择关系抽象而来,有[兼容性+]和[兼容性-]两个特征值。[兼容性+]指分句所指事件间彼此可以共存,不存在非此即彼的取舍关系。[兼容性-]指分句所指事件间存在非此即彼的取舍关系,不能共存。[兼容性-]复句一般可用“或者、与其……不如”等连接词来连接分句,[兼容性+]的复句则不能。

下列一组句子,可以证明为[兼容性+]。

例8 A. 因为饿,她已经没有力气跑跑跳跳。(因果) B. 为了买一辆进口汽车, 他省吃俭用了好几个月。(目的) C. 除非再打几眼井,才能解决北坡干旱的问题。(条件) D. 如果你不表态,大家会失望的。(假设) E. 她学习刻苦,但是成绩并不好。(转折) F. 我们一边喝酒,一边吸烟,一边畅谈。(并列) G. 不光铁会生锈,就连铜铝等金属也会生锈。(递进) H. 她摇摇头,接着打起我无论如何也不明白的手势。(顺承) I. 说假话的人会得到这样的下场,即他说的真话也没人相信。(解说)

下列一组句子,可以证明为[兼容性-]。

J. 星期天,或者你来,或者你让圆圆来。(选择) →星期天,或者你来(圆圆不来),或者你让圆圆来(你不来)。

K. 我不是不想走,而是现在还不能走。(并列) →与其说我不想走,不如说现在还不能走。

3.6 [顺序性]

从传统顺承关系抽象而来,有[顺序性+]和[顺序性-]两个特征值。[顺序性+]指分句所指事件间前后相承,具有先后顺序。[顺序性-]指分句所指事件间是平列的或者不存在前后相承关系。[顺序性+]一般会出现或者可以加上“接着、以后、后来”等关联词。

下列一组句子,可以证明为[顺序性+]。

例9 A. 因为饿,她已经没有力气跑跑跳跳。(因果) →因为饿,她后来已经没有力气跑跑跳跳。

B. 为了买一辆进口汽车, 他省吃俭用了好几个月。(目的) →为了以后买一辆进口汽车,他省吃俭用了好几个月。

C. 除非再打几眼井,才能解决北坡干旱的问题。(条件) →(除非)再打几眼井,然后才能解决北坡干旱的问题。

D. 如果你不表态,大家会失望的。(假设) →你不表态,接着大家会失望。

E. 她学习刻苦,但是成绩并不好。(转折) →她学习刻苦想笑,但是后来成绩并不好。

F. 他不但没有逃走,反到直奔边防站而来。(递进) →他不但没有逃走,然后反到直奔边防站而来。

G. 她摇摇头,接着打起我无论如何也不明白的手势。(顺承)

下列一组句子,可以证明为[顺序性-]。

H. 星期天,或者你来,或者你让圆圆来。(选择) I. 小王喜欢古典音乐,而小李喜欢流行音乐。(转折) J. 我们一边喝酒,一边吸烟,一边畅谈。(并列) K. 不光铁会生锈,就连铜铝等金属也会生锈。(递进) L. 说假话的人会得到这样的下场,即他说的真话也没人相信。(解说)

以上特征是全局特征,对于任何一个复句关系,均存在以上特征。下面的几组特征则是局部特征,通常具有某种特定特征的复句关系,会有某种特有的局部特征。

3.7 [意图性]

从传统目的关系抽象而来,有[意图性+]和[意图性-]两个特征值。[意图性+]指分句所指事件间一事件的存在以另一事件为目的。[意图性-]指分句所指事件间不是一事件以另一事件为目的。[意图性+]一般会出现或可加上“为了”等关联词来明示性质,而[意图性-]的复句则不能。[意图性]存在于[因果性+]的复句关系中。

下面句子,可以证明为[意图性+]。

例10 A. 为了买一辆进口汽车, 他省吃俭用了好几个月。(目的)

下列一组句子,可以证明为[意图性-]。

B. 因为饿,她已经没有力气跑跑跳跳。(因果) C. 除非再打几眼井,才能解决北坡干旱的问题。(条件) D. 如果你不表态,大家会失望的。(假设) E. 她学习刻苦,但是成绩并不好。(转折)

3.8 [等次性]

从传统递进和并列关系抽象而来,有[等次性+]和[等次性-]两个特征值。[等次性+]指分句所指事件间存在共同述谓,且该共同点在程度、范围等方面存在增减变化。[等次性-]指分句所指事件间不存在共同述谓,事件间不存在程度、范围等的增减变化。[等次性+]一般会出现或可加上“更”、“不但……而且”等标志性关联词明示这种性质,而[等次性-]的复句则不能。[等次性]存在于[因果性-]的复句关系中。

下列句子,可以证明为[等次性+]。

例11 A. 不光铁会生锈,就连铜铝等金属也会生锈。(递进) B. 他不但身体好,而且学习好。(递进) C. 他身体好,学习更好。(递进)

A、B中,述谓共同点的范围扩大,C中述谓共同点的程度增加。

下列句子,可以证明为[等次性-]。

D. 我们一边喝酒,一边吸烟,一边畅谈。(并列) E. 她摇摇头,接着打起我无论如何也不明白的手势。(顺承) F. 星期天,或者你来,或者你让圆圆来。(选择) G. 说假话的人会得到这样的下场,即他说的真话也没人相信。(解说) H. 小王喜欢古典音乐,而小李喜欢流行音乐。(转折)

3.9 [同一性]

从传统解说关系抽象而来,有[同一性+]和[同一性-]两个特征值。[同一性+]指分句所指事件间,一事件与另一事件或其某个内部项外延相同。[同一性-]则不存在这种情况。两事件间具有[同一性+]的内容可以替换,事件间出现或者可以加上“就是、换句话说、即”等关联词明示这种性质。[同一性]是客观范畴的语义关系,存在于[因果性-]的复句关系中。

下面句子,可以证明为[同一性+]。

例12 A. 说假话的人会得到这样的下场,即他说的真话也没人相信。(解说) → 说假话的人会使得他说的真话也没人相信。

下列一组句子,可以证明为[同一性-]。

B. 不光铁会生锈,就连铜铝等金属也会生锈。(递进) C. 她摇摇头,接着打起我无论如何也不明白的手势。(顺承) D. 星期天,或者你来,或者你让圆圆来。(选择) E. 我们一边喝酒,一边吸烟,一边畅谈。(并列) F. 小王喜欢古典音乐,而小李喜欢流行音乐。(转折)

4 基于特征结构的复句关系分析

一个具体复句关系的特征结构分析,就是用特征结构系统来对其描写。表2给出了本文分析过的部分复句关系的特征结构。为方便与传统分类比较,同时给出例句的传统分类。

值得指出,各种复句关系同时具有多种特征,并不意味着各种特征完全平等,在说话人的表达上或听话人的认知理解上,通常会有某一个或几个特征比较突出。例如:

例13 A. 因为饿,她已经没有力气跑跑跳跳。([因果性]突出) B. 如果你不表态,大家会失望的。([现实性]突出) C. 为了买一辆进口汽车, 他省吃俭用了好几个月。([意图性]突出) D. 她学习刻苦,但是成绩并不好。([反转性]突出)

例13的一组例子均具有[因果性][现实性][意图性][反转性]四方面特征,但这四个特征在各句中的突出程度并不一样,A突出[因果性],B突出[现实性],C突出[意图性],D突出[反转性]。表2中,加粗的特征为突出特征。

突出特征在句中的标志是关联词,通常关系分类正是依据某种突出特征建立的。正因此,A、B、C、D在传统分类中,一般分别归为因果、假设、目的、转折。当句中没有关联词时,突出特征的辨认就会成为问题,而基于突出特征的传统分类就可能面临多种判断分歧。

5 特征结构与分类机制的比较

5.1 描写深度

相比分类机制,特征结构对复句关系的描写更深刻。这突出表现在与传统分类对照时,特征结构对于传统分类同中之异和异中之同的揭示。

例14 A. 她学习刻苦,但是成绩并不好。(转折) B. 小王喜欢古典音乐,而小李喜欢流行音乐。(转折)

例15 A. 虚心使人进步,骄傲使人落后。(并列) B. 小王喜欢古典音乐,而小李喜欢流行音乐。(转折) C. 他不但没有逃走,反倒直奔边防站而来。(递进) D. 与其平庸苟且一生,不如轰轰烈烈一场。(选择)

首先,同中之异。例14中A、B两句从传统分类看,都是转折关系,二者完全相同。但从特征结构角度看,两者还有重要差异: 第一,A句为[因果性+],B句为[因果性-]。第二,A句为[顺序性+],B句为[顺序性-]。

其次,异中之同。例15中A、B、C、D四句从传统分类看,分别为并列、转折、递进、选择,毫不相关,但从特征结构看,二者在[反转性+]这一特征上具有非常相似的特征。

事实上,在特征结构看来,类并不是根本的概念。一方面,类可以通过不同的特征结构集合来定义;另一方面,按照不同的特征结构,可以聚合出不同的类来(表2)。

表2 复句关系的特征结构与传统分类

5.2 分析判断

特征结构要比分类机制对于篇章关系的刻画深刻得多,但其分析却又比分类判断更准确、易行。主要原因在于: 第一,在结果选择上,特征结构一般是二值选择,判断结果非此即彼,分歧较小;而分类机制,一般涉及较大数量的类别选择,选择多,分歧大。第二,在判断机制上,特征结构的二值选择判断,涉及的判断标准相对单一,且一般有形式依据或方便易行的判断机制;而分类机制的多类选择,涉及的判断标准综合复杂,不同的着眼点,可能会有不同选择。

5.3 调整机制

目前,特征结构和分类系统基本都是基于经验的,而非严格的逻辑体系。由此,均可根据实践或需求调整,即可以增删特征或类。但二者调整机制的代价不同,一般来说分类机制的调整代价大于特征结构。这一点特别表现在语料库构建等实际分析应用中。基于分类机制的分析中,一旦改变分类系统,必然涉及大量已标注数据的重新分类。而基于特征结构的分析中,增删某个特征,并不涉及其他特征的改变,由此,可以较好的保留原有的已标注数据。

由于以上的原因,当用于复句关系的大规模语料分析及语料库构建时,特征结构不仅在深刻性上优于分类机制,而且在判断与调整机制的准确、易行、便捷性上大大优于分类机制。

6 相关研究

首先,和本文密切相关的是篇章关系研究,一些研究也把复句关系研究作为篇章关系研究的一部分。和复句研究相似,现有篇章关系研究也是分类系统,而且也一样面临分类和归类的分歧。例如,Hobbs模型将语篇关系分为12种[7];修辞结构理论定义了四大类25小类语义关系[8];修辞结构语料库定义了16组78种关系[9];宾州语篇树库定义了四个大类,16个次别,23个子类的篇章关系[10]。而一些汉语篇章树库的篇章关系体系也不尽相同[11-14]。为减少关系归类分歧,研究中往往提出种种判断机制。由于复句关系和篇章关系问题的相似性,本文所提特征结构机制也可用于篇章关系研究。

其次,除在语音、词义等领域的特征结构研究外,也有研究提出用语义特征的方法来研究汉语复句关系,但该研究的最终目的仍是通过语义特征构建新的复句关系分类系统[15]。而在本文看来,复句关系系统并非分类系统,而是特征结构系统,复句关系分析不是归类,而是用特征结构系统去描写。

7 结语

本文提出用特征结构而非分类机制来刻画复句关系,并初步构拟了汉语复句关系的特征结构系统。较之分类机制,特征结构对复句关系的分析深刻,并且准确、易行。目前,特征结构系统还是开放的,但新特征的增删,不会更改其他的特征分析结果。

我们将进一步根据实践调整特征结构系统,并最终研制基于特征结构的复句及语篇关系标注语料库,从而为其深度语义计算打下坚实的理论与语料基础。

致谢: 水桂秀就本文例句分析提出了宝贵意见。

[1] 胡裕树.现代汉语(第六版)[M].上海:上海教育出版社,1995.

[2] 黄伯荣,廖序东.现代汉语(增订五版)[M].北京:高等教育出版社,2011.

[3] 张斌.新编现代汉语[M].上海: 复旦大学出版社,2002.

[4] 邢福义.现代汉语[M].北京:高等教育出版社,2011.

[5] 邵敬敏.现代汉语通论(第二版)[M].上海:上海教育出版社,2007.

[6] 林焘,王理嘉.语音学教程[M].北京:北京大学出版社,1992.

[7] Hobbs J R.Coherence and coreference [J].Cognitive Science,1979,3(1): 67-82.

[8] Mann W C, Thompson S A. Rhetorical structure theory: Toward a functional theory of text organization[J]. Text, 1988, 8(3): 243-281.

[9] Carlson L, Marcu D, Okurowski M E. Building a discourse-tagged corpus in the framework of rhetorical structure theory [C]//Proceedings of the Current and New Directions in Discourse and Dialogue, Kluwer Academic Publishers,2003:85-112.

[10] Prasad R, Dinesh N, Lee A, et al.The Penn Discourse Treebank 2.0[C]//Proceedings of the 6th International Conference on Language Resources and Evaluation.2008.

[11] 乐明.汉语财经评论的修辞结构标注及篇章研究[D]. 北京:中国传媒大学博士学位论文.2006.

[12] ZhouY, Xue N. PDTB-style Discourse Annotation of Chinese Text[C]//Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics. 2012:69-77.

[13] 张牧宇,宋原,秦兵,等.中文篇章级句间语义关系体系及标注[J],中文信息学报,2014,28(2):28-36.

[14] Li Y, Feng W, Sun J, et al. Building Chinese discourse corpus with connective-driven dependency tree structure[C]//Proceedings of the EMNLP 2014:2105-2114.

[15] 邵敬敏.建立以语义特征为标志的汉语复句教学新系统刍议[J].世界汉语教学,2007,(4):94-103.

Feature Structure for Relationship of Chinese Complex Sentence

FENG Wenhe

(1. Department of Chinese Language and Literature, He Nan Institute of Science and Technology, Xinxiang, Henan 453003, China; 2. School of Computer, Wuhan University, Wuhan, Hubei 430072, China)

Complex sentence relationship analysis is usually based on classification. Due to lack of a unified logic, it is faced with a lot of divergences. This paper proposes a feature structure as to describe the complex sentence relationship. The feature structure of complex sentence relationship is a tuple of [Feature: Value]. This paper presents a preliminary set of feature structure for Chinese complex sentence, and demonstrates them in some specific applications. Compared with classification mechanism, feature structure analysis is reflective, and its determination is accurate and easy, which is promising in resource construction and computation research for deep semantic analysis of complex sentence.

complex sentence relationship; feature structure; semantic analysis

冯文贺(1976—),博士,博士后(在站),硕士生导师,主要研究领域为理论语言学、计算语言学、语言资源。E-mail:wenhefeng@gmail.com

1003-0077(2015)06-0013-10

2015-07-15 定稿日期: 2015-09-08

教育部人文社科基金(13YJC740022、15YJC740021),中国博士后基金(2013M540594),国家自然科学基金(61273320、61402341)

TP391

A

猜你喜欢
复句语义分类
真实场景水下语义分割方法及数据集
连动结构“VP1来VP2”的复句化及新兴小句连接词“来”的形成
基于语料库的汉语复句韩译研究
汉语复句学说的源流
分类算一算
语言与语义
分类讨论求坐标
数据分析中的分类讨论
教你一招:数的分类
批评话语分析中态度意向的邻近化语义构建