中美英语议论文语篇修辞特征对比研究
上QQ阅读APP看书,第一时间看更新

四 修辞关系标注

语料标注者共两人,包括笔者和另一个研究者,两人都从事修辞与写作研究,且有外语写作教学经验,熟悉修辞结构理论。为了统一修辞关系标注的标准,标注者首先接受了广泛的训练,大致分为三个阶段。我们采用O’Donnell研制的修辞关系标注软件(RSTTOOL Version 3.0)。在定位阶段,标注者熟悉修辞结构理论的原则和该项目使用的语篇标记工具。该工具使注释器能将文本分割成基本语篇单元,画好修辞关系树形图,整个文本就构成有层次结构的完整语篇。然后在第一阶段,培训重点是将文本切分为基本语篇单元,并学习工具的操作原理。在第二阶段,标注者开始探索语篇修辞关系的解释,通过对一个个短文档进行独立标注,确定基本初始标注准则,然后比较标注结果。最初阶段的学习重点是解决语篇的单元分割差异,但随着时间的推移,学习重点转变到处理关系和非关系问题。这些探索性学习可以增加修辞关系的一致性标注准则。在最后阶段,标注者集中讨论如何通过一些启发性方法处理更高层次的语篇结构以减少标注差异。为了保障标注者对修辞关系标注的信度,我们对两位标注者在同一文本中的修辞关系评判结果进行了一致性检验(Interrater Reliability),Kappa值为0.7,说明一致性较好,故修辞关系标注结果可信度较高。

为了增强英语议论文写作语料标注的可信度,两个标注者对所选的中美英语议论文语料的修辞关系分别进行标注。若对修辞关系标注结果不统一时,两者反复协商、修改,直到达成一致意见。在对所有语料的修辞关系标注工作完成后,统计出每篇文本中的修辞关系频数,然后分类统计出不同类别的关系类型和频数。

不同学者根据修辞关系的概念和定义,基于修辞关系之间可能共享某种修辞意义将修辞关系分组,比如环境—S关系(Circumstance)和背景—S关系(Background)为背景类,非意愿性原因—S关系(Non-volitional Cause)、非意愿性结果—S关系(Non-volitional Result)、意愿性原因—S关系(Volitional Cause)、意愿性结果—S关系(Volitional Result)为因果类等。在某些情况下,两个结构段之间可能存在多个关系,例如,因果类关系和时间类关系可以同时存在于两个结构段之间。标注语篇修辞关系旨在将语篇的两个结构段(或单元)之间的修辞关系限制为一种修辞关系。因此若有多个候选关系,就选择最佳的那种修辞关系。丹尼·马库斯建立了一个修辞关系的协议顺序,在关系模棱两可的情况下,帮助关系标注器评估并选择在协议中排名更高的关系。他发现,分析师更倾向于将关系突显性的局部比较作为标准,例如详述—附加—S关系(Elaboration-Additional)更普遍;时间上早于—S关系(Temporal-Before)也更普遍,而条件—S关系(Condition)没那么显著[10]。因此,我们参考了丹尼·马库斯标注手册中相应的协议,在语篇关系标注中指派修辞关系时遵循其修辞关系优先选用顺序。