三 规范化与信息化面对的主要问题
现行盲文在规范化方面存在比较大的局限。为节约盲文篇幅,现行盲文方案采用了必要时才标调的原则,标调较为随意,声调符号大量省略,音节标调率低,客观上造成了盲人摸读时需要依据上下文猜测准确读音的问题,也显著增加了计算机自动处理盲文的难度,难以适应新时期盲人文化教育和盲文信息化的需要。中国残联等单位1996年发布的《关于印发〈汉语双拼盲文“九五”实施方案〉的通知》指出:“它(指现行盲文)还是一种初级形态的拼音文字,一般不标调,往往需要依赖上下文猜测词的读音和含义,容易造成误解。”现行盲文规范化与信息化面对的问题表现在以下三个方面。
1.标调率低,声调省略随意,表音文字不能准确表音
现行盲文一般不标调,省去音节的声调标记,在节省盲文篇幅的同时,在很大程度上丢失了表音的准确性,使得同音不同调词同形,大幅增加了盲文中同形词的数量。例如,“时间、实践、事件、世间、尸检、始建、时艰、诗笺”等声韵相同而声调不同的一组词,因声调省略,其盲文符形完全相同。
在实际执行过程中,现行盲文还存在标调规则难统一、声调省略随意的特点。据对来源于正式出版物的400篇盲文语料(约100万字)进行的标调统计,盲文语料的音节标调率不高,大约为11%。不同篇目语料的标调率差别较大,甚至同一本书的不同章节也存在标调率的显著差异。
同形词过多、声调大幅省略给盲人带来了比较严重的识读障碍,盲人阅读时往往需要根据上下文文义推测猜读。对盲文信息处理来说,声调省略没有明确一致的规则,汉盲转换时无标准可循,随意性大,准确率难以评价。盲文转换汉字时,由于声调标记缺失,音字转换的难度非常大,准确率普遍不高。
2.一符多用带来符号兼用歧义,不利于准确识读
布莱尔点字体系本身是一种未赋含义的框架,各国文字经过合理设计均可用点字符号表示。设计者可以结合本国、本民族语言文字的特点,规定各点字符号的含义,建立适合自己的盲文文字体系。由于盲文符形非常有限,不同语言的盲文方案都允许用同一盲符代表不同的视觉字符,存在程度各异的盲文符号兼用问题。例如,双拼盲文允许声韵母同形,存在较多的声韵母符号兼用,因而易混淆,这是其推广试行遇到困难的原因之一。
现行盲文同样存在大量的符号兼用情况,这种兼用有时无歧义,有时有歧义。无歧义的符号兼用有效节约了盲符资源。有歧义的符号兼用需要盲人在阅读时根据语境及上下文消解歧义,这给盲文使用者和盲文信息处理带来了明显的障碍。例如,现行盲文中,声母g和j、k和q、h和x共用一个符号,韵母e和o共用一个符号。前者是一种无歧义的兼用,不会造成误读,而韵母e、o共用一个盲符,则是有歧义的兼用,造成了“这么”和“折磨”两个不同读音的词盲文符形相同的缺陷,需要盲人在阅读时依据文义猜测。这种歧义也是盲文信息化的障碍,加大了盲文和汉字自动转换的难度。
3.分词连写规则执行困难,分词一致性低
汉语书面语按字分写,而我国大陆地区采用的现行盲文和双拼盲文两种方案都规定汉语盲文采用分词连写的书写形式。
盲文分词连写是指在盲文中以词为单位、有分有连的特殊书写规则。书写时,以词(或词组、短语)为书写单位,词(或词组、短语)之间以一个空方做分隔。书写一个语句时,词内连写,词间分写。
现行盲文采用分词连写的书写方式被大多数盲人和盲文研究者认为是一个重要的进步,有助于盲人摸读,也有助于理解。但是从60多年来盲文教学、出版等应用实践来看,由于分词连写规则复杂且过于笼统,不同出版机构、不同人在执行盲文分词规则时不易做到统一、规范,造成了作为文字使用的汉语盲文存在符形不固定、不同人有不同写法的问题。这不仅给盲人阅读与书写带来障碍,也给计算机自动处理带来了挑战。
现行盲文在标调随意省略、符号兼用歧义、分词连写规则执行难等方面存在的规范化问题对盲文信息化造成了非常显著的影响,汉盲、盲汉自动转换难度显著增大。据对主要盲文信息化软件的测试,计算机实现盲文分词连写达不到明眼文[2]所能达到的平均准确率约95%的水平,盲汉翻译时音字转换的准确率也不能达到高水平,影响了盲文信息软件的实用性。