logo图片
您当前的位置: 首页 /经验交流 /国家通用盲文核心数据解析

国家通用盲文核心数据解析

作者:钟经华、田昊
来自:
人气:9442
2020-07-31


       国家通用盲文是对现行盲文的继承与发展,是国家发布的语言文字规范,是盲人的规范字。通用盲文制定了严格的标调和声调省写规则,表面没有声调的音节也能够根据规则还原出省写的声调,表面无调实质有调,本质上做到了字字标调。通用盲文解决了近70年来我国盲文读音不准,严重缺失声调信息的问题,实现了盲文由“猜”到“读”的转变,结束了盲文“猜调”的历史。消除了严重影响盲人文化教育发展,严重制约盲文信息化的瓶颈。

       通用盲文与汉语拼音方案从根本上取得了一致,我国盲人有了相当于汉语拼音功能的文字工具,这是我国盲人使用国家通用语言文字的里程碑。通用盲文在盲人教育中具有基础性、工具性地位,是盲人语言文字权益的核心。

       在实践层面上,通用盲文受到了广大盲人、盲生、盲校教师的普遍欢迎。理论层面上,还需要较大规模的定量研究,对通用盲文进行客观描述,以实证数据客观回应广大盲文使用者的关切。

       本研究从国家社科基金重大项目建设的汉语盲文语料库中提取1200751字(不含标点符号、外文、阿拉伯数字等非音节符号)盲文语料数据,进行通用盲文、现行盲文的量化比较研究。从多维度进行客观数据统计分析,形成了客观的学术研究成果。

       没有盲文语料库之前,我国对盲文的评价,一直没有客观数据支撑。仅停留在定性研究层面,大多依赖主观感受,仁者见仁,智者见智,研究结果无法验真亦无法验伪,难以形成学术公信力。

       一、通用盲文基础数据

       通用盲文的声韵调符号、标点符号都与现行盲文相同,核心差异是声调符号的用法不同。次要差异是通用盲文设计了六个简写字,涉及2.47%的符号,与以往相同的旧符号占97.53%。

       从现行盲文四个声调随意省略到通用盲文规范的“标三省一”,声调信息有了质的跨越。现行盲文中无调的单音节最多有5种可能的读音,双音节最多有20种可能的读音(首音节4种、尾音节5种),通用盲文表面无调的单音节、尾音节表面无调的双音节至多有2种读音(省写的声调或轻声)。只要尾音节表面有调,不论首音节是否表面有调,读音都是唯一确定的(省写的声调)。

       相同的1200751字样本,通用盲文2668533方、现行盲文2298491方、字字标调3248447方。通用盲文字均2.22方,现行盲文字均1.91方。如果字字标调,字均2.71方。通用盲文、现行盲文、字字标调方均点数分别为:2.68点、2.96点、2.50点。

       本语料1200751字被分成了684765块,每块平均词长约为1.75字。分词连写形成了684765个空方,平均每字附带0.57个空方。也就是说,通用盲文每字实际占2.79方的版面,其中空方约占20%。

       通用盲文显性标调率为49.59%,声调省写率为42.81%,轻声约为7.6%。现行盲文标调率为13.29%,比黄乃先生文献中5%标调率有大幅度上升,主要集中在声韵母自成的音节(不标调情况下的单方字)上。

       二、读音混淆情况

       1、现行盲文混淆情况

       现行盲文无调单音节中,除了“neng、gei、ri、ce、hei”等31个唯一声调音节外,其他无调的单音节都有混淆。有二、三、四、五种读音的单音节数分别为38、85、95、13个。第26点兼作两个韵母,自成音节时共9个可能的读音。在可能的读音中,一个是正确的读音,其余的是混淆,混淆的数量比读音的可能性少1。混淆的数量与其出现频次的乘积为混淆总数。现行盲文单音节混淆总数为166339,占单音节的72.42%。

       在双音节中,首尾音节都带调的没有混淆,出现9325次。仅首音节有调的出现54744次,有3970个混淆。仅尾音节有调的出现39285次,有4328个混淆。首尾音节都无调的出现298213次,有126331个混淆。现行盲文双音节中,混淆率为33.52%。其中,全无调音节cheng/wei的混淆量最大,有3190个。yi/qi有7种不同的声调组合,有6种混淆。

       现行盲文三音节累计混淆16次。四音节及以上没有检出混淆。

       现行盲文混淆总数为300968次,总平均混淆率约为25.06%。

       2、通用盲文混淆情况

       通用盲文没有新增轻声符号,省写与轻声都是以表面无调的形式出现。通用盲文中,四个基本声调之间不存在混淆,若轻声及省写声调同时存在,它们存在1种混淆。

       通用盲文语料中,带调单音节共673个,出现78509次。表面无调单音节292个,出现151220次。肯定是省写的单音节275个,出现139076次。肯定是轻声的3个(de、le、ne),出现3622次。有轻声和省写两种可能的14个,出现8522次。通用盲文单音节的混淆率为5.64%。

       通用盲文双音节中,带调尾音节出现207851次,无混淆;无调尾音节出现193716次,检出33个实际混淆的双音节词(如:qing1/chu,尾音节可能是阳平,也可能是轻声),共出现1895次。混淆率占双音节词总频次的0.47%。

       通用盲文中没有检出三音节及以上的省写与轻声混淆现象。

       通用盲文混淆总数为10417次,总混淆率约为0.87%,约为现行盲文的二十八分之一。

       三、通用盲文实现了预期目标

       本研究以较大规模盲文语料为基础,验证了通用盲文方案研制的可靠性,通用盲文方案预期的三个客观目标“新旧衔接”、“读音准确”、“省时省方”得到了数据支撑。

       通用盲文读音混淆降低到了0.87%,彻底改变了现行盲文读音混淆的失控状态,从跟本上实现了读音准确的目标。通用盲文字均2.22方、5.95点,做到了少方少点,能够有效提升盲人的阅读与书写效率。通用盲文新旧衔接率高达97.53%,保持了盲文稳定,新中国盲人文化70年的积淀得以保存。保障了盲人文字安全的核心利益,能够顺畅、平稳、顺利、自然地实现过渡,与试点和推广以来盲文使用者的高接受度相吻合。

       四、轻声符号需要继续研究

       通用盲文唯一的遗憾是没有轻声符号,造成了轻声与省写同形,留下了混淆的风险。在“对不起”中,“不”是轻声字,不标调。通用盲文的书写形式没有直接告诉读者“不”是轻声还是去声的省写,需要读者根据语境或者语言积累来判断。在“不错”中,“不”读阳平,这是变调,需要标去声的本调(在省写范围要省写)。这种受后面音节读音的影响而改变调值的变调现象,在通用盲文中不造成混淆。轻声和变调都属于汉语语音音变范畴,但是,它们的起因、过程、结果都不相同,是两类互相独立、性质不同的音变现象。通用盲文相应地采取了两种不同的处理方法:轻声不标调、变调音节标本调。

       对于轻重两读音节,通用盲文一律按重读标调。对于必读轻声的词,必须按照轻声词整体的音义属性,不标调。不能从字本位出发,逐字标调。如果逐字标调,盲文就没有了词汇,通用盲文就从拼音文字倒退到了注音符号。

       如果将轻声与变调混为一谈,给轻声词标上一个非轻声的“本调”,会造成带调的也可能是轻声,严重违背以往的习惯。如果表示物品的“东西”标为dong1/xi1,就变成了表示方向,读者无法将标着阴平的音节读作轻声。在原本没有障碍的地方制造出了新的阅读障碍。

       在现行盲文中,只允许用无调的dong/xi表示两个读音,从未允许带调的dong1/xi1表示两个读音。现行盲文中,无调的猜,有调的不用猜。如果通用盲文轻声标了“本调”,会造成带调的尾音节有轻声和非轻声两种可能,有调的也需要猜,比现行盲文更倒退。同时,通用盲文的混淆率会成倍地上升。

       只要坚持轻声不标“本调”,就不会导致带调的尾音节有轻声与非轻声两种可能。坚守“有调不猜”的传统,通用盲文带调音节就不会发生系统性的混淆风险。

       受现行盲文轻声肯定无调的习惯影响,通用盲文试点中对轻声“标本调”、“前加第4点”的两次努力都没有成功。轻声问题虽小,造成的混淆微乎其微,毕竟还是有问题。后续还应继续探索轻声符号设置问题,只有设置出轻声符号,才能完善通用盲文的声调体系,从源头上彻底消除轻声与省写混淆的风险。


录入:伊然 添加:2020-07-31
>>下一条
友情链接
更多

Copyright @ 2005-2020中国盲人协会版权所有