[摘要]普通话语料库建设方兴未艾。本文就吉林省普通语语料库建设的现状进行了分析,发现语料库建设在取得不俗成绩的同时也存在诸多问题,并就这些问题指出解决办法。
[关键词]吉林省;普通话语料库
随着计算机软件技术的发展以及人们对实际语料价值的重新认识,20世纪60年代以来,基于语料库的语言学研究取得了长足的进步,涌现出大量的优秀成果。各类语料库也应运而生,在当今语言学研究中扮演着十分重要的角色,为语言学研究提供了丰富、详实的语言素材。
一、吉林省语料库基础建设研究现状
自国家开始推广普通话伊始,吉林省便积极响应国家政策,出台了一系列相关的政策条文,支持普通话的发展。目前普通话语料库已基本健全,形成了比较科学规范的管理和运行体系,产生了广泛的社会影响。以推进汉语的词法、句法、语义和语用的研究为目的,同时也为中文信息处理的研究提供语言资源。在人文科技发展与基础教育领域中发挥着巨大的优势,对少数民族地区普通话的推广起到了不可替代的作用。
但存在的问题也不容忽视。语料库的快速建设跟不上语言发展态势的潮流。当代网络传媒飞速发展,其新兴用语及词法变更必将打破传统语言格式的发展态势,而是否将其纳入语料库的辞海之中还有待商榷与解决。同时,语料库的发展必将造成语料库层序混乱,良莠不齐。很多当地人自以为说的就是普通话,不重视普通话的学习和训练,势必混淆某些普通话与非普通话之间的句法、词汇。例如东北方言中使用频率很高的方言特色词汇“贼!哎呀妈呀!嗯哪!那啥!疙瘩”等。是否把这些非普通话词汇纳入其中是一个未知命题。有些地区方言与普通话发音相差甚远,以白山方言特色词语为例:[挨克]aik即受到指责、训斥;[包屈]booqQ即委屈。通话方言:“儿白儿着虎——真的不骗你;外屋地——厨房;劲引的——故意的;脑乎——暖和;管灯——日光灯;手闷子——棉手套”等等。吉林俗语:“捏嘎达,睐悬,绷丁,大氅等等”。这些都是推广和普及普通话亟待解决的问题。
此外,作为普通话语言推广工作的拦路虎,语音问题的存在也不容忽视。以舌尖音为例,在吉林方言和普通话之间主要存在声母转化的差异。在通化、辽源、延吉和四平这四个地区,舌尖音转化在不同人群中也存在明显差异。这些都不约而同地传达着同一个信息,即发音问题与人们所处地区、年龄、文化程度等有一定的关系。地域环境的影响已经深深植根于每一个吉林人心中,要想彻底填补吉林方言与普通话之间的鸿沟,非一日之功。所以,语料库在建设成功之始,问题的出现也相伴而生。如何推广,是一个任重而道远的任务。
二、吉林方言与普通话词汇方面的差异与原因
吉林方言来自多元文化的融合,下面就以白山、吉林、通化、延边等代表性方言词语为例来诠释其与普通话之间的差异。
白城方言与普通话间存在一些异议。首先,古精组字在普通话中把舌尖声母成读[ts、tsh、s],白山话中古精组字与古知、章、庄组字存在混淆。其次,白山话也分为四个声调,但调值、语速接近于山东话。白山话把普通话中的阴平调55全部降调,读成介于44—22之间的平直调,如捞33。白山话的两个字词语中,上声+阴平被变调为35+33,如:眼眵214+55。
吉林方言与普通话最大的差别就是平舌和翘舌不分的问题。首先,是平、翘舌音混用:普通话常用汉字3500字中,翘舌音字有624个,平舌音字只有262个。吉林方言却恰恰相反,往往把普通话中的翘舌音读成平舌音,把平舌音读成翘舌音,两者混用情况较为严重,造就了吉林人独特的发音方式。其次,是舌尖前音z、c、s和舌面音J、q、X混淆:大多数吉林人把舌面音j、q、X,读得接近舌尖前音Z、c、s,造成了语音缺陷,听起来纯净度不够,给人一种含混不清的感觉。吉林人还存在着语音缺陷,即声母发音时发音部位不准确,读翘舌音(zh、ch、sh)时只是舌尖接触或接近上腭位置过于靠后或靠前,但还没有完全错读为平舌音(z、c、s),使人难以在短时间内辨别他们所说的词汇到底是什么。吉林话在韵母上存在的问题较少,稍加注意,基本上就可以解决。最后,是多加声母n:普通话中有四个韵母不能构成零声母音节,它们是——一i(前)、一i(后)、ong、eng,但在吉林话里,常常在e、ai、ao、ou、an、en、ang这7个开口呼零声母音节前加上声母n,比如,把恶()读成(n宅)。
通化方言的使用地区包括通化市、通化县、集安等地,因距离说胶辽官话的丹东、宽甸等地很近,至今保留了胶辽官话的特征,主要表现在古平声清音的调值为423或312。其主要特征有如下几方面:首先,在通化方言中不存在古知庄章组字。普通话古精组字读Z、c、s,古知庄章组字今读zh、ch、sh。通化方言中古知庄章组字今读Z、c、S,如只=兹zi、诗=思si、抄:操coo、是=四sl等。通化方言常把r读作零声母字。如:人=银yin、冉:演yan等。其次,端系字有丢U介音现象。普通话中,U韵母作韵头的开口呼韵母有8个:an、UO、uai、ui、uan、un、uang、ueng,通化方言中丢韵头的主要有3个,即ui、uan、un,如:短=胆dan、端=丹dan、乱=烂lan、孙=森sn、酸=三son等。通化方言中丢失介音在农村比较普遍,老年人丢介音的情况多于年轻人,所以要改正通化方言中丢介音的现象,需从年轻人抓起。最后,通化方言中至今还保留着一些胶辽官话特殊读音,如:干什么ganh6nme、你家nnjia、塌hd、药yn、摘z6等。改正这些方言所存在的问题,需要几代人的不懈努力。
作为少数民族聚居的延边自治州,其语音与普通话语音存在较多区别。(1)舌尖前声母Z、c、s与舌尖后声母zh、ch、sh不分,也就是我们常说的平翘舌不分。(2)声调发音不到位,把“然后”的“ran(二声)”读成“ran(一声)”、把“照旧”的“旧jiu(四声)”读成“jiu(一声)”。延边地区另外一种语音错误现象,就是一个人读一个字的时候,也会读出不同的音,如:“站台”的“站zhan(四声)”,读出zan3、zhan3、zhan4、zan4四种音,这说明延边人不懂得到底如何去读。对于这一点,没有立竿见影的辨正方法,只能循序渐进地进行纠正。(3)将W读成v。如:“蚊子”的“蚊”wen(二声)——ven(二声)。(4)把韵母0误读成e的现象也是存在的。把韵母ong误读成eng,如:把“浓nong2”误读成“neng2”;把“r”读成“Y”,如:热re(四声)——ye(四声)、润run(四声)——yun(四声)月。(5)把声母m读成n,如:把“谜语”的“谜mi(二声)”误读成“ni(二声)。(五)把介音“U”省略,主要体现在“luan”这个音节上,如:将“山峦”的“峦luan(二声)”误读成“峦lan(二声)”。(六)把声母r读成l或者y,如“扔reng(一声)——leng(一声)”和“允run(三声)——(三声)”这两个字上。(7)在一些音节中把“ia0”读成“tie”,如:上学xue(二声)——xia0(二声)、姓岳yue(四声)读成yao(四声)。所以相对来说,延边地区普通话存在的问题较为严重,应加以重视。
“御敌之法不在胜人在自胜”。了解各地区方言语音的问题及规律,对于解决普通话发音问题有着至关重要的作用。只有在明确了普通话语音问题的根本原因后,才能集中精力解决问题。一步一个脚印,稳扎稳打,方言语音的现存问题和当代普通话的推广问题便会迎刃而解。
三、吉林省语料库建设策略
语料库建设的目的是重整中国语言的整体构架与思维态势,完善和健全国语在华夏大地的推广工作。目前吉林省普通话语料库已基本健全,形成了比较科学规范的管理和运行体系,产生了广泛的社会影响。但仍存在不完善之处,针对我省语料库建设状况,有如下建设策略:
(一)与时俱进,借鉴国外先进经验
随着计算机网络的快速发展、新传媒的出现,人们的交流方式日益丰富,这造就了一大批新兴词汇的出现,如“囵”、“驴友”、“俯卧撑”、“雷”等。这些词如今已经不仅出现在网络,而且已经在传统媒体如电视、报纸及期刊中出现,并且得到广泛认可。对这些新兴语汇,我们必须加以重视。因而,语料库的建设必须与时俱进,才能不落窠臼。与此同时,我们还应~,-tN关注国外语料库的建设进度,借鉴外国先进的方法手段,并根据我省的实际情况将其本土化。
(二)利用人工及现代先进科技,将语料库进行细化筛选
语料库的规模以及对语料加工的细化程度,决定了语料库的数据的可靠性以及为使用者提供的服务程度。由于吉林省的语料极为庞杂且存在混同的问题,我们必须对其收录的语料进行二次甚至多次筛选。利用现代科技,对其重复添加词加以删除,更新语料库,使其正确添加新的词汇。同时,对少数不规律的以及一些方言词汇,必须聘任相关语言专家进行人工评测,确保语料库的数据全面、规范及细致。同时,应建立“中介语”语音语料库。汉语普通话“中介语”语音语料库如果全面展开,必定是一个规模浩大的工程,需构筑一个技术平台,探索一套研究模式,并为将来建立更大规模的“中介语”语音料库提供一个范本。
(三)实地考察与理论研究相结合
吉林省属于多个少数民族聚居的省份,语言面貌比较多样且复杂。按照吉林省行政区划,全省辖8个地级市、1个自治州、2O个市辖区。其中辽源市、通化市、白山市、松原市、白城市、延边朝鲜族自治州6个地区,因其自身有其独特的语音面貌,被列为重点语料样本选取地区。我们应该注重实地调查,通过交谈、收听、问答等多种方式收集方言词汇,书写记录调查方言词汇必须做到既准确又全面,并以当时当地的语境了解词语的语义和词语的感情色彩。
[参考文献]
[1]李如龙.汉语方言比较研究[M].北京:商务出版社,2001.
[2]罗福腾.胶辽官话研究[D].济南;山东大学,1998.
[3]李荣.现代汉语方言大词典[z].南京:江苏教育出版社,2004.
[4]王如辰.吉林方言区内普通话教学[J].白城师范高等专科学校学报,2002(4).