语言学:从卡片之学到数据之学
中新网 2010年07月28日 14:00 来源:《中国社会科学报》
现代语言学的研究理念和研究方法正在发生重要的变化。从经验科学转到实证科学,从定性研究到定量研究,从发现和描写语言现象、事实,到对这些现象、事实进行解释和探源,从静态研究到动态研究,从单一领域到多领域的结合(从语言学内部各单个领域的研究到语言学内部各领域的结合),从单一学科到多学科的合作(从语言学这个单一学科的研究到语言学与社会学、心理学、物理学、考古学、遗传学以及信息科学等多学科的合作)。在现代社会中,科学飞速发展,文理分家已经远远落后了。所以,很多创新的理论和应用的成果都建立在学科交叉的节点上。这些节点就是新的学术生长点。
现代语言学的研究方法是从卡片之学转变到数据之学。卡片之学代表传统语言学的优良方法。卡片的内容包括:(1)所有看过的参考文献摘录、笔记。(2)语言调查的资料记录。比如在一个方言,这个字音读什么,那个字音读什么,一个字音一张卡片,一个例句一张卡片。所以,一套卡片就代表一个语言/方言的系统。(3)卡片记录自己的学习心得和思考收获。所以,传统的语言学有一句话,语言学是卡片之学。这种说法代表了语言学的“朴学”精神。今天,我们仍需要发扬这种“朴学”精神,现在做得还远远不够。从卡片之学转向数据之学的过程中,卡片之学是基础。绝不能有了数据之学,就可以抛开卡片之学。只有在卡片之学的基础上,我们才能建立和转向数据之学。数据之学不排斥、不否定卡片之学,而是在卡片之学基础上的提升和进步。
数据之学是量化分析。它使研究实证化、系统化、科学化,甚至将来成为自动化,使我们做到“心中有数”。“心中有数”有两个意义,字面意义和实际意义。字面意义是心里要有数目的概念,实际意义是要对事物有大体、全局的把握。这两个是一致的。只要心中有了数目,我们就能够把握全局。
我们知道,有了现象才能获得印象,有了印象才能最终得到真相。现象和印象都不一定是真相。有了真相,有了事实,才能获得理论。现象不能直接产生理论,印象也不能直接产生理论,只有真相才能产生理论。这就是我们经常说的那句话,实事求是。
数据之学有三个大的方面。
一是我们需要什么样的数据,以哪些数据作为研究对象?事实上,我们的研究对象很广泛:古代、现代的语言现象、语音、语法、词汇、语义的研究,生理、心理、物理的研究,不同方言、语言的研究,儿童语言习得、第二语言习得、语言接触研究等。语言接触现象很普遍,第二语言习得是方向确定的语言接触。这些都是我们研究的对象。
二是怎样取得数据?用哪些工具?用什么作为武器?比如说使用仪器、问卷、调查、记音、查考文献等都是取得数据的方法。不过,方法不断地进展。使用的仪器、工具不一样,取得数据的途径不一样,这方面有很多可以进一步发挥的余地,空间很大。比如说,取得多少数据、多大的样本,问卷是发10个还是发100个、500个;调查什么样的人,找人发音,找多少个,找什么地方的人,找年轻人还是找老年人,发什么样的音,这些都有很多可以由自己设计、确定的空间。怎样取得数据直接影响到最后数据的处理。我们往往在最后处理数据的时候,才感到在前面的某个步骤和程序出现了缺陷。有时候这种缺陷可以补偿,有时候不能补偿。所以,在怎样取得数据这个问题上,需要我们仔细周密地进行思考。我以前讲过,这个过程就像我们在纸上练兵,要把全部过程都推演一番,就像作战演习一样;一般都是先做小型的实验,再做大规模的调查。
三是如何处理数据?如何驾驭数据?尤其是数据越来越多,大样本的情况。我们要利用归一化处理。但实际上,归一化不是目的,脑子要清楚。我们不能迷失方向,迷失自我,不能掉进去出不来。要清楚我们的方向,我们的目的,归一化就是为了获得语音格局。归一化是量化分析的第一步,后面还有很多的步骤。归一化就是把最大值和最小值之间的跨度看做百分之百,看做单位一。
归一化之后就是相对化,相对化是在归一化基础上,所有最大值、最小值中间的数据都转化为百分数,就是把所有数据的明数去掉,变成无量纲的数据。
相对化之后就是范畴化。在语言学中,不同单位(音位、词类、句法结构、语义特征)都有各自的分布范围,这种分布范围表现为数据分布的范畴。归一化和相对化之后,要把不同范畴的分布范围、分布界限找出来。
不同范畴之间的关系不是线型、平面的,而是立体的关系,具有层级性。语言是一个系统,系统的特点是层级性。不同范畴在不同平面、层级上才能更清楚地显示出各自有规律的关系。这种有规律的关系就是系统。只有层级化之后,才能得到系统——格局。
格局化和系统化是一致的,系统是隐性的,格局是显性的,格局是可见的系统。经过量化分析一系列的过程得到语言的格局,才是我们最后的目的。衡量一个方法、做法是不是有效、有优越性,就是看能不能使我们简捷地、便利地得到语言的格局。
需要什么样的数据,怎样取得数据,如何处理数据,这些都是现代语言研究面临的重要课题。在语言学研究中需要充分利用数据。数据就是客观事实,数据就是实践经验。实践是我们认识的来源,理论的根基,检验的标准。我们应该提高对于语言数据的认识和理解,增强处理和分析语言数据的能力,从而在更为坚实的客观事实的基础上进行语言学理论的探索。
(作者:石锋 单位:南开大学语言研究所)