提要:随着中国社会科学的快速发展,规范化和国际化的讨论被提上议事日程。本文旨在分析讨论西方社会科学经验研究的方法论范式。通过分析总结国际一流社会科学杂志之范文,本文勾勒出经验社会科学研究的八个组成部分:问题、理论(文献)、假设、数据、测量、方法、发现和结论。这种范式反映后实证主义逻辑,我权称其为“洋八股”结构。 文中重点分析问题、理论和假设三股,讨论提出好问题,做好文献分析的指导性原则;强调假设乃连接理论与经验之桥梁,并分析建构假设的几种常见策略和形式。最后,讨论了“洋八股”与本土化之关系。
关键词:社会科学范式; “洋八股” ;经验研究 ;后实证主义 ;方法论 ;问题 ;理论 ;假设
————————
* 本文是基于作者在香港中文大学教研究生方法课的提纲改写的。从1994到2004年,我有幸遇到了许多优秀的国内的、还有一些香港的学生和学者,他们为这门课增添了色彩,使我获得教学相长的收益,所以首先应该感谢这门方法课的参与者。黄宗智、周雪光、张宛丽和郑丹丹教授在这篇文章的写作过程中提出了很多宝贵意见,我受益匪浅,在此深表谢意。还要特别感谢孙明将英文初稿翻译为中文。本文由上海市教育委员会E-研究院建设计划项目资助。
————————
自从托马斯·库恩(Thomas Kuhn,1970)发表了《科学革命的结构》一书,我们认识到了范式及其变革对学科发展的重要性。根据库恩的定义,范式指被学术共同体奉为标准的一系列普遍性规则、方法、概念、及理论。社会科学的各学科,如社会学、经济学、政治学,都尚未形成统一的实质理论范式,但已经初步形成了经验研究,特别是定量研究的普遍性方法论范式。所谓经验研究,广义指从经验资料总结理论并用经验资料验证理论的过程。方法论范式指学术界通用的连接理论与经验的基本规则和方法,其存在为形形色色的经验研究和大大小小的理论讨论提供了平台。
纵观当前西方主流的社会科学刊物,如《美国社会学评论》(American Sociological Review)、《美国社会学杂志》(American Journal of Sociology)、《美国经济学评论》(American Economic Review)、《美国政治学评论》(American Political Science Review)等,都采用一种非常刻板、近乎迂腐的格式,不遵循这个格式,就难以发表。林毅夫(1995)也曾指美国经济学文章格式单一八股,千篇一律。笔者将这种结构戏称为“洋八股”,并力图从主流刊物中提炼出“洋八股”的一般结构,目的是为国内社会科学的年轻学者,特别是研究生,做规范化研究,写一流学术文章,提供一个范式参考。
经验研究虽然在实质性的领域、风格,以及性质上千差万别,但都具有类似的结构,并且在逻辑上恰好有八个组成部分,因此称“洋八股”。表1列出“洋八股”的八个组成部分,并与土八股做对比。
尽管两种八股文都以刻板、学究为特点,在内容和功用上却大相径庭。“土八股”用来写作道德哲学的文章,而“洋八股”是经验研究的范式,反映实证主义和后实证主义哲学的基本思想(如Popper 1959,1963)。关于实证主义哲学在社会科学的应用,学术界历来争议不断,比如基尔茨早在20世纪70年代就宣布,实证主义方法在社会科学研究中已经寿终正寝(Geertz,1973)。近几十年西方社会科学界涌现许多新方法论,如后现代主义和解构主义等,但总体来看,实证主义依然是主流,并且越来越格式化。图1总结洋八股的基本结构。
简言之,一项研究要从问题出发,然后综述相关文献和理论、讨论各种不同观点和可能的答案,进而从中抽出假设命题;之后测量概念,收集数据,设计分析方案;最后分析数据以检验假设,并做出总结。八个部分各行其职,环环相扣。
从方法论角度来看,问题、理论(文献)、假设可以称为“前操作化阶段”,而数据、测量、方法和结果可以称为“操作化阶段”。社会科学之所以称为“科学”,就是因为操作化和资料分析阶段有程序和步骤可循,但同时由于其操作化不够、也很难严格,所以称作“软科学”。数据、测量、抽样调查、实地观察、统计分析或个案研究都有标准教科书可参照,而问题、理论和假设这三个“前操作化阶段”既没有标准教科书,也没有程序可循,甚至可以说带有艺术和工匠的特点,所以又有别于自然科学。自然科学杂志的文章,一般短小精干,怎么做的试验,有什么发现,干脆利索,大部分文章不超过几千字。社会科学的文章则洋洋洒洒,动辄上万或几万字。这是因为自然科学研究的前沿问题比较清楚,没有很多异议,概念定义和操作程序标准化,所以用于理论和概念讨论的篇幅很少,而社会科学研究则需要用大量篇幅澄清理论和概念纠纷。
本文的重心在于分析八股结构中的前三股,即问题、理论和假设的功用以及关系,并试图总结粗线条的研究策略。其他各股,本文只予以原则性的概括,读者可参考相关教科书。
一、经验研究的八个组成部分
(一)第一股:研究问题
问题是一项研究的灵魂,一般在文章导言中开门见山地明确提出。假设是研究的心脏,其前的文献分析和其后的数据分析都是为它服务的。但一篇文章应该起始于研究问题而不是研究假设,因为问题是开放的,可以容纳不同答案,而假设则容易排斥其他答案和解释。所以,从问题开始能使我们思路保持开放,避免偏颇;而从假设出发则有先入为主、排斥异己观点之虞。在实践中,研究者往往在动笔写文章前,有时在开始研究前,已经有了答案,即某种假设。即便如此,我们在文章中还是必须探讨对同一问题的不同理论观点、不同答案,以及相反的经验证据。事实上,研究者应该特别关注那些与自己相对立的理论观点,因为这显示了理论争议。如果一个问题没有理论争议,可能是因为这个问题没有争论价值。
社会科学的经验问题可分三大类:描述性、解释性(explanatory)或意释性(interpretative)。对现象的描述和分类属于分类学的范畴。纯粹描述性研究在社会学和经济学已经比较少见了,除非所描述现象是全新的。在宏观和历史分析中,描述性命题仍然占据重要地位。比如韦伯的世袭官僚制(patrimonial bureaucracy)以及黄宗智(Huang,2008)的“简约集权”,都是对中国历史上政体性质的描述。再如,迈克尔·曼(Michael Mann,1984)根据基础能力(infrastructural power)和专制能力(despotic power)将国家分为四种类型:弱基础、弱专制(中世纪西欧封建),弱基础、强专制(封建帝国),强基础、弱专制(现代民主制),强基础、强专制(现代集权国家)。应该指出,描述性问题不同于描述性方法。描述性方法,如细致叙事(detailed narratives)、深厚描述(thick description)等,是质性研究者常用来做因果解释或意义阐释的方法。
一个好问题往往比正确的答案更加重要,因为好问题会激发讨论和争论,如果问题不好,正确答案也会很快被忘记。如何问好问题?我认为取决于个人的知识结构、经历和灵性。我在这里提出几个评价好问题的参考标准。
⒈具体。经验问题应该明确而具体,切忌空泛,以小见大远胜于虎头蛇尾。“中国经济政治改革的困境”这样的论题显得太宽泛,而“国企改革与改革的关系”则具体得多。“社会结构对个人行为的影响”过于含混,“社会网络结构与集体行动”则更加明确具体。纯实证研究最好看料下锅,根据手中的经验资料提出问题,脱离资料,好高骛远,就难免虎头蛇尾。假如手中的资料是个人收入,而提出的问题却是国企改革与效率,问题与资料便遥遥相望而不可及。
⒉集中。专注于一个研究问题,或者彼此相关的一组问题。当一篇文章问多个问题时,这些问题应该围绕同一个理论轴心,而不是同一个现象或事物。例如,研究社会关系在国企下岗职工和农民工求职过程中作用的差异,就比全面研究下岗职工的失业原因、心理冲击、婚姻稳定性以及再就业等问题更加有趣。如果一个博士研究生计划写一本关于乡镇企业的书,包含乡镇企业发展、农村金融、乡村财政、外商投资等多个主题,那么分在不同章节,各章有各自的焦点,也未尝不可。写书和写论文的要求不一样。
⒊原创性。原创诚然可贵,却是真金难求。研究新现象往往能提出新问题,但新现象本身的独特或罕见性未必是创新。用新资料研究老问题尽管有价值但绝不是创新,而对一些老话题或普通现象以崭新的视角提出研究问题则可能具有独创性。比如周雪光(Zhou,2005)采用新颖的制度主义思路来研究社会分层的老话题,为解决老问题提供了有趣的新视角。对新现象提出老问题尽管有价值但绝不是创新。有时,真正具有独创性的研究要经历一个漫长的过程才被人们接受和欣赏,例如科斯(Coase,1937)的问题:“企业为什么存在?”
老生常谈的问题很难做出新意,比如布劳、邓肯的升迁模型,从20世纪60年代提出便成为美国社会学的主流,到现在40多年来学术界对它进行了翻来覆去的研究,已经变得索然无味。此类研究的“原创性”大多体现于从某个未被研究过的国家(如中国)搜集新数据,此外很难再做出新意。问题不新鲜,数据新鲜也可以,二流杂志也许感兴趣。比较稳妥的做法是围绕当前学术界前沿争论提出问题,虽然不一定有创意,但不至于陈词滥调,抱着老掉牙当宝贝。
⒋意义。这一标准包括语义上的意义和理论意义。语义上有意义的基本要求是研究问题要符合逻辑、符合事实,不应是假问题。不符合逻辑的假问题如:家猫是否质数?反正回答都没有意义。此类假问题在社会科学中并不常见。不符合事实的假问题则充斥社会科学领域,如“如何保护大足野人?”就是一个假问题。“乡镇企业发展如何挤占农业发展劳动力”听上去似乎深刻,其实也是一个假问题,因为中国农业劳动力是过剩的。再如,进城农民工是否是造成动荡的“火山”,中国的崛起会不会导致全球粮食短缺,或者威胁世界和平,更显得荒诞。
学术研究特别强调理论意义,即理论缘由(theoretical rationale)。每一个好的经验问题背后,都有一个理论问题,比如中国传统司法制度是否理性,蕴含的问题可能是韦伯对中国法律的理解是否正确?理论问题的水平反映研究者的理论训练和理论修养,决定研究的价值。魏昂德(Walder,1995a)曾提出一个问题:中国的知识精英与政治精英是分裂的还是融合的?对许多中国学者来说,这个问题的答案似乎是秃子头上的虱子——明摆着的。其实这个问题有深远的理论渊源,即新阶级理论。知识分子与官僚的冲突并非中国特色,而是社会主义体制自身的固有矛盾。
理论意义的评价从根本上看是主观的。例如,科学研究本身是否是有意义就很主观,清朝的官僚们曾认为西方的科学技术不过是雕虫小技。那么,谁来对重要性做出评判呢?判断理论意义不仅需要学者的理论功底,并且必须是学术界认可。定义重要概念、提出重要问题要比做回归分析困难得多。对大部分研究者而言,只能通过文献分析来证明自己的研究问题有理论意义。“遛狗”、“交谈中的口误”是不是有意义的研究问题?我的看法无关紧要,但是加芬克尔(Garfinkel)研究过这个问题,加芬克尔乃本土方法论(ethnomethodology)之一代宗师,他感兴趣的问题一定是重要的、值得研究的。又如,倪志伟(Victor Nee)1989年在《美国社会学评论》(American Sociological Review)发表第一篇关于中国市场转型的文章,提出农村改革使普通农民受益更多,干部受益较少命题,并将自己的研究同泽兰尼(Szelenyi)关于匈牙利从再分配机制向市场机会转型的研究联系起来。之后,随着倪志伟学术声望的提高,他只需要从自己以前的研究中提出问题。
借助著名理论可以是追捧,也可以是批判。追捧大理论可以形象地比喻为“傍大款”策略,而批判大理论则被戏称为“稻草人”策略。无论是“傍大款”策略还是“稻草人”策略,都需要扎实的理论基础和实实在在的经验研究,否则就成了追逐时髦的花架子。
应该注意的是,对理论缘由的追逐也可能将研究引向歧途。科学发展史上充斥着基于不当理论范式的“假问题”,比如对“以太”的探索,对炼金术的痴迷。关于中国历史的研究,套用马克思主义历史唯物主义,认为中国从秦汉到明清的历史平行于西欧的封建制,从而引发关于中国的农民与地主之间的个人依附关系的探讨等等。在当代中国研究中,一些西方理论根本不适用,而不适用的理论就会衍生出不恰当的问题。具体科学理论(中层理论)能通过经验研究筛选淘汰,而宏大理论范式即使有误,也不能靠例行经验研究检验来扬弃,只能通过革命性的“解放思想”来击破。例行经验研究绝大多数只在现行理论范式内,谋求证实或证伪具体的理论或经验命题。
研究者的个人动机不能算理论缘由。每个人选某个题目都可能有个人原因,比如,我想研究代沟,因为我跟父母搞不好关系;我要研究婚姻关系,因为找不到男朋友或女朋友;我想研究升迁,因为对自己攀爬社会阶梯的成绩感到洋洋得意;我想研究精神健康,因为觉着自己精神有点不正常;我想研究中国,因为她是我魂牵梦绕的祖国;等等。个人原因本身无可厚非,并且往往是强大动力,使学者对自己的研究满怀热情。但这些个人原因并不适合作为选题的缘由写在文章中。相反,我们在文章中说:“笔者将研究……因为韦伯(或科斯、科尔曼、魏昂德、等等)曾提出……”。
政治意义和意识形态的重要性也不能作为选题的理论缘由。“深远的历史意义和伟大的现实意义”是不算数的。如果一项研究包含政策涵义,当然是好事,政策涵义本身就可以是缘由,但不构成理论缘由。如果想做一流学术研究,则应该找理论缘由。道德关怀对研究而言往往是最浅薄的动机。我想研究腐败,“因为我对中国的道德衰落深感痛心”,这个原因虽然听起来高尚但并不能构成研究的理论缘由。最近,格兰诺维特(Granovetter,2007)撰写 《腐败的社会构造》 一文,客观冷静的分析社会网络和社会规范在权钱交易中的作用,字里行间找不到仇视二字,虽然格氏肯定不是因为对腐败怀有恻隐之心才撰写此文。有时,道德关怀是强有力的研究动因;有时,道德关怀只是表象,真正的原因既不是政治的也不是意识形态的,而是自私、自怜、或自我标榜。
针砭时弊的报纸或搏客文章属于公共社会科学范畴,无可厚非,但不在本文讨论之列。纯政策性研究也不在“洋八股”的范围之内。如果研究的目的是政策评估,或向政府部门提交政策咨询报告,那么写文献综述、证明理论意义就是画蛇添足了。
以下列举几个好问题的范例。
布莱恩·伍兹(Brian Uzzi,1999:482)“研究与企业之间的关系网络如何影响企业贷款成功率和贷款利率”。英格拉姆、罗伯茨(Ingram & Roberts,2000)提问:在悉尼竞争激烈的酒店行业,酒店经理之间的朋友网络是否影响酒店的业绩(入住率、房价等)。周雪光等人(Zhou et al.,2003)探讨中国经济转型过程中,社会网络、交易成本以及产权对公司间契约缔结和执行的影响。这三项研究的问题明确具体,并且都有深刻的理论缘由,根植于“社会嵌入”理论。
蔡丽丽(Tsai,2007)研究中国村落的祠堂、庙会是否对农村公共物品(自来水、学校等)提供产生影响,其理论背景是普特南(Putnam)等政治学家的社会资本理论,即社会网络和民间社团能提高民主政治的效率。蔡丽丽指出,中国村落的宗族和庙会就是社会资本;那么此类民间社团能否帮助村民解决集体行动困境,提高村民对政府的监督能力,改善村政府执政业绩,就成了一个极有理论意义的问题。
魏昂德(Walder,1995b)在《美国社会学杂志》(American Journal of Sociology)撰文,探讨乡镇企业为什么比国有企业发展好。这个问题的重要性在于集体所有的村、镇企业取得成功显然与古典产权理论相悖,所以如何解释这一悖论,就成了经济学和社会学热衷的话题。
马什2000年在《美国社会学杂志》(American Journal of Sociology)撰文探讨:“中国传统的法律系统是否具有实质理性”?这个问题缘于韦伯对中国古代法律系统的判断,认为它完全是非理性的,并因而抑制了理性经济组织的出现。所以这篇文章的理论缘由十分清楚,就是文章的标题:“韦伯对中国传统法律的误解”(Marsh,2000)。
笔者的两篇文章(Peng,2004;彭玉生,2009),分别探讨中国村落的宗族网络对私营企业发展和生育率的影响。这两篇文章讨论问题不同,却有共同的理论缘由,即社会网络与非正式规范之间的关系问题。前者讨论在缺乏正式私产保护法的前提下,宗族网络如何维系农民的私产观念,从而保护私有企业的发展;后者讨论在计划生育的大政策背景下,宗族网络通过维护传统的生育观念,进而提高农村的生育率。
(二)第二股:文献(理论)综述
文献综述指对与中心问题有关的文献进行分析和综合。尤其是对年轻学者而言,这部分往往是研究中最难而且最耗时间的部分。现在国际一流杂志的文章,动辄数十篇甚至上百篇引文,但并非所有引文都与中心问题或中心假设(命题)有关,有时大多是用来引述历史背景(如统计年鉴类),讨论控制变量或技术细节。这类辅助性引文应与核心文献区别对待。下面讨论文献综述,指核心文献。
1、文献综述有三个功用:澄清贡献,提供理论框架,提出理论缘由。
功用一:澄清贡献。经验研究是事实性的,因此应该具有积累性。从哲学意义上讲,所有科学知识都来自经验观察,但并不是所有经验研究都要从零开始。我们不必每项研究都做出开天辟地头一遭的姿态。文献综述能够勾勒出研究领域的前沿阵地,让我们清楚地看到哪些是新观点、新理论、或新资料,哪些是现有的,哪些是我们的新贡献。不同于道德哲学需要天天讲,月月讲(因为永远不能证实),科学发现仅仅需要被提出、证实(或证伪)、验核,之后更多的验证就是重复了,只有教学功用。社会科学当然没有这么简单,需要验证的次数多一些。因此,社会科学研究也需要证明自己有所新贡献,不管是新理论还是新数据。如果学术刊物没有这样的基本要求,要么是“天下文章一大抄”,要么是人人都在“重新发明轮子”。
与著名理论或学说“攀关系”很重要,与前人研究“划清界线”更重要。找出现有文献的空白点或缺陷是一种常见的澄清贡献的途径,但作者必须熟读文献。类似“现有研究都忽略了……” 这样的一棒子打翻一船人的断言,说说容易,证明艰难,往往站不住脚。但如果有根有据,也不失为一种很有效的策略。比如,古德(Gould,1991)认为当前集体行动的文献越来越重视社会网络因素,但由于网络分析都采用个人层面指标,因而不能对网络结构进行操作化。基此,他则以1871年巴黎公社起义为例,从网络结构操作化入手,分析起义者的地域网络如何影响不同市区国民自卫军的参与度,从而加速起义的蔓延,有力地推进了相关研究。再如,英格拉姆、罗伯茨(Ingram & Roberts,2000)认为,尽管许多研究认识到了正式的组织关系对组织行为和业绩的影响,比如连锁董事会、企业与企业间的合资关系、供货关系等,但没有人关注跨组织的私人关系对组织之间互动的作用。他们则藉分析悉尼酒店经理之间的朋友关系网,发现即便是竞争对手之间的私人友谊也有益于酒店盈利,从而拓展了组织关系对组织行为和业绩的影响的研究视野。
不同于自然科学,社会科学的研究和理论到底有多少积累性,很难说得清楚。经济学好一些,从古典理论到新古典经济学,再到新制度主义和信息经济学,继承和积累关系比较清楚。相比之下,社会学的实质理论经常是循环和跟风的,反映出社会学尚没有一个被普遍接受的理论范式来推动中层理论的发展和成熟。社会学还处在“前范式”阶段,还在摸索统一范式。马克思的历史唯物主义和帕森斯的结构功能主义都试图建立统一的理论范式,但都并未成功。理性选择理论很有前途,但距离被普遍接受,尚“路曼曼其修远兮”。缺少统一的理论范式说明社会学还不是以“拼图填空白”为主的规范科学。但话说回来,多种“范式”共存未必是缺陷,也许反映学科的本质特点。对社会学来说,积累方式主要是对前人学术传统的承袭,比如从涂尔干的社会事实到帕森斯的社会系统论,从韦伯的权威分类到本迪克斯(Reinhard Bendix)对传统与现代权威的分析,从马克思的阶级论到赖特(Erik Wright)的阶级分析,等等。
功用二:提供理论框架。科学知识的增长依赖理论的建构和经验证据的积累。没有好的理论,我们积累的只是资料而不是知识。彭加勒(Poincare,1952: 141)曾形象地比喻:“科学是由事实组成的,就像房屋是石头砌成的;但是事实的累积并不等于科学,就像一堆石头不等于房屋一样”。社会科学研究者时常面对浩如烟海的资料不知从何入手。
寻找理论视角是文献综述最重要的功用。理论有时能让我们对习以为常的事实产生新视角,加深对理所当然事件的理解,令人耳目一新。即使研究者面对的是从未观察过的新现象,比如一个新部落社会,理论依然很重要,因为它提供了观察视角。
例1:魏昂德(Walder,1995a)运用新阶级理论(New Class Theory)来分析中国知识分子与官僚之间的冲突。他发现中国的知识精英和政治精英具有不同的筛选标准,享有不同的特权。虽然这个结论对中国学者来说既不新鲜、也不令人兴奋,但魏昂德将其置于新阶级理论的框架之下,从而深化了我们对中国知识分子境遇的理解。知识精英与政治精英之间的冲突并非中国独有,而是社会主义国家的通病。
例2:笔者对中国宗族网络与私营企业关系的分析,理论框架既可以是新制度主义经济学和科尔曼的社会资本理论的整合(Peng,2004),也可以说源于韦伯关于科层化、形式理性化与现代资本主义兴起之关系的理论(Peng,2005)。所以,同一经验问题,可以有不同的理论框架。
当然,研究人员也可以创造自己的理论框架,不必囿于现有理论。本文强调理论框架的重要性,并不倡导对现有理论不加批判地全盘接受。有时用现有理论来解释具体个案会有隔靴搔痒、不着边际之感。但是,即使研究者决定发展新理论,仍然应该对文献认真综述,对现有理论进行批判性的回顾。通过澄清与现有理论的渊源和区别,研究者才能说明自己的创新之处。关于理论创新,容稍后详述。
功用三:提供理论缘由。如果能做到以上两点,理论缘由也就水到渠成了。如果研究者能够在文献中形成自己的问题,并将自己的研究与重要理论联系起来,那么已经证明了研究的意义。
2、什么是好文献综述?
文献综述反映研究者对所研究领域文献的掌握程度和理论思维能力。评价文献综述并没有硬性标准,就像评价艺术品只有指导性原则而没有硬指标一样。笔者在这里只是提出一些“软标准”供参考。
(1)前沿性。文献综述应该关注学术的最新发展,不是为了赶时髦,而是为了防遗漏。
(2)覆盖性。一个好的综述应该涵盖所有重要文献,围绕研究的中心问题,探索方方面面的答案,包括自己不同意的答案。对与自己的假设或发现不一致的文献或理论,尤其不能忽略。首先,只有站在对立面上,才能真正深思熟虑地斟酌自己的观点。其次,如果你能驳倒某个主流的观点或有影响力的理论,那么你的研究将更有分量。再次,对立面的存在至少说明你的结论并非显而易见,琐碎无聊。
(3)相关性。在坚持“全面”原则的同时,我们又不能对所有文献不加选择地包揽。我们只需要回顾与本研究直接相关的、或至少间接相关的文献,避免讨论不相关文献。
(4)分析而不是堆砌文献。罗列文献是初级水平的文献综述,成熟的文献综述要有分析。最重要的分析技巧包括辨识有重要理论贡献的关键文献,依据不同的理论视角将文献进行归类,比较各种观点之间的差异和逻辑关系,并且批判性地评估各种观点的理论价值和经验证据。
(5)连贯性。好的研究综述应该自始至终围绕一条主线,为作者的思路服务,一步一步推演出研究假设。年轻的学者容易被繁琐的文献牵着鼻子走,偏离主题。
3、理论创新
学术贡献有两种方式:理论创新或新证据。就是说,研究者不一定非要创造新理论来对知识积累做出贡献。如果新的经验证据涉及重要而又未被解决的理论争议,那么经验证据本身就十分重要。例如,笔者(Peng,2001)曾在《美国社会学杂志》撰文,比较解释中国集体乡镇企业为何成功的三种理论:非正式私有化、地方国家公司主义、以及市场监督(预算约束)理论,这三种理论分别来自倪志伟(Nee,1992),魏昂德(Walder,1995b)和林毅夫等(Lin et al.,1997)经济学家,并且都是没有经过严格经验证明。这篇文章的贡献就在于为裁判这三种理论提供了比较严格的经验证据。
理论创新当然优胜于简单地综述、解释、甚至拓展他人的理论。真正的理论创新有赖大脑的创造力和对相关文献的深刻理解。但不幸的是,很多“创新”只反映作者的学术自大情结,或者作者对相关文献的无知。对文献掌握不够,对现有成果不知不觉,创新者只是重新发明了轮子而已。
理论创新包括创造新理论或新概念,也包括创意地应用一般理论,扩展或整合现有理论。概念纯粹是人脑的构造,不存在“真实的”概念。概念不能被证实、也不能被证伪,只能根据其解释力来评判其是否有用。定义一个有用的概念需要天才与灵感,最重要的是,需要学术界的认同。科斯提出的“交易成本”概念,科尔奈的“软预算约束”以及黄宗智的“商业化的农业内卷”概念因为具有解释力而得到广泛的使用。创造新概念,一定要慎之又慎。如果大家都去创造新概念、新术语,那么,最后的结果是谁都不知道自己的同行在说什么。
相对而言,理论创新比较容易。科学的理论或假设常常是关于概念之间因果关系或相关关系,比如社会网络与规范控制之间的关系, 人力资本与经济发展之间的关系等等。历史学家关注个案的分类和描述,例如黄宗智(Huang 2008)对传统中国国家政体的“简约集权”描述。
根据波普尔和默顿(Robert Merton)的定义,理论有两种类型:(A)能够被经验资料证实或证伪的科学理论或中层理论,以及(B)不能或无需用经验资料检验的宏大理论(grand theories)。宏大理论的例子包括帕森斯的AGIL模型、马克思的历史唯物主义、新古典经济学的市场理论、博弈论、理性选择理论、以及周易八卦理论。虽然宏大理论也是基于对人的行为和人类社会的观察,但与经验研究联系不大。它们不受时空的限制,具有普遍适用性。有些宏大理论具有普适性,因为是套套逻辑(tautological),自圆其说,永远不会错。宏大理论本来就不打算接受经验资料的检验,而是根据效用来评判:能否充分而又简洁地解释经验现象。
无论与经验研究联系密切与否,理论创新不可能从零开始,它经常以批判地总结前人学术成果为基础,从现有的或普适性理论中获取灵感。用一句套话说,后人是站在前人肩膀上的。
例1:理论创新泰斗之头衔,非科斯莫属,而科斯《社会成本问题》(Coase,1960)一文是在批判继承庇古(Arthur C. Pigou)关于外部不经济和税收理论的基础上,结合一些个案分析,提出了著名的科斯定理:即当交易费用为零时,外部性问题能通过市场交易自动解决;当交易费用不为零时,外部性问题要靠合理的产权配置或政府税收来解决。
例2:黄宗智(Huang,2008)受迈克尔·曼关于(Michael Mann)低基础能力和高专制能力的国家类型的启发,提出“简约集权”的概念。简约集权指一个世袭皇权(高度专制),凌驾于一个简约的官僚机器(的基础能力)之上。这一概念发展补充了韦伯提出的“世袭官僚制”概念。韦伯认识到中国古代国家既有封建世袭的特点,又有理性官僚制的特点,是二者的混合体;而黄宗智则更明确地指出了这种混合体的结构和存在条件。
例3:魏昂德(Walder,1995b)曾在《美国社会学杂志》撰文,从理论上重构科尔奈“公有制经济改革不可能成功”命题。根据匈牙利改革的经验,科尔奈认为软预算约束是公有制无法解决的弊病,因而在公有制体制内国企业改革都是注定要失败的。魏昂德指出,中国集体所有乡镇企业却是一个例外,它们的预算约束是硬的,并且发展胜过国有企业。魏昂德提出地方国家公司主义的概念,将一个地区(村、镇、市)的公有企业视为集团公司,地方政府视为公司的董事会,认为分析公有产权应该考虑整个“公司”的组织特征。村、镇政府较城市政府管辖的“集团公司”规模小,(财政收入)利益更直接,因而有更强的激励和能力来监督来维护其产权。
(三)第三股:假设
假设一般定义为尚未验证或证据不足的命题。本文将假设定义为从文献综述或理论讨论中产生的对经验问题的回答,是文章将要验证但尚未验证的经验命题。假设必须从现有理论或文献、彼此竞争的理论或文献、或学者自己创新的理论中演绎而来。直觉、预感、灵感也许在假设的形成过程中起了至关重要的作用,但此类假设只能称为猜想或工作假设(working hypothesis)。假设并不总是直接了当地表述为“本文的假设是……”。有时,假设出现的形式是“我认为”、“我主张”或是“本文将证明”等等。
在经验研究中,假设是连接理论与经验数据的桥梁。我们的经验资料常常不能够直接检验我们感兴趣的理论,所以需要从理论中演绎出可验证的假设,从而将理论与经验资料间接地联系起来。特别是较具普遍性的理论,难以直接检验,需要一些“中介”命题才能与资料发生关系,这就是假设。理论不一定是可以直接检验的,但假设必须是可以直接检验的。我们通过验证或证伪假设,间接检验理论。
连接理论与假设的过程带有手工艺或艺术的成分,因为无章可循。程序化或形式化艺术创造过程似乎愚不可及,但笔者还是力图概括出一些连接理论与假设的方式与策略。根据理论与假设的密切程度,我分出三种建构假设的方式:直接演绎、间接演绎和应用普适理论。根据假设的数量,又可区分证实单一假设、证伪单一假设和检验竞争假设三种策略。先看假设的构建方式。
1、构建假设的三种方式
方式1:应用普遍理论。研究者经常简单地应用一些一般性的理论概念或者理论框架,这些理论经常是宏大理论或者被广泛接受的理论。有些普遍性理论,比如理性选择理论、博弈论或者交易成本经济学,本身就不是为了被检验,并且也无法检验。但是将它们应用到具体的研究中就能产生可以检验的假设。这一过程遵循演绎逻辑,可以是严谨的演绎,也可以是不严谨的演绎。根据所研究案例的本质和特性,普遍性理论可分枝到不同的方向。演绎链条之所以不严谨,是因为研究者对个案的理解对演绎过程起决定性作用。即便是严谨的演绎,比如经济学的许多搬弄数理的“理论证明”文章,大都有很强的前提条件。
例1:林毅夫(Lin,1991)运用博弈论来解释中国集体农业的失败。他的主要观点是:当集体化运动在1958年变成强制性的,农民被剥夺了退社权,农业合作社就从“重复博弈”变成了“一次博弈”,从而出现普遍的“搭便车”和“偷懒”。尽管博弈论没有被检验,林毅夫的命题是能够被检验的,需要当年合作社和生产队层面的微观资料,特别是退社权或退社行为的纪录,但这样的历史资料大概无法追寻了。学术界对林毅夫命题的热烈讨论基本上限于理论层面。
例2:张维迎(Zhang,1997)关于改革初期国有企业内部人控制和经理专权是“好事”的分析也是制度经济学基本原理的应用。张先设定一个企业利润函数,取决于经理的能力、努力、激励以及企业的基本因素。在政府不可能将剩余控制和剩余索取权完全转给企业内部人的前提下,政府与经理之间的讨价还价模型就是次优方案。这种可以事后还价的承包安排既提高了经理的激励,也在一定程度上硬化了企业的预算约束。该文运用了许多数理演绎。数理演绎本身是不会错的,这类文章结论的对错取决于那些前提条件的对错。数理分析的好处在于其前提条件比较清楚。
例3:李树和(Li,2003)提出了一个比较经济交易的关系治理(relation-based governance)和规则治理(rule-based governance)的理论模型,用来解释日本和东南亚的金融危机。关系治理指交易双方靠互相的信任、声誉和对未来交易的期待来保证交易的完成。规则治理指交易根据非人格的规则(产权法、合同法)进行并由第三方(国家)监管。在小群体情况下,关系治理有其优势,但随着交易圈的扩大,交易数量的增加,需要维持、投资的关系越来越多,边际成本越来越高。相反,正式规则治理对小群体是很不经济的,因为制订规则和筹建中立“第三方”的初始成本极高。但一旦建立之后,正式规则治理的边际成本随交易范围的扩大而减小。所以两种治理方式各有优势,各得其所。最容易发生危机的时间是从关系治理向规则治理的过渡阶段,因为一方面关系治理瓦解,另一方面法制和民主政体的建设不仅成本高昂、并且旷日持久。日本、亚洲四小龙以及后来南亚各国的经济起飞,都是建立在关系治理基础上的,其特点是专制政体直接掌控经济命脉,或者操纵少数的大财团。日本20世纪90年代初、东南亚90年代末的金融危机都发生在这些国家经济自由化之后,即,都在过渡时期栽了跟头。总的说来,李提出的理论模型颇有魅力,简洁而符合常理。但这个模型是没有经验证明的,并且有普适性,西方30年代的大危机也能解释。狄西特(Dixit,2004: 65-95)将李的模型用博弈论数理化,但不改变其实质。
例4:倪志伟(Nee,1992)运用威廉姆森的杂交组织理论来解释中国过渡经济的特点。威廉姆森曾从交易成本的角度详细论述了纯粹自由市场或纯粹科层组织(market or hierarchy)两种极端的经济组织形式。1991年威廉姆森(Williamson,1991)又撰文讨论这两个极端之间的杂交形式,包括各种类型的关系合同,如特许销售、互惠贸易等。杂交形式既保留了市场激励,又利于行政控制,在具有高度不确定性的环境中,以其灵活性和适应性而优于纯市场或纯科层组织形式。倪志伟发挥这个概念,指出中国的乡镇企业和城市集体企业代表一种杂交形式,保持市场和计划的双重特性,最适应过渡经济的不确定性,因此比单纯的私营企业或未改革的国企更有效率。显然,倪志伟创造性地发挥了威廉姆森的概念,因为魏氏的杂交形式概念指企业之间的交易合同,而倪氏的分析焦点是企业与政府之间的关系从纯粹行政命令变为半行政半交易的关系。
例5:周雪光等人(Zhou et al.,2003)应用交易成本经济学来研究中国企业间的合同关系。威廉姆森指出,交易因有限理性和投机行为而成本高昂,人们采取不同的交易方式以降低交易成本。周雪光等人认为,如果中国企业间交易行为遵循交易成本的理论逻辑,那么交易成本因素(如风险、金额)会影响寻求合同伙伴的途径、合同的形式以及在执行合同的过程中社会交往的强度。这些假设能否在经验分析中得到验证与交易成本经济学没有关系,只反映中国经济转型过程中的企业行为特征。
方式2:间接演绎。如果理论A是正确的,那么根据条件、、推导出假设a。如果假设a被证实,则说明理论A与资料是一致的并且可能是真实的。如果假设a被证伪,则理论A也不一定是虚假的,因为任何一个前提条件都可能是错的。但此时研究者可能已经抓住了理论的要害或者揭示出它的限制条件,为理论的修正和重构做好了准备。理论是复杂的系统,如果只是枝末细节的命题被证伪,那么整个理论系统只需要部分地修正或者再给出一些限制的条件,还是依然说得通的。间接演绎与应用大理论的区别在于间接演绎所涉及的理论不具普适性,是可以验证的。
例1:魏昂德(Walder,1995a)撰文《美国社会学评论》(American Sociological Review),分析中国知识分子精英与政治精英之间的分裂,其假设来自对泽兰尼新阶级理论的间接演绎。新阶级理论的核心观点是:社会主义计划经济为知识分子,以及技术精英提供了掌管经济和实现政治抱负的制度基础。计划经济的理论核心是理性计划、科学管理,因而受过正式训练、具备专业知识的专家和技术人员理应掌管国家政权。然而,社会主义革命往往发生在落后国家,而不是资本主义最发达的国家,革命的中坚不是知识分子而是工农大众。所以,第一代官僚阶级往往不是技术精英,而是不懂专业的工农干部,因而不可避免地与知识分子阶层发生冲突。康拉德和泽兰尼(Konrad & Szelenyi,1979)观察到匈牙利在20世纪60年代有大量新生知识分子涌入官僚机构,由此提出知识分子将与官僚集团融为一体而成为新的统治阶级的判断。
魏昂德分析80年代中国天津资料,比较中国知识分子与政治精英的职业路径、收入,以及住房特权,他发现这两类精英群体在诸方面仍然存在显著差异。魏昂德“双重精英”结论看似与泽兰尼在匈牙利观察到的“统一精英”相矛盾,并不证伪泽兰尼的新阶级理论,相反,映证其解释力。中国知识分子的确有很强的参政意识和政治抱负,对工农老干部的统治地位构成威胁。所以,反右运动和文化大革命中“傲慢”的知识分子受到残酷迫害。中国的知识分子队伍弱小而无组织,因而更难以融入权力阶层,裂痕延续到了80年代。安舟(Andreas,2009)最近著书《红色技术官僚的崛起》,对中国知识分子的经历做了精彩分析。
例2:笔者(Peng,2004)根据科尔曼的社会资本理论和诺斯的新制度主义,提出一个理论命题,即社会网络可以通过维持社会规范,影响经济发展。然后从这个理论命题中演绎出宗族网络维持私有产权、孕育私营个体户的假设。但是这个演绎过程长,附加条件多:第一,宗族网络是一种独特的社会关系,是强关系;第二,宗族网络支持农民的私有观念,也支持裙带观念、任人唯亲等不利于私营企业发展的规范。所以,虽然我用统计资料验证了假设,即宗族网络保护了私有企业发展,但并不验证科尔曼命题,即社会关系支持非正式规范,充其量只是增加了后者的可信度。
方式3:直接演绎。如果理论A是正确的,那么假设a就是正确的。这里假设从理论或理论的核心观点中直接演绎出来,不加任何条件。如果假设被经验资料证实,那么理论被验证(不是证实)。如果假设被经验资料证伪,那么理论也被证伪。如果研究假设是理论本身或者理论的核心观点,研究假设不再是理论与资料间的桥梁,因为假设就是理论本身,经验数据直接检验理论。在这种情况下,文章中不一定要单独列出“假设”,而是将其融入理论讨论部分。有时文章依然会明确地列出研究假设,这也仅仅是重述理论的核心观点。一般来说,直接演绎所涉及的“理论”,不是默顿意义上的中层理论。当代西方的社会科学文献中常将具体经验命题或经验模型(如流动表分析和升迁模型)称为理论,我们不妨称之“经验理论”。下面看两个直接检验经验理论的例子。
例1:马什2000年在《美国社会学杂志》(American Journal of Sociology)发表文章,直接检验韦伯关于中国传统的司法体系属于“实质非理性”类型的判断。马什(Marsh,2000: 284-285)从韦伯的著作中直接概括出以下四个假设:
(a) 中国古代执法官的专制权力只受神圣传统的约束。
(b) 中国古代的行政长官和执法官员判案无需依照成文法典,因而司法判决是随意的、不可预期的和武断的。
(c) 家长制衙门雇用饱读经书的通才而没有合格的法律专才。
(d) 在中国古代法律系统中,主观能动性是执法者的特权;涉案人员只是司法过程的被动牺牲品。
这些假设基本涵盖了韦伯对中国古代法律系统的核心观点,因此证伪它们也就证伪了韦伯的观点。其实,黄宗智在《清代的法律实践》一书的结尾,对韦伯的这些命题进行了一一分析和批驳。韦伯(Weber,1951)对中国的研究依靠二手历史资料,翻译谬误甚多,因此对中国的法律系统产生了误解。
例2:作者(Peng,2001)在《中国的村镇工业公司:所有权、公司治理与市场监督》一文,检验三个假设:地方国家公司主义、非正式私有化和市场监督理论。对魏昂德(Walder,1995b)地方国家公司主义的检验,属于严格演绎。魏昂德的核心命题是,村镇工业公司因为规模小,所以监督严,(公有)产权清晰,效益高于城市工业公司。如果正确,那么地方政府“公司”规模越大,效益越差。这个假设是魏昂德核心命题的直接推演,没有附加条件。并且我的数据来自苏南,没有张冠李戴之嫌。证伪这个假设,地方国家公司主义理论就需要重新构建。我的结论是,地方国家公司主义用公司治理分析苏南模式的政企关系是正确的,但错在只关注内部行政控制,忽视外部市场监督。同篇文章对另外两个理论,即非正式私有化和市场监督理论,只是间接演绎出假设,没有严格检验。
表2总结假设连接经验与理论的三种不同方式。这里需要指出两点:第一,检验假设的结果一般在“经验分析”部分(即第七股)讨论;而检验结果的理论含义则留在结论部分(即第八股)讨论。第二,这些逻辑关系成立的前提是资料、测量以及方法都准确无误。社会科学中的经验分析经常不能确切证实或证伪一个假设,可能因为测量不严谨、方法不标准或数据不可靠等等,任何一个环节都可能出问题。
2、验证假设的三种策略
策略1:证实单一假设。采取这种策略的,一般要么证明某著名的、有影响力的现有理论,要么证明自己创新的理论。能为一个有影响的、学术界关心的理论提供经验证据,意义自然重大。检验新鲜的、有争议的理论要比检验陈旧理论更有趣。在现有的理论框架之内,报告新数据、新发现,也属于这一策略。
例1:倪志伟(Nee,1989)20世纪80年代初在福建收集数据,分析农民的收入增长。他援用泽兰尼(Szelenyi,1988)关于东欧市场改革有利于下层老百姓的分析,提出中国的农村改革,特别是包产到户,削弱了干部的再分配特权,并给普通农民创造了通过市场致富的机会;所以,改革对普通农民的收入增长更有利。这个关于农村社会分层的简单命题后来被称为市场转型理论,引起一场长达10多年的学术争论。
例2:本人(Peng,2004)根据科尔曼的社会资本理论和诺斯的新制度主义,提出一个理论命题,即社会网络可以通过维持社会规范,影响经济发展。然后从这个理论命题中演绎出一个假设:中国的宗族网络通过维持农民的私有观念,刺激私营经济的发展。该文集中讨论该单一假设,没有提出竞争假设。虽然韦伯曾经讨论过中国的宗族网络,并认为它阻碍了资本主义在中国的产生,但这篇文章避而不谈韦伯命题,因为科尔曼的社会资本理论和韦伯的理论不属于同一个语境。后来我另写了篇文章(Peng,2005),专门讨论韦伯命题及其争论(见后文)。
策略2:证伪单一假设。采取这种策略,一般是证伪被广泛接受和广泛传播的著名理论,只有证伪这样的理论,证伪才有价值。证伪一个默默无闻的小理论,不会有人在乎。自己创新一个理论然后证伪之,也没有道理,属于瞎折腾。以一个知名学者或理论为靶子,才能有效地吸引人的注意力。这就是所谓“稻草人”战术。“稻草人”战术与前面所讲的“傍大款”战术同工异曲,都能提升自己研究的含金量。但牵强附会地攻击大理论,也是常见的谬误,特别是年轻学者,所谓“初生牛犊不怕虎”。使用“稻草人”战术,一定要言之有理、论之有据。
例1:马什(Marsh,2000)的文章就是这个策略有效性的最好例证。如前所述,韦伯认为中国法律系统是实质非理性的,法官判案不依成文法典,主观武断,带有很大随意性。马什援用黄宗智对清朝法律实践的史料分析,说明韦伯的论断是错误的,提出中国法律系统不具有形式理性,但具有实质理性。其实马仕并没有提供新资料,也没有贡献新理论,文章仍然发表在《美国社会学杂志》(American Journal of Sociology),足见“稻草人”策略之效力。
例2:关于全球化和海外投资,依附理论一直是美国社会学界的主流,其核心命题之一是海外投资对落后国家有害而无益。20世纪90年代初,菲尔堡(Glenn Firebaugh,1992)撰文《美国社会学杂志》(American Journal of Sociology),重新分析了依附理论的经验数据,证明海外投资对国民经济增长有显著正向作用,从而推翻了依附理论的结论,并指出依附理论的结论完全基于对统计指标和统计分析的错误解释。在这篇文章里,费尔堡没有提出备择理论来解释海外投资为什么有利于发展中国家的经济增长,甚至连数据也不是自己的。虽然破而不立,但能够推翻一个影响深远的理论,分量已足够在美国顶尖社会学杂志发表。
策略3:仲裁竞争假设。分歧是社会科学的特点或者至少是现状。社会科学中很少有大家都接受的惟一解释。因此,我们的大部分研究问题可以找到竞争的理论,并从中演绎出竞争假设。裁判竞争假设是一种最稳妥的策略,因为这样做减轻了进行证明的负担。研究者不需要去证明单一理论的绝对真实性,而是扮演裁判的角色,评判哪个假设更加符合资料,哪个理论相对更真实。社会科学各学科理论丛生,争议不断,所以该策略的运用相当普遍。社会学家能做到相对验证,也就满足了。如果能穷尽现有文献对问题所有可能的理论解释,那么这种策略就更加有效。
例1:倪志伟(Nee,1989)分析20世纪80年代福建农民收入资料,提出市场转型理论,认为中国改革更有利于普通农民。此论一出,立刻引起学术界强烈反响,许多学者纷纷提出与之针锋相对的论点,其中以戴慕珍(Jean Oi,1989)最为旗帜鲜明,她认为,基层干部才是农村改革的最大受益者。倪志伟(Nee, 1991)两年后再次撰文《美国社会学评论》(American Sociological Review),操作、对比这两种论点,从中直接演绎出两套对立假设,并用统计分析来判别孰是孰非。
例2:笔者(Peng,2001)从文献中总结了三种解释苏南模型早期成就的理论,即地方国家公司主义、非正式私有化、和市场监督论,并从中演绎出三套假设。通过分析企业层面和村镇层面的资料,笔者发现市场监督论与资料分析的结果最一致。虽然我的资料仅直接检验地方国家公司主义理论,并不直接验证非正式私有化和市场监督论,但因为是比较三种理论,容易说服读者:在现有的解释中,市场监督论相对而言最符合经验证据。
例3:笔者(Peng,2005)继2004年在《美国社会学杂志》(American Journal of Sociology)发表宗族与私营企业一文后,又撰文讨论韦伯(Weber,1951)对中国宗族的分析。韦伯对中国的宗族制度十分感兴趣,多次提到,认为它是阻碍资本主义在中国的罪魁之一。恰巧马丁·怀特于(Whyte,1995,1996)20世纪90年代中连发两篇文章,批评韦伯对中国家族主义传统的批评。所以,我从怀特与韦伯幽灵的争论中,推演出两套对立假设,然后用现代统计数据,证明韦伯的幽灵是错的,怀特的批评是对的。虽然我并没有直接证伪韦伯本人的古老命题,因为韦伯所讨论的宗族组织和今天的宗族网络相去甚远,但至少说明韦伯的命题对今天已经过时。
第三种策略也可以运用“稻草人”战术,即一方面证明自己的理论,另一方面打倒著名理论。与只破不立的单纯“稻草人”策略不同,“稻草人”战术用于第三种策略是“破旧立新”。以下以边燕杰(Bian, 1997)的强关系命题为例。
例4:格兰诺维特(Granovetter,1985)曾提出著名的弱关系假设,大意是美国人找工作更多利用弱关系,因为弱关系往往能带来新信息、新机会,而强关系同质性较高,较少带来有价值的新信息。边燕杰(Bian,1997)分析中国的数据,发现中国人更多利用强关系来找工作,因为对中国人来说,找工作不仅仅需要信息,而且需要人情。以此,边燕杰提出相反的强关系假设。强关系命题的意义在于指出了格氏弱关系假设的限制性条件。
从逻辑上说,任何一个命题都有一个反命题,每一个假设都有竞争假设。证实/证伪了自己的假设,也就证伪/证实了该假设的反命题。但在实际研究中,并不总是存在着支持竞争假设或备择假设的理论,即竞争假设未必有理论意义。如果经验资料证伪我们假设的反命题,并且我们能够找到论战的对手,那么研究就更加有趣。如果反命题没有理论支持,或者其理论牵强无聊,不值得费口舌,那么设置竞争假设也没有意义。反之,如果经验资料证实我们假设的反命题,将反命题转变为竞争假设则需要严谨的理论演绎。。特别需要指出的是,对反命题做特设(ad hoc)解释并不能构成竞争假设,最多只是猜想。
(四)第四股:资料描述
资料部分系描述资料的来源或搜集过程,并向读者解释所用资料可靠性。毋庸赘言,收集数据并不是学术研究的目的,而是手段,基本功。如果有现成二手数据,当然应该充分利用。过去40年,国内外中国研究专家花费了大量人力财力搜集数据,但其中大部分没有得到充分的利用。类似统计局和人口调查局等政府机构也搜集了大量的数据,学者和研究生都可以使用。使用二手资料时,要尽可能详细地交待资料来源,并对资料的可靠性做评估分析。
(五)第五股:概念的测量与操作化
操作化是将概念层次和经验层次联系起来的认识论过程。概念是思维的抽象,不可观察。我们看不到性别,却可以看到男人和女人。我们看不到智商却可以看到IQ分数或学生回答问题的速度。将观察结果分类就是所谓测量,我们只能透过测量间接观察概念。概念的测量结果就是所谓变量。因此,变量具有两个层面的定义:概念层面和操作层面。寻根问底,概念的定义都是同义反复的,循环的,并且不存在惟一正确的概念定义。概念的定义经常镶嵌在理论中,要考虑其在理论中的位置以及与其他概念的关系。
如果从理论演绎出假设是一种艺术,那么从假设到验证的过程则是社会科学之所以被称作“科学”的原因。尽管还存在许多问题,但总的来说,这一过程有比较规范的程序和标准。任何一本本科生的社会学方法教科书,都会讲到关于操作化的三种理论:即古典理论、扎根理论和操作主义(如Bailey,2007,参见图2)。前两种方法都对概念层和观察层进行了区分,坦承二者之间的认识论鸿沟,但在认识过程的先后顺序上截然相反。古典理论从概念层出发,然后设计经验测量。这种理论的关注点是如何保证经验测量准确反映抽象概念,即测量效度问题。扎根理论则认为科学研究应该从经验观察开始,然后过渡到抽象的概念层。操作主义合并概念层和观察层:在经验主义者的世界中只有感官观察,抽象概念不过是概括某一类经验观察的标签。这样,测量效度的问题就不存在了。
三种方法的差异主要是哲学意义上的。扎根理论的贡献在于,它强调研究者不应该把自己的文化规范、价值判断带进对异族文化的研究。这是非常有益的忠告,因为不相关的文化规范和先入为主的概念,经常有意无意地被搬运到不同的文化背景中。所以,扎根理论强调,我们不应从概念、理论出发,而应该从实地经验观察出发,产生概念。在实际研究中,大多数文化人类学家辗转于概念和经验层次之间。
操作主义认为概念仅仅是标签,只要研究者觉得合适,就可以使用任何标签。从哲学意义上讲,这并没有错。但在实践中,研究者经常使用大学者的理论或者概念,所以不得不关心效度问题。如上文所述,概念没有真假之分,只有有用和无用之分。“概念错误”不是概念的定义出现了错误,而是概念的使用出现了问题。例如,如果我们使用科尔曼的社会资本概念,那么就必须保证我们的测量确实指向科尔曼所定义的社会资本,并且被其他研究者所承认。即使我们构造了自己的概念,也需要考虑新概念与现有概念的联系,以及新概念能否在学术共同体中得到传播。
心理学家花费很大功夫建立各种概念的量表,如智商、情商、抑郁症等等。经济学的概念都比较简单明了,所以不大关心测量问题。社会学的概念往往很抽象,少有经过信度检验并被普遍接受的操作定义。职业声望是一例外。布莱洛克(Blalock,1979)认为概念不清晰、定义不精确、测量不严格是社会学理论发展的主要障碍。但是,正如文化比较研究者所尖锐批判的,在不同的文化背景中应用同一种概念的测量是不合适的。例如,在美国,社会网络可能通过观察打保龄球的圈子来测量,而在中国,较好的测量方式则是请客吃饭和礼物的往来。做跨国抽样调查的学者都知道,同一个量表被用于不同文化时需要适当调整。
许多做质性研究的学者,避而不谈操作化,好象这根本不是个问题。实际上,这恰恰是概念化与操作化的一些最基本原则被忽略的地方。定性研究者经常混淆变量概念及取值概念(value concepts),因为定性研究经常研究少量案例并且重视的是每个案例的独特性。因此,一些定性研究者专注于变量的取值,却忽视了抽象的变量。我们常听人说,中国如此特殊以至于西方的理论概念不适用。这话本身没错,但大多数情况是变量本身对中国直接相关,只是取值独特。比如,费孝通先生将中国的人际关系模式描述为“差序格局”,西方是“团体格局”(费孝通,1985)。这里的变量概念是人际关系模式,而“差序格局”和“团体格局”只是这个概念的两个取值。再比如,中国的商业交易严重依赖人际关系和“走后门”,这反映了正式制度的脆弱,而不是正式制度这一概念无用。其实,“关系”操纵也不是中国独有“特色”,只是方式、程度(取值)不同而已。
这一部分不仅要讨论因变量和核心自变量的测量,也要讨论控制变量的测量。许多定量研究者还喜欢在这一部分讨论有关控制变量的文献,如:根据人力资本理论,我们要控制教育水平等。逻辑上说,我觉着控制变量的讨论应该放在下一部分,即统计模型的解释。不过,大家好像觉着在定义变量时讨论它们更简便。并且,许多作者往往顺手把简单描述性统计也放在这一部分。
(六)第六股:方法设计
该股解释资料分析的技术策略。如果研究者所做的是比较案例分析(comparative case analysis),那么需要解释研究设计。如果是统计分析,则要说明统计分析的类型,如OLS线性回归模型、泊松(Poisson)回归模型、多元对数比率(multinomial logit)模型等等,写出回归方程,明确哪些是核心变量,哪些是控制变量。总之,作者需要给出足够的技术细节,这样读者才能清楚地知道分析是如何进行的,并且能够复制分析过程。
虽然本文所讨论的八股格式,主要常见于定量研究,但是定量和定性方法并不互相排斥,而是可以结合起来的。比如现在比较流行的“三点定位”法(triangulation),强调好的研究要理论推理、个案分析和统计验证三结合。简单说来就是,一项研究首先要结合理论演绎和个案归纳推演出假设,然后用统计数据验证之。关于三点定位法,我将另文详述,这里只举两个范例。
例1:蔡丽丽(Tsai,2007)提出的问题是:在正式民主监督体制薄弱的情况下,谁来监督政府对公共物品的提供?她援引政治学中社会资本理论(如Robert Putnam),提出社会网络和非官方社会团体应该能够提高民众对政府的监督能力。然后以中国农村为例,进行了大量实地调查,比较分析了四个不同类型的个案村庄(庙会村、教堂村、单姓村和多姓村),提出与政府具有嵌入性和包容性的社会团体对政府有较高监督能力,进而改善公共物品的提供(比如自来水、道路和学校)。最后蔡丽丽用316个村庄的抽样调查数据做多元回归验证假设。
例2:伍兹(Uzzi,1999)研究嵌入型和疏离型关系网络对中小企业与关系的影响。理论上来说,中小企业的商贷行为,由于缺乏正式信用评级制度,因而更加依赖与之间的信任关系。伍兹通过对芝加哥地区26位信贷经理的深度访谈,提出厂商与之间的私人网络有助于其获得低利率贷款,并且,兼备嵌入型和疏离型关系的网络最为有利的假设。最后,他用严格随机抽样和统计分析验证这些假设。
(七)第七股:经验分析
该股报告分析过程和分析结果,是证实或证伪假设的经验过程。首先,呈现结果,对主要的研究发现进行概括和解释。定量研究一般采用表格的形式,简明扼要。这一部分应紧紧围绕经验发现和假设证实或证伪,理论讨论留到下一节。
(八)第八股: 结论
结论部分有三个任务:(1)概括经验发现,即验证了或证伪了什么假设和回答中心问题;(2)探讨假设的证实或证伪有什么理论含义;(3)如果研究者愿意,还可以做进一步的理论上的推论(新假设)。有些作者还在这一部分总结自己研究的贡献、不足之处,等等。
我个人认为,最重要的是第二个任务,即针对前部分的文献或理论综述来阐明这些经验发现的含义。即使假设不是从理论中严格的演绎出来,研究者依然可以提出一些以后再检验的理论推论和预测。但是,应该尽量避免在结论中大篇幅讨论前面根本没有涉及的新文献或理论。如果研究者想讨论新的文献或者新的理论,那么可以将它们整合进文献综述部分。
二、兼论“洋八股”与本土化
经验研究的核心是理论、假设和数据,余下各部分只是将这三部分有机地连结为一个整体。假设是文章的核心观点。但仅有观点是不够的,观点需要论证才能转化为知识。我们需要提供两种论证:理论论证和经验论证。这是“洋八股”的基本出发点。就其本质而言,“洋八股”是组织研究的一种简约有效方式。将核心观点和发现置于“八股”的结构之中,研究者才能周密、清晰地思考自己的研究和现有文献之间的关系,假设和资料之间的关系等等。同时,也能帮助读者一目了然看清楚这些关系。
必须强调,所谓“洋八股”指的是研究的最终产品的结构,不反映研究过程。研究过程贯穿以上讨论的八个部分,但并没有固定的结构。思维的过程混沌复杂、循环往复。标准的研究方法教科书,如现在流行的巴比(Babbie,2006) 或者20世纪80年代最早引入的贝利(Bailey,2007/1982),不论定性,还是定量,都将研究视为循环往复、持续不断的过程。研究者可能从某个问题出发,对文献或数据做初步分析后发现当初所提出的问题是错误的,又打算换个新问题或采用新的理论视角,等等。再如,有些研究并不一定从问题开始,它可能起始于经验观察,也可能始于理论问题。特别是对研究生来说,他们的研究往往是从数据开始的,从数据中倒腾出一个有趣的结果之后,才开始翻文献、寻找理论解释等等。这都是正常思维过程。不过,当我们撰写研究报告时,没有必要直白地把自己混乱的思维过程一一交代清楚,。“八股”结构是研究者思考后呈现给读者的最终产品。
实践中,已发表文章也不一定机械地分解为八个部分,还是有很强的灵活性和变通的。例如,文献综述和理论建构可以由多个部分组成。假设有时隐含在文献综述和理论建构部分。资料、测量、和方法经常合并为一节。定性研究经常将概念的定义隐含在案例的叙述当中,等等。优秀文章不一定各个部分都优秀。有的文章好在完备的理论论证和创新,经验证据不充分或者根本没有经验证明。比如倪志伟关于杂交组织理论(Nee 1992),魏昂德关于地方国家公司主义(Walder 1995b),两篇文章其实只有问题、理论和假设三部分,除了一些例子之外,并无严格证明,但两篇文章对后来的许多实证研究产生巨大影响。同理,有的文章好在扎实的经验分析或假设检验。还有些经验研究,比如历史叙事,本身就很有意义,生拉硬扯理论,反而弄巧成拙。
“洋八股”结构主要适用于定量经验研究,对质性研究的适用性尚需斟酌。在我看来,大部分用定性个案研究探讨一般理论的文章,严格说来都是“前操作化”分析,即只有问题、理论、假设三股;从案例中总结出来的“发现”严格说来只是新的假设。不过,如果个案研究检验的理论是关于个案本身的理论,比如韦伯关于中国法律制度的论断,此类质性研究也有严格的实证性质,用八股格式未尝不可。
新文化分析学者(new cultural analysts)认为研究应该从经验观察开始,不应该因为一些先入为主的概念、猜想、假设或理论而产生偏见。但我认为这个主要指收集经验资料的过程。这些文化分析者也强调理论框架和理论视角对分析经验资料的重要性(Denzin & Lincoln,1998)。质性研究者也需要做文献回顾,理论分析,从中找出自己的视角,构造分析框架,提出主要观点,然后讨论资料收集方法,分析经验数据。但他们中许多人回避或拒绝“检验假设”和“操作化”之类的科学主义概念,因为逻辑上他们确实没有检验假设,只是提出了假设。
归纳逻辑为辅。波普尔演绎逻辑是科学理论惟一正确的逻辑(Popper,1959)。让我们试想一下反映归纳逻辑的文章结构:(1)提出问题;(2)收集资料;(3)分析资料;(4)用理论解释经验发现;(5)概括新理论。这种归纳过程本身没有错,并且是完整研究过程的重要组成部分,但它反映假设产生过程而不是假设检验过程。许多单纯质性研究其实就是这样的步骤,虽然他们大多不承认或者没有意识到他们所谓结论不过是尚待验证的假设。
但如果社会科学研究都遵循这种路径,则只有假设的产生而没有检验,更谈不上通过学术积累实现理论的建构。社会科学的发展有赖于精确的概念和形式演绎逻辑。理论的逻辑是演绎逻辑。如果没有理论演绎和假设验证,我们永远处于搜集事实、积累假设的阶段。所以“洋八股”将这种结构头尾倒置过来,要求研究者从现有理论中推导出假设,然后验证假设。大部分经验研究是应用或验证现有理论。如果一个研究者从其经验分析中归纳出了一个全新的天才理论,不能从现有理论演绎出来,那么这个事后理论就是个新的假设,需要用不同的数据进行再证实。
作为本文的结束语,我简单探讨一下“洋八股”与本土化的关系。本文提倡“洋八股”,但绝不是提倡全盘引进西方的社会科学的实质理论和概念。我十分赞同实质理论应该具有本土特色。实质性概念和理论的创新应该来源于扎实的经验研究而不是照搬西方理论(黄宗智,2007)。但我认为起码目前没有必要创造新的方法论范式,中国的社会科学研究在现阶段应该遵循“洋八股”这一方法论的范式,理由如下:
第一,本文所讲的“洋八股”,只是形式上的八股,是学术研究的形式主义规范,不是实质理论上的八股。作为形式规范,研究者可以将任何实质性的概念和理论放进去,不论是西方的还是本土的,或者是中西结合的。一方面,本土理论应该立足于对中国现实的切肤而深刻的观察与理解。直接将西方的理论和概念应用于中国现实有时让人觉得隔靴搔痒。在学术研究中,生搬硬套西方理论可能会谬误千里。在实践中,生搬硬套更会产生灾难性的后果,如俄罗斯在后共产主义转型中的“休克疗法”,以及国际货币基金组织对东亚金融危机的处理(Stiglitz,2002)。
第二,笔者认为“洋八股”的应用将切实推进本土社会科学理论的发展。过去20年,中国社会学有了长足进步,对理解中国改革的过程做出了重大贡献。但是许多文章仍然只是简单地报告一些观点或观察、或经验,而没有理论依据或严格的经验支持。国内社会学研究至今没有形成学派或理论流派,我认为主要原因就是学者们不能对他人的研究成果进行很好的综述和辨析。你说你的,我说我的,没有学术争论,更没有积累。如果大家都做规范的学术,那么至少能够增进有益的学术对话,促进本土理论流派的形成。
第三,现有理论失效的地方,是新理论产生的沃土。中国四十年改革经验在许多方面充满了创新性和独特性,新理论、新概念呼之欲出。中国正经历着高速的经济发展和转型的社会变迁。剧烈的社会变迁塑造伟大的社会思想家。中国的改革为中国社会科学研究者创造一流学术成果、为国际学术界做出重要贡献提供了宝贵的机会。这不仅需要对知识孜孜不倦的追求和奉献,也需要遵守国际学术界的标准和模式。做规范研究,写一流文章,中国的社会科学研究才能再向前迈进一大步。
参考文献:
费孝通,1985,《乡土中国》,北京:三联书店。
黄宗智,2007,《连接经验与理论:建立中国的现代学术》,《开放时代》第4期。
林毅夫,1995,《本土化、规范化、国际化:祝贺创刊40周年》,《经济研究》第10期。
林毅夫、蔡昉、李周,1997,《充分信息与国有企业改革》,上海:三联书店、上海人民出版社。
彭玉生,2009,《当正式制度与非正式制度发生冲突:宗族与计划生育》,《社会》第1期。
Andreas, Joel 2009,Rise of the Red Engineers. Palo Alto, CA: Stanford University Press.
Babbie, Earl 2006, The Practice of Social Research, 11th Edtition. Belmount, CA: Wadsworth.
Bailey, Kenneth 2007,Methods of Social Research, 4th Edition. New York: Simon & Schuster, Inc.
Bian, Yanjie 1997,“Bringing Strong Ties Back in: Inderect Ties, Network Bridges, and Job Searches in China.”American Sociological Review 62.
Blalock, Hubert 1979,“Measurement and Conceptualization Problems: The Major Obstacle to Integrating Theory and Research.”American Journal of Sociology 44.
Coase, Ronald 1937,“The Nature of the Firm.”Economica 4(16).
—— 1960,“The Problem of Social Cost.”Journal of Law and Economics 3.
Denzin, Norman K. & Yvonna S. Linclon 1998,The Landscape of Qualitative Research. Thousand Oaks: Sage Publications.
Dixit, Avinash K. 2004,Lawlessness and Economics. Princeton,NJ: Princeton University Press.
Firebaugh, Glenn 1992,“Growth Effect of Foreign and Domestic Investment.”American Journal of Sociology 98(1).
Geertz, Clifford 1973,The Interpretation of Cultures. New York: Basic Books.
Gould, Roger 1991,“Multiple Networks and Mobilization in the Paris Commune, 1971.””American Sociological Review 56(6).
Granovetter, Mark 2007,“The Social Construction of Corruption.”In Victor Nee & Richard Swedberg (ed.),On Capitalism. Stanford, California: Stanford University Press.
—— 1985,Getting a Job: A Study of Contacts and Careers. Chicago: University of Chicago Press.
Huang, Philip C. C. 1996,Civil Justice in China: Representation and Practice in the Qing. Stanford, California: Stanford University Press.
—— 2008,“Centralized Minimalism: Semiformal Governance by Quasi–Officials and Dispute Resolution in China.”Modern China, 34(1).
Ingram, Paul & Peter Roberts 2000,“Friendships Among Competitors in the Sydney Hotel Industry.”American Journal of Sociology 106(2).
Konrad,George & Ivan Szelenyi 1979,The Intellectuals on the Road to Class Power. New York: Harcourt Brace Jovanovich.
Kuhn, Thomas 1970,The Structure of Scientific Revolution (2nd edition). Chicago: The University of Chicago Press.
Li, John Shuhe 2003,“Relation-based Versus Rule-based Governance: an Explanation of the East Asian Miracle and Asian Crisis.”Review of International Economics 11(4).
Lin, Justin 1991,“Collectivization and China’s Agricultural Crisis in 1959-1961.” The Journal of Political Economy 98.
Mann, Michael 1984,“The Autonomous Power of the State.”Archives Europeennes de Sociologies 25.
Marsh, Robert M. 2000,“Weber’s Misunderstanding of Traditional Chinese Law.”American Journal of Sociology 106(2).
Merton, Robert 1968,“On Sociological Theories of the Middle Range.”In Social Theory and Social Structure. by R. Merton,New York: the Free Press
Nee, Victor 1989,“Theory of Market Transition: from Redistribution to Markets in State Socialism.”American Sociological Review 54.
—— 1991,“Between Redistribution and Markets in China.”American Sociological Review 56.
—— 1992,“Organizational Dynamics of Market Transition: Hybrid Forms, Property Rights, and Mixed Economy in China.”Administrative Science Quarterly 37.
Oi, Jean. 1989. State and Peasant in Contemporary China: The Political Economy of Village Government. Berkeley: University of California Press.
Peng, Yusheng 2001,“Chinese Townships and Villages as Industrial Corporations: Ownership,Governance, and Productivity.”American Journal of Sociology 106(5).
—— 2004,“Kinship Networks and Entrepreneurs in China’s Transitional Economy.”American Journal of Sociology 109.
—— 2005,“Lineage Networks, Rural Entrepreneurs, and Max Weber.”Research in the Sociology of Work 15.
Poincare, Henri 1952/1905,Science and Hypothesis. New York: Dover Publications, Inc.
Popper, Karl R. 1963,Conjectures and Refutations. London: Routledge.
—— 2002/1959,The Logic of Scientific Discovery. London: Routledge.
Skocpol, Theda & Margaret Somers 1980,“The Uses of Comparative History in Macrosocial Inquiry.”Journal of Comparative History and Society 22(2).
Stiglitz, Joseph E. 2002,Globalization and Its Discontents. New York: W.W. Norton & Company.
Szelenyi, Ivan 1988,Socialist Entrepreneurs: Embourgeoisement in Rural Hungary. Madison, WI.: University of Wisconsin Press.
Tsai, Lee Lily 2007,“Solidary Groups, Informal Accountability, and Local Public Goods Provision in Rural China.”American Political Science Review 101.
Uzzi, Brian 1999,“Embeddedness in the Making of Financial Capital: How Social Relations and Networks Benefit Firm Seeking Financing.”American Sociological Review 64.
Walder, Andrew G. 1995a,“Career Mobility and the Communist Political Order.”American Sociological Review 60.
—— 1995b,“Local Government as Industrial Firms: An Organizational Analysis of China's Transitional Economy.”American Journal of Sociology 101.
Weber, Max 1951,The Religion of China. New York: Free Press.
Whyte, Martin K. 1995,“The Social Roots of China's Economic Development.”The China Quarterly 144.
—— 1996,“The Chinese Family and Economic Development: Obstacle or Engine?”Economic Development and Cultural Change 45(1).
Williamson, Oliver 1991,“Comparative Economic Organization: The Analysis of Discrete Structural Alternatives.”The Administrative Science Quarterly 36.
Zhang, Weiying 1997, "Decision rights, residual claim and performance: A theory of how the Chinese state enterprise reform works." China Economic Review 8(1).
Zhou, Xueguang 2005,“The Institutional Logic of Occupational Prestige Ranking: Reconceptualization and Reanalyses.” American Journal of Sociology 111(1).
Zhou, Xueguang, Wei Zhao, Qiang Li & He Cai, 2003,“Embeddedness and Contractual Relationships China’s Transitional Economy.”American Sociological Review 68(1).
作者单位:纽约城市大学、上海市高校社会学E-研究院(上海大学)
原文刊载在《社会学研究》 2010年02期
网络资料来自:
http://www.aisixiang.com/data/34374.html