打印

咫尺应须论万里:说电子版《四库全书》

咫尺应须论万里:说电子版《四库全书》

咫尺应须论万里:说电子版《四库全书》

范子烨
象牙塔 2003-10-29 01:52:29 摘自“书同文”公司网页


  
  公元1772年(乾隆三十七年),是中国历史上极不寻常的一年。那一年的正月,皇帝下令在全国征书;次年二月,一大批杰出的学者便正式开始了纂修《四库全书》(以下简称为“《四库》”)的艰巨工作。十年之后,在乾隆四十六年(1781)的十二月,中国人便拥有了一部包罗万象,富兼山海的文化瑰宝。毫无疑问,面对蕴大含深,横无际涯的《四库》,即使我们穷毕生之力,也难以尽窥全豹;不用说一般的读书人,即如晚近的著名学者,以《四库提要辨证》驰誉学林的余嘉锡先生,也未能通读这部我国古代规模最大的丛书。不仅如此,即使我们抱着按图索骥,观澜讨源的目的去查检它,也往往因其浩博而无从下手。因此,每当我在堆满《四库》的书架中间往来穿梭之际,常常会产生入宝山而空回,游翰海而遗珠的感觉,而总不免望洋兴叹。
  人类历史的沧桑巨变,科学技术的日新月异,使人们对文化的渴望,得到前所未有的满足。在《四库》纂成218年以后,也就是公元2000年,在千禧年的曙光普照寰球的时刻,由北京书同文电脑技术开发有限公司(UniHan IT Development Co.,Ltd.)开发制作,由香港迪志文化出版公司和上海人民出版社推出的文渊阁《四库全书》电子版原文及全文检索版终于问世了。这对研究中国传统文化的学者,不啻为一个莫大的福音!
  电子版《四库》的本质在于,它将华夏古国传统的文化载体与当代世界先进的电脑技术珠联璧合,交融无间;换言之,就是将距离甚远,差异极大的两种文化两种文明,完美、和谐,令人不可思议地沟通起来。但是,电子版《四库》并不是《四库》原书的简单而忠实的复制品。相对而言,在电子版《四库》问世之前,《四库》是死的;在电子版《四库》问世之后,《四库》变活了。过去,我们仰望《四库》的苍茫群山,即使想细细地观赏某一簇夺目的林峦,或者涉足某一片峥嵘的岩岫,也是绝难做到的;纵目《四库》的滔滔翰海,即使我们要充分领略几座海岛的旖旎风光,或者耽味它的万状涛澜,也几乎是不可能的。而电子版《四库》的出现,使以往的诸多不可能成为可能。现在,我们借助它强大而完备的检索功能,可以随意掇拾山中的一块卵石,可以尽情把玩海底的一粒细沙。也就是说,电子版《四库》使《四库全书》真正成为可资利用、借鉴和汲取的文化资源,从而实现并升华了原书的价值。譬如,我们想获取与南朝著名诗人徐陵(507-583)及其编纂的著名诗集《玉台新咏》有关的的全部资料,我在电子版《四库》全文版“全文检索”一栏中分别输入与此有关的“徐陵”、“徐孝穆”(徐陵字孝穆)“玉台新咏”、“玉台新咏集”和“玉台集”等五个主题词,便可以迅速地获得五次检索的结果:

   徐 陵,正文939卷(1275个匹配),注文1252卷(4599个匹配)
   徐孝穆,正文62卷(74个匹配),注文20卷(20个匹配)
   玉台新咏,正文190卷(279个匹配),注文288卷(371个匹配)
   玉台新咏集,正文5卷(6个匹配),注文卷15(16个匹配)
   玉台集,正文24卷(30个匹配),注文21卷(28个匹配)

由此我们可以确切地知道,徐陵在《四库》正文中出现的次数是:1275+74=1349次;在《四库》注文中出现的次数是:4599+20=4619次;总计出现1349+4619=5968次。根据以上检索结果,我们可以逐一披览《四库》原文的有关记载,具体方法是用鼠标双击“显示结果”中的“x个匹配”。如果我们将上述五项检索结果的匹配所涉及的原文逐一拷贝下来,编辑为一个文档,那么,一部比较完整的《徐陵研究资料汇编》就辑成了。这部资料可以蕴涵5968条有关徐陵的资料,以及(279+371)+(6+16)+(30+28)=730条有关《玉台新咏》的资料,总共5968+730= 6698条。这些资料分布在939+62+190+5+24=1220卷的《四库》正文和1252+20+288+15+21=1596卷的《四库》注文中。如果不是通过电子版《四库》来检索,如果采取皓首穷经的读书方式来搜寻,任何人也不可能将有关徐陵的学术资料辑录得如此齐全。当然,在《四库》之外可能还有若干关于徐陵的材料。如果我们在利用电子版《四库》的同时,再辅以人工之力,就可以在最大程度上做好有关徐陵的学术资料的搜集工作。不久以前,我曾经根据中国社会科学院文学研究所刘跃进博士的提议,将上述检索过程演示给他看,当时他赞不绝口,推测其中有不少材料可能是自己未曾寓目的。刘先生是研究南北朝文学的专家,而对徐陵和《玉台新咏》尤为究心。再如我个人对《世说新语》的研究。《〈世说新语〉研究》(哈尔滨:黑龙江教育出版社,1998年4月版)作为我的博士论文,也是我花费五年时间精心构撰的一部学术专著。在撰写此书的过程中,我曾经阅读了大量的学术资料。而当我把以下与这部古典名著有关的若干主题词输入电子版《四库》进行检索时,刹那之间所获得的结果真令我吃惊不小:

   世 说,正文1704(2665个匹配),注文2293(6906个匹配)
   世说新语,正文170(235个匹配),注文177(265个匹配)
   世说新书,15正文(20个匹配),注文4(5个匹配)
   刘义庆,正文173(208个匹配),注文226(387个匹配)
   刘 峻,正文153(175个匹配),注文643(1122个匹配)
   刘孝标,正文380(423个匹配),注文320(376个匹配)

这意味着,在《四库》中,有9482条资料与《世说新语》有关(这个统计数字,是我使用“全文检索”的“高级检索”功能,在排除主题词“世说新语”中的“新语”和主题词“世说新书”中的“新书”之后得出的),有595条资料与其编纂者刘义庆(403—444)有关,有2096条资料与其注释者刘孝标有关。我随便对着关于刘义庆的一条原文(属于《四库》注文)点了两下,结果显示出《四库全书》子部类书《初学记》卷十九“郑泥中”条下的一段文字:

  刘义庆《说苑》曰:“郑玄家奴婢皆读书。尝怒,使曳一婢於泥。婢來问曰:‘“胡為乎泥中?”’答曰:‘“薄言往愬,逢彼之怒。”’”

这段文字,我一看就知道属于《世说新语》第四门《文学》第三条。值得注意的是“刘义庆说苑”的提法。过去,香港著名学者杨勇先生曾经指出《世说新语》有一个别名,叫做“刘义庆说苑”(《<世说新语>“书名”“卷帙”“版本”考》,《东方学报》,1970)。原来竟然出自《初学记》!尽管我对检索到的有关《世说新语》的资料,还没有来得及细看,但我猜想其中绝大部分可能都是我未曾见过的。由此我想到,我们可以利用电子版《四库》编纂一系列富有学术价值的索引,诸如《四库全书魏晋南北朝作家作品资料综合索引》《四库全书隋唐五代作家作品资料综合索引》以及《四库全书宋代作家作品资料综合索引》等等。而这些工作,都不是我们在有限的人生中,凭借人工搜寻之力所能够完成的。当然,类似的有关中国传统文、史、哲的工具书,我们都可以通过电子版《四库》来编纂。只要我们需要,就可以编,而且易如反掌。
  电子版《四库》的强大检索功能,对研究语言的学者是特别有用的。尽管我对中国传统的语言学并不谙熟,但是,我可以这样讲,在电子版《四库》问世以后,国内外通行的有关汉语语词的一切工具书,可能都需要进行程度不同的修改和订正。这绝不是危言耸听,也绝不是夸大其辞。因为电子版《四库》为我们提供了当今世界上最为丰富的数字化形式的汉语语料库,而这是在传统的工作模式下,任何语言学家也不能构建出来的。因此,电子版《四库》也就为语言学研究提供了一个异常丰富的的语料源泉,人们可以在其中轻轻松松地检索到自己所需要的东西。基于这种认识,我们对现行工具书的各个词条、义项和语例进行考察,可以发现其中存在着相当多的缺陷乃至讹误。不仅如此。电子版《四库》还为我们检索某些语词提供了纵向的历史线索和横向的当代线索。借助于它的强大检索功能,我们可以迅速地捕捉到任何一个语词在汉语当中的嬗变轨迹。过去清朝人编《康熙字典》,在列举某一义项的义例的时候,都是按照各个义例所取材典籍的时代先后排列的。这为研究者提供了极大的方便。但是,《康熙字典》摄取的义例,并不完整,也不尽妥当。现在,我们通过电子版《四库》,就可以更为出色地完成这项工作了。不过,编纂《康熙字典》的那些硕学鸿儒,他们的学问可真是太大了,正如同后来纂辑《四库》的几百位编修一样,其笔参造化之力,学究天人之功,在中国文化史上恐怕要永付阙如了。我们不得不对他们表示由衷的钦佩和永恒的景仰。而在我们追溯先贤的伟业感到万分惭愧的同时,我们也特别感到欣慰,因为我们拥有了电子版《四库》,我们可以做前人想做而未能做,前人想做好而未能做好的事情。
  利用电子版《四库》,我们确实可以完成单纯凭借人工之力所不能完成的学术课题。譬如,我们想对古人的“梦”进行研究。“庄生晓梦迷蝴蝶,望帝春心托杜鹃。”(李商隐《锦瑟》)中国人做梦做了几千年,中华民族也是一个非常富于梦想的民族。如果我们通过对古人所做过的形形色色的梦的考察,来研究梦与现实、社会、人生以及思想等方面的关系,不仅有价值,而且有趣味。如果我们能够撰写出《中国梦典》或者《华夏之梦的解析》之类的书,不是很有意义么?但材料那里去找?关于梦的记载,我想《四库全书》肯定是非常全的。我试将“梦”这一主题词输入电子版《四库》,短短的40秒过后,就获得了如下检索结果:

    正文33844条,158341个匹配
    注文8141条,36767个匹配

于是,关于华夏先人之梦的原始材料就基本上被囊括进来了。试想,如果不是通过电子版《四库》,如果仅仅凭借手工作坊式的搜集,那么,完成这样一个学术课题,几乎是不可能的。
  确实,对于研究中国文化的人来说,材料,特别是第一手材料是至关重要的。实际上,就国学研究而言,学术上的突破,往往依赖于新材料的发现。从敦煌遗书到近年来的考古发掘,都足以说明这一点。但是,新材料有两种,一种是从来没有的材料而突然出现了,一种是已经有的而不为我们所知晓所掌握的。譬如,我们对中国文学史的研究,关于明清时代的小说家的材料最为稀少。在这方面,即使发现一条新材料,也是极为宝贵的。我试将与明清时代的一些著名小说家(主要是一些大家)有关的若干主题词(姓名、字号)输入电子版《四库》,获得的检索结果是:

   1.罗贯中,正文5条,5个匹配;注文,1条,1个匹配
   2.施耐庵,正文3条,3个匹配;注文,0条,0个匹配
   3.吴承恩(约1500—约1582),正文16条,16个匹配;注文,2条,2个匹配
   4.李 渔(1610—1680),正文15条,16个匹配;注文,2条,2个匹配
    李笠翁(李渔字),正文2条,2个匹配;注文,0条,0个匹配
   5.吴敬梓(1701—1754),正文0条,0个匹配;注文,0条,0个匹配

所得虽不甚丰,但其中是否有我们所不知道的东西呢?我们试对《四库》正文与罗贯中有关的五条材料逐一进行观察。第一条见于《西湖游览志余》卷二十五:

  钱塘罗贯中本者,南宋时人,编撰小说数十种。而《水浒传》叙宋江等事,奸盗脱骗,机械甚详,然变诈百端,坏人心术,其子孙三代皆哑。天道好还之报如此。

案《四库全书总目》:“《西湖游览志》,二十四卷,《志余》二十六卷,明田汝成撰。”第二条见于《增补武林旧事》卷八,文字与上文完全相同,末题曰《西湖志》,显然是《西湖游览志余》的原文照录。而《西湖游览志余》的记载又大体上为明代嘉靖末期的王圻所遵循:

  《水浒传》罗贯著。贯,字本中,杭州人。编撰小说数十种,而《水浒传》叙述宋江事,奸盗脱骗机械甚详。然变诈百端,坏人心术。说者谓子孙三代皆哑。天道好还之报如此。(《续文献通考》卷一七七《经籍考》)

可见《西湖游览志余》关于罗贯中是南宋人的说法是值得重视的。第三条见于明胡应麟《少室山房笔丛正集》卷二十五:

  世所传《宣和遗事》极鄙俚,然亦是胜国时闾阎俗说。中有南儒及省元等字面,又所记宋江三十六人,卢俊义作李俊义,杨雄作王雄,关胜作关必胜,自余俱小不同。并花石纲等事,皆似是《水浒》事本。倘出《水浒》,后必不更创新名。又郎瑛《类稿》记《点鬼簿》中亦具有诸人事迹,是元人钟继先所编,然则施氏此书所谓三十六人者,大概各本前人,独此外则附会耳。郎谓此书及《三国》并罗贯中撰,大谬。二书浅深工拙,若霄壤之悬,讵有出一手理。世传施号耐菴,名字竟不可考。友人王承父尝戏谓是编《南华》《太史》合成,余以非猾胥之魁,則剧盗之靡耳。

此文下有注曰:“施某事见田叔禾《西湖志余》。”(案:田汝成,字叔禾)第四条见于《文章辨体汇选》卷三百二十七王思任《批点玉茗堂牡丹亭词序》:

  火可画,风不可描;水可镂,空不可干。盖神君气母,别有追似之手,庸工不与耳。古今高才,莫高于《易》。《易》者,象也;象也者,像也。其次则五经递广之,此外能言其所像,人亦不多。左丘明,宋玉,蒙庄,司马子长,陶渊明,老杜,大苏,罗贯中,王实甫,我明王元美,徐文长,汤若士而已。若士时文既绝,古文词诗歌尺牍,玄贵浩鲜,妙处夥颐,然稟胎江右,开乳六朝……

度其文意,王思任大概也认为罗贯中是南宋人。这种说法,与现在通行的罗氏生活于元末明初之说相差一百多年。实际上,关于罗贯中的生平情况,人们掌握的材料是很少的。明嘉靖间人郎瑛所撰《七修类稿》卷二三“三国宋江演义”条说:

  《三国》、《宋江》二书,乃杭人罗本贯中所编。予意旧必有本,故曰编。《宋江》又曰钱塘施耐庵的本。昨于旧书肆中得抄本《录鬼簿》,乃元大梁钟继先作,载元、宋传记之名,而于二书之事尤多。据此尤见原亦有迹,因而增益编成之耳。

我们再看《辞海》“罗贯中”条的解释:

  元末明初小说家。名本,号湖海散人,山西太原人。一说东平(今属山东)人,也有说钱塘(今浙江杭州)或庐陵(今江西吉安)人。……《水浒传》一书,有说是施作罗编(高儒《百川书志》),也有说是罗所著(王圻《续文献通考》)。其生平事迹,旧籍记载既少,且多参差。明贾仲明《录鬼簿续编》所记,较为可信。(页1894,缩印本,上海辞书出版社,1989)

贾仲名所著《录鬼簿续编》的原文是:

  罗贯中,太原人,号湖海散人。与人寡合。乐府隐语,极为清新。与余为忘年交,遭时多故,天各一方。至正甲辰复会,别后又六十余年,竟不知所终。

这段记述,现在被人们当作有关罗贯中生平情况的最为可靠的资料。元至正甲辰,即二十四年(1364年)。贾仲名《录鬼簿续编》作于明永乐二十年(1422年),故称“别后又六十余年”。后人据此推知罗贯中的活动时间大约在元天历(1328-1330年)到明永乐(1402-1424年)之间。这种分析是不无道理的。第五条见于《御定曲谱》卷三:

《驻马听》 罗贯中《风云会》

  黄道烟迷韵 瑞霭盤旋飞凤椅韵 紫垣风细韵 御香缭绕衮龙衣韵 近宫墙杨柳拂旌韵 傍雕阑花萼迎环珮韵 行大礼这的是韵 太平天子朝元日韵

此文下题云:“旧谱云无名氏,今考元人《百种曲》及《酹江集》云罗贯中作。傍字应去声。”据此,《驻马听》当系罗贯中创作的一篇散曲。这可能是我们尚不知道的罗氏的一篇佚文。《御定曲谱》为清人王奕清所编。《四库全书总目》:“康熙五十四年,王奕清等既奉勅编次《词谱》,爰别为《曲谱》十四卷,相辅以行。”

  考证罗贯中生活的确切时代,判断其已经亡佚了的作品,都是非常重大需要谨慎对待的学术问题,我们当然不能依据《西湖游览志余》等书的几条新鲜材料草率立论。但这些材料毕竟提供了不为学术界所稔知的东西,我们应该给予高度重视。也就是说,借助于电子版《四库》的强大检索功能,我发现了三条关于罗贯中的新材料,其中可能还包括罗氏的一篇佚文。至于其他作家的有关材料,我没有一一去查看,但我相信,其中或许就有若干不为人知的记载。我之所以如是说,原因很简单,正如我在本文开始时所指出的那样,任何人也没有通读过《四库》。既然如此,其中就必然存在着许多人迹罕至的死角。而在这些死角当中,堆放着许多有价值的对我们来说是虽老而犹新的东西。
  以上所言,只不过是想表明电子版《四库》在学术研究方面的重要作用和特殊意义。而这一技术含量极高的软件工具的价值,应该是随着时间的推移而不断增加的。随着电子版《四库》在学术界的普及(目前,书同文公司已经开始在网上运行电子版《四库》了,大家可以通过访问http://skqs.unihan.com.cn,来浏览、查询),它的重要性会被越来越多的学者所认识。
  需要略作说明的是,就规模而言,电子版《四库》的“体积”比《四库》原书要小得多:它只有一百八十多张光盘,而《四库》原书所负载的中国文化的浩浩洪波,华夏文明的云兴霞蔚,却被细大不捐地悉数纳入了。“尤工远势古莫比,咫尺应须论万里。”(杜甫《戏题王宰画山水图歌》)我们不妨借用老杜那如椽诗笔所创造的这种雄浑而深远的意境来形容它的美。这种美是来之不易的。作为中国古代文化的研究者和电子版《四库》后期制作工作的参与者,我亲眼目睹了也充分领略了《四库全书》电子版工程技术总监张轴材先生及其所领导的全体员工为完成这一浩大工程所付出的艰辛劳动。而当我在小小的电脑显示器前面对这部皇皇巨秩时,更是心游万仞,浮想联翩。激动之余,谨以拙文聊书所感,期能唤起国内外同行专家的关注。

编辑:陈爽

TOP