与考究新生态,民间文化艺术商量中考据方法的应用与策略

“大数据”如今已渗透到人类生活的方方面面。随着各种数据库的大量出现,传统文史研究也发生了变化。近年来,与“e考据”和“数字人文”相关的研究日趋增多,因此,进一步探索如何更切实地将理论、方法与研究实践有机结合,就变得十分重要。

在信息技术日益普及和发达的时代,计算机具有很强的检索功能已人所共知并普遍加以利用,但是,计算机还能如何深度开发,进一步为我们传统学术研究服务,依然为学术界广泛关注。为此,本刊特约几位专家,围绕这些问题发表高见,以飨读者。

内容摘要:互联网时代的历史学,正在发生一场深刻的变革。当代史学已经呈现出三种清晰可见的史学研究形态,即传统史学研究形态,新史学研究形态,扭曲的史学研究形态。互联网时代的史学变革,最主要的表现是:由事实性史学向思想性史学转变,由知识性史学向问题性史学转变,历史贯通性研究日益发展。这场史学变革,要求史学研究工作者比以往任何时候都要更加重视历史学专业基础训练;比以往任何时候都更加重视提升自己的史学理论水平;重视关键词合理设置的极端重要性;重视选题问题,把提出问题看作是实现自身价值的最重要的标志。新史学时代对史学基础的重视,对提升理论水平的要求,对问题意识极端重要性的强调,将会使未来的史学更深刻,更诱人,更繁荣!


要:考据作为中国本土的一种注重客观实证的学术研究方法,也是民间文学研究的基本范式之一,是早期的民间文学学者常用的技术手段。钟敬文先生凭借其深厚的古典文献功底,在马克思辩证唯物主义思想的指导下,将考据方法广泛运用于中国民间叙事的研究,取得了一系列重要学术成果。就这一学术范式进行专门讨论,对民间文学研究仍有借鉴意义。

扬弃既有研究成果


关键词:互联网时代;史学变革;史学研究形态;思想性史学;问题性史学

关键词:民间文学研究;考据;钟敬文;运用

大数据时代对传统文史研究产生的影响,首先表现在资料上。近些年新推出的电子资源在内容上甚至有超越传统出版物之势,检索的快捷性和精确度,可以令学者省却翻检群书、游历访书之劳。在这样的学术环境下,探讨某些疑难问题可能只需简单检索,许多“悬案”的解决难度也相应大幅度降低。前人因资料局限而不得不大量运用的“理校”“推论”“悟证”诸方法,在大数据时代无疑要重新进行扬弃。

技术与心智的互补建立在计算机检索基础之上的古典文学研究

作者简介:

作者简介:陈祖英,北京师范大学文学院博士研究生。万建中,北京师范大学文学院教授

与考究新生态,民间文化艺术商量中考据方法的应用与策略。在学术史研究中,清人往往因所见善本不丰而大量运用“理校”法展开研究,其中有的结论或与善本相合或遭善本否定。今人既然已经能够在研究中大量占有善本供校勘,那么这种研究方法虽仍有学习的必要,但其实用性也难免会打些折扣。大量新材料理应引发大量新结论,一些“常识”或“定论”必然也会随之遭到质疑甚至颠覆,这对于现有的研究自然会有相当明显的刺激作用。近年来学界对于近代学人的成就时有争论,原因之一就在于当时学者以一人之力所做的资料性工作,精度和效率都很容易被数据库所超越。不少在民国时期“古史辨”中几乎成为公认的定论,随着出土文献的发现而被推翻(典型的例子如对《孙子兵法》的辨伪),足见新材料在某些研究领域确实处于相当核心的地位。

郑永晓 (中国社会科学院文学研究所)

内容提要:互联网时代的历史学,正在发生一场深刻的变革。当代史学已经呈现出三种清晰可见的史学研究形态,即传统史学研究形态,新史学研究形态,扭曲的史学研究形态。互联网时代的史学变革,最主要的表现是:由事实性史学向思想性史学转变,由知识性史学向问题性史学转变,历史贯通性研究日益发展。这场史学变革,要求史学研究工作者比以往任何时候都要更加重视历史学专业基础训练;比以往任何时候都更加重视提升自己的史学理论水平;重视关键词合理设置的极端重要性;重视选题问题,把提出问题看作是实现自身价值的最重要的标志。新史学时代对史学基础的重视,对提升理论水平的要求,对问题意识极端重要性的强调,将会使未来的史学更深刻,更诱人,更繁荣!


通过数据库重新打捞那些以往不被关注的文献,这实际上仍是发现新材料,其性质与考古相似,亦可称之为当下的“预流之学”(陈寅恪:《敦煌劫余录序》)。与此相关的一个问题是,在超过120亿字的可检索的古典文本,以及各种不同类型的数据库中,还蕴藏无限问题可供发掘。而这些数据资源能否被学者使用,很大程度上取决于其所在单位购买的数据库数量。在高校间已有明显“数位落差”的现实条件下,学者个人的学术水准有可能受到所处文献环境的制约,而不同文献环境导致的信息素养的差异可能会进一步拉大这一差距。

  陈寅恪先生在《王静安先生遗书序》中,归纳王国维的治学方法有三:一曰取地下之实物与纸上之遗文互相释证;二曰取异族之故书与吾国之旧籍互相补证;三曰取外来之观念与固有之材料互相参证。(《金明馆丛稿二编》第247页。三联书店2001年出版)这些方法代表了上个世纪之初最先进的治学理念,即使放在今天来看也仍然具有不可忽视的意义。然而,时代在发展,在改革开发三十年,二十一世纪的第一个十年所剩时日也已不多的今天,我们反思并总结当代学界在古典文学研究方面的成就和缺憾,就会发现,自上个世纪八十年代以来尽管我们不停地尝试运用各种方法,但对当代古典文学研究影响最大的则是以计算机和网络为核心的IT(Information
Technology,即信息技术)技术。

  关 键 词:互联网时代 史学变革 史学研究形态 思想性史学 问题性史学

  提到考据,大家首先想到的可能是古籍整理、史实辨伪之类的校勘、辑佚等工作,感觉这与民间文学研究好像没多大关系?其实不然,回顾上个世纪20、30年代,茅盾、闻一多、顾颉刚等主要就是运用考据的方法研究民间文学的。那么在科技信息时代,网络如此发达,民间文学研究还需要考据吗?回答是肯定的。虽说网络便捷了,人人都可以将收集到的民间文学传到网上并向所有人开放,但有的民间文学作品上传后即遭遇节录、分割、删削的命运;虽说网络发达了,但鱼龙混杂的民间文学作品更让人眼花缭乱了。哪怕通过现代拍摄录像技术将民间文学的表演过程全程拍录,也会因文字表达与理解不同而产生异文,可见,即使是研究当代的民间文学,也同样离不开考据。那么,在民间文学研究中到底该如何运用考据方法呢?除了顾颉刚对孟姜女故事的考据研究模式外,钟敬文先生的民间文学研究论文同样提供了很好的学习范例。本文拟以钟先生的民间文学研究为例,对考据方法在民间文学研究中的运用做一点尝试性的探讨。

数据库大量涌现,学术评判标准也会发生变化。出于“功利”眼光计算,当代学者费尽周折的考据工作,很可能被下一代学者轻易解决。其原因并非人的智力、才能有别,而是文献环境不断变化提供的巨大方便使然。一代有一代之学术,面对不同的环境,学术范式也应随之转移。所以,当下正是海量文献可供使用、可以大有作为的时代,也是考据研究缺乏亮点而趋于同质化的时代。换言之,即使是在数据仍未被充分电子化的当下,考据研究的合法性也正在受到冲击。一般性的文献挖掘仍然重要,但能够解决核心学术问题的研究更为重要。

  之所以这样说,是因为看似与古典文学研究这样的传统人文学科毫无关系的IT技术,对古典文学研究的影响已经渗透进这一学科的方方面面,这种影响不仅表现在文献的检索和资料的整理有了远超以往任何历史时期的便捷和准确,而且随着技术的不断发展,计算机所承担的工作将会逐步代替人所从事的部分工作,技术与心智的分野在部分领域将不再那样截然分明。

  作者简介:李振宏,河南大学黄河文明协同创新中心、史学理论与史学史研究所教授。河南
开封 475001

  一、早期民间文学研究的考据范式

引发学术伦理讨论

  古典文学、包括与文学相关的历史文献的研究,所涉及的层面和研究范围相当广泛。如果我们做一个粗浅的区分,则大致可分为三个层面:其一为文献整理,包括大型文献总集的编纂、别集的整理等,涉及版本校勘、文献标点、作品辑佚等工作。在古籍数字化的数量和质量日益提高的今天,计算机在文献整理方面的优势正表现得淋漓尽致。例如,使用计算机的检索功能,可有效避免影响大型文献总集编纂质量的重收、误收问题,这一点在北京大学中文系开发的全宋诗电子分析系统中得到了很好的验证。又如,首都师范大学中国传统文化数字化中心进行的古典小说版本比对方面的研究,也很有启发意义。伴随越来越多的古籍被数字化,计算机在文献整理方面的优势将尽显无遗。建立在准确、快速、高效、智能基础上的计算机检索系统,可以帮助我们在古籍文献的整理方面大幅提高工作效率和工作水平。

  两年前,《史学月刊》曾经编发过一组题为《计算机技术与史学研究形态》的笔谈文章,我在给这组文章写的“编者按”中说:“最近30年来,随着计算机技术的广泛应用以及在人文社科研究领域的普及,学术研究的路径、手段以至研究形态,都在发生着深刻的变化,一向被认为是最古老最传统的历史学科也不例外。如今的历史学研究,不光是搜集资料的方式或手段由于电子文献检索的推广而变得极为便捷,以往竭泽而渔、将材料一网打尽的梦想轻而易举地变为现实,而且数据库方法也渗透到逻辑分析的领域,影响到学者思维方式的改变。古老的历史学科,似乎正在展开一个学术科学化的发展方向。但也不容否认,计算机技术的应用也带来不少新的问题,诸如以材料检索代替读书的便捷路径是否可靠,读书与检索的关系如何处理,数据分析与逻辑分析、历史分析的关系,如何看待数据库方法的局限性,在数据库方法日益推广的条件下理论思维的价值和意义,如何估价计算机技术带来的研究形态的变化,在新的科研条件下新一代史学研究人才如何培养,等等,都是需要认真面对和慎重思考的问题。”①所以会组织这样一组笔谈文章,就是我们深深地感受到了在计算机网络技术日益普及的今天,传统历史学正在发生着一场深刻的变革,如何正确地面对这场变革,是当代史学发展需要回答的一个重要问题②。

  考据,又叫考证、考核、考订等,是一种绵延中国近三千年的传统学术思想与方法。考据源于对古代文献的疑问,早在春秋战国时期就已萌芽。自汉以来,考据作为学者所普遍使用的一种整理文献的技能或方法,发展到清代乾嘉时期达到顶峰,并形成乾嘉学派。鸦片战争以后,在西方文化的冲击和影响下,考据方法呈现新的变化,有学者以王国维提出二重证据法为标志,将考据学分为传统考据学和新考据学。传统考据学以校勘、辑佚、辨伪、版本、注释、笺证为其基本方法,以文献的语言与事实为基本对象,其学风本质特点就是实事求是。新考据学受西学东渐影响,扩大考据范围,方法多有创新,除实事求是这一根本特点之外,还有考古学与文献学的综合研究,文献与文化、社会的综合研究,不同学科之间比较互证的三个特点。[1]20世纪初期,随着马克思主义传入中国,考据学与唯物史观结合,使考据方法有了辩证法的指导。而现代科技的广泛运用尤其是网络和电子资料库的普及,更是为考据提供了许多新的可能,台湾黄一农教授就提出e-考据学派的时代或已出现![2]由是观之,作为学术研究操作方法的考据,是随着时代的发展而发展的。考据本身也从为经学服务发展到为史学服务,再到为文学乃至几乎所有的传统学科服务,成为了一切学问的基础。

在电子检索受到学界瞩目的同时,一些批评尤其是对于学术伦理的讨论也随之热门起来。电子检索的高效快捷,令不少学者担忧其可能引发更严重的学术不端。比如,有的研究者可能对相关领域了解有限,但在检索工具的助力下仍敢匆匆上马,轻易立说;有的研究者征引繁复,可谓博瞻,但实际上许多材料是脱离语境的“遥读”,经不起细加辨析;有的研究者过于迷信电子文本的全面性,但却因此而忽略了那些未被电子化的文献;有些电子文本存在错误,研究者未核查原书导致误引误断;等等。

  我们以整理某个作家别集为例对此略作说明。别集的笺注、辑佚等整理工作,历来是古籍整理中除大型总集编纂之外的重点,清人以其广博的学识和严谨求实的治学精神,在别集的整理方面为后人树立了良好典范,其对李白、杜甫、苏轼等很多作家文集的整理具有集大成的特点,至今仍是我们阅读学习这些经典作家作品的必备版本之一。但是,清人的博学和严谨在今天的计算机时代便不再具有任何优势,因为计算机进行简单检索即可准确罗列出更多的有助于解释某个词语或典故出处的文献资料。这已是目前尽人皆知的事实,毋庸笔者赘言。笔者需要说明的是,如果有足够多的数字化文献支持,计算机这种建立在准确检索基础之上的诸多功能可以在古籍整理方面发挥得淋漓尽致,绝非仅仅限于简单地帮助学者查找某个词汇的原始出处。我们知道,整理一部作家文集无非需要这样几个步骤:一、确定一个优良版本作为底本。二、确定几个参校本以与底本进行比勘。三、从各类总集、类书、方志、他人文集等文献中辑出该作家的逸作。这其间又会遇到该作家的作品被他人文集误收或同一作品收录于多种文集,署名无法判断等问题。五、为该文集所收作品进行笺注。在这几种工作中,确定底本的工作必需由人进行,但在无法判断何种版本更为优秀的情况下,由计算机提取所有版本中的部分词汇进行比对,看看哪种更为合适也不失为一个有效的辅助方法。比如,古人刻书时有因字型相近而致亥豕鲁鱼相混淆的现象,如将舆、
與相混而致讹误,我们完全可以利用计算机将这些字从各个版本中提取出来,比对一下哪个版本错误率更低,从而在确定底本方面多一个可靠的参照系数。将参校本与底本进行校勘的工作基本上可以由计算机单独完成。由于计算机可以按照相关指令对数据进行任意排列,可以按照整篇、整句或逐字比对,所以,不论是分体编的文集抑或是编年体的文集均可交由计算机进行比勘。辑佚工作可以由计算机在广泛的古籍数据库中进行检索,提取出最大限度的备选作品,包括那些同一作品有不同署名的案例,计算机都会为我们提交一份经过比对处理而只等最后判断的清单。这不仅使我们能够搜罗到前人因见闻所限有可能忽略的作品,可以避免因见闻不广导致的各种遗憾,工作的繁杂程度和工作量也大为降低。至于为作品进行笺注等方面的工作,则可以由计算机根据事先建立的典故、词语、人名、地名等专有数据库对所处理的对象进行分析,并将分析结果按照设定的格式罗列在被笺注作品之下。事实上,这样的工作方式在某种意义上还是按照传统阅读方式所作的处理。在互联网已经进入Web2.0时代的今天,由于Wiki(源于夏威夷语Wee
Kee,原意为快点,现用以表示一种支持面向社群的协作式写作的超文本系统,主要用以构建开放式的百科全书)等技术的运用,计算机可以随时根据阅读需要从相关典故、词语等数据库中提取相关数据对文本进行即时性解释,而无需事先进行笺注。

  关于这场史学变革,人们都惊呼进入了一个新的学术时代,并对之有各种称谓,诸如数字化时代、数据库时代、计算机时代、互联网时代、信息化时代,等等。总之,这是一个电子、信息、人工智能越来越深化发展,越来越改变着人们的生活方式、思维方式并影响到学术研究形态深刻变化的时代。本文将直面这个学术时代的种种变化,以期为我们更好地应对这场变革提供一些初步的思考,希望听到学界同人校正和批评的声音。

  翻开中国现代民间文学学术史,其发轫之初就与考据关系密切。比如民间传说研究的兴起缘于顾颉刚关于孟姜女故事演变的研究,他用考据的方法对孟姜女传说进行了历史的和地理的爬梳、整理,建立了我国现代民间传说学的奠基石。其实在孟姜女研究之前,顾颉刚引发的古史大讨论,之后形成古史辨,着眼于上古史传说的考辨还原工作。以顾颉刚、杨宽等为代表的历史学家们,通过对中国上古史的考证辨析,将融在历史之中的神话传说从古史中分离出来,促成了中国神话、传说研究的兴起。洋洋洒洒三百二十五万言的7册《古史辨》,有4册是关于古史传说的考辨,不仅是运用考据方法研究民间文学的重要成果,也代表了我国早期民间文学研究的考据范式。

对这些实际存在甚至时显泛滥的问题,我们可以尝试从以下几个方面来进一步认识。首先,技术本身是中立的,上述批评很大程度上是在针对研究者个人的文史素养和治学态度,并未否定技术能够令优秀学者如虎添翼。而擅长检索的学者也能够认识到文史素养的重要性,并非一味依赖电子资源。从现实情况看,电子技术确实使那些曾经看上去遥不可及的一流学者,变得可以企及了,这至少是正在提升学术研究的平均水准。校勘、笺注、考据中的一些前期工作,可由计算机更精准地代劳,在人机结合的研究过程中,“高明子弟,自然沉潜”。

  利用计算机从事古籍整理和文学史研究的辅助性工作,需要确保两个前提:第一,数字化的古籍文本必须是以精良善本为底本、经过机器和专家认真校勘的电子文本,也就是电子文本本身必须具备相当程度的可信度。这一点,由于目前古籍类数据库的开发主体不同,所采用的策略不同,部分数据库开发者或因为认识的误区,或由于版权方面的原因,在古籍数字化的版本处理方面尚不能尽如人意。不难想象,如果不能很好地处理版本问题,再大的数据库也只能仅仅充当一个检索字词出处的工具,而检索出的结果还需要学者与纸质书籍进行核对,很难以此为依据进行更为深入的工作。在这方面,高校古籍整理委员会项目中国基本古籍库处理得比较好,所收数字化文献均以精良善本为据。美中不足的是该数据库舍弃了各类古籍的序跋,令人无从了解这些版本的详细信息。第二,数字化的古籍文本必须已经达到相当规模。这一点,随着时间的推移和各科研教育机构对数据库重要性认识的提高,应该不难达到。目前,唐以前的文献基本上都有数字化版本。宋元两代的文献及明清二代的小说戏曲等多数已有数字化版本或正在被数字化。《永乐大典》、《古今图书集成》等大型类书和部分石刻、碑帖资料都已有可全文检索版本。明清两代的诗文文献和方志,由于数量浩繁,未见有大型高质量的数据库问世,距离有成效的实际应用,恐尚有相当的距离。但是,即使古籍浩如烟海,在日新月异的计算机扫描和OCR(Optical
Character
Recognition,光学字符识别)技术面前,终有被穷尽之日。问题在于出于经济利益的考虑,各数据开发机构都对所处理的文献进行了某种程度的加密或数据格式的限定,没有统一的元数据(Metadata,关于数据的数据,用以描述数据库结构等)标准,为各数据库间的整合利用带来了困难。而古籍数字化的程度和数据库被整合的程度越高,则前述运用计算机从事古籍整理和学术研究的成效才更大。

  一 当前学界关于史学变革的认识

  为什么民间文学研究需要考据呢?这是由民间文学的本体特征决定的。与作家文学相比,民间文学具有口头性、集体性、传承性和变异性特征,民间文学是以发音的方式呈现的,它可以让人们面对面的交流、感觉、甚至欣赏,却无法让研究者对出口即逝的声音进行深入细致的分析。在多数情况下,研究者面对的通常是被记录下来的民间文学文本。众所周知,记录民间文学文本的多数不是讲述者本人,民间文学的记录资料由于记录者与讲述者世界观不同、对民间文学的认识或自身的兴趣等原因,记录文本呈现不同的复杂情形。首先是民间文学资料的散乱零碎。比如中国神话就没有一部记叙完整、比较系统的资料汇编,而那些分散在各个时代、各种观念的文献,不仅零碎而且有的还相互矛盾,需要严谨的考据功夫才可能整出某一神话的些许眉目。其次是有些民间文学资料在记录过程中的历史化、哲学化和文学化现象,使原本鲜活的民间文学改变了状貌,甚至改换了意义。再次是民间文学的集体创作和传承中的变异性,使民间文学没有像作家文学那样的固定文本,讲述者也不可能像背书那样一字不落地照以前的讲述重复故事,出现较多异文。近年来,随着政府和学者对民间文学田野作业的深入,出现了有的被采录者根据采录需要进行讲述的复杂情形。因此,面对各种历史文献和各类现代采集的异文,需要研究者对各文本产生的时代背景、地域特色、语言风格等情况进行细致的考证,以保持资料引用的科学性。可以说,研究者在使用民间文学的文献资料之前,对文献资料的整理和考辨是一项不可或缺的工作,也是做学问的第一步。因为只有材料的真实,才能保证结论的可靠。

其次,当下的电子文本绝非完美,即使是扫描版也往往不能完全忠于原书,引用之前必须与原始文献核对,不能径用。但这恰好说明,现在的数据库还没有脱去以往“工具书”的性质。前人做研究,亦会查阅类书、索引等,甚至常有转引、代查的现象,这证明“工具”本来也不被排斥。如将数据库理解为一种高级的“逐字索引”,则其学术价值自然彰显。此外,纸质文献同样常常有误。古籍校勘中,也多有以“通行本”为底本的典范。事实上,核心问题不在于当下的电子文本有多少具体错误,而在于能否使注释具有可回溯性和规范性。如果一味排斥征引电子文本,很可能也会使数据库开发者缺乏将电子文本精确化的动力。

  这里特别需要提出Djvu
文档格式的发明及其广泛应用问题。DjVu是由美国AT&T实验室自1996年起开发的一种图像压缩技术,已发展成为标准的图像文档格式之一,目前正得到越来越广泛的应用。这种压缩比例大、便于传输的数据格式,核心技术是将图像分成背景层(可用于显示纸的纹理)和前景层(可用于显示文本和线条)两部分,用高分辨率来显示前景层(文本和线条),而用低分辨率来压缩背景图片。其优越性在于显示文字或有用信息的前景层非常清晰,可以令读者阅读锐利清晰的文字信息而又保持原有介质的版式和风格,绝对不会遗失有用信息,也不会使前景层所负载的文字、图画等有用信息产生变异。因为从本质上而言仍是一种图形,所以保证了数字化后古籍文本的可信度问题,不会产生因校对不精而造成的信息失真。同时,因为这种技术是将图层分别予以不同的处理,对于文档前景层所显示的文字可以进行OCR处理,所以这个格式的文件可以进行关键字查询检索,满足数据库需要进行精确检索的需求(由于制作方式不同,并非所有djvu格式的文档都可以全文检索)。Djvu文档的这些特点对于传统古籍的数字化有着极为特殊的意义,它是截至目前惟一可以将稿本、钞本等文献纤毫毕现地发布于网络的压缩技术。时下网络上有《全宋文》、《丛书集成》和部分《续修四库全书》等文献都是利用这种文档格式制作并传播的。撇开知识产权保护问题不论,这种数据格式的发明的确为传统古籍的广泛利用提供了极大便利。

  关于互联网、大数据、传统文献数字化所带来的史学变革,人们已经发表了不少看法,这些看法构成本文讨论的基础和前提。所以有必要对学界已有的研究给予介绍和评述。

  二、民间叙事研究的考据实践

促进材料深度辨析

  从资料获取方式方面所作的评论

  研读钟先生撰写的民间叙事研究论文,发现先生总是先整理中国各民族的相关文献古籍,接着梳理当时收集采录的新材料,然后通过比较分析,从而得出结论。感觉到先生论文中的资料非常丰富,却没有丝毫材料堆积之感,这精心选择的过程就是考据的过程,先生考据的运用似润物细无声的春雨,温和又富有诗意。

一般观点通常认为,电子检索作为一种“捷径”,往往令学者过于重视关键词,却忽视同一词语所处的不同语境。时代的风气、作者的习惯、史料的性质等,都在大数据时代的考据中付之阙如。在笔者看来,这种弊病在传统文史研究中同样并不少见,却有可能在大数据时代觅得新的解决契机。

  在以往的研究中,人们大多都注意到了传统文献数字化和大数据、互联网技术所带来的研究手段的改变,特别是获取资料方式的改变,盛赞当今人们实现了传统史家将史料一网打尽、竭泽而渔的梦想。文献检索的便捷,网络资料的丰富性,文献资源的共享,极大地改变了史学研究的速率和方式。这一方面是最表面化的表现,最易观察的方面,同时也是传统文献数字化给人们留下的最初印记,是每个学者都有的切身感受。譬如,陈爽写道:

  钟先生是位十分关注研究方法的学者,认为治学的方法,是科学研究上一个重要的因素。方法得当与否,可以决定那研究成果的命运。方法可以使研究成果完美地丰收,或者使它悲惨地失败。[3]在不同的座谈会和论著中,钟先生总是不厌其烦地强调自觉运用研究方法的重要性,并把他总结的方法三层次论和盘托出:第一个层次,是世界观或文化观的层次,也可称为哲学的层次。它属于学术活动的最高层,是指导研究者客观地去审察所面对的事物(民俗事象)的根本性质的。其次,是一般或大部分科学共同使用的方法,例如分析法、比较法、归纳法以及调查法、统计法等。再次,是某种学科特殊的研究方法。以上三种方法,虽然各有性质、范围,实际上大都是互相联系的,在使用上也往往彼此互相协力。它们并不一定是楚河汉界、截然分开的。[4]中国传统的考据方法自然融合在这方法三层次论中。

首先,大数据时代资源丰富,找寻辅证、反例的难度都较以前小,可以在一定程度上防治孤证武断,并有益于深入理解史料所处的特殊语境。

  30年间,古代历史典籍的载体大多已经由纸质书本转换为电脑可识别的文字符号,新一代学者对电脑写作和网络查询早已驾轻就熟,数字化检索已成为史学研究必不可少的辅助手段,史家对于史料的获取方式经历了亘古未有的革命。数字媒介的引入,促成了阅读方式和写作方式的改变,也使知识发现途径与处理手段都发生了变革。甚至有学者十分乐观地断言“一个有机会孕育‘e考据学派’的时代或已出现”③。

  (一)马克思主义指导下的方法论意识

其次,当大数据呈现出全部信息时,可以在多方面帮助学者辨析问题,甚至可以用“结构取义”的方式展开新的研究思路。例如高树伟在研究《永乐大典》的辑佚条例时,推翻了认为《大典》“直取全文”的成说,并且依靠海量文本对校的方式,提出了《大典》征书的新通例。这一认识既变,或许在一定程度上可以借助通例建立参考系,并以此来重新认识前人辑佚的成果,不妨称之为类似于“理校”的“理辑佚”。黄一农最近在脂批本“宁”字抄写避讳的研究中,也提及抄本研究应建立参照系,这些见解似可遥相呼应。又如在文本细读工作中,作者究竟是直接使用某一典故,还是受到文化传统影响,实际存在多种可能。笺注、考据家往往侧重于锁定甲乙间的因果承袭关系,但容易忽视文化大传统的潜在影响。近年来古代文学研究引入“互文”理论,尝试说明这种影响往往是网络状、多源多流的。张昊苏在此基础上提出“e互文”思路,意在指出大数据时代有助于深入理解这种多样性。

  陈春声发文赞誉新时代的历史学变革说:

  钟先生将马克思主义基本原理作为指导民间文学研究的最高层,他有关考据方法的运用也是在辩证唯物主义观点的指导下进行的。钟先生认为,马克思主义本身就包含着实证精神,马克思主义的辩证法比实证主义站得高,但是实证的研究也不可少。没有实证的基础,那个理论是空洞的、抽象的东西。没有马克思主义的理论,这种更高层次的抽象,那么实证的知识站不起来,是爬在地上的东西。[5]因此他一贯重视具有实证精神的考据,要求每一句话都要有根据。钟先生还特别强调要正确运用唯物辩证法,他曾提出两种运用马克思主义原理不恰当的情况:例如在论述歌谣、故事的文章里,把马克思主义的社会、历史的某些理论公式,生硬地套在对象上,或者引用经典著作中的某些个别论断以充当自己的结论或立论的出发点。[6]生搬硬套地引用肯定不是科学地运用马克思主义原理;结论在先,论证为预定的结论服务更是对马克思主义原理的糟蹋,也违背了考据的基本精神。

借助大数据提供的便利,考据学出现了“后发先至”的现象。前辈学者经年研究的难题,很可能被新一代学人在短时间内解决。至少在这类问题上,信息素养的意义很可能要高于传统知识体系,掌握查找知识的能力很可能也比掌握知识更为高效且重要。这里并非是说新时代的学者可以不掌握知识而解决问题,而是说,信息素养可以出于研究的需要,迅速进入新的领域并建构具有针对性的知识体系,这种大幅度的跨界是传统学者较难做到的。当然,就目前的研究状况来看,大数据时代“数字人文”研究还没有作出第一流的成果,多数成果仍然是在研究具体问题,而尚未建立新的范式。但近十余年来这一领域的学术积累正以指数级速度增长,足以令人期待由“量变”产生“质变”。或许,未来传统学者也应该未雨绸缪,需要考虑能否做出不被数据库遮蔽、凸显研究者个性的学问。

  传统时代的历史学者皓首穷经,有时可依赖对冷僻资料的占有、对新资料的发现、对浩瀚文献中某个词句的挖掘或解读而对学术有所贡献。然而,进入21世纪之后,占有所谓冷僻资料或发现新资料这类具有“学术积累”意义的工作,已经越来越成为普通史学工作者日常研究过程的一部分,毫无惊喜可言。更为重要的是,在“数字人文”的时代,由于“数字仓储”和“数字图书馆”的大量存在和在互联网上的利用便利,由于海量的资料文献可以“全文检索”之类的方式便利地查询,由于“文本数字挖掘”蕴含着几乎没有限制的“创造”与“重构”史料的可能性,传统条件下一位学者需要花费数月、数年光阴,甚至要花费毕生精力进行比对、校勘、辑佚、考订才得以解决的问题,现在可能在计算机网络上花费数秒钟、数分钟就可以有相当确切的结果;而原来因为缺乏史料,许多传统历史学家认为不能研究的重要问题,在“数字人文”的背景下,变得有点“唾手可得”④。

  由于一切理论都是一定时间、空间、条件下的产物。时过境迁,研究者如何看待、利用以往的资料可能是考据的关键。面对文献哪怕是经典文献,钟先生认为,研究者一定要研究他们(指文献作者笔者注)在什么条件下,对什么问题说的话,当时这种学问的成熟程度和跟这种学问有密切联系的那些学问的程度怎样。[7]比如钟先生在《晚清革命派著作家的民间文艺学》中关于鲁迅对于神话性质的考据,充分显示辩证唯物主义的指导。首先,钟先生简略交待鲁迅之前的文人学者虽表达了对神话的意见,却很少注意神话的性质,将鲁迅先生放置到神话研究的历史背景中,为进一步的考据提供了个参照系统。接着还原到鲁迅所处的资产阶级民主革命思想高涨的时代背景,那是对古代神话、传说有了新的注意和见解的时期。然后引用鲁迅对神话之产生和特点的阐述:夫神话之作,本于古民,睹天物之奇觚,则逞神思而施以人化,想出古异,諔诡可观,虽信之失当,而嘲之则大惑也。[8]最后钟先生指出:在今天看来,鲁迅这种神话的观点还没达到马克思主义神话学的高度。……但是,从我们过去长时期的神话思想史看,它无疑是一种向前跃进的见解。[9]在《作为民间文艺学者的鲁迅》中,钟先生更明确指出鲁迅这种神话说法,如果从当时中国学界这方面的实际状况看,不能不说它是比较进步的意见――我们应该记得:当时还有不少旧头脑的老学究,和那些走得太远的新学派的神话观存在呢。[新浦京www81707con ,10]可见,钟先生活学活用马克思主义原理考核、思辨材料,使其民间文学研究充满随处可见的唯物辩证之光。需要说明的是,钟先生写于信仰马克思主义之前的系列论文,同样充溢着辩证的法则。

(作者单位:南开大学文学院)

  姜义华撰文《大数据催生史学大变革》,也主要是强调由于历史资料利用方式改变所带来的变革。他说:

  大数据使历史资料利用产生革命性变革……大数据具有速率、体量、多样性、价值密度四大特征。在历史学领域,大数据成百倍、成千倍地扩大了历史资料的范围。尤其突出的是,除传统的文献与遗址、遗物外,人类存留的所有纸质的、音像的和其他物质的、非物质的资料,几乎都可被用来协助复原历史的本来面貌……大数据通过数据采集、数据储存、数据分析、数据管理为大范围、中时段、长时段定量分析提供了现实的可能。历史学研究与大规模基因检测相结合,有力推动了家族史、宗族史、移民史、民族史研究,就是一个成功的实践。

  大数据使历史资料利用产生革命性变革,更集中表现在大数据有助于人们获得新的认知,因为它可以较好地用数字模拟方式在一个大范围内展现历史场景。大数据信息系统还可以较方便地将历史活动中各种要素全面、综合、动态地展示出来,这样,它就可能为历史研究创造新的价值基准⑤。

  最近一些年,台湾学者黄一农提出一个著名的“e-考据”概念,即基于互联网、电子资源所进行的历史考据。“e-考据”说引起了一些讨论,不时地有相关论文问世,而究其实,所谓“e-考据”,也是从文献利用的角度对新形态史学研究方法的一种表述。一篇介绍黄一农“e-考据”的文章说:

  1994年,黄一农曾经以利玛窦在中国最亲密的友人瞿汝夔为素材写过一篇3页的《瞿汝夔家世与生平考》,十年后,当他准备将该文收为其研究中国天主教史的新书《两头蛇》中的一章时,黄一农选择了重写……通过台北汉学研究中心所制作的《明人文集联合目录及篇目索引资料库》,黄一农从其中收录的2500多种明人文集中检索到了丰富到难以令人相信的素材。通过这些素材,黄一农不仅可以了解到瞿汝夔家族中其他人的资料,甚至还可以知道其研究对象的外貌、身高、性格及其人脉关系,并有条件探索瞿汝夔与嫂嫂发生暧昧关系的背景环境,而这之前仅仅有三四本文集可以参考。通过运用这些资料,黄一农得以像写侦探小说一样细致而逻辑严丝合缝地还原历史现场,这一次,他写了30页,并且在《两头蛇》一书中严肃地提出了“e-考据时代”这一新的概念⑥。

  70多年前傅斯年先生大力提倡以科学方法治史,但是以其为代表的史料学派,无可否认尚未能令中国史学界的治学方法普遍发生质变……但是随着现在网络和电子资料库的普及,我们有机会在很短时间内就掌握前人未曾寓目的材料,来填补探索历史细节时的许多缝隙,或者透过逻辑推理的布局,迅速论断先前待考的疑惑或矛盾。西方已经把18世纪以前,几乎30万种的书籍全文送到网络上面去,而且有相当比例可以全文检索的……黄一农认为一个有条件孕育“e-考据学派”的时代正在悄然来临,而史学工作者应责无旁贷地将历史研究深化并提升到新的阶段⑦。

  这就是说,黄一农的“e-考据”概念,也是由于文献电子化利用的产物,是从数字化文献的丰富性系统性角度提出的问题。黄一农提倡“e-考据”,也是意在提醒人们充分利用因特网和丰富的电子文献数据库,借鉴前人的科学考据方法,将历史学研究提升到一个新的阶段。所谓“e-考据”,在其方法论上,在其科学属性上,和傅斯年提倡的“史料即史学”的科学治史方法并无二致,仅只是利用资料的方法、广度不同而已。

  以上诸说,大抵都是人们从电子文献检索之便、随着文献数字化程度的加深所带来的文献资源的空前丰富、电子文献利用方式等方面所感受到的史学变化。

相关文章