《周易注疏》 資料圖片
《周易》是中國最古老的文化經(jīng)典,隨著其思想體系的不斷拓展、社會價值的不斷發(fā)掘,逐漸形成了博大深邃的易學(xué)文化。而在我國不同歷史時期涌現(xiàn)出來的卷帙浩繁、汗牛充棟的易學(xué)古籍,成為中華優(yōu)秀傳統(tǒng)文化演進(jìn)、發(fā)展的重要載體,也成為中華民族精神和智慧的集中體現(xiàn)。目前,國學(xué)發(fā)展已經(jīng)進(jìn)入“大數(shù)據(jù)時代”,如何把傳統(tǒng)易學(xué)古籍與現(xiàn)代信息技術(shù)結(jié)合起來,開展好易學(xué)古籍?dāng)?shù)據(jù)庫建設(shè),將是我們面臨的一個重大學(xué)術(shù)課題。
收集整理易學(xué)典籍,夯實數(shù)據(jù)庫基礎(chǔ)
作為一項浩大的文化工程,易學(xué)古籍?dāng)?shù)據(jù)庫建設(shè)應(yīng)當(dāng)以易學(xué)古籍的收集、整理和編纂為前提和重要基礎(chǔ)。
我國歷代學(xué)人非常重視對卷帙浩繁的易學(xué)文獻(xiàn)進(jìn)行整理、編纂,從最早的官修書目《別錄》《七略》,到《漢書·藝文志》《隋書·經(jīng)籍志》等史志目錄等,從中都體現(xiàn)了易學(xué)文獻(xiàn)整理、編纂的重要成果。及至清代,乾隆年間開四庫館,編纂《四庫全書》,易學(xué)典籍作為群經(jīng)之首,位列開篇,而且數(shù)量也是所有分類中最多的。阮元主持編纂《清經(jīng)解》,進(jìn)一步總結(jié)了清代易學(xué)的研究成果。王先謙編纂《清經(jīng)解續(xù)編》,續(xù)收清代學(xué)者經(jīng)學(xué)著作209種,涉及胡渭、惠棟、張惠言、俞樾等十?dāng)?shù)家易說,完整地展現(xiàn)出清代易學(xué)研究的全貌。20世紀(jì)20至40年代推出的《續(xù)修四庫全書總目提要》是現(xiàn)存規(guī)模最大的文獻(xiàn)解題目錄,亦涉及大量易學(xué)典籍。
近年來,隨著文化事業(yè)的發(fā)展,新的易學(xué)古籍整理和編纂工程不斷涌現(xiàn)。北京師范大學(xué)中國易學(xué)文化研究院分別于2013年、2018年推出的《中國易學(xué)文獻(xiàn)集成》68冊和《中國易學(xué)文獻(xiàn)集成續(xù)編》70冊,共計138冊,不僅網(wǎng)羅了各時期代表性的易學(xué)著作,而且首選善本為底本,為易學(xué)古籍的整理、編纂起到了重要的示范作用。與此同時,北京師范大學(xué)中國易學(xué)文化研究院又與國學(xué)網(wǎng)、首都師范大學(xué)電子文獻(xiàn)研究所聯(lián)合承擔(dān)《中華易學(xué)全書》項目,以文淵閣《四庫全書》經(jīng)部易類典籍為基礎(chǔ),整理易學(xué)典籍183種、1839卷,共3500余萬字,并制作2000余幅矢量易圖,被已故著名學(xué)者余敦康先生譽為“《易藏》”。同一時期,在學(xué)術(shù)研究機(jī)構(gòu)和專門技術(shù)公司的共同推動下,我國陸續(xù)出現(xiàn)的各類古籍?dāng)?shù)據(jù)庫,均不同程度地收錄有易學(xué)古籍,傳統(tǒng)易學(xué)古籍與現(xiàn)代信息技術(shù)相結(jié)合的趨勢開始出現(xiàn)并獲得初步發(fā)展。
雖然近年來易學(xué)古籍的整理、編纂工作不斷取得新成就,但還存在許多有待改進(jìn)之處。一方面,以往的易學(xué)古籍整理大多屬于傳統(tǒng)類型的典籍匯編,缺乏與現(xiàn)代信息技術(shù)的緊密結(jié)合。另一方面,現(xiàn)有各類古籍?dāng)?shù)據(jù)庫所收錄的易學(xué)古籍,由于受到分類法的限制尚未實現(xiàn)優(yōu)化整合。比如雕龍古籍?dāng)?shù)據(jù)庫有《四部叢刊》《四部備要》《雕龍四庫全書》等子庫,卻沒有單獨的“易學(xué)”分類。同時,各數(shù)據(jù)庫收錄的古籍版本相對比較單一,對各種版本尤其是海外珍本鮮少涉及,包括日本足利學(xué)校所藏南宋初年刊本《周易注疏》等。整體而言,現(xiàn)有古籍?dāng)?shù)據(jù)庫尚存在資料不夠完備、零散不成系統(tǒng)、內(nèi)容未能精細(xì)化、文本未能精準(zhǔn)化等問題。因此在新時代,易學(xué)古籍?dāng)?shù)據(jù)庫建設(shè)是一項亟須開展的學(xué)術(shù)課題和文化工程。
確立數(shù)據(jù)庫主體框架,推動易學(xué)數(shù)字化
易學(xué)古籍?dāng)?shù)據(jù)庫是順應(yīng)信息化技術(shù)發(fā)展需要、服務(wù)于易學(xué)研究及中華優(yōu)秀傳統(tǒng)文化研究的重要平臺,主要目標(biāo)是開發(fā)通用的統(tǒng)一查詢、輔助分析易學(xué)文獻(xiàn)的綜合管理和應(yīng)用系統(tǒng),以便快捷地進(jìn)行數(shù)據(jù)和文獻(xiàn)資料的查詢、下載等工作。在我們看來,易學(xué)古籍?dāng)?shù)據(jù)庫的建設(shè)應(yīng)當(dāng)以“古籍系統(tǒng)化+數(shù)字化”的學(xué)術(shù)理念為推手,從傳統(tǒng)文獻(xiàn)學(xué)和數(shù)字文獻(xiàn)學(xué)相互融合、相得益彰的角度展開,需要收集、整理易學(xué)古籍文獻(xiàn),運用先進(jìn)技術(shù)將其轉(zhuǎn)化為數(shù)字化資源,逐步建設(shè)數(shù)據(jù)庫,最后還要校對數(shù)據(jù)庫文本的精確性,完成數(shù)據(jù)庫的檢查和驗收工作。具體來說,其主體框架可以概括為一條主線、兩大環(huán)節(jié)和三個要點。
一條主線是以“易學(xué)古籍?dāng)?shù)據(jù)庫”為中心,系統(tǒng)收集整理易學(xué)古籍,并采用先進(jìn)的數(shù)據(jù)信息技術(shù),將之轉(zhuǎn)化為數(shù)字化資源,建立科學(xué)、全面、準(zhǔn)確的易學(xué)古籍?dāng)?shù)據(jù)庫。
兩個環(huán)節(jié)是指建設(shè)易學(xué)古籍“錄入文本”和“影像文本”,錄入文本是由人工輸入計算機(jī)的易學(xué)古籍全文,影像文本則是采用現(xiàn)代技術(shù)工具真實呈現(xiàn)的易學(xué)古籍原貌。
三個要點是指數(shù)據(jù)庫技術(shù)系統(tǒng)的三大方面,即數(shù)據(jù)存儲系統(tǒng)、數(shù)據(jù)分析系統(tǒng)和平臺管理系統(tǒng)。
數(shù)據(jù)存儲系統(tǒng)作為數(shù)據(jù)庫的上層系統(tǒng)、數(shù)據(jù)分析共享的支撐系統(tǒng),是整個數(shù)據(jù)庫的核心組成部分。能夠滿足對結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)統(tǒng)一存儲和查詢的需求,便于實現(xiàn)查詢的高效性和存儲的安全性。
數(shù)據(jù)分析系統(tǒng)利用分布式存儲和并行計算框架,結(jié)合多種分布式計算引擎,對各類結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化的信息資源進(jìn)行快速的分布式計算,并提供基于關(guān)聯(lián)、聚類、分類、預(yù)測等類算法庫以及可視化組件、拖拽式的數(shù)據(jù)挖掘分析開發(fā)工具包,既可提供易學(xué)古籍查閱與研究的深度挖掘和分析服務(wù),也可提供數(shù)據(jù)資源管理、目錄管理、組織人員管理、用戶權(quán)限、數(shù)據(jù)接入和共享服務(wù)運行監(jiān)控及平臺運維等功能。
平臺管理系統(tǒng)是圍繞文本、PDF、圖片、音視頻等多種格式資源的持久化存儲數(shù)據(jù)庫,設(shè)計相關(guān)分類及元數(shù)據(jù)結(jié)構(gòu),以便為系統(tǒng)地查詢檢索、在線使用以及持續(xù)擴(kuò)展等業(yè)務(wù)提供基礎(chǔ)支持。這些都是非常重要的。
整合易學(xué)書目版本,系統(tǒng)構(gòu)建子數(shù)據(jù)庫
關(guān)于易學(xué)古籍?dāng)?shù)據(jù)庫建設(shè)的具體內(nèi)容和步驟、方法,不同學(xué)者或許會有不同看法,見仁見智。我們認(rèn)為,這一數(shù)據(jù)庫至少應(yīng)該包括易學(xué)古籍書目數(shù)據(jù)庫、易學(xué)古籍全文數(shù)據(jù)庫、易學(xué)古籍版本數(shù)據(jù)庫,作為三個二級子目錄即子數(shù)據(jù)庫,統(tǒng)一于易學(xué)古籍?dāng)?shù)據(jù)庫這一母數(shù)據(jù)庫中。
易學(xué)古籍書目數(shù)據(jù)庫是收錄歷史上出現(xiàn)的所有易學(xué)著作和篇章的數(shù)據(jù)庫。具體的建設(shè)步驟應(yīng)該分為兩個方面:一是對易學(xué)古籍的編目,需要對歷代相關(guān)史志目錄和官修、私修目錄以及近數(shù)十年來整理出版的出土易學(xué)文獻(xiàn)和國內(nèi)外館藏易學(xué)古籍資料,進(jìn)行全面收集、系統(tǒng)編目,注明版本、館藏,編纂出高水平、高質(zhì)量的易學(xué)古籍書目,并撰成《歷代易學(xué)古籍書目》;二是充分借鑒吸收中外建設(shè)數(shù)據(jù)庫的成功案例和優(yōu)秀經(jīng)驗,運用先進(jìn)的數(shù)據(jù)庫技術(shù)將其轉(zhuǎn)化為數(shù)字、文字、圖形、圖像、聲音等數(shù)據(jù)形式,并存儲于計算機(jī)內(nèi),成為由計算機(jī)操控、能夠有效共享的數(shù)字化資源,推進(jìn)易學(xué)研究的現(xiàn)代化。
易學(xué)古籍全文數(shù)據(jù)庫是著錄易學(xué)古籍全文內(nèi)容的數(shù)據(jù)庫。建設(shè)的重點是需要以現(xiàn)存易學(xué)古籍的文本為對象,參考著名學(xué)者的校釋、研究成果,對已有標(biāo)點的古籍文本進(jìn)行重檢,對無標(biāo)點的古籍文本則運用先進(jìn)的數(shù)據(jù)信息處理技術(shù)自動標(biāo)點,再輔之以人工重檢,糾正誤差,最后產(chǎn)生古籍點校本,統(tǒng)一由人工輸入計算機(jī)形成數(shù)據(jù)庫,以供使用者進(jìn)行檢索、閱覽??紤]到全文數(shù)據(jù)庫應(yīng)用的廣泛性,該數(shù)據(jù)庫還應(yīng)當(dāng)具備豐富的檢索方式,包括標(biāo)題檢索、全文檢索、分類檢索、專書檢索、高級檢索等。全文檢索數(shù)據(jù)庫需要在書目檢索數(shù)據(jù)庫的元數(shù)據(jù)基礎(chǔ)上添加古籍內(nèi)容及其與古籍的對應(yīng)關(guān)系,能夠讓使用者對檢索結(jié)果進(jìn)行準(zhǔn)確定位或?qū)Ρ?,直接了解古籍?nèi)容。
易學(xué)古籍版本數(shù)據(jù)庫是囊括現(xiàn)存易學(xué)古籍各種不同版本的數(shù)據(jù)庫。版本學(xué)是以各類古籍的抄本、批校本、稿本和印本等為研究對象的學(xué)科,易學(xué)著作的不同版本有著不同的歷史和價值,對修繕古籍、考辨真?zhèn)尉哂兄匾饔?。建設(shè)易學(xué)古籍版本數(shù)據(jù)庫需要盡可能全面地收集整理現(xiàn)存易學(xué)古籍的所有版本,包括國內(nèi)外高校、圖書館、博物館等單位以及科研機(jī)構(gòu)收藏的傳世易學(xué)古籍,以及載錄于甲骨、金石、簡帛等不同載體的易學(xué)出土文獻(xiàn),并轉(zhuǎn)化為數(shù)字化資源,為使用者提供包括封面、序跋、插圖、版本、版式、藏書印、批校題跋等古籍版本信息,真實呈現(xiàn)易學(xué)古籍原貌,滿足讀者和研究者不同的閱讀體驗和學(xué)術(shù)需求。
打破時空限制,深化易學(xué)研究與保護(hù)
新時代的易學(xué)古籍?dāng)?shù)據(jù)庫,將建成最具綜合性、系統(tǒng)性的易學(xué)古籍總匯,建成最具專業(yè)性、權(quán)威性的一流數(shù)據(jù)庫,其學(xué)術(shù)價值和現(xiàn)實意義尤為突出。
數(shù)據(jù)庫對易學(xué)古籍的系統(tǒng)梳理和完整呈現(xiàn),尤其是數(shù)據(jù)庫所具有的共享性,為學(xué)者提供了便捷的檢索和閱覽服務(wù),打破了獲取資源的時空限制,即便在不同地區(qū)和不同單位,都能夠便捷地獲取分布于全球的易學(xué)古籍資源,有效地提高工作效率,最大限度地推動易學(xué)研究的深化和拓展。同時,易學(xué)古籍?dāng)?shù)據(jù)庫的建設(shè)既需要易學(xué)古籍整理領(lǐng)域與數(shù)據(jù)庫建設(shè)領(lǐng)域的通力合作,也需要積極整合學(xué)術(shù)界多學(xué)科、多方面的資源和力量。隨著中華文化的廣泛傳播,易學(xué)古籍?dāng)?shù)據(jù)庫的建設(shè)有助于在當(dāng)代易學(xué)研究中樹立和把握全球意識、國際視野,從而在與國外學(xué)術(shù)界互學(xué)、互鑒、互動的過程中促進(jìn)易學(xué)研究的進(jìn)一步發(fā)展和傳播,推動中華文化更好地走出去。
隨著信息技術(shù)的不斷革新、發(fā)展,建設(shè)中文古籍類數(shù)據(jù)庫的技術(shù)已經(jīng)在自動比對、自動標(biāo)點、自動排版等方面取得突破性進(jìn)展,但如何實現(xiàn)“影像文本”向“錄入文本”的精準(zhǔn)、高效轉(zhuǎn)化,實現(xiàn)列表視圖和提要視圖的隨時切換,實現(xiàn)從研讀批注到下載打印的一站式完成,凡此種種,依然是有待攻克的重大難題。而且考慮到易學(xué)古籍文獻(xiàn)會由于文物出土等因素而不斷豐富,已完成的古籍?dāng)?shù)字化體系在吸納現(xiàn)有數(shù)字對象的基礎(chǔ)上,還需要不斷補(bǔ)充新的研究資訊和成果,即該體系應(yīng)是動態(tài)的、可靈活擴(kuò)展的。如何在技術(shù)層面有效地實現(xiàn)這一點,也是我們應(yīng)該思考的重要問題。易學(xué)古籍?dāng)?shù)據(jù)庫建設(shè)為這些新技術(shù)的探索和研發(fā)提供了契機(jī)和平臺,有助于實現(xiàn)數(shù)據(jù)庫建設(shè)技術(shù)的新突破,確立數(shù)據(jù)庫的典型范例。
古籍是人類智慧的結(jié)晶,卻屢因戰(zhàn)亂、火燒水浸、蟲蛀鼠咬等破壞而殘缺、亡佚。古人采取的對策是抄寫備份、分開保存,其中《四庫全書》被分藏于全國七座藏書閣就是一例。相比之下,古籍?dāng)?shù)字化在保護(hù)古籍方面無疑具有得天獨厚的優(yōu)越性。利用現(xiàn)代信息技術(shù)對古籍文獻(xiàn)進(jìn)行加工處理,使古籍轉(zhuǎn)化為電子數(shù)據(jù)形式,通過網(wǎng)絡(luò)、光盤等介質(zhì)傳播,使其徹底免于各種災(zāi)厄而永續(xù)保存,可謂功在當(dāng)代,利在千秋。在這一方面,易學(xué)古籍?dāng)?shù)據(jù)庫建設(shè)將會是一個成功案例。
總之,在新時代,在易學(xué)研究更加綜合、更具全球視野、更注重現(xiàn)代轉(zhuǎn)化和創(chuàng)新發(fā)展的當(dāng)下,易學(xué)古籍?dāng)?shù)據(jù)庫不僅是對以往易學(xué)文化成果所作的一次系統(tǒng)、全面的總結(jié)和梳理,而且也會在研究思路、學(xué)科布局、研究方法、基本框架、主要內(nèi)容等方面有所創(chuàng)獲。我們相信,以此為契機(jī)和平臺,今后易學(xué)研究的開展將獲得更加堅實的文獻(xiàn)資料基礎(chǔ),并獲得人工智能、互聯(lián)網(wǎng)、大數(shù)據(jù)等現(xiàn)代信息技術(shù)手段的支持和支撐,而這將有助于相關(guān)的學(xué)科建設(shè)和學(xué)術(shù)發(fā)展,有助于中華優(yōu)秀傳統(tǒng)文化的進(jìn)一步傳承、弘揚和發(fā)展。
聯(lián)系客服