更新日期:2010/06/06 21:46:36
學習次第 : 進階
數位經錄與時空資訊
內容摘要:本文擬擷要介紹臺灣近年來電子佛典相關計畫的製作方法及成果,以探討新時代“大藏經全文數位資料庫”編撰的可行性。
文中擬藉演示數位時代電子佛典的發展過程,如簡述歷年來的漢文大藏經電子化作業內容、簡列多年來的各項電子佛典周邊專案,並報告近年執行“數位經錄”與“時空資訊”等資料庫內容及功能,以瞭解大藏經數位化作業發展現況,作為本探討之基礎。
文末,擬以“數位經錄”、“時空資訊”及“電子佛典”等數位成果,說明對數位藏經未來開展的期望。
關鍵字:數位藏經 數位經錄 多語佛典 佛典辭匯 時空信息
一、前言 :臺灣“大藏經數位資料庫”相關計畫發展現況
本文擬擷要介紹臺灣近年來電子佛典相關計畫的製作方法及成果,以探討新時代“大藏經全文數位資料庫”編撰的可行性。因筆者自1994年從事“佛學網路資料庫”(http://ccbs .ntu.edu.tw) 的建構以來,有機會參與建構多項佛學網路資料,涵蓋有“佛學書目資料庫”、“佛學全文圖書資料庫”、“佛教電子大藏經”等資料庫總計二十余項。故擬抛磚引玉,藉此演示數位時代電子佛典發展過程,如簡述歷年來的漢文大藏經電子化作業內容、簡列多年來的各項電子佛典周邊專案,以及報告近年執行的“數位經錄”與“時空資訊”等計畫內容,以權顯臺灣“大藏經數位資料庫”的發展現況,作為本探討之基礎。
首先,簡述歷年來漢文大藏經電子化作業:
中華電子佛典協會CBETA自1998年2月15日起開始《大正新修大藏經》(以下簡稱《大正藏》) 電子化作業,當年年底發表《大正藏》第5冊至第10冊網路版與光碟版。嗣後再 經一年多時間完成漢譯佛典“經、律、論”計32冊6000萬字作業,於1999年12月發行《大正藏》第1冊至第32冊。同年,CBETA 亦完成建立電子資料庫的“標準化”、“國際化”作業規範。此項作業奠定了國際間漢文電子文獻製作的規範。
迄2000年底,CBETA已大致完成《大正藏》第1冊至第55冊暨第85冊初稿。其中,有需特別處理的難度與挑戰,如“雙行小字”及“缺字”等問題,耗費較長時間一一處理。這些技術面的克服與缺字的處理,並成為國際間漢字處理的一大突破。2001年4月,CBETA發表《大正藏》第1冊至第55冊暨第85冊全文電子檔。至此,歷時三年二個月的努力,CBETA終於完成“大正藏普及版”電子化初步作業。
在完成上述各項艱巨作業之後,CBETA又積極展開“校勘版”的輸入、校對、標記、缺字處理等工作。於2002年底完成所有校勘資料電子檔的輸入及電子化初步作業。2003年, CBETA成立五周年時,正式發表“校勘版”作業的初步成果。除上述《大正藏》作業外,CBETA同時也進行《卍新纂大日本續藏經》(以下簡稱《卍續藏》) 的基本輸入與測試作業,2002年初正式進行《卍續藏》電子化作業。于2003年底發行“CBETA電子佛典集成”內含“校勘版”與《卍續藏》的電子資料。2006年底完成《卍續藏》1至98冊全套藏經的數位化作業。 2007年起則開始執行不包含於《大正藏》與《卍續藏》的藏經遺珍。
其次,簡列多年來執行各項電子佛典周邊專案:
筆者除于1995年至2003年間,參與建構與維護臺灣大學“佛學數位圖書館暨博物館”網路資料庫,以及1998年以來的CBETA建構外,從1999年至今,所參與執行電子佛典周邊專案建構,計有國科會之“數位博物館計畫:玄奘西域行”、數字典藏“臺灣佛教數位博物館:蓬萊淨土游”計畫、“數字典藏多媒體檔案之研究與建置--西藏珍藏語音檔案研究計畫”、“臺北版電子佛典集成之研究與建構”、“絲路中印文化交流研究--以法顯、玄奘、義淨三大師西行路線為主”、“瑜伽師地論資料庫-電子佛典製作與運用之研究”;以及蔣經國國際學術交流基金會贊助的國際合作案,如“臺灣佛教文獻數位資料庫的建構與研究”、“漢文古籍譯注與數位編輯的研究--以巴厘文與漢文《別譯雜阿含經》(T。100) 的版本比對與英譯為例”,及“《法華經》多種語文版本數位資料庫的建構與研究”等多項佛學數位計畫。從上述筆者所參與資料庫之建置數量及經驗而言,或可提供編撰“大藏經全文數位資料庫”可資討論的基礎。
最後,報告目前執行中的計畫:
除上述已完成的專案外,目前執行中的計畫與項目尚有“佛典數字典藏內容開發之研究與建構--經錄與經文內容標記與知識架構”(以下簡稱“數位經錄”或本計畫)、“漢傳佛教高僧傳之時空資訊系統研究計畫”(以下簡稱“時空資訊”)、“臺北版電子佛典集成之研究與建構”、“佛教人名地名及年表權威資料庫(Authority Database)”、“ZEN --〝輕安一心〞創意禪修空間研究”以及“佛教數位工具資源的建構與研究”等計畫,因資料繁多不易聚焦,故下文擬集中於與“數位經錄”與“時空資訊”有關的資料,作進一步報告。
二、“數位經錄”資料庫的內容與功能
歷時三年完成的“數位經錄”計畫,第一年已建置漢文現存版本藏經“現藏錄”強大功能檢索、古師大德所編“古經錄”檢索;第二年亦如期完成多語言梵文、巴厘語、藏文藏經經錄等資料庫檢索,並提供對應相關經群線上閱讀連結等相關資料的查詢,豐富並加強使用者的需求與方便性;第三年于漢文經錄增加多部日本求法目錄與“至元錄文獻專區”、多語言經錄則增設“滿文經錄資料庫檢索”等。
“數位經錄資料庫”的完成,堪稱為佛教學界的一大貢獻。學者已不需出門上圖書館、翻閱目錄,輕易能從本資料庫檢索到某部經,找到佛典收錄版本冊頁出處,及漢、藏、巴等相關經群對應,並同時連結全文線上閱讀。其中“數位經錄”的主要功能是多語言、多版本佛典強大效能的“經錄資料庫檢索”。於此,僅依“現藏錄”及“古經錄”兩大類,簡介經錄資料庫的檢索功能:
1.現藏錄資料庫檢索
首先于網頁上方設立九項功能選單,即是本網站的主要功能。其中現藏錄經錄資料庫檢索及古經錄資料庫檢索,提供強大功能檢索即是本網站之特色。現藏錄經錄檢索頁,主要是經名與作譯者功能檢索,亦可二者合併檢索。
2.古經錄資料庫檢索
在古經錄資料庫頁面,左邊是歷代古經錄依年代排列的樹狀結構,每一個古經錄依性質內容不同分類,各有各的架構,可一層一層打開。
三、“時空資訊”資料庫的作用與功能
“數位經錄”資料庫不同于以往傳統紙本經錄,除整合24部藏經經錄,建立功能強大的檢索網頁外,更具有連結、閱讀電子佛經全文與擴展技術應用端的中間媒介功能,為提升經錄資料庫與其他資源整合之應用服務與技術開展,並建立“經錄時空地理檢索平臺”網站。本節即梗概陳述“數位經錄”資料庫與“時空資訊”系統整合應用的研究與討論。
“數位經錄”資料庫是一種“後設資料庫”,資料庫可加入需要的欄位元,“經名”、“朝代”、“作譯者”與“地點”等資訊,每一筆資料各設定一個唯一的ID,透過TimeMap及 Google Map等網路式地理資訊技術(Web-based GIS)程式,將時間及空間資訊加以整合,使漢文佛經目錄文獻中的人事時地物等重要訊息,轉換並呈現為時空地理資訊系統的數位資源,以茲架設人物與時空二軸互動關係的數位研究平臺。目前已測式完成,建立“經錄時空地理檢索平臺”網站。但時空地理檢索平臺涉及許多技術作業,礙于篇幅無法于本文討論。故以圖示說明“經錄時空地理檢索平臺”的作用與功能於下:
以上介紹的“數位經錄”資料庫與“時空資訊”系統,所整合應用的數位功能,可說是開時代之先機與創新,加上“電子佛典”藏經數位資料庫的大量全文建置,或可作為編纂一符合新時代的完整實用的數位佛教全文資料庫的參考。而此類巨型的數位資料庫,可在漢文經典文獻數位化保存、知識管理與學習、流通推廣上,挹注一股連結時代發展趨勢的新動力,並為數字典藏與當代佛學資訊化奠定厚實的基礎。
四、結語:臺灣“大藏經全文數位資料庫”目前成果及未來規劃
以CBETA 2009年成果發表為例
資訊時代的數位化作業,可將浩瀚的佛典陳現出有別于古文獻不同的新的面貌與功能,如以前述多年來已建置的資料量及經驗為基礎,參照“數位經錄”與“時空資訊”兩項作業為方法,進而瞭解臺灣已完成的“電子佛典”全文成果,相信通過各界的合作,新編撰的“大藏經全文數位資料庫”將成為一項重要的學術資源。
因此不揣譾陋,提出“數位經錄與時空資訊的交會”整合應用的功能,以探討新時代“大藏經全文數位資料庫”編撰的可行性。故本文文末即介紹CBETA擬於2009年4月15日發表的成果,以作為本文結語。
CBETA的作業重點不只在《大正藏》或《卍續藏》電子版,而是以完成漢傳佛教電子佛典集成為首要目標。因此在整理完成《大正藏》、《卍續藏》兩者不重複的典籍後,已開始就其他藏經所特有的典籍進行數位化工作。因此,先以“數字經錄”完成的“佛教藏經目錄數位資料庫”(http://jinglu.cbeta.org/) 作為前行作業,從24種“現存藏經目錄”篩選其他各部藏經可能的特有典籍,再經仔細核對,扣除有目無經、重複收錄、內容分合等情況,目前確定收錄的經目有389部。2007年9月,又進而開始與“臺北版電子佛典集成”專案(http://taipei.ddbc.edu.tw/) 合作進行“集成”的工作,預計以三至四年時間完成目標。
這是一個全新的挑戰,遠比之前《大正藏》、《卍續藏》的數位化工程有著更高的難度,是以執行時也遇到一些困難,譬如這批待處理資料大都是年代久遠的雕版藏經,常有字跡模糊的狀況;而且,當中的字形異體變化極大,判別及規範均屬不易。可以瞭解,從雕版藏經《高麗藏》到鉛字排版《大正藏》,《高麗藏》經文用字的異體狀況被大幅的規範(通用化);又,從鉛字排版《大正藏》到 CBETA 電子佛典,其實也對《大正藏》異體用字做了相當程度的規範(通用化)。
2008年,《嘉興藏》選輯是我們的工作重點。《大正藏》、《卍續藏》以外尚未收錄的典籍大都集中在《嘉興藏》,當中豐富的明清禪宗史料最為學界所企盼。進行中的《嘉興藏》典籍共有283部1668卷,約1500萬字,分“原選輯”及“新增選輯”兩部份。目前已完成的《嘉興藏》選輯電子檔案,可以在國科會數典計畫“臺北版電子佛典集成”(http://taipei.ddbc.edu.tw/)網站閱讀及取得。
CBETA不但著力于《嘉興藏》,“補足現存歷代藏經經文”的作業。同時,很榮幸,CBETA取得杜鬥城先生所編輯《正史佛教資料彙編》(共一冊)以及方廣錩先生所編輯《藏外佛教文獻》(共九冊)的數位化授權,始能更進一步執行“當代補編及藏外文獻”的作業,這兩項珍貴的歷史資料,於下一版光碟中會錄入《正史佛教資料彙編》全文,以及《藏外佛教文獻》部份冊數。
此外,對於已收錄典籍的“新式標點”及“經文修訂”作業的成果。新增的“新式標點”經文有95經282卷;而“經文修訂”也新增了6657筆,分別為《大正藏》4877筆、《卍續藏》1780筆等。
未來規劃
在數位化經文生產方面,《嘉興藏》選輯完成之後,接下來處理下列資料:
1.其他藏經遺珍:共106部1100卷。
2.正史佛教資料彙編(杜鬥城輯編):1冊。
3.藏外佛教文獻(方廣錩主編):9輯。
4.大藏經補編(藍吉富主編):36冊,但扣除之前已處理過的入藏典籍。
以上四項是已經確定的目標,後三項均已取得授權。第一項是將所有入藏典籍搜羅完整,二、三兩項屬於藏外文獻的收集,第四項的重點在於近代中國佛教典籍以及國外的珍貴佛教相關文獻。這個作業方向,完全依循著 CBETA 電子佛典集成的四個步驟:
1.完成《大正藏》與《卍續藏》漢傳佛教典籍──作為基礎。
2.補足現存歷代藏經經文──完整呈現歷代藏經。
3.進行當代補編及藏外文獻──超越古德的整理。
4.未來若有餘力再進行寫本及其它形式經文之數位化。
作者簡介:
杜正民 法鼓佛教學院副院長