什么是數(shù)字檔案館,現(xiàn)在尚無定論。無論是學(xué)術(shù)研究人員,還是項(xiàng)目建設(shè)人員,大都處在摸索和實(shí)驗(yàn)的階段。目前在學(xué)術(shù)界主要有兩種觀點(diǎn):一種觀點(diǎn)認(rèn)為數(shù)字檔案館是一種實(shí)體概念,是全方位實(shí)現(xiàn)信息化的新型檔案館,它包括服務(wù)數(shù)字化和檔案館其他業(yè)務(wù)職能的信息化。實(shí)現(xiàn)了數(shù)字化館藏的存儲(chǔ)、維護(hù)、傳輸和提供利用,同時(shí)實(shí)現(xiàn)了文檔接收、征集、整理、著錄、鑒定、編研、維護(hù)、保管、遷移等各項(xiàng)工作的信息化。第二種觀點(diǎn)認(rèn)為,數(shù)字檔案館是一個(gè)跨越空間的檔案信息資源的集成,主體是基于網(wǎng)絡(luò)的共享數(shù)據(jù)庫系統(tǒng),它突破了館與館之間的物理界限,將分散在不同物理位置、不同載體上的信息聯(lián)接起來,向用戶提供方便快捷的在線信息服務(wù)。①簡單來說,基于本館信息化②的數(shù)字檔案館和基于信息共享的數(shù)字檔案館將成為數(shù)字檔案館的主要形式。而且實(shí)踐將說明,這兩種數(shù)字檔案館具有很大的互補(bǔ)性,未來應(yīng)該看到基于“信息化充分發(fā)展的檔案館“的信息共享空間。
在國際檔案界,“數(shù)字檔案館”(digital archives)概念雖然目前不像“電子文件”那么“火爆”,但卻有逐漸升溫的可能,而且相關(guān)的項(xiàng)目也越來越多。美英兩國關(guān)于數(shù)字檔案館的研究比較集中,而加拿大、澳大利亞、荷蘭等國家雖然對美英兩國數(shù)字檔案館中的某些項(xiàng)目內(nèi)容也有深入研究,但卻相對分散,而且較少使用“數(shù)字檔案館”這樣的概念。本文將主要以美國和英國的情況為例,對國外數(shù)字檔案館建設(shè)進(jìn)行簡單的介紹。
一、基于信息共享的數(shù)字檔案館
此類項(xiàng)目主要是由圖書館等機(jī)構(gòu)發(fā)起而由檔案館參與的項(xiàng)目,其中較為典型的有伊利諾斯數(shù)字檔案館。該“數(shù)字檔案館”主要是由該州的圖書館和行政部門聯(lián)合建設(shè)和維護(hù),參加者有15個(gè)機(jī)構(gòu),除了伊利諾斯州檔案館之外,還包括兩所學(xué)校,一個(gè)歷史研究會(huì)和一個(gè)博物館。其項(xiàng)目的主要目的是在網(wǎng)上為用戶提供有關(guān)該州歷史和現(xiàn)狀的信息,同時(shí)為項(xiàng)目參加機(jī)構(gòu)向伊利諾斯數(shù)字檔案館上傳數(shù)據(jù)提供工具。
這樣的合作項(xiàng)目還有美國的西北數(shù)字檔案館 (northwest digital archives),該數(shù)據(jù)庫于2002年初由13個(gè)機(jī)構(gòu)共同建立。該項(xiàng)目得到美國國家人文基金批準(zhǔn),資助金額為兩年35萬美元。參加該項(xiàng)目的13個(gè)機(jī)構(gòu)除了高校和歷史協(xié)會(huì)之外,還包括華盛頓州檔案館、西雅圖市檔案館。該數(shù)據(jù)庫最終將安裝在華盛頓州立大學(xué),為各類研究人員提供在線的信息檢索和服務(wù)。
因?yàn)樵跉W美國家數(shù)字圖書館的建設(shè)中包括檔案資源,因此這種由圖書館、檔案館參加的基于信息共享的數(shù)字檔案館非常普遍。其核心部分主要是數(shù)據(jù)庫和網(wǎng)站建設(shè)。數(shù)字檔案館建設(shè)的過程中除了遇到數(shù)字化技術(shù)、數(shù)據(jù)壓縮、數(shù)據(jù)組織、信息檢索等技術(shù)問題之外,還會(huì)遇到數(shù)字化權(quán)、著作權(quán)、隱私權(quán)等法律難題。
由于該類型的項(xiàng)目主建方不是檔案機(jī)構(gòu),也就無形中降低了從專業(yè)角度對它進(jìn)行分析的價(jià)值。從目前掌握的材料,似乎還沒有由若干檔案館聯(lián)合建立的基于信息共享的數(shù)字檔案館。
二、基于本館信息化的數(shù)字檔案館
這種類型的數(shù)字檔案館,根據(jù)其現(xiàn)階段信息化側(cè)重的不同,可分為重視服務(wù)數(shù)字的項(xiàng)目和強(qiáng)調(diào)各項(xiàng)業(yè)務(wù)活動(dòng)信息化的項(xiàng)目。前一種基于數(shù)據(jù)的積累,后一種則基于各種研究成果的積累。此分類并不是數(shù)字檔案館類型的劃分,而只是強(qiáng)調(diào)不同數(shù)字檔案館項(xiàng)目切入點(diǎn)的區(qū)別,因?yàn)檫@兩種思路將會(huì)殊途同歸,英國的NDAD(National Digital Archive of Datasets)和美國的電子文件檔案館(BRA)分別是這兩類的代表。
1、基于服務(wù)信息化的數(shù)字檔案館
20世紀(jì)90年代,英國國家檔案館為了履行安全保管和提供利用電子文件的義務(wù),實(shí)施了兩項(xiàng)計(jì)劃,一項(xiàng)是針對政府機(jī)構(gòu)產(chǎn)生的電子文件的EROS(E1ectronic Records Oelce System);另一項(xiàng)就是NDAD。NDAD是為了保存和利用結(jié)構(gòu)數(shù)據(jù)集(DATASET)而提供的整套系統(tǒng)和服務(wù),由倫敦大學(xué)計(jì)算機(jī)中心和倫敦大學(xué)圖書館建設(shè)和維護(hù)。NDAD的主要功能包括,接受、存儲(chǔ)、保管政府部門產(chǎn)生的需要永久保存的數(shù)據(jù)集(比如每年的農(nóng)業(yè)人口普查、犯罪統(tǒng)計(jì)、污染土地面積的報(bào)告等),并且提供利用。1998年3月,NDAD作為一項(xiàng)服務(wù)向社會(huì)推薦。公眾可以通過網(wǎng)站訪問某些政府部門的一手?jǐn)?shù)據(jù)和背景材料。為了提高服務(wù)質(zhì)量,NDAD還提供了隨時(shí)報(bào)道數(shù)據(jù)變化和發(fā)展的在線新聞服務(wù)。
NDAD項(xiàng)目主要側(cè)重于數(shù)字館藏的信息服務(wù),雖然它也在網(wǎng)站和系統(tǒng)建設(shè)的基礎(chǔ)上兼顧了數(shù)字檔案的保管問題。但該項(xiàng)目對電子文件真實(shí)性、完整性、長期可讀等問題的研究并不深入,而且該項(xiàng)目中的數(shù)據(jù)種類相對單一(主要是結(jié)構(gòu)化的數(shù)據(jù))。這兩個(gè)因素都在一定程度上降低了該項(xiàng)目的示范作用。
2、基于整體職能信息化的數(shù)字檔案館
其中最具代表性的就是美國國家文件和檔案管理局(NARA)組建的電子文件檔案館(ERA,E1ectronic Record Archives)。與NDAD相比,ERA更側(cè)重于電子文件和數(shù)字文獻(xiàn)的各項(xiàng)管理技術(shù)研究。
20世紀(jì)90年代末以來,美國國家檔案和文件管理局發(fā)現(xiàn)其收集的電子文件種類日益豐富,除了數(shù)據(jù)文件、數(shù)據(jù)庫之外,還有電子郵件、地理空間數(shù)據(jù)、數(shù)字影像等等結(jié)構(gòu)復(fù)雜的數(shù)據(jù),電子檔案管理的難度和復(fù)雜程度今非昔比。此外公眾迫切希望能夠通過在線的方式獲取國家檔案館中保存的電子文件。這些壓力和挑戰(zhàn)促使美國國家檔案和文件管理局決定自2000年起建立一個(gè)自動(dòng)化程度很高的集成系統(tǒng),在實(shí)現(xiàn)數(shù)字資源提供利用的同時(shí),管理、維護(hù)各種類型電子文件,保證其真實(shí)、完整和長期可讀。該項(xiàng)目就是電子文件檔案館。美國國家檔案與文件管理局希望能夠設(shè)計(jì)一個(gè)接收、保管和提供利用的系統(tǒng),它不只是軟件系統(tǒng),還包括政策、工作流程、標(biāo)準(zhǔn)和必需的技術(shù)等。與NDAD不同,電子文件檔案館立足于解決任何類型的電子文件(而不僅限于結(jié)構(gòu)數(shù)據(jù))對特定硬件和軟件的依賴問題,其職責(zé)就是不管多長時(shí)間,只要社會(huì)需要,就能夠提供可讀和有效的電子文件。
為了實(shí)現(xiàn)這樣的項(xiàng)目預(yù)期,ERA資助了很多研究項(xiàng)目,并與美國國家科學(xué)基金會(huì)(NSF)進(jìn)行了深入的合作,其中包括在美國國家圣地亞哥超級計(jì)算中心的“檔案和電子文件的持久管理”項(xiàng)目;美國國家歷史出版物和文件委員會(huì)在圣地亞哥超級計(jì)算中心的項(xiàng)目“依賴于軟件的電子文件的保存和利用”。此外電子文件檔案館還贊助了美國InterPARE5等。這些項(xiàng)目的研究結(jié)果將成為美國電子文件檔案館的技術(shù)基礎(chǔ)。
美國國家檔案與文件局稱ERA是未來的檔案館,這類檔案館沒有局限在某個(gè)地理位置上,數(shù)字技術(shù)保證人們能夠通過INTERNET在世界各地方獲得檔案信息。但從另一個(gè)角度來說,ERA在功能上確實(shí)等同于傳統(tǒng)的實(shí)體檔案館。從這個(gè)角度來看,KRA確實(shí)是一個(gè)相對徹底和完善的檔案館信息化項(xiàng)目。
2002年8月14日,ERA向供應(yīng)商們征集電子文件檔案館的各類解決方案。并決定在2003財(cái)政年度的第二個(gè)季度召開一次業(yè)界的會(huì)議。③
3、基于物理實(shí)體館址的數(shù)字檔案館
ERA的設(shè)計(jì)過程中,專家們已經(jīng)考慮到場所的問題。但就目前來看,ERA項(xiàng)目目前看來還是屬于一個(gè)集成系統(tǒng)的建設(shè),對于新館建筑可能會(huì)在項(xiàng)目成熟之后開始籌劃。英國的NDAD也是一個(gè)系統(tǒng),是一個(gè)沒有考慮實(shí)體建筑的數(shù)字檔案館項(xiàng)目。但國際檔案界對電子文件、數(shù)字信息保管的研究中開始出現(xiàn)一種新的呼聲—基于新型的現(xiàn)代化建筑的檔案保管策略。這樣的建筑可能會(huì)更多地考慮合理的網(wǎng)絡(luò)布線,嚴(yán)格的保管環(huán)境和技術(shù)環(huán)境等要素。和該理論相呼應(yīng),2002年6月18日一個(gè)基于物理館址的數(shù)字檔案館將在美國華盛頓破土動(dòng)工。④華盛頓州官員Sam Reed稱,這是美國國內(nèi)第一個(gè)組建數(shù)字檔案館。這個(gè)數(shù)字檔案館將立足于解決各類電子文件的管理問題,包括電子郵件、網(wǎng)站文件和政府的數(shù)據(jù)庫文件等。這個(gè)投資1430萬美元、占地48000平方英尺的數(shù)字檔案館大樓預(yù)計(jì)15年之內(nèi)將擁有800TB的信息量,這可能相當(dāng)于2000億張紙質(zhì)文件。而且據(jù)有關(guān)專家的介紹,美國的德克薩斯州今年也開始了同樣的數(shù)字檔案館項(xiàng)目,并且這兩個(gè)項(xiàng)目將由美國同一家公司完成。
注釋:
①馮惠玲主編,《電子文件管理教程》,北京:中國人民大學(xué)出版社,第23頁。
②實(shí)體的數(shù)字檔案館不是基于館藏?cái)?shù)字化,而是基于信息化的全面發(fā)展。它包括服務(wù)數(shù)字化和其他各項(xiàng)業(yè)務(wù)職能的信息化兩部分。服務(wù)數(shù)字化主要是包括館藏檔案的數(shù)字化及存儲(chǔ)、壓縮、保管和提供利用。而各項(xiàng)業(yè)務(wù)職能信息化包括:數(shù)字文件的保管,數(shù)字文獻(xiàn)長期可讀性的維護(hù),電子文件的歸檔、傳輸與管理,電子文件真實(shí)性、完整性維護(hù)與鑒定等。
③http://www.efs.gov/spg/NARN/NAA/AC/NZ/NA-MA02SEM0009/listing.html
④據(jù)IDG(國際數(shù)據(jù)集團(tuán))旗下的計(jì)算機(jī)世界(COMPUTER WORLD)報(bào)道。
(牛角摘自《中國檔案》2003年第3期)