天天看點

李明傑 謝慶标 | 論古籍數字出版規範體系的建構

摘要

學術品質規範和行業管理規範是古籍數字出版良性發展的兩大保障。目前古籍數字出版已經從原文提供和資訊檢索,深入到資料加工和知識挖掘層面,成果頗豐,但各種失範問題也與日俱增,其根本原因在于缺失一套完整的出版規範體系。本文基于古籍整理的學術傳統、古籍利用的現實需求以及對古籍出版的效益預期,提出了建構古籍數字出版規範體系的保真性、共享性和協同性原則,并從學術品質規範和行業管理規範兩個方面,探讨了古籍數字出版規範體系的建設内容。

關鍵詞:數字出版 古籍出版 古籍數字化 學術規範

文 / 李明傑 謝慶标

大陸古籍數字出版從最初的文本錄入、索引編制,發展到如今的各類型古籍資料庫的建設,其功能也從簡單的提供古籍原文、檢索文獻資訊,深入到更加複雜的文本資料加工和知識挖掘層面。然而,随着古籍數字出版的發展,暴露的問題也越來越多,如因學術失範造成古籍内容的錯訛和失真、因檔案格式不同緻使古籍資源難以共享、因選題重複導緻行業無序競争,等等。為使古籍數字出版走向良性發展的軌道,目前亟需從學術品質規範和行業管理規範兩個方面,建立一套完整的古籍數字出版規範體系。

1

古籍數字出版規範體系的建構原則

古籍數字出版不是古籍内容存儲媒體的簡單轉換,而是傳統古籍整理範式在現代資訊技術條件下的拓展和延伸,是以它必須遵從古籍整理的學術規範,盡可能為讀者提供真實、完整、可靠的版本;古籍數字出版的目的不僅僅是長期儲存古籍内容,還在于更高效地深入開發古籍文獻資源,使之能為讀者無差别地共享和利用;古籍數字出版是一種出版行為,牽涉收藏和儲存古籍的圖書館、整理和研究古籍的學術機構、出版和發行古籍的出版機關等多個不同性質的主體,存在多方利益博弈,為使之發揮最大的社會效益和經濟效益,必須建立一種協作機制。基于以上整理、利用和管理的三個環節,古籍數字出版規範體系的建構,需要兼顧古籍整理的保真性原則、古籍數字資源的共享性原則和古籍數字出版的協同性原則。

(一)保真性原則

古籍原本具有“物質易損性”和“内容可複制性”,通過影印、縮微複制、數字化等方式進行内容的再生,可實作古籍内容的長期儲存,以解決古籍“藏”與“用”的沖突,但最終目的還是在于利用,這就要求古籍數字化必須保持古籍的原貌,即保真性原則。大陸文獻整理的一項優良傳統就是“述而不作,信而好古”,[1]孔子當年提出這一口号的初衷是恢複周禮,但因其以治六經為手段,這一理念經後人的闡發和弘揚後,被引申到文獻校勘、注釋、辨僞、輯佚、編纂等各個環節,進而發展成為文獻整理的一項基本原則,即尊重曆史原貌、信守典籍原文、遵從作者原意。[2]古籍數字化的本質既然是古籍整理在數字環境下的發展和延伸,就必須遵守這一原則。

然而,目前古籍數字出版實踐領域一味地強調資訊技術的進步,對文獻整理的學術傳統的傳承和借鑒不足,古籍數字出版物學術品質不高,甚至出現了很多學術失範的現象。有的在轉錄古籍文本内容時,不僅沒有按照原樣保留諱字、異體字、俗體字、假借字,還經常遺失夾注、眉批、钤印、圖檔等副文本資訊,甚至任意删除原書的序跋、注釋和校記,認為正文之外的内容都是沒有必要儲存的,如“鼎秀古籍庫”收錄的《海國圖志》,[3]數字版删去了底本的書名頁、牌記和序文;北京書同文公司開發的“明清兩朝邊塞海疆地理文獻彙編全文檢索系統”收錄的《海國圖志》[4]删去了書中總目,亦無書名頁。有的還變亂古籍體例,改變原書的分卷方式和順序,如“鼎秀古籍庫”中的《出三藏記集》[5]分卷混亂,卷一至卷十五的内容在數字版目錄中全被編入了卷一;“萬方地方志知識服務系統”中舊方志左右頁面順序颠倒。至于通過OCR識别古籍原文出現的各種錯誤,未經仔細校對就釋出出來的例子,更是不勝枚舉。這些有違保真性原則的種種纰漏,嚴重削弱了古籍數字出版的品質,也降低了學者對數字古籍的信任度和學術引用意願。

(二)共享性原則

古籍數字出版的相關技術發展至今,已經能夠滿足讀者日常的基本需要。但由于人為設定的技術壁壘,經常導緻古籍數字資源難以共享,也為下一步的大規模的古籍文本資料加工和知識挖掘制造了障礙。這既有數字出版機關(機構)保護自己合法權益的原因,也與古籍數字出版缺乏統一的技術标準有關。

首先,通行的漢字字元集不統一,有GB2312、BIG5、

Unicode、GBK等,且都或多或少存在收字不全和字迹不清的問題。即便是收錄漢字最多的Unicode 13.0版,字元總數多達143859個,仍有些古籍用字沒有收入。對于一些生僻字、不規範的異體字,以及缺筆的避諱字等,仍無法處理。利用區位私造漢字雖能臨時解決單個古籍數字出版項目缺字的問題,但在後期資源整合階段會無法顯示和檢索,進而遺失一些有價值的曆史資訊。其次,不同古籍數字出版物的資料格式混亂,各種閱讀器之間不能相容,既有像Pdf、Doc、Txt、Html、Png這類常見的檔案格式,也有像Exe、Wdl、Pdg、DjVu、Ebk、Edb、Nlc等相對少見的格式,導緻讀者在閱讀不同的古籍數字出版物時需要打開不同的浏覽器,不同格式的古籍數字資源不能互通共享。而利用相關軟體進行格式轉換時,又容易産生新的資訊失真。最後,大陸古籍著錄缺乏統一的中繼資料标準,目前古籍數字資源描述與組織常用的是CALIS所采用的CDLS中繼資料标準、CADAL項目的中繼資料标準、國家圖書館的中繼資料标準,雖說大同小異,但因為很多圖書館都願意将古籍中繼資料标引外包出去,造成中繼資料格式不一緻,标引品質難以保障,容易造成漏檢或誤檢。

針對以上情況,一方面需要從法律層面明确參與古籍數字出版各方的知識産權的權屬關系,切實保障數字出版機關(機構)的合法權益;另一方面,需要從古籍資料的存儲、組織和檢索等各個環節,大力推進古籍數字出版的标準化建設,最終實作古籍數字資源的無障礙共享。

(三)協同性原則

古籍數字出版與傳統的古籍整理的最大差別是其已經脫離了純粹的學術路線,需要全面協調不同參與主體的利益訴求,考慮不同來源、不同類型的古籍特點,才能取得最大的社會效益和經濟效益。從古籍數字出版的參與主體來說,作為古籍收藏機關的圖書館,由其事業機關的公益性決定,追求的是保護和開發古籍資源以服務讀者,提倡公藏公用,它們在版本鑒定和古籍編目方面具有人才優勢;作為古籍整理研究的學術機構,其參與古籍數字出版實踐是在數字環境下探索新的古籍整理方法,服務于人文曆史研究,它們在選題策劃、内容整理、系統功能規劃等方面是無可替代的;數字出版機關(機構)追逐的是商業利益的最大化和産業規模的擴張,關注知識産權的保護,它們在古籍數字出版技術、資本運作和産品營銷等方面具有獨特的競争力。同時,古籍資源的分布不均衡,除了國内各大系統的圖書館外,在民間和海外也有收藏。古籍類型既有普通古籍,也有善本、珍本古籍,還有各類少數民族古籍和特種古籍,它們在數字出版方面的要求也各不相同。是以,協同性也是古籍數字出版必須要遵循的原則。

2

古籍數字出版規範體系的建設内容

古籍數字出版規範體系主要由學術品質規範和行業管理規範兩部分組成。其中學術品質規範包括操作程式規範、技術标準規範和品質控制規範;行業管理規範包括行業協作規範、資訊搜集和釋出規範、古籍征集與底本使用補償規範、知識産權保護規範、安全管理規範等。

(一)古籍數字出版的學術品質規範

第一,操作程式規範。古籍數字出版的操作程式規範,是指将紙本古籍轉換成數字古籍的過程中要嚴格遵守的一系列操作準則,主要包括以下内容。

①底本遴選規範。古籍通常有多種版本,良莠不齊,數字化之前如不加審慎考察,誤選了劣本,不僅擴散了錯訛的文本,還可能使得善本因無法入選資料庫而緻湮沒。這就要通過版本源流的梳析,辨明各版本之間的關系,從中發現最接近祖本的存本,把它作為數字化的底本。有的情況,甚至要在這個底本基礎上,參校其他的版本,整理出一個新的善本,或直接選用經過校勘的整理本作為底本。對于内容殘缺、文字漫漶以至于難以掃描和轉錄的版本,應剔除在外。

②資訊登記規範。對于標明的古籍版本,應登記相關文獻資訊,主要包括書名、卷數、責任者、責任方式、版本類型、版式特征、裝訂形式、冊數、頁數、館藏來源等。這實際上是為古籍數字出版建立可供核查的底本檔案,友善日後出現任何問題時有源可溯。

③古籍掃描規範。有縮微膠片的古籍可參照《GB/T 7517-2004縮微攝影技術在16mm卷片上拍攝古籍的規定》《GB/T 7518-2005縮微攝影技術在35mm卷片上拍攝古籍的規定》和文化行業标準《WH/T 46-2012圖像資料加工規範》等标準,優先将縮微膠片轉換成高清圖像。沒有縮微膠片的,再考慮掃描古籍原本,盡量采用專用掃描器,保證冷光源、無接觸、零邊距,減少掃描時有可能發生的損傷。掃描順序依據古籍閱讀順序從右至左、大幅面輿圖等另計;掃描時遇到缺頁的情況,以顔色相近的空白頁補足,說明缺頁的文字、圖檔或水印占位情況。

④文字轉錄規範。通常使用OCR技術将古籍圖像轉錄成文本,并輔之以嚴格的人工校對。首先,要規範文本内容辨別。注釋、評點等副文本資訊應與正文在辨別上有所區分,以免互相混淆。正文大字與注文小字在系統裡以不同方法做辨別,使其在閱讀界面的展示效果不同,并在複制時用符号隔開。其次,要規範文本内容的字型。數字版古籍的功能菜單可以是簡體,但古籍的文字内容推薦以繁體呈現,以便于呈現古籍原貌和減小文字認讀的難度。選用Unicode字元集以包括盡可能多的漢字,使用支援超大字元集、能夠利用字元集内不常見漢字的輸入法進行文字輸入。因為傳抄錯誤、後世避諱改字等原因産生的通假字、避諱字,依照古籍整理專家的意見,在統一的資訊平台上進行造字工作,并以注釋的形式說明原字;異體字、異形字、俗體字則以正體字輸入,但需留下編輯标記,以便與圖像版對照。

⑤圖像處理規範。插圖是古籍不可分割的一部分,在數字化過程中必須保留。有的古籍由于字迹模糊、書體以篆書或草書為主、版式歪斜錯位或頁内分兩三欄的,也可以隻保留圖像。圖像的拍攝應該注意光源清楚、裝置清潔,書封放置的直尺位置準确、色卡無褪色污染;拍攝過程中同步展開圖像品質檢查,拍完一定數量就檢查有無順序錯誤、缺頁、重頁、漏掃、圖像模糊、頁面不完整、中縫夾字等情況,及時做好補掃、糾偏等處理工作,如原書有缺頁情況,則對缺頁進行标記。可遵循的規範有《GB/T 31219.3-2014圖書館館藏資源數字化加工規範第3部分:圖像資源》《WH/T 46-2012 圖像資料加工規範》。

⑥輔助功能添加規範。除基本的閱讀、檢索功能外,數字古籍通常需要添加一些輔助學術研究的功能。可根據對讀者需求調研的實際情況,由淺入深地添加諸如布爾邏輯檢索、詞典、年表、職官表、繁簡關聯、實體關聯、地理資訊分析、人際網絡分析等功能。輔助功能的設計也要遵循“述而不作”的基本原則,主要以提供查檢性的名物典制知識為主,或是提供根據詞頻統計、資訊分析得出的資料和事實,而不提供主觀性、誘導性的結論。

第二,技術标準規範。古籍數字出版在漢字的顯示、古籍資源的描述、存儲、組織和檢索時,必須有一套通用的中繼資料标準,這樣才能消除古籍資料資源交換和共享的障礙。本文參照國家标準《GB/T 13016-2018 标準體系建構原則和要求》,提出了古籍中繼資料标準體系的架構。

①字元集标準。對古籍數字出版而言,首先是文字顯示的字元集标準。如前所述,古籍數字化還沒有統一的字元集,這成了制約古籍數字出版漢字處理的瓶頸。2006年《國家“十一五”時期文化發展規劃綱要》和2009年《文化産業振興規劃》提出要建設“中華字庫”工程,重點研發漢字輸入、輸出、存儲、傳輸以及相容等關鍵技術,預計将建成全部漢字及少數民族文字的編碼和主要字型字元庫,可編碼字元數達到50萬左右,其中古漢字約10萬、楷書漢字約30萬、各少數民族文字約10萬字元數。[6]“中華字庫”解決了古籍生僻字、異形字不能顯示和檢索的問題,應成為大陸古籍數字出版的字元集标準。此外,在文字顯示方面還有《WH/T 91-2020漢文古籍集外字描述規範》《WH/T 90-2020 漢文古籍文字認同描述規範》等标準。

②古籍著錄标準。這類标準主要描述古籍資源的内容和外形特征。在古籍著錄方面,目前已經形成了系列标準,可供參照的有《GB/T 3792.7-2008古籍著錄規則》《WH/T 66-2014古籍中繼資料規範》《WW/T 0093-2018拓片中繼資料著錄規則》《DB32/T 3485-2018地方志著錄中繼資料規範》《國家圖書館古籍中繼資料規範與著錄規則》《國家圖書館輿圖中繼資料規範與著錄規則》《國家圖書館家譜中繼資料規範與著錄規則》《國家圖書館拓片中繼資料規範與著錄規則》等,其中既有國家标準、原文化部标準、原國家文物局标準,也有地方品質技術監督局标準、圖書館标準,雖大同小異,但還是存在不統一的問題。

③古籍分類和控制詞表标準。目前古籍的分類比較混亂,多數古籍資料庫仍采用傳統的四庫分類法,但也有古籍資料庫采用《中國圖書館圖書分類法》等新式分類法。這兩種分類方式對于古籍而言各有利弊,但長期各行其是很不利于古籍數字資源的交流與共享。1996年,北京大學姚伯嶽課題組曾參考數十種古籍分類目錄和圖書分類法,研制出結合現代圖書分類技術與傳統分類法特點的《中國古籍分類法》。該分類法按照人文社會科學、自然科學、綜合性圖書的序列,将古籍分為20個大類,采用混合制号碼,吸取了新式分類法中的複分、仿分、參見等分類技術,既照顧了現代人的思維方式,又盡可能地保留了傳統,适用于古代的中、西圖書的分類,[7]但在推廣使用過程中遭遇了很大阻力。古籍中的人名、地名、書名、職官、年号、廟号、谥号等名物典制是古籍知識組織的重要實體,但在不同種類的古籍中的表述差異很大,且普遍存在同人異名、同名異人等情況,而像《漢語主題詞表》《中國分類主題詞表》這類綜合性的控制詞表并不完全适用,還需要專門編制用于古籍主題标引和檢索的控制詞表。

④古籍加工、存儲和交換标準。這方面還沒有專門針對古籍制定的技術标準,隻有相關的行業标準可供參考,如文本加工方面有《WH/T 45-2012文本資料加工規範》《GB/T 31219.2-2014 圖書館館藏資源數字化加工規範第2部分:文本資源》;圖像資料加工方面,有《WH/T 51-2012圖像中繼資料規範》《國家圖書館圖像資源中繼資料規範和著錄規則》《IPTC圖像中繼資料(IPTC Photo Metadata)》等,古籍圖像儲存通常采用TIFF或JPEG2000格式,後者支援無損壓縮;音視訊資料加工方面,有《WH/T 51-2012 音頻資料加工規範》《國家圖書館視訊資源中繼資料規範與著錄規則》《國家圖書館音頻資源中繼資料規範與著錄規則》等;在資料儲存方面,可參照《WH/T 72-2015 圖書館數字資源長期儲存資訊包封裝規範》《國家數字圖書館長期儲存中繼資料标準規範與應用指南》等;在資料交換方面,有《YD/T 2915-2015集中式遠端資料備份技術要求》《METS中繼資料編碼與傳輸規範》等。顯然,古籍資料加工、存儲和交換方面的标準化建設還需加強。

第三,品質控制規範。古籍數字出版過程中需全程對出版物的學術品質進行監控,特别是在數字化之後,要對其進行系統性的審查,以確定古籍數字出版的項目完整、文字準确、圖像清晰、功能完備。

①審查内容的完整性,保持原有的體式結構。古籍掃描和轉錄完成後,要保證正文無缺卷、不缺頁,中縫完整,頁碼順序無錯亂;原書的書名頁、序言、目錄、注釋、評點、校記、題跋、附錄、牌記、刻工、藏印等内容資訊,應予以全部保留,且原書的體裁、結構、篇卷順序在數字化之後不得随意改變;正文與注文、批語、校記等副文本資訊應嚴格區分,不可雜糅在一起。

②審查文字的準确性,将差錯率降至合格水準。對照古籍原版,仔細核對數字文本是否存在訛文、脫文、衍文、倒文、錯簡等情況。參照2005年頒布實施的《圖書品質管理規定》,差錯率低于萬分之一的圖書編校品質認定為合格,因古籍的特殊性,建議根據其字型漫漶、缺損等情況,将差錯率放寬至萬分之三至萬分之五。生僻字、異體字無法顯示的一般用方框、黑塊表示空缺,但應計入差錯率中,超過一定比例則判定為編校品質不合格。圖像版保留底本的各種生僻字、諱字、異體字等,以友善讀者比照。

③審查圖像的清晰度及插圖的位置。古籍掃描分辨率大小的選擇,原則上以圖像清晰、完整、不影響浏覽和利用為準。依照CADAL的經驗,可采用600DPI分辨率。檔案格式使用TIFF或JPG2000,最終成品建議生成一個平台通用的PDF格式。圖像色彩可采用黑白為主,對于套印本、插圖、藏印等特殊情況則使用彩色方案。古籍由圖像轉換成數字文本格式後,有的資料庫将書中的插圖删除,隻保留了文本,涉嫌變亂原書體例。審慎的做法是,對照圖像版古籍中的插圖,在數字文本版頁面相應的位置附上插圖。如原書插圖失真未能保留,也應在插圖對應的位置留出空位,用文字說明原書插圖的情況。

④審查古籍資料庫的系統功能。古籍數字出版主要是以資料庫的形式呈現。首先,古籍資料庫應具備基本的浏覽、閱讀和檢索功能。對于每種古籍而言,資料庫都應提供圖像、繁體、簡體三套不同的版本。圖像版既友善浏覽和欣賞古籍原版的風貌,滿足版本專業研究的需要,也便于将文本版與之比對書中的文字和插圖;繁、簡兩種字型的版本,則主要供讀者閱讀原文和檢索相關文獻資訊。系統檢索效率的評價,一是要全,二是要準,三是要快。目前,大部分古籍資料庫都能實作書名、作者、全文檢索,但在知識語義層面的關聯性檢索還存在明顯不足。其次,古籍資料庫應嵌入配套的知識工具。傳統工具書中的人名詞典、地名詞典、職官表、年号表、曆代書目等,是古籍閱讀中經常要查閱的資料,應與古籍一道數字化,并以超連結的方式嵌入正文中,友善讀者随時利用。最後,古籍資料庫應提供輔助學術研究的功能。數字人文研究中的知識資訊工具可以實作對古籍文本的知識挖掘、重組和可視化,還可以對相關主題和人物進行地理、時空和社會網絡分析,并以可視化的形式呈現。

(二)古籍數字出版的行業管理規範

古籍數字出版是一個多部門、多行業、多機構共同參與的文化産業,牽涉各方參與主體的利益配置設定,為了形成有序的市場環境,必須建立一套行之有效的行業管理規範。

第一,古籍數字出版行業協作規範。古籍數字出版需要出版機構、古籍資源提供方、古籍整理專家、數字技術開發商等多方協作來完成,因為各方目标和利益不同,如果缺少長期規劃和彼此之間的協作,必然會導緻無序競争、零和博弈的情況發生,是以需要有一個統一的行業協作規範來指導古籍數字出版産業的發展。首先,古籍數字出版應以項目為機關,建立完善的項目選題報送、評審、招标制度。建議成立類似全國古籍整理出版規劃上司小組的機構,由它負責制訂古籍數字出版的中長期發展規劃、年度工作計劃、項目評選方案、項目招标實施方案,嚴格評審古籍數字出版選題,優先立項亟需搶救、學術價值高、具有學科基礎性和學派代表性、使用者需求強烈的選題,适當照顧冷門選題,避免重複選題。其次,各地方新聞出版局應推進出版社與圖書館、古籍所、數字技術開發商的合作,在古籍數字出版的資源保障、平台開發、市場營銷、利益配置設定等方面形成持續、穩定的協作機制。

第二,古籍數字出版資訊搜集和釋出規範。為了解讀者和專業研究人員不同的古籍需求,消除資訊不暢帶來的各自為政、重複出版的局面,有必要建立一個統一的古籍數字出版資訊搜集和釋出平台。從出版的角度講,古籍的普通讀者和專業研究人員的不同需求,是古籍數字出版物功能差異化設計的依據;使用者使用古籍數字出版物後回報的意見,也是改進古籍數字出版品質的重要參考。是以,這個平台應具有征集使用者需求和回報意見的功能。平台上還可釋出全國古籍數字出版中長期規劃、當年的選題計劃、古籍數字出版項目招标方案,以及每年新出版的古籍數字出版成果,讓各個古籍數字出版商之間能彼此互通聲參考、資訊共享。同時,平台還應建立古籍數字資源導航系統,便于整合現有的古籍數字資源。張力元和王軍曾選取主題、類型、格式、地區、建置主體和權限六個緯度建構古籍資料庫分面分類體系,以此來分類、描述、浏覽、檢索和連結網際網路上的古籍數字資源。[8]這一理論研究成果,可以應用于古籍數字出版資源導航系統的建設。

第三,古籍征集和底本使用補償規範。圖書館是古籍的主要收藏部門,此外還有民間收藏者及海外收藏機構。這些機構和個人為古籍的采集、收藏和保護都付出了一定的經濟成本。數字出版雖是古籍保護事業的一部分,具有一定的公益性,但同時具有商業價值,出版機構在使用這些機構和個人提供的古籍底本時,支付一定的費用是合理的。不過,也有圖書館常以此為借口限制底本使用,或收取高額的底本使用費。為保障古籍數字出版的底本來源,特别是鼓勵民間收藏者獻出孤本、珍本,促使海外漢籍的回歸,建立一項古籍征集和底本使用補償制度是非常有必要的。應根據所獻古籍的等級、品相和珍稀程度,确定補償的方式和數額。隻有這樣,才能保證古籍善本擷取管道暢通,最大範圍完成古籍的保護和出版。

第四,古籍數字出版知識産權保護規範。古籍本身沒有版權,但點校、注釋的古籍整理成果及開發的資料庫是受知識産權法保護的。古籍數字出版面臨的知識産權問題主要有兩個方面:一是古籍資料庫建設過程中,如何合理使用已有的古籍整理成果和古籍數字資源;二是古籍數字出版物上市後,如何保護自己的合法權益不受侵害。2004年南開大學在學校網站傳播“國學寶典”,被北京國學時代文化傳播有限公司訴諸法庭;[9]2005年,中華書局狀告天津索易資料技術有限公司、天津電子出版社和北京中基偉業科技發展中心未經許可,在網際網路上傳播其點校的《二十四史》和《清史稿》,北京市第一中級人民法院判決3名被告立即停止複制、出版、發行和銷售“二十五史”全文檢索閱讀系統及該系統的網絡版,并賠償中華書局125萬元。[10]鑒于此類案例經常發生,古籍數字出版在利用古籍整理成果和他人建成的古籍數字資源時,應通過版權商或有關知識産權集體管理組織取得法律許可,避免侵權行為發生。同時,古籍數字出版商也應聯合相關機關,推進古籍數字出版物版權聯合體的建立,以維護自身的合法權益。

第五,古籍數字資源安全管理規範。古籍數字資源由于存儲密度大,存儲媒體壽命短,在建設的各個階段都有必要做好安全防護措施。首先,應建立古籍數字出版物繳送制度,保證國家古籍資源庫的完整性和權威性,從戰略上保證大陸古籍數字資源的安全;其次,要建立數字安全機制,控制不同級别的通路權限,賬号使用強密碼,内容傳輸進行加密解密操作,以解決古籍數字資源可能失竊、内容損壞、内容外洩等問題;最後,建立即時的資料備份機制,以應對病毒和黑客攻擊、誤操作以及斷電、天災等意外情況造成古籍數字資源的丢失。為應對傳統資料存儲的不足,可以選擇網絡存儲服務代理。網絡存儲服務提供商以先進的裝置、可靠的技術,提供安全的資訊内容存儲、備份服務。從國外的情況看,通過接受網絡存儲服務可以節約4%—8%的成本。[11]

3

結語

大陸古籍數字出版規範體系的建設仍處在初級階段,遠落後于古籍數字出版技術取得的進展。從目前古籍數字出版的實踐情況來看,學術品質規範和行業管理規範的不健全已成為制約古籍數字出版業發展的瓶頸。筆者從整理、利用和管理的三個環節入手,提出了建構古籍數字出版規範體系的保真性原則、共享性原則和協同性原則,并初步建構了包括操作程式規範、技術标準規範、品質控制規範在内的古籍數字出版學術規範;包括行業協作規範、資訊搜集和釋出規範、古籍征集與底本使用補償規範、知識産權保護規範、安全管理規範在内的古籍數字出版行業管理規範。需要說明的是,古籍數字出版規範體系的建立是一項長期的制度建設工作,本文提出的隻是一種理論上的構想,還需要在實踐中不斷驗證和改進。

(原文發表于《出版參考》2024年4月刊)

參考文獻

*本文系教育部哲學社會科學研究重大課題攻關項目“中國古代科技文獻整理與研究”(項目号:19JZD042)的研究成果。

[1]楊伯俊.論語譯注[M].北京:中華書局,2006:74.

[2]李明傑,方正,宋時雨.文獻整理學術傳統對古籍數字化的參照價值(之二)——以“述而不作”為例[J].圖書館論壇,2020(7):142-149.

[3]魏源.海國圖志[EB/OL].[2023-04-25].http://www.ding-xiu.com/ancientbook/Portal/index/Index.do.

[4]魏源.海國圖志[EB/OL].[2023-04-25].http://stw.lib.whu.edu.cn.

[5]釋僧祐.出三藏集記[EB/OL].[2023-5-25].http://www.ding-xiu.com/ancientbook/Portal/index/Index.do.

[6]“中華字庫”工程第七包“兩漢、吳、魏、晉簡牍文字的搜集與整理”[J].吉林大學社會科學學報,2021,52(1):2+61.

[7]李明傑.簡明古籍整理教程[M].武漢:武漢大學出版社,2018:9.

[8]張力元,王軍.古籍資料庫分面分類體系設計研究[J].圖書館建設,2021(3):56-61.

[9]闫肅.南開大學使用“國學寶典”被訴侵權[EB/OL].[2012-07-15].http://www.iprlawyers.com/iprHtml/31-02/2006-3/5/20060305205954923.html.

[10]李京華.點校《二十四史》《清史稿》被侵權獲賠百萬[EB/OL].[2011-06-01].http://news. xinhuanet.com/newmedia/2005-01/04/content_2418378.htm.

[11]University of Iowa Libraries Policy for Electronic Resources Management.[DB/OL].[2021-07-15]. http:www.lib.uiowa.edu/collections/policy.Html.

【責任編輯:張迎春】

作者簡介

李明傑 謝慶标 | 論古籍數字出版規範體系的建構

李明傑,江西豐城人,管理學博士。現為武漢大學資訊管理學院三級教授、博士生導師。兼任中國索引學會第七屆理事會理事、中國圖書館學會第九屆理事會編譯出版委員會副主任委員、中國圖書館學會第十屆理事會學術研究委員會委員、中國古籍保護協會智能開發與利用專業委員會委員、《中國大百科全書》(第3版)圖書館學卷“文獻學與文獻保護”分支副主編、武漢大學文化遺産智能計算實驗室研究員、武漢大學古籍保護暨文獻修複研究中心研究員。主持教育部哲學社會科學研究重大課題攻關項目、國家社科基金項目多項,著有《宋代版本學研究》(齊魯書社2006年)、《中國出版史·古代卷》(湖南大學出版社2008年)、《中國古代圖書著作權研究》(社會科學文獻出版社2013年)、《簡明古籍整理教程》(武漢大學出版社2018年)、《暮雨弦歌:西德尼•D•甘博鏡頭下的民國教育(1917-1932)》(武漢大學出版社2019年)等,發表論文近百篇。主要研究領域:文獻整理與保護、中國圖書文化史。

出版六家

出版人的小家

出版六家公衆号的所有内容,均為原創。

未經許可,請勿使用。

歡迎合作、轉載。

繼續閱讀