李明杰谢庆标 | 论古籍数字出版规范体系的构建

摘要

学术质量规范和行业管理规范是古籍数字出版良性发展的两大保障。当前古籍数字出版已经从原文提供和信息检索，深入到数据加工和知识挖掘层面，成果颇丰，但各种失范问题也与日俱增，其根本原因在于缺失一套完整的出版规范体系。本文基于古籍整理的学术传统、古籍利用的现实需求以及对古籍出版的效益预期，提出了构建古籍数字出版规范体系的保真性、共享性和协同性原则，并从学术质量规范和行业管理规范两个方面，探讨了古籍数字出版规范体系的建设内容。

关键词：数字出版古籍出版古籍数字化学术规范

文 / 李明杰谢庆标

大陆古籍数字出版从最初的文本录入、索引编制，发展到如今的各类型古籍数据库的建设，其功能也从简单的提供古籍原文、检索文献信息，深入到更加复杂的文本数据加工和知识挖掘层面。然而，随着古籍数字出版的发展，暴露的问题也越来越多，如因学术失范造成古籍内容的错讹和失真、因文件格式不同致使古籍资源难以共享、因选题重复导致行业无序竞争，等等。为使古籍数字出版走向良性发展的轨道，当前亟需从学术质量规范和行业管理规范两个方面，建立一套完整的古籍数字出版规范体系。

古籍数字出版规范体系的构建原则

古籍数字出版不是古籍内容存储介质的简单转换，而是传统古籍整理范式在现代信息技术条件下的拓展和延伸，因此它必须遵从古籍整理的学术规范，尽可能为读者提供真实、完整、可靠的版本；古籍数字出版的目的不仅仅是长期保存古籍内容，还在于更高效地深入开发古籍文献资源，使之能为读者无差别地共享和利用；古籍数字出版是一种出版行为，牵涉收藏和保存古籍的图书馆、整理和研究古籍的学术机构、出版和发行古籍的出版单位等多个不同性质的主体，存在多方利益博弈，为使之发挥最大的社会效益和经济效益，必须建立一种协作机制。基于以上整理、利用和管理的三个环节，古籍数字出版规范体系的构建，需要兼顾古籍整理的保真性原则、古籍数字资源的共享性原则和古籍数字出版的协同性原则。

（一）保真性原则

古籍原本具有“物质易损性”和“内容可复制性”，通过影印、缩微复制、数字化等方式进行内容的再生，可实现古籍内容的长期保存，以解决古籍“藏”与“用”的矛盾，但最终目的还是在于利用，这就要求古籍数字化必须保持古籍的原貌，即保真性原则。大陆文献整理的一项优良传统就是“述而不作，信而好古”，[1]孔子当年提出这一口号的初衷是恢复周礼，但因其以治六经为手段，这一理念经后人的阐发和弘扬后，被引申到文献校勘、注释、辨伪、辑佚、编纂等各个环节，进而发展成为文献整理的一项基本原则，即尊重历史原貌、信守典籍原文、遵从作者原意。[2]古籍数字化的本质既然是古籍整理在数字环境下的发展和延伸，就必须遵守这一原则。

然而，当前古籍数字出版实践领域一味地强调信息技术的进步，对文献整理的学术传统的传承和借鉴不足，古籍数字出版物学术质量不高，甚至出现了很多学术失范的现象。有的在转录古籍文本内容时，不仅没有按照原样保留讳字、异体字、俗体字、假借字，还经常遗失夹注、眉批、钤印、图片等副文本信息，甚至任意删除原书的序跋、注释和校记，认为正文之外的内容都是没有必要保存的，如“鼎秀古籍库”收录的《海国图志》，[3]数字版删去了底本的书名页、牌记和序文；北京书同文公司开发的“明清两朝边塞海疆地理文献汇编全文检索系统”收录的《海国图志》[4]删去了书中总目，亦无书名页。有的还变乱古籍体例，改变原书的分卷方式和顺序，如“鼎秀古籍库”中的《出三藏记集》[5]分卷混乱，卷一至卷十五的内容在数字版目录中全被编入了卷一；“万方地方志知识服务系统”中旧方志左右页面顺序颠倒。至于通过OCR识别古籍原文出现的各种错误，未经仔细校对就发布出来的例子，更是不胜枚举。这些有违保真性原则的种种纰漏，严重削弱了古籍数字出版的品质，也降低了学者对数字古籍的信任度和学术引用意愿。

（二）共享性原则

古籍数字出版的相关技术发展至今，已经能够满足读者日常的基本需要。但由于人为设置的技术壁垒，经常导致古籍数字资源难以共享，也为下一步的大规模的古籍文本数据加工和知识挖掘制造了障碍。这既有数字出版单位（机构）保护自己合法权益的原因，也与古籍数字出版缺乏统一的技术标准有关。

首先，通行的汉字字符集不统一，有GB2312、BIG5、

Unicode、GBK等，且都或多或少存在收字不全和字迹不清的问题。即便是收录汉字最多的Unicode 13.0版，字符总数多达143859个，仍有些古籍用字没有收入。对于一些生僻字、不规范的异体字，以及缺笔的避讳字等，仍无法处理。利用区位私造汉字虽能临时解决单个古籍数字出版项目缺字的问题，但在后期资源整合阶段会无法显示和检索，从而遗失一些有价值的历史信息。其次，不同古籍数字出版物的数据格式混乱，各种阅读器之间不能兼容，既有像Pdf、Doc、Txt、Html、Png这类常见的文件格式，也有像Exe、Wdl、Pdg、DjVu、Ebk、Edb、Nlc等相对少见的格式，导致读者在阅读不同的古籍数字出版物时需要打开不同的浏览器，不同格式的古籍数字资源不能互通共享。而利用相关软件进行格式转换时，又容易产生新的信息失真。最后，大陆古籍著录缺乏统一的元数据标准，目前古籍数字资源描述与组织常用的是CALIS所采用的CDLS元数据标准、CADAL项目的元数据标准、国家图书馆的元数据标准，虽说大同小异，但因为很多图书馆都愿意将古籍元数据标引外包出去，造成元数据格式不一致，标引质量难以保障，容易造成漏检或误检。

针对以上情况，一方面需要从法律层面明确参与古籍数字出版各方的知识产权的权属关系，切实保障数字出版单位（机构）的合法权益；另一方面，需要从古籍数据的存储、组织和检索等各个环节，大力推进古籍数字出版的标准化建设，最终实现古籍数字资源的无障碍共享。

（三）协同性原则

古籍数字出版与传统的古籍整理的最大区别是其已经脱离了纯粹的学术路线，需要全面协调不同参与主体的利益诉求，考虑不同来源、不同类型的古籍特点，才能取得最大的社会效益和经济效益。从古籍数字出版的参与主体来说，作为古籍收藏单位的图书馆，由其事业单位的公益性决定，追求的是保护和开发古籍资源以服务读者，提倡公藏公用，它们在版本鉴定和古籍编目方面具有人才优势；作为古籍整理研究的学术机构，其参与古籍数字出版实践是在数字环境下探索新的古籍整理方法，服务于人文历史研究，它们在选题策划、内容整理、系统功能规划等方面是无可替代的；数字出版单位（机构）追逐的是商业利益的最大化和产业规模的扩张，关注知识产权的保护，它们在古籍数字出版技术、资本运作和产品营销等方面具有独特的竞争力。同时，古籍资源的分布不均衡，除了国内各大系统的图书馆外，在民间和海外也有收藏。古籍类型既有普通古籍，也有善本、珍本古籍，还有各类少数民族古籍和特种古籍，它们在数字出版方面的要求也各不相同。因此，协同性也是古籍数字出版必须要遵循的原则。

古籍数字出版规范体系的建设内容

古籍数字出版规范体系主要由学术质量规范和行业管理规范两部分组成。其中学术质量规范包括操作程序规范、技术标准规范和质量控制规范；行业管理规范包括行业协作规范、信息搜集和发布规范、古籍征集与底本使用补偿规范、知识产权保护规范、安全管理规范等。

（一）古籍数字出版的学术质量规范

第一，操作程序规范。古籍数字出版的操作程序规范，是指将纸本古籍转换成数字古籍的过程中要严格遵守的一系列操作准则，主要包括以下内容。

①底本遴选规范。古籍通常有多种版本，良莠不齐，数字化之前如不加审慎考察，误选了劣本，不仅扩散了错讹的文本，还可能使得善本因无法入选数据库而致湮没。这就要通过版本源流的梳析，辨明各版本之间的关系，从中发现最接近祖本的存本，把它作为数字化的底本。有的情况，甚至要在这个底本基础上，参校其他的版本，整理出一个新的善本，或直接选用经过校勘的整理本作为底本。对于内容残缺、文字漫漶以至于难以扫描和转录的版本，应剔除在外。

②信息登记规范。对于选定的古籍版本，应登记相关文献信息，主要包括书名、卷数、责任者、责任方式、版本类型、版式特征、装订形式、册数、页数、馆藏来源等。这实际上是为古籍数字出版建立可供核查的底本档案，方便日后出现任何问题时有源可溯。

③古籍扫描规范。有缩微胶片的古籍可参照《GB/T 7517-2004缩微摄影技术在16mm卷片上拍摄古籍的规定》《GB/T 7518-2005缩微摄影技术在35mm卷片上拍摄古籍的规定》和文化行业标准《WH/T 46-2012图像数据加工规范》等标准，优先将缩微胶片转换成高清图像。没有缩微胶片的，再考虑扫描古籍原本，尽量采用专用扫描仪，保证冷光源、无接触、零边距，减少扫描时有可能发生的损伤。扫描顺序依据古籍阅读顺序从右至左、大幅面舆图等另计；扫描时遇到缺页的情况，以颜色相近的空白页补足，说明缺页的文字、图片或水印占位情况。

④文字转录规范。通常使用OCR技术将古籍图像转录成文本，并辅之以严格的人工校对。首先，要规范文本内容标识。注释、评点等副文本信息应与正文在标识上有所区分，以免相互混淆。正文大字与注文小字在系统里以不同方法做标识，使其在阅读界面的展示效果不同，并在复制时用符号隔开。其次，要规范文本内容的字体。数字版古籍的功能菜单可以是简体，但古籍的文字内容推荐以繁体呈现，以便于呈现古籍原貌和减小文字认读的难度。选用Unicode字符集以包括尽可能多的汉字，使用支持超大字符集、能够利用字符集内不常见汉字的输入法进行文字输入。因为传抄错误、后世避讳改字等原因产生的通假字、避讳字，依照古籍整理专家的意见，在统一的信息平台上进行造字工作，并以注释的形式说明原字；异体字、异形字、俗体字则以正体字输入，但需留下编辑标记，以便与图像版对照。

⑤图像处理规范。插图是古籍不可分割的一部分，在数字化过程中必须保留。有的古籍由于字迹模糊、书体以篆书或草书为主、版式歪斜错位或页内分两三栏的，也可以只保留图像。图像的拍摄应该注意光源清楚、设备清洁，书封放置的直尺位置准确、色卡无褪色污染；拍摄过程中同步展开图像质量检查，拍完一定数量就检查有无顺序错误、缺页、重页、漏扫、图像模糊、页面不完整、中缝夹字等情况，及时做好补扫、纠偏等处理工作，如原书有缺页情况，则对缺页进行标记。可遵循的规范有《GB/T 31219.3-2014图书馆馆藏资源数字化加工规范第3部分：图像资源》《WH/T 46-2012 图像数据加工规范》。

⑥辅助功能添加规范。除基本的阅读、检索功能外，数字古籍通常需要添加一些辅助学术研究的功能。可根据对读者需求调研的实际情况，由浅入深地添加诸如布尔逻辑检索、词典、年表、职官表、繁简关联、实体关联、地理信息分析、人际网络分析等功能。辅助功能的设计也要遵循“述而不作”的基本原则，主要以提供查检性的名物典制知识为主，或是提供根据词频统计、信息分析得出的数据和事实，而不提供主观性、诱导性的结论。

第二，技术标准规范。古籍数字出版在汉字的显示、古籍资源的描述、存储、组织和检索时，必须有一套通用的元数据标准，这样才能消除古籍数据资源交换和共享的障碍。本文参照国家标准《GB/T 13016-2018 标准体系构建原则和要求》，提出了古籍元数据标准体系的框架。

①字符集标准。对古籍数字出版而言，首先是文字显示的字符集标准。如前所述，古籍数字化还没有统一的字符集，这成了制约古籍数字出版汉字处理的瓶颈。2006年《国家“十一五”时期文化发展规划纲要》和2009年《文化产业振兴规划》提出要建设“中华字库”工程，重点研发汉字输入、输出、存储、传输以及兼容等关键技术，预计将建成全部汉字及少数民族文字的编码和主要字体字符库，可编码字符数达到50万左右，其中古汉字约10万、楷书汉字约30万、各少数民族文字约10万字符数。[6]“中华字库”解决了古籍生僻字、异形字不能显示和检索的问题，应成为大陆古籍数字出版的字符集标准。此外，在文字显示方面还有《WH/T 91-2020汉文古籍集外字描述规范》《WH/T 90-2020 汉文古籍文字认同描述规范》等标准。

②古籍著录标准。这类标准主要描述古籍资源的内容和外形特征。在古籍著录方面，目前已经形成了系列标准，可供参照的有《GB/T 3792.7-2008古籍著录规则》《WH/T 66-2014古籍元数据规范》《WW/T 0093-2018拓片元数据著录规则》《DB32/T 3485-2018地方志著录元数据规范》《国家图书馆古籍元数据规范与著录规则》《国家图书馆舆图元数据规范与著录规则》《国家图书馆家谱元数据规范与著录规则》《国家图书馆拓片元数据规范与著录规则》等，其中既有国家标准、原文化部标准、原国家文物局标准，也有地方质量技术监督局标准、图书馆标准，虽大同小异，但还是存在不统一的问题。

③古籍分类和控制词表标准。目前古籍的分类比较混乱，多数古籍数据库仍采用传统的四库分类法，但也有古籍数据库采用《中国图书馆图书分类法》等新式分类法。这两种分类方式对于古籍而言各有利弊，但长期各行其是很不利于古籍数字资源的交流与共享。1996年，北京大学姚伯岳课题组曾参考数十种古籍分类目录和图书分类法，研制出结合现代图书分类技术与传统分类法特点的《中国古籍分类法》。该分类法按照人文社会科学、自然科学、综合性图书的序列，将古籍分为20个大类，采用混合制号码，吸取了新式分类法中的复分、仿分、参见等分类技术，既照顾了现代人的思维方式，又尽可能地保留了传统，适用于古代的中、西图书的分类，[7]但在推广使用过程中遭遇了很大阻力。古籍中的人名、地名、书名、职官、年号、庙号、谥号等名物典制是古籍知识组织的重要实体，但在不同种类的古籍中的表述差异很大，且普遍存在同人异名、同名异人等情况，而像《汉语主题词表》《中国分类主题词表》这类综合性的控制词表并不完全适用，还需要专门编制用于古籍主题标引和检索的控制词表。

④古籍加工、存储和交换标准。这方面还没有专门针对古籍制定的技术标准，只有相关的行业标准可供参考，如文本加工方面有《WH/T 45-2012文本数据加工规范》《GB/T 31219.2-2014 图书馆馆藏资源数字化加工规范第2部分：文本资源》；图像数据加工方面，有《WH/T 51-2012图像元数据规范》《国家图书馆图像资源元数据规范和著录规则》《IPTC图像元数据（IPTC Photo Metadata）》等，古籍图像保存通常采用TIFF或JPEG2000格式，后者支持无损压缩；音视频数据加工方面，有《WH/T 51-2012 音频数据加工规范》《国家图书馆视频资源元数据规范与著录规则》《国家图书馆音频资源元数据规范与著录规则》等；在数据保存方面，可参照《WH/T 72-2015 图书馆数字资源长期保存信息包封装规范》《国家数字图书馆长期保存元数据标准规范与应用指南》等；在数据交换方面，有《YD/T 2915-2015集中式远程数据备份技术要求》《METS元数据编码与传输规范》等。显然，古籍数据加工、存储和交换方面的标准化建设还需加强。

第三，质量控制规范。古籍数字出版过程中需全程对出版物的学术质量进行监控，特别是在数字化之后，要对其进行系统性的审查，以确保古籍数字出版的项目完整、文字准确、图像清晰、功能完备。

①审查内容的完整性，保持原有的体式结构。古籍扫描和转录完成后，要保证正文无缺卷、不缺页，中缝完整，页码顺序无错乱；原书的书名页、序言、目录、注释、评点、校记、题跋、附录、牌记、刻工、藏印等内容信息，应予以全部保留，且原书的体裁、结构、篇卷顺序在数字化之后不得随意改变；正文与注文、批语、校记等副文本信息应严格区分，不可杂糅在一起。

②审查文字的准确性，将差错率降至合格水平。对照古籍原版，仔细核对数字文本是否存在讹文、脱文、衍文、倒文、错简等情况。参照2005年颁布实施的《图书质量管理规定》，差错率低于万分之一的图书编校质量认定为合格，因古籍的特殊性，建议根据其字体漫漶、缺损等情况，将差错率放宽至万分之三至万分之五。生僻字、异体字无法显示的一般用方框、黑块表示空缺，但应计入差错率中，超过一定比例则判定为编校质量不合格。图像版保留底本的各种生僻字、讳字、异体字等，以方便读者比照。

③审查图像的清晰度及插图的位置。古籍扫描分辨率大小的选择，原则上以图像清晰、完整、不影响浏览和利用为准。依照CADAL的经验，可采用600DPI分辨率。文件格式使用TIFF或JPG2000，最终成品建议生成一个平台通用的PDF格式。图像色彩可采用黑白为主，对于套印本、插图、藏印等特殊情况则使用彩色方案。古籍由图像转换成数字文本格式后，有的数据库将书中的插图删除，只保留了文本，涉嫌变乱原书体例。审慎的做法是，对照图像版古籍中的插图，在数字文本版页面相应的位置附上插图。如原书插图失真未能保留，也应在插图对应的位置留出空位，用文字说明原书插图的情况。

④审查古籍数据库的系统功能。古籍数字出版主要是以数据库的形式呈现。首先，古籍数据库应具备基本的浏览、阅读和检索功能。对于每种古籍而言，数据库都应提供图像、繁体、简体三套不同的版本。图像版既方便浏览和欣赏古籍原版的风貌，满足版本专业研究的需要，也便于将文本版与之比对书中的文字和插图；繁、简两种字体的版本，则主要供读者阅读原文和检索相关文献信息。系统检索效率的评价，一是要全，二是要准，三是要快。当前，大部分古籍数据库都能实现书名、作者、全文检索，但在知识语义层面的关联性检索还存在明显不足。其次，古籍数据库应嵌入配套的知识工具。传统工具书中的人名词典、地名词典、职官表、年号表、历代书目等，是古籍阅读中经常要查阅的资料，应与古籍一道数字化，并以超链接的方式嵌入正文中，方便读者随时利用。最后，古籍数据库应提供辅助学术研究的功能。数字人文研究中的知识信息工具可以实现对古籍文本的知识挖掘、重组和可视化，还可以对相关主题和人物进行地理、时空和社会网络分析，并以可视化的形式呈现。

（二）古籍数字出版的行业管理规范

古籍数字出版是一个多部门、多行业、多机构共同参与的文化产业，牵涉各方参与主体的利益分配，为了形成有序的市场环境，必须建立一套行之有效的行业管理规范。

第一，古籍数字出版行业协作规范。古籍数字出版需要出版机构、古籍资源提供方、古籍整理专家、数字技术开发商等多方协作来完成，因为各方目标和利益不同，如果缺少长期规划和彼此之间的协作，必然会导致无序竞争、零和博弈的情况发生，因此需要有一个统一的行业协作规范来指导古籍数字出版产业的发展。首先，古籍数字出版应以项目为单位，建立完善的项目选题报送、评审、招标制度。建议成立类似全国古籍整理出版规划领导小组的机构，由它负责制订古籍数字出版的中长期发展规划、年度工作计划、项目评选方案、项目招标实施方案，严格评审古籍数字出版选题，优先立项亟需抢救、学术价值高、具有学科基础性和学派代表性、用户需求强烈的选题，适当照顾冷门选题，避免重复选题。其次，各地方新闻出版局应推进出版社与图书馆、古籍所、数字技术开发商的合作，在古籍数字出版的资源保障、平台开发、市场营销、利益分配等方面形成持续、稳定的协作机制。

第二，古籍数字出版信息搜集和发布规范。为了解读者和专业研究人员不同的古籍需求，消除信息不畅带来的各自为政、重复出版的局面，有必要建立一个统一的古籍数字出版信息搜集和发布平台。从出版的角度讲，古籍的普通读者和专业研究人员的不同需求，是古籍数字出版物功能差异化设计的依据；用户使用古籍数字出版物后反馈的意见，也是改进古籍数字出版质量的重要参考。因此，这个平台应具有征集用户需求和反馈意见的功能。平台上还可发布全国古籍数字出版中长期规划、当年的选题计划、古籍数字出版项目招标方案，以及每年新出版的古籍数字出版成果，让各个古籍数字出版商之间能彼此互通声参考、信息共享。同时，平台还应建立古籍数字资源导航系统，便于整合现有的古籍数字资源。张力元和王军曾选取主题、类型、格式、地区、建置主体和权限六个纬度构建古籍数据库分面分类体系，以此来分类、描述、浏览、检索和链接互联网上的古籍数字资源。[8]这一理论研究成果，可以应用于古籍数字出版资源导航系统的建设。

第三，古籍征集和底本使用补偿规范。图书馆是古籍的主要收藏部门，此外还有民间收藏者及海外收藏机构。这些机构和个人为古籍的采集、收藏和保护都付出了一定的经济成本。数字出版虽是古籍保护事业的一部分，具有一定的公益性，但同时具有商业价值，出版机构在使用这些机构和个人提供的古籍底本时，支付一定的费用是合理的。不过，也有图书馆常以此为借口限制底本使用，或收取高额的底本使用费。为保障古籍数字出版的底本来源，特别是鼓励民间收藏者献出孤本、珍本，促使海外汉籍的回归，建立一项古籍征集和底本使用补偿制度是非常有必要的。应根据所献古籍的等级、品相和珍稀程度，确定补偿的方式和数额。只有这样，才能保证古籍善本获取渠道畅通，最大范围完成古籍的保护和出版。

第四，古籍数字出版知识产权保护规范。古籍本身没有版权，但点校、注释的古籍整理成果及开发的数据库是受知识产权法保护的。古籍数字出版面临的知识产权问题主要有两个方面：一是古籍数据库建设过程中，如何合理使用已有的古籍整理成果和古籍数字资源；二是古籍数字出版物上市后，如何保护自己的合法权益不受侵害。2004年南开大学在学校网站传播“国学宝典”，被北京国学时代文化传播有限公司诉诸法庭；[9]2005年，中华书局状告天津索易数据技术有限公司、天津电子出版社和北京中基伟业科技发展中心未经许可，在互联网上传播其点校的《二十四史》和《清史稿》，北京市第一中级人民法院判决3名被告立即停止复制、出版、发行和销售“二十五史”全文检索阅读系统及该系统的网络版，并赔偿中华书局125万元。[10]鉴于此类案例经常发生，古籍数字出版在利用古籍整理成果和他人建成的古籍数字资源时，应通过版权商或有关知识产权集体管理组织取得法律许可，避免侵权行为发生。同时，古籍数字出版商也应联合相关单位，推进古籍数字出版物版权联合体的建立，以维护自身的合法权益。

第五，古籍数字资源安全管理规范。古籍数字资源由于存储密度大，存储介质寿命短，在建设的各个阶段都有必要做好安全防护措施。首先，应建立古籍数字出版物缴送制度，保证国家古籍资源库的完整性和权威性，从战略上保证大陆古籍数字资源的安全；其次，要建立数字安全机制，控制不同级别的访问权限，账号使用强口令，内容传输进行加密解密操作，以解决古籍数字资源可能失窃、内容损坏、内容外泄等问题；最后，建立即时的数据备份机制，以应对病毒和黑客攻击、误操作以及断电、天灾等意外情况造成古籍数字资源的丢失。为应对传统数据存储的不足，可以选择网络存储服务代理。网络存储服务提供商以先进的设备、可靠的技术，提供安全的信息内容存储、备份服务。从国外的情况看，通过接受网络存储服务可以节约4%—8%的成本。[11]

结语

大陆古籍数字出版规范体系的建设仍处在初级阶段，远落后于古籍数字出版技术取得的进展。从当前古籍数字出版的实践情况来看，学术质量规范和行业管理规范的不健全已成为制约古籍数字出版业发展的瓶颈。笔者从整理、利用和管理的三个环节入手，提出了构建古籍数字出版规范体系的保真性原则、共享性原则和协同性原则，并初步构建了包括操作程序规范、技术标准规范、质量控制规范在内的古籍数字出版学术规范；包括行业协作规范、信息搜集和发布规范、古籍征集与底本使用补偿规范、知识产权保护规范、安全管理规范在内的古籍数字出版行业管理规范。需要说明的是，古籍数字出版规范体系的建立是一项长期的制度建设工作，本文提出的只是一种理论上的构想，还需要在实践中不断验证和改进。

（原文发表于《出版参考》2024年4月刊）

参考文献

*本文系教育部哲学社会科学研究重大课题攻关项目“中国古代科技文献整理与研究”（项目号：19JZD042）的研究成果。

[1]杨伯俊.论语译注[M].北京：中华书局，2006：74.

[2]李明杰，方正，宋时雨.文献整理学术传统对古籍数字化的参照价值（之二）——以“述而不作”为例[J].图书馆论坛，2020（7）：142-149.

[3]魏源.海国图志[EB/OL].[2023-04-25].http://www.ding-xiu.com/ancientbook/Portal/index/Index.do.

[4]魏源.海国图志[EB/OL].[2023-04-25].http://stw.lib.whu.edu.cn.

[5]释僧祐.出三藏集记[EB/OL].[2023-5-25].http://www.ding-xiu.com/ancientbook/Portal/index/Index.do.

[6]“中华字库”工程第七包“两汉、吴、魏、晋简牍文字的搜集与整理”[J].吉林大学社会科学学报，2021，52（1）：2+61.

[7]李明杰.简明古籍整理教程[M].武汉：武汉大学出版社，2018：9.

[8]张力元，王军.古籍数据库分面分类体系设计研究[J].图书馆建设，2021（3）：56-61.

[9]闫肃.南开大学使用“国学宝典”被诉侵权[EB/OL].[2012-07-15].http://www.iprlawyers.com/iprHtml/31-02/2006-3/5/20060305205954923.html.

[10]李京华.点校《二十四史》《清史稿》被侵权获赔百万[EB/OL].[2011-06-01].http://news. xinhuanet.com/newmedia/2005-01/04/content_2418378.htm.

[11]University of Iowa Libraries Policy for Electronic Resources Management.[DB/OL].[2021-07-15]. http:www.lib.uiowa.edu/collections/policy.Html.

【责任编辑：张迎春】

作者简介

李明杰，江西丰城人，管理学博士。现为武汉大学信息管理学院三级教授、博士生导师。兼任中国索引学会第七届理事会理事、中国图书馆学会第九届理事会编译出版委员会副主任委员、中国图书馆学会第十届理事会学术研究委员会委员、中国古籍保护协会智能开发与利用专业委员会委员、《中国大百科全书》（第3版）图书馆学卷“文献学与文献保护”分支副主编、武汉大学文化遗产智能计算实验室研究员、武汉大学古籍保护暨文献修复研究中心研究员。主持教育部哲学社会科学研究重大课题攻关项目、国家社科基金项目多项，著有《宋代版本学研究》（齐鲁书社2006年）、《中国出版史·古代卷》（湖南大学出版社2008年）、《中国古代图书著作权研究》（社会科学文献出版社2013年）、《简明古籍整理教程》（武汉大学出版社2018年）、《暮雨弦歌：西德尼•D•甘博镜头下的民国教育（1917-1932）》（武汉大学出版社2019年）等，发表论文近百篇。主要研究领域：文献整理与保护、中国图书文化史。

出版六家

出版人的小家

出版六家公众号的所有内容，均为原创。

未经许可，请勿使用。

欢迎合作、转载。

李明杰谢庆标 | 论古籍数字出版规范体系的构建

继续阅读

这本古籍的每一页都藏着岁月的故事，翻开它，仿佛能听到历史的声音。

翻开一页古籍，穿越千年的智慧。

《陈子性家藏书》古代钦天监里的一个大师所藏的一本地理和择日学古籍，是这个领域里的一本经典古籍藏书，不可错过！

甄嬛无意间一句话，害得自己的父亲甄远道被革职下了大狱，全家抄家流放到苦寒之地宁古塔。电视剧《甄嬛传》中，甄远道和瓜尔佳·

当搞古籍的人去看鲁迅时，看到的是别人未曾注意到的鲁迅

20年过去了，才发现04年亚洲杯李明攻破日本球门是国足史上巅峰

88岁老戏骨李明启自己去逛超市，满头白发略显疲惫，老到认不出！

李明禄：云计算、网络计算到云网融合的演变 | CNCC专家谈

珍贵古籍醒过来活起来传下去，国图让古籍全方位与公众亲密接触

玩逆水寒门槛都这么高了吗？不仅要懂民俗，还得懂古籍甲骨文！

金陵图书馆展出特藏珍贵古籍，古籍普查仍在进行中

新手藏书家如何购买第一册古籍？

世界艺术巅峰：十大领袖人物李明

重阳活动：唐国强朗诵，88岁李明启神采奕奕，于适劈腿风波后露面

古时，某县，一男子吃了妻子送的午饭后，竟然七窍流血，气绝身亡，妻子被判砍头，然而，新任知府看过后，却说：“去，给我把全县

中国书刊发行业协会古籍发行工作委员会第一次会员代表会议暨成立大会顺利召开

李明杰 谢庆标 | 论古籍数字出版规范体系的构建

继续阅读

李明杰谢庆标 | 论古籍数字出版规范体系的构建