云南省档案馆馆藏档案数字化又添新秀
——以民国图书资料为例

2020-11-18 05:53张凤刚
云南档案 2020年10期
关键词:原书图书资料馆藏

■ 张凤刚

图书,是一代又一代人知识的凝聚、智慧的结晶。在风云际遇的历史长河中,为社会留下了一串串厚重的足印。云南省档案馆馆藏图书资料品种丰富,包括明清时期、民国时期、革命历史时期、建国后时期约十万册。装帧多样、版本各异,诸如图书、报刊、杂志、丛书、图册、影印本等类别齐全。为了使查阅利用者获得云南社会发展全方位、多角度的直观感受,2019年6月,省档案馆启动馆藏图书资料数字化库建设,计划覆盖所有图书资料馆藏。届时,将极大方便广大研究人员、大中专院校师生、文学历史爱好者的查阅利用需求,也将为馆藏档案史料的开发挖掘提供新的契机。

一、民国图书资料数字化概览

民国图书资料数字化著录条目

档号为D-005147 的图书数字化图像

省馆决定先从扫描难度最大,但是利用需求最高的民国时期图书资料着手加工。馆藏民国图书资料约有一万册,即在1949年10月建国以前的民国时期印制。首期数字化3523 本,内容涉及政治、经济、军事、历史、工业、文学、哲学、法律、教育、艺术、地理等社会的方方面面。

二、民国图书资料数字化流程

1.前处理

通过对原书的逐页翻检,了解其保存状况,为后续的保护与修复提供依据。检查过程中记录褪色、扩散、脱页、残页、缺页、跳页、夹纸、夹字、粘连、虫蛀、脆化、污渍、空白页等情况。其中,当书况有轻微破损瑕疵或是开胶脱垂时,要准备浆糊、毛笔、裁尺、裁刀、衬板、衬纸等工具,对其进行修补。有严重书质问题、不能直接扫描的书;或是书脊熔粘胶老化开裂,造成书页零散,需用棉线把书拦腰捆扎。这些问题书籍都要装入装具(如大信封),注明破损状况,不予加工,以免毁损。

2.著录

民国图书和古籍不同。古籍,又叫善本,是指未采用现代印刷技术印制的书籍。虽然民国图书资料有相当一部分是线装书,而且反映的内容是明清时期的,如《周礼精华》《四部备要》《御批历代通鉴辑览》《春秋三传》《古今清版图书集成》等,但均为正式出版社印刷的书籍,所以不能称为古籍。因此,民国图书资料的数字化不能依据2014年5月由国家古籍保护中心出台的古籍数字化工作手册(试用本)中的著录规范来直接套用(现在云南省图书馆对保存的古籍数字化加工是采用此规范)。

图书在古代称作典籍,也叫文献,兼有文书、档案、书籍三重意义。但是在近现代社会,随着各领域功能定义的范畴不断细化,致使馆藏图书资料和馆藏文书档案也有其差异性:档案本质上是人们在社会实践中直接形成的原始记录;图书本质上是系统知识的结晶,是人类对自然及社会现象进行系统认识研究的结果。所以,图书档号的编号规则有其特殊性。省馆尊重图书的原始属性,根据中国图书馆图书分类法来标注每本书的档号。档号是唯一的,编号规则是:图书分类号+书次号(六位数字)。如D-005147,代表D 类图书在库房排架第五千一百四十七本书,不够六位的补零。

中国图书馆图书分类法简表(部分)

在工作开展伊始,就要设置若干著录字段。如书名、档号、分类号、书次号、页数、开本、册数、出版发行者、作者、其他作者、丛书名、出版发行地、出版发行时间、价格、版本、备注等。原书涵盖的信息都要完整著录。其中,每本书一个档号,即为一条条目,包括丛书,有几本书就有几个档号,即有几条。如果是上下册,则共用一个档号,一并扫描。

3.扫描

图书资料以册为单位进行数字化,从封面、正文、封底依次加工。扫描设备选择零边距平板扫描仪、A3 幅面、光学分辨率600DPI、24 位真彩。数字化环境注意防护光源,避免透光或反光的影响。按1:1 比例扫描,图像不能有明显歪斜。如原件有粘贴物,先将原件与粘贴物一起扫描,然后将粘贴物掀开,再次扫描原件,这样就获得2 个图像。原书透字时,需垫上颜色相近的衬纸后扫描。发现文件漏扫时,应及时补扫并正确插入图像。

按装帧方式来看,民国图书主要分为精装、胶装、线装书几大类。每个类别都有符合其自身特点的加工设备和方式。精装本数量不多,主要是各类词典、纪念册、图册等。书的封面封底多是硬壳,内页的纸质也比较好、比较厚,不透字、不透光、字迹清晰、印刷精良。省馆存有一台彩色仿真复制非接触扫描仪,采用投射式无炫目冷光源、高精度真彩色扫描镜头、自动开启压稿玻璃、自适应压力调节托稿台,专门针对此类书籍而设。其余的普装书(即胶装、线装等),由于加工进度所限,需要采用流水化作业,适用于普通的平板扫描仪。其中,线装书页面主要有筒子页、半页、双半页等,由于纸薄易透,需要衬纸扫描;必要的时候,可以拆线展平,单页依次扫描。

拆线展平后的筒子页扫描图像

4.图像处理

在未改变原扫描件的色彩、分辨率、格式、压缩等情况下进行,减少对图像的后期处理。

5.质量检查

监理人员对照原书,对剪辑以后的图像逐页检查。检查是否有透字、裁字、变形、杂点、彩线、黑边、歪斜、杂色、模糊、漏页、重页、颠倒、背面、无边距、褶皱等现象。

6.装订还原

个别厚书由于扫描中出现弧度,需拆线压实,每页依次平扫。扫描完毕后,准备棉线、剪刀、针锥等工具,按照三孔/ 四孔装订法,尽量原孔装订还原,要求页面按原书排列准确,不得跳页、漏页。

三、民国图书数字化的难点

一是安全性保管条件苛刻,不可抗力会发生损耗。图书资料从恒温恒湿、相对封闭的档案库房调出,进入数字化加工场所。加工期间的人力调归、搬动、上架、下架、清点、拆装、派发、翻动、扫描、质检、入库等各个流程都会直接和页面接触。本就年代久远、纸质脆弱的页面经过一遍遍工序的损耗,直接会对页面寿命产生重大影响。有时质检后返工,损耗的频率就更高了。这就要求加工公司做好规划,合理地调配人员、图书的进出库频率、优化操作流程、熟练培训员工操作技能、避免重扫,尽量减少出库图书的损害;并且在加工场所、临时库房减少开关窗和柜门的次数,保持清洁和一定的温湿度,注意遮光。

二是书质新旧不一、书况各异,需要修复、适配。由于加工公司的员工不是修复专业科班出身,修复技巧不如专业人员,在加工前期,只能适当地对问题轻微的图书比如小破洞、小缺损、小虫蛀等略作修补。对于问题严重的书籍,比如档案砖、酸脆粉化的书籍无能为力,暂时不予调卷;已调出库的要装入大信封标示,暂时搁置、不予加工。另外,古体书纸张和现今的印刷用纸有很大不同,又经过了多年的生化积累,造成了材质的特殊。对于透字透光书籍的衬纸问题,要尽量选择颜色和材质相近的衬纸。纸的种类繁多,如麻纸、绵纸、皮纸、宣纸、竹纸等,每种纸又分多种颜色,从黄褐色到浅黄、纯白,深浅不一;又因为草浆成分含量的不同,从而形成各种规格。不同的颜色和材质排列组合,又衍生许多纸张的适配性。到底选哪一种衬纸适合于哪一本书,情况复杂;并且经过机器扫描以后的图像和实际的原书对比,终究会有些许差异,只能是尽量保持一致。

三是图书规格不同、印刷装订古今有异,需要选择合适的扫描方式。较厚的书具有更强回弹力的书脊,很不容易压实压平,扫描仪平板盖下来后直接造成书籍变形,从而造成图像弯曲失真。扫描这类书籍,即使小心翼翼,但效果仍差强人意,并且效率不高。古体书印刷装订不如现在规整,书页四围留白有限,有时临近中缝的字由于进入了装订线内,造成夹字。但有的书本身的装订就是歪的,目测偏差有一定角度,这时就要实事求是,书本身是什么样的,就按原状态扫描。更有一些书历经辗转,最终进入档案馆保存时,面貌已然沧海桑田:许多书页被圈点勾画、批注剪贴,附着物众多。主观上加入了很多原有读者的意志,具有很大随意性。本着忠于原书的准则,需要一一连带着扫描,此时已经不是一页一个粘贴物,扫描得到两个图像的情形了,而是一页多个图像,容易造成页码的失序和利用者阅读时的混乱。

四是馆藏图书根据类别进行库房排架,不分年代时期。经过择选后可以加工的书,和不适宜加工的书混杂在一起;民国时期的书和建国后的书编排在一起,彼此交织。所以,加工后进入数据库的图书档号并不全是按顺序排列的,中间有跳号。不利于调归卷的实施:加工人员通常要全体出动,分人分区域进库房捡卷。此时加工流程就要暂停,影响了项目的进程。

综上,省馆馆藏图书资料并非所有都适合数字化,部分书籍只能待修复完毕后再行加工。另外,在现有技术、设备条件下,一些无法很好地达到扫描效果的图书,即使很有利用价值,也只能搁置,进而影响着整体的加工进度。

四、结语

省馆馆藏图书资料形态瑰丽多姿、内容包罗万象,有许多还是异常珍贵的孤本。建设图书资料数字化库,能最大限度地对原书进行保护,有利于精细安全的档案管护体系建立;同时,对于档案资源体系的全覆盖和档案利用体系的多层次建设也都具有重要意义。

猜你喜欢
原书图书资料馆藏
白马和马可以是同一匹马吗
网络信息化环境下如何加强图书资料管理探析
馆藏高句丽铁器的显微共聚焦激光拉曼光谱分析
馆藏几件残损《佚目》书画琐记
云南省档案馆馆藏《东巴经》
姚雪垠:卡片读书法
试论图书资料管理工作的路径优化
促进图书资料管理信息化的策略分析
《水浒传》在日本江户时期的传播
浅谈如何提高图书资料管理人员综合素质