浅谈套录中文图书数据存在的问题及对策

2009-06-11 05:13张洪铭
图书馆界 2009年4期
关键词:数据

图书馆界(LibraryWorld)2009年第4期(No.4,2009)张洪铭:浅谈套录中文图书数据存在的问题及对策[摘要]本文结合广西壮族自治区图书馆编目工作的实际情况,着重分析了现阶段套录中文图书数据编目过程中存在的问题,并提出了提高图书编目数据质量的建议。

[关键词]套录;中文编目;数据

[中图分类号]G254[文献标志码]B[文章编号]1005-6041(2009)04-0104-03[HT]

套录编目是指编目员为一种图书编目之前,先对从外部获取的编目数据进行必要的编辑加工,从而转换为本馆数据库记录的过程。中文图书数据套录可以提高分编工作的效率及编目质量,减轻分编人员的工作压力,但由于我国制作编目数据的单位很多,采用的标准也不一致,使得中文图书编目套录数据时遇到了不少问题。本文就目前中文图书编目套录中存在的问题进行分析,并提出相应的对策。

1 图书馆中文图书套录数据的来源

1.1权威情报机构的数据

国家图书馆联合编目中心和深圳图书馆联合编目中心提供的编目数据,其数据质量和可信度在国内的声誉比较好,也是国内各大省市图书馆目前使用率最高的数据来源。高校图书馆则更多采用的是CALIS联合目录中心数据库提供的编目数据。

1.2书商的数据

一些书商往往为客户购买的图书提供编目数据,保证了图书和数据的集中性和及时性,但是此类数据大多为字段不完整的采访数据,基本内容不够完整且主题分析不准确,因此仅做参考。

1.3自编的数据

对于查重后无数据的新书,馆多采取自编的方式著录。比如多卷书或丛书的著录,套用馆同类书的数据是较为方便的方式。

2 套录数据存在的问题及对策

编目数据的套录一般是从查重数据开始到存盘入库结束,其过程为:查重—确定—检查修改—存盘。将本馆编目系统中的数据与手中编目实体所反映的信息内容逐一对照检查,两者若有不符,则以实体内容为依据进行数据的修改、补充,并加上本馆馆藏信息项,完整的书目数据即可完成。在实际的套录工作中,常常发现来源于外部的编目数据总会有与本馆的编目细则存在着许多不一致的地方,一般多见于书名、外国责任者项、出版发行项和丛书项等项。

2.1国际标准书号(ISBN)项的著录

该字段除国际标准书号(ISBN)外,还包含有著作的装订形式、价格及错误的ISBN号。在010字段的@d价格的著录就因为规则不同表现为CNY、RMB,目前《中国文献编目规则(第二版)》明确规定@d价格的著录采用CNY,这就要求数据提供商按照要求著录。由于数据的来源不同,在套用数据中常发现随书光盘的著录格式不一样,有的将光盘的ISBN号著在“010”字段,例:010##@a7-900110-62-3@b光盘;有的将光盘的ISBN号放”307”字段,例307##@a附光盘:ISBN7-900110-62-3。

2.2题名项的著录

该字段包括题名、其他题名信息与题名相关的责任说明,以及出现在题名页上的用其他语言重复的并列信息(并列题名、并列责任说明等)。副题名的著录,要分清楚题名和副题名的关系,一般情况下“:”后面的内容作副题名处理,但不能一概而论,要根据具体的情况进行著录[1]。例如:1)2001#@a中国:经济转型与经济政策,在本例中“:”后面的内容起到了并列修饰的作用,因此共同作为正题名才合适;2)2001#@a古庙探幽:西安名庙,在本例中“:”后面的内容同样是起了修饰前面的内容,所以应该作为正题名。

2.3外国责任者的著录

在著录外国责任者时,是按照规范汉译姓著录还是完全按照题名页上的责任者信息来著录,这种矛盾时常困扰这编目人员。CNMARC中有关责任者的著录主要集中在200、304、7xx字段中。而有关外国责任者的著录又多了一项:314字段,314字段主要是对提供检索点的7xx字段中外国责任者的补充说明。目前CALIS对外国责任者的著录方式主要有两种:701字段按照规范汉译姓著录或完全按照题名页上的责任者信息来著录。为了综合以上两种著录情况各自不同的优缺点,笔者建议再加一个703字段,著录题名页上标非规范汉译姓的外国责任者,而编目员取著者号码则按照701字段的规范汉译姓来取。例如:

2001#@a诱拐@f(英)罗•路•斯蒂文森著@g张建平译

314##@a责任者Stevenson的规范汉译姓为:史蒂文森

701#1@a史蒂文森@g(Stevenson,RobertLouis)@4著

703##@a斯蒂文森@g(Stevenson,RobertLouis)@4著

其中703字段有检索意义,这样的话可能看上去有点多余,但是弥补了以往著录方法的缺点,既解决了读者利用题名页上的外国责任者汉译姓检索的问题,不会造成图书漏检,提高了馆藏图书资源的利用率;又解决了编目员取责任者号码的问题,避免了同一责任者取不同著者号的问题,也解决了排架问题,给读者查找图书带来了方便。

2.4附注项的著录

附注项是对题名与责任说明、版本、出版发行信息、载体形态、丛编等信息内容的附注与补充说明[2]。在CNMARC中本信息块有30个字段,对该项的著录,各馆的要求有所不同,一般只是选择较为重要的项目进行著录。为了有利于不同编目人员统一套录工作以及图书馆工作的延续性和一致性,我馆对这一字段都有着较明确的规定。例如,为了说明教材性质以及读者对象,会看到“高等学校教材”字样出现在题名页上,许多外部数据放入“225丛书项字段”,我们套录数据时往往应书而异,对于该类型的图书,如属丛书的性质才入225丛书项,否则入“300一般附注字段”即可。

2.5丛书、多卷书的著录

对丛书的著录,从理论上讲,可分为按整套集中著录和按册分散著录两种方式。图书馆界对于丛书用何种方法著录,到目前为止也没有取得一致意见,但总的倾向多为分散著录。因为计算机进行编目工作,书目数据库中每条记录都是检索点,读者使用起来非常方便,而读者通常习惯是书名检索,因此应该进行分散著录。丛书中的每一分册都是可以单独存在的完整著作,以分册为主体进行分散著录,一个分册对应一条书目记录,能更全面更好地揭示与反映实际库存情况。多卷书的著录也可以采用分卷著录,克服集中著录书目数据不够明确的缺点,充分记录它们的内容特征,使所编数据具有一定内在联系,相互字段呼应,整体关系匹配,成为最详细的完整著录,达到书目数据的标准规范化,以实现信息的增值利用[3]

2.6主题分析的著录

主题词内涵的揭示与主题词使用的规范是为了描述、查找、存储、检索文献的主题,从而建立的一个具有检索工具意义的规范化词表。主题词在书目数据中占有非常重要的地位,以至于成为CNMARC中缺一不可的必备字段。在锁定主题之前,首先要根据文献检索存贮的要求,对文献内容进行分析,从中提炼主题的概念。主题分析包括文献的审读、概念的提炼,隐含概念的分析、主题类型的确定、主题结构分析5个环节,其中隐含概念的分析是较为重要的一环,关系到主题标引、文献归类是否准确的实质性问题[4]。如:《敲醒心灵的能量——迅速平衡情绪的思维场疗法》一书是部翻译作品,从题名表述上似乎是心理学的情绪与情感类,因此有人给出的主题词是:“情绪”“心理学”。经过仔细分析、翻阅书中的序和译序后,我们给出的主题词是“按摩疗法”,鉴于该书涉及心理方面的活动,为了充分揭示该书所涉及的其他相关内容,我们又给出“医学心理”这一主题词。随着科技的迅猛发展,高新技术领域和其他行业里派生出大量的专业的、时尚的新词汇,如:网页制作、数码技术、项目管理、物业管理、知识管理等,这些词汇的大量涌现,为我们给书目数据标引提出了新的课题。为了更好地提高文献的检索效率,在这些新词没有被收入主题词表之前,我们只能将这些新词当作自由词处理,在610字段予以揭示。

2.7记录来源的著录

该字段是必备字段,包括记录来源的标记、编制数据的机构、将数据转化为机读形式的机构、修改原始书目记录/数据的机构以及发行纪录的机构。该字段套录到馆后应该保留,套录数据时,依据《中国机读目录格式使用手册》的有关规定,原有字段保留,再添加一个801字段,将新添字段的指示符的“0”改为“2”。例:801#0@aCN@bNLC@c20090218801#2@aCN@bGXG@c20090608这样才可以准确反映出该记录的来源,表示该书目数据是由国家图书馆(NLC)于2009年2月18日编制的,广西壮族自治区图书馆(GXG)于2009年6月8日进行了修改。

3 提高图书套用数据编目质量的几点建议

3.1职业道德的教育

良好的职业道德是搞好专业工作的前提。编目的实质是全面正确地揭示图书的内在与外在特点,让读者透过记录认识图书并能加以利用,记录的质量直接影响图书的利用率。图书馆人员面对繁琐枯燥的编目工作必须具有良好的职业道德和敬业精神,敬业爱岗,以高度的责任感,一丝不苟地对待自己的工作。干一行,爱一行,钻一行,一定要专心致志,全面、真实、准确地揭示图书的特点。图书馆工作环环相扣,编目工作更讲究团体协作。编目人员要有全局观念,不能把编目工作看成个人的工作,必须认识到个别环节的出错有可能影响全局的工作质量。

3.2加强合作和交流,协调工作

首先,是与书商及时沟通。将本馆的编目规则分发给合作书商,使他们有章可循。在合作过程中遇到问题,要及时沟通、解决。其次,是编目人员之间的沟通和学习。最突出的表现在多卷书的处理上,因为此类书籍有时不能一次到馆,或者即使一次到馆,却被分成不同批次分编,从而在不同编目人员的手中,极易造成漏查、错查。因此,在遇到同一系列的丛书、多卷书时,分编人员在仔细查重的同时,相互之间应及时进行信息沟通,以保证套录数据的质量。由于编目人员都有各自的技术优势,彼此的沟通和交流有助于全体编目人员的技术向全方位发展,达到双赢的效果。

3.3制定具有本馆特色的套录数据审校细则

在套录外来数据时,不能一味地照搬照抄,应依本馆的实际情况,严格按照《中国图书馆分类法》(第四版)、《中国文献编目规则》和《中国机读目录格式使用手册》等制定各馆的套录数据审校细则。如我馆根据本馆的馆藏特色、服务对象,应制定出《普通中文图书套录数据审校基本要求》,详细地规定馆藏书目数据著录的详简级次、分类与主题标引的深度、索书号的分配等,并以此为根据对源数据的著录和分类加以适当修改,建立适合于本馆使用的书目数据库。在套录数据时,不能照搬照抄,应当根据本馆所制订的分类使用本、著录规则等适当加以修改。

3.4业务能力的培训

任何一个编目人员所受的教育都不可能是终极教育,编目员除系统掌握图书情报专业知识之外,还应掌握计算机操作,掌握计算机网络知识和外语知识等,所以对编目人员进行继续教育是必要的。继续教育可弥补学位教育的不足,是补充新知识和新技能的有效途径。进行岗位培训与继续教育应侧重于实际操作能力的提高。针对编目人员业务方面的继续教育,应包括国内外联机编目培训班、网上资源编目培训班、各种分类主题标引培训班等。同时引入竞争机制,强化编目人员的管理。编目员一定要经过各编目中心的执证编目员培训班的培训,才能独立完成标准书目数据制作及数据上传、下载工作,从而使本馆数据库书目数据更加规范。

3.5更新软件并规范数据库

各馆在建立自己的数据库时,要做好前期准备工作,确保数据准确和建库工作质量,符合CNMARC的标准,并及时对本馆使用的软件不断更新、升级。同时,对过去有数据库中的不规范书目数据最大限度地进行修改和弥补,是一项刻不容缓的工作,它关系到图书馆信息资源的“根基”是否牢靠。

4 结论

知识经济社会的不断发展,网络化、信息化的普及,使得编目工作的模式发生了巨大的变化。编目工作不再是在一个封闭的环境里对馆藏文献进行一般的加工,而是在动态的环境中对文献进行知识整序,书目数据的套录成为图书编目发展的主流趋势,它的不断完善,将是未来图书馆实现更大程度上的联机编目和馆际互借的前提。

[参考文献]

[1]国家图书馆.新版中国机读目录格式使用手册(修订版)[M].北京:北京图书馆出版社,2004.

[2]陈艳茹,杨雪绒.套录数据存在的问题与对策[J].情报杂志,2007(10).

[3]林帼贞,周清.中文图书套录编目探析[J].图书与档案管理,2006(3).

[4]周晓红.中文套录编目应注意的问题[J].连云港师范高等专科学校学报,2007(1).

[收稿时间]2009-04-01

[作者简介]张洪铭(1981—),男,助理馆员,大学本科。

猜你喜欢
数据
智能大棚温湿度监测系统的设计开发
论数据权的划分标准和分类
以未来决定现在
医院统计报表数据在医院管理服务中的常见问题研究
竞技分析及其发展趋势研究
公路工程试验检测存在的问题及措施
一种借助数据处理构建的智能食堂管理系统
浅谈计量自动化系统实现预购电管理应用