MARC 21数据格式RDA化的修订*

2015-10-23 02:14赵丹丹
图书馆 2015年2期
关键词:数据格式字段名称

赵丹丹 刘 丹

(国家图书馆 北京 100081)

MARC 21机读目录格式自20世纪60年代诞生以来在全世界范围内得到了广泛的应用,成为编目工作的格式标准。随着RDA的开发和应用,MARC 21数据格式也在不断与时俱进,进行了一系列RDA化修订。文章旨在对MARC 21数据格式的修订进行归纳总结,并对修订特色加以分析。

1 修订概况

MARC 21数据格式的修订是由MARC指导小组总负责,成员来自美国国会图书馆(LC)、加拿大国家图书档案馆(LAC)、英国国家图书馆(BL)和德国国家图书馆,下设MARC咨询委员会(MAC)。1997年至2013年,作为MAC成员的机读书目信息委员会(MARBI)负责在美国图书馆协会会议期间组织讨论MARC的修订。2013年MARBI解散后,这一职责由MAC承担,继续广泛征求修订意见、审核并针对修订情况进行投票。投票的结果经MARC指导小组认可后,修订才可以实施。[1]

针对RDA的研发,MARC 21早在2006年就开始实施修订。[2]2008年,在LC、BL和LAC的提议下,RDA发展联合指导委员会(JSC)成立了RDA/MARC工作组,旨在适应RDA对MARC 21提出修订建议。LC在MARC标准网站[3]上设立了专栏“RDA in MARC”,及时通报MARC 21修订的最新情况。

MARC 21的修订涵盖书目数据格式、规范数据格式和馆藏数据格式,包括新增字段、子字段、修改编码定义等几个方面。其中,MARC 21书目数据格式为RDA新增了17个字段,规范数据格式新增了25个字段。在这些新增字段中,有9个字段同时存在于书目和规范数据格式,新增字段情况如下图所示:

图1 MARC 21为RDA新增字段

2 修订内容及特色分析

通过对修订内容加以分析,MARC 21数据格式RDA化修订的重点主要包括三个方面:一是加强对内容、媒介、载体类型及特征的描述;二是加强对实体属性的描述;三是加强对关系的揭示。加强对实体属性的描述从概念上其实已经涵盖了第一方面的内容,但是因为内容、媒介、载体类型及特征在RDA中的特殊性和重要性,在此将其单列为一个方面加以分析。

2.1 加强对内容、媒介、载体类型及特征的描述

随着网络影响力的不断扩大,出版环境发生了巨大变化,资源的内容和载体形态也日益呈现出多样化和复杂化的趋势,因此,深化对资源内容和载体的描述变得十分必要,使其更具有针对性和专指性,方便用户根据自身需求选择和获取资源。FR家族概念模型率先增加了内容表达的形式、载体形式、物理媒介等属性。在FR家族思想的启迪下,ISBD也积极做出了的变革,于2011年发布的ISBD(统一版)中正式提出“第0项”(内容形式和媒介类型项)的概念,将原本作为著录第1项一个子项的一般资料标识(GMD)提升为独立的著录项目,而且是置于其他项之首,体现其“预警”功能[4],这也就充分肯定了内容和媒介类型的重要地位。RDA在融会贯通FRBR和ISBD思想的基础上,解构了GMD,将其拆分为内容、媒介和载体类型三个元素,并且专门辟出第3章用于描述载体。媒介和载体类型的相关规则就记录在第3章中。

此外,第3章中还包含了对其它载体特征的描述,尤其是针对特殊类型资源载体特征的描述。而上述元素在MARC 21中均没有相应独立的字段或者子字段,因此MARC 21数据格式RDA化修订的第一个重要体现就是新增字段加强了对内容、媒介、载体类型及特征的描述。

2.1.1 内容、媒介和载体类型

RDA的一个重要举措是将GMD拆分为内容类型、媒介类型和载体类型,分别记录在RDA 6.9(内容类型)、3.2(媒介类型)和3.3(载体类型),避免了多层资料类别混为一体和特征类别的模糊不清。这三个元素之所以记录在RDA不同章,是因为分属不同实体的属性,内容类型是内容表达的属性,而媒介类型和载体类型是载体表现的属性。尽管如此,鉴于三个元素都分离于GMD,并且内容类型与媒介和载体类型的关系非常紧密,因此将内容类型与媒介和载体类型在本处一并说明。

为了表达RDA中的这三个元素,MARC 21数据格式相应增加了336(内容类型)、337(媒介类型)和338(载体类型)字段。这三个字段的使用范围和用法基本相同,其中336字段不仅适用于书目记录,还可用于规范记录。336、337、338字段常用的子字段包括:$a术语、$b术语代码、$2术语来源,其中术语和术语代码通常取自RDA相应的术语表和代码表。著录时,可仅著录术语或术语代码,也可两者同时著录,同时指明术语来源。此外,336、337、338字段与书目记录LDR/06字符位(记录类型)、007/00字符位(资料类型)和007/01字符位(特定资料标识)存在对应关系[5](具体对应关系见相关代码表[6]),共同决定书目记录的类型和结构。

例:

LDR/06 g 007/00 v 007/01 d 336##$atwo-dimensional moving image$bcrd$2rdaco ntent

337##$avideo$bn$2rdacontent

338##$avideodisc$bnc$2rdacontent

本例为DVD录像资料。通过从内容、媒介和载体类型三个层面对资源进行揭示,改变了过去将多重信息杂糅在一起的做法,对资源类型的描述比传统的GMD更加全面和深入。

2.1.2 其它载体特征

RDA摒弃了传统编目规则,按照资源类别和著录项记录规则的方式,在第3章“描述载体”中将AACR2中不同资源类型的载体特征进行了重组,将其列为独立小节说明规则,如RDA 3.10(代)、3.13(字体大小)、3.14(极性)。同时对载体特征的描述进行了细化,如增加了3.11(版面设计)、3.12(图书开本)等元素。还加强了对一些特殊载体特征的描述,如RDA 3.16-3.19的“声音特征”、“电影放映特征”、“视频特征”和“数字文件特征”。而以上元素在MARC数据格式中或无相应字段,或与其他载体特征混杂在一起表达。为了能够更完整地表达载体特征,MARC 21格式针对RDA的相关规则新增了字段和子字段。

针对RDA 3.10(代)、3.11(版面设计)、3.12(图书开本)、3.13(字体大小)、3.14(极性),MARC 21完善和充实了340字段(物理媒介),增加了$j、$k、$m、$n、$o,分别对应RDA上述五个元素。

例:

340##jprinting master$2rda

(缩微制品的代为“印刷母本”,术语来源于RDA)

此外,针对RDA 3.16-3.19关于音频、视频、电子资源载体及电影放映的技术规格,MARC 21相应增加了344(声音特征)、345(动态图像的放映特征)、346(视频特征)和347(数字文件特征)四个字段,将原来混杂著录在300$b和附注项的载体特征用独立的字段或子字段表达,描述更加全面,层次更加清晰,逻辑更加紧密,载体特征描述更加细化和立体化。

例:

344##$adigital$boptical$gsurround$hDolby Digital 5.1$2rda

(音频的技术规格)

345##$a3D$b48 fps$2rda

(与电影放映相关的技术规格)

2.2 加强对实体属性的描述

RDA采用了FR家族的概念模型,将实体分为三组:第一组实体为资源实体,即作品、内容表达、载体表现和单件;第二组实体为名称实体,即个人、家族和团体;第三组实体为主题实体,即概念、物体、事件和地点。通过对实体分组,RDA实现了实体层面的立体化,改变了过去以载体表现为主的单一结构,而MARC 21数据格式恰恰只适应于过去平面式的实体构建。因此,MARC 21对载体表现的描述已是比较充分的,但是作品和内容表达这两个源自于FRBR家族的实体对MARC 21来说是全新的概念,在MARC中对其属性的描述尤其匮乏。此外,相较于AACR2,RDA细化了个人、家族和团体名称规范建立的规则,因此适用于AACR2的MARC格式。由于以上原因,MARC 21数据格式RDA化的第二个重要体现就是修订和新增了若干字段,加强了对实体属性的描述。

鉴于与第三组实体相关的RDA章节还未编制完成,故而本处对MARC 21加强实体属性的描述的阐释未涵盖主题实体。除上文已提及的媒介、载体类型及特征,MARC格式对载体表现的描述变化不大,最重要的变化是增加了264字段,关于该字段的相关介绍颇多,此处不再着墨。而单件由于主要依存于载体表现,关于它的描述较少,此实体也略过。因此,本部分主要侧重于分析MARC 21对作品、内容表达、个人、家族和团体属性的描述的加强。一般来说,MARC 21为作品和内容表达新增的字段可同时应用于书目和规范数据格式,而为名称属性新增的字段只应用于规范数据格式。

2.2.1 作品和内容表达的属性

RDA中第6章专门记录识别作品和内容表达,以作品的属性为例,包括作品题名、作品日期、作品原创地、作品的其他区别特征等。MARC 21数据格式中原就存在一些字段可记录作品和内容表达的属性,如记录作品题名的130和240等,只是数量较少,对作品和内容表达属性的描述很不充分。为了适应RDA中记录作品和内容表达的规则,MARC 21针对RDA 6.4(作品的日期)和6.10(内容表达的日期),修订了046字段,增加了子字段$o(合集内容的单个日期或起始日期)和$p(合集内容的结束日期)。针对RDA 6.3(作品形式)增加了380字段(作品形式);针对RDA 6.6(作品的其他区别特征)和6.12(内容表达的其他区别特征)增加了381字段(作品和内容表达的其他区别特征)。

RDA 6.11为内容表达的语言,即作品被表达所用的语言。MARC格式中关于语言的字段多为用于载体表现,如041字段,或可同时用于载体表现和内容表达,如008/35-37和546字段。为了更好地描述内容表达的语言,MARC增加了377字段,不仅可包含作品被表达所用的语言,还可包含与记录中所描述实体相关的语言,包括个人在创作、广播时所用的语言,团体交流时所用的语言,家族的语言。

例:

1001#$aNabokov, Vladimir,$d1899-1977

377##$arus$aeng

(该作家使用两种语言进行创作)

RDA 6.15-6.17为记录表演媒介、音乐作品的数字标识和调,这是音乐作品的属性。MARC修订前没有专门用于记录音乐作品属性的字段,为了容纳RDA中这些新的元素,增加了382、383和384字段。382字段记录载体表现中包含的乐器、人声或其他表演媒介,以及记录音乐作品最初构想时和音乐内容表达在记录或演奏时所使用的乐器、人声或其他表演媒介。383字段包含由作曲者、出版者或音乐学者赋予音乐作品的系列号、作品号或主题索引号。384字段包含音乐作品的调。

例:

1001#$aBeethoven, Ludwig van,$d1770-1827

24010$aSonatas,$mpiano,$nno. 14, op. 27, no. 2,$rC#minor

382##$apiano

383##$ano. 14,$bop. 27, no. 2

384##$aC minor

(记录音乐作品的属性)

上述为作品和内容表达属性新增的字段记录的均为RDA条件核心元素,即当需要与相同作品的不同内容表达或题名相同的不同作品做区分时,作为核心元素,旨在加强对实体的描述,从而加强对实体的查找、识别、选择和获取。

尽管作品和内容表达的属性大部分集中于RDA第6章,但在RDA其他章节中也不乏相关内容,如RDA 7.7(读者对象)、7.9(学位论文或毕业论文信息)。MARC格式相应地增加了385字段(读者对象特征),为502字段(学位论文附注)新增了$b、$c、$d、$g和$o子字段,将原有$a的内容拆分为多个独立的子元素,使得相关属性的描述更加明确,易于识别。

2.2.2 名称的属性

RDA中8-11章记录名称的属性,即个人、家族和团体。第8章为一般性规则,第9章为识别个人,第10章为识别家族,第11章为识别团体。如此章节安排足以表明对名称属性的重视,即对名称规范的重视。

MARC规范数据格式中,此前虽然存在一些字段描述个人、家族和团体名称的属性,但是并不全面,且往往混杂在一起。而在RDA中,用于识别个人、家族和团体的属性为了加强识别,已经不再相互混杂,而是作为独立元素存在,如RDA 9.8(出生地)、9.9(死亡地)、9.11(居住地)和9.12(个人地址)。因此,MARC规范数据格式以RDA中名称的属性为依据,增加了如下字段(见表1):

表1 MARC 21为RDA名称属性新增字段及适用范围

上表中,普遍适用的字段,即046和370字段,不但适用于所有名称属性,同时也适用于作品和内容表达的属性,但只用于规范数据格式中,其余字段分别只适用于个人的属性、个人和团体的属性以及家族的属性。由于上表已经将MARC格式为加强对名称属性的描述增加的字段列出,在此不再赘述,仅以个人名称Coetzee, J. M.为例展示MARC格式如何加强对名称属性的描述。

例:

046##$f1940

1001#$aCoetzee, J. M., $d 1940-

370##$aCape Town, South Africa

370##$cAustralia$s2002

373##$aUniversity of Cape Town$s1968$t2000

374##$aWriter$aLiterature professor

375##$amale

378##$qJohn Maxwell

在本例中,对该个人名称的属性描述包括了出生地、相关国家、隶属机构、职业、性别和个人名称的完整形式。这些信息在MARC修订前通常记录在670字段,通过创建独立的字段使得属性的描述更加完整清晰,一目了然,有利于对实体的识别和区分。

2.3 加强对关系的揭示

RDA采用了FRBR的“实体-关系”模型,将扁平的书目记录建构为关联的、立体的书目结构,可以说关系描述在RDA中占据着至关重要的位置。RDA共计10个部分,5-10部分为记录关系,另有3个用于揭示关系的关系说明语的详细附录,从关系描述在RDA中所占的篇幅来看,关系在RDA中的重要性可见一斑。MARC 21中存在一些表达关系的既定规定,但是因为关系的重要性没有得到充分认可,有些表达关系的字段或子字段曾一度废弃,仅存的表达方式与关系描述在RDA中不能匹配。因此,MARC 21数据格式RDA化的第三个重要体现是加强对关系的揭示,增加了专门用于描述关系的子字段并结合RDA的关系术语,进一步增强了对名称与资源间、名称间及资源间关系的描述。

2.3.1 名称和资源

名称和资源间关系,即个人、家族和团体与其负有责任的作品、内容表达、载体表现和单件间的关系。在MARC 21数据格式中,用$e子字段来揭示名称和资源间的关系。这一用法曾一度被取消,因为RDA对关系的着重强调,$e子字段得以重新启用。在书目数据格式中,$e子字段用于1XX、6XX、7XX和8XX字段;而在规范数据格式中,$e子字段用于1XX、4XX和5XX字段。虽然所用字段不同,但是用法是基本相同的,$e使用的关系说明语均取自RDA附录I。

例1:

1001#$a Shakespeare, William, $d 1564-1616,$eauthor

24510$aRomeo and Juliet /$cWilliam Shakespeare

(本例为书目记录。关系说明语“author”揭示作品和责任者之间的创作关系)

例2:

1001#$aBlum, Leon,$d1872-1950,$edefendant$tLeon Blum devant la Cour supreme, Riom.$lHebrew

(本例为规范记录。关系说明语“defendant”表明“Blum, Leon”是“Leon Blum devant la Cour supreme,Riom”中的被告)

2.3.2 资源和资源,名称和名称

资源和资源间关系,即不同作品、内容表达、载体表现和单件之间的关系,换言之,相关资源间的关系。名称和名称间关系既包含同一名称的不同形式间的关系,也包含不同名称之间的相互关系。MARC 21格式增加了$i子字段以揭示资源和资源间及名称和名称间关系。在书目格式中只能揭示资源和资源间关系,$i子字段用于7XX字段。在规范格式中,既可揭示资源和资源间关系,也可揭示名称和名称间关系,$i子字段用于4XX及5XX字段。$i子字段在MARC格式中的定义为“关系信息”,揭示其所在字段的名称/资源与1XX或245字段中名称/资源的关系。当$i子字段揭示资源和资源间关系时,关系说明语取自RDA附录J;当揭示名称与名称间关系时,关系说明语取自RDA附录K。

例1:

1001# $aVerdi, Giuseppe, $d1813-1901

24510$aOtello :$bin full score /$cGiuseppe Verdi

7001#$iLibretto based on (work)$aShakespeare,William,$d1564-1616.$tOthello

78708$ireproduction of (manifestation)$aVerdi,Giuseppe,$d1813-1901.$tOtello.$dMilan: Ricordi, c1913

(本例为书目记录。700字段$i揭示作品之间“台本”的关系,787字段$i揭示载体表现之间“复制品”的关系)

例2:

1001#$aClemens, Samuel Langhorne,$d1835-1910 5001#$wr$ialternate identity$aTwain, Mark, $d1835-1910

(本例为规范记录。控制子字段$w/0字符位用代码“r”,表示使用$i子字段中的内容生成参照说明短语,显示于相关参照中。本例名称与名称之间的关系为“交替身份”)

3 结语

综上所述,MARC 21数据格式为适应表达RDA的需求,进行了大刀阔斧的修订,而且修订工作仍在进行中,以期可以更好地容纳RDA中诸元素。尽管随着美国国会图书馆“书目框架迁移行动”的启动和不断发展,MARC所面临的质疑越来越多,希望用新的模型取代MARC的呼声也越来越高,但是真正实现迁移的道路还很长,MARC 21在未来的一段时间内仍然是主流的书目交流格式。

(来稿时间:2014年8月)

1.MARC Advisory Committee. [2014-07-21].http://www.loc.gov/marc/mac/advisory.html

2.Stewart, Margaret. Mapping RDA to MARC 21.[2014-07-21]. http://www.dnb.de/ SharedDocs/Downloads/DE/DNB/standardisierung/stewartMappingRdaToMarc21En2009.pdf?__blob=publicationFile

3.MARC Standards. [2014-07-21].http://www.loc.gov/marc/

4.胡小菁. 内容和媒介类型: RDA与ISBD对比分析. 中国图书馆学报, 2012(4): 55-62

5.罗翀等. 电子资源MARC 21组织法. 北京: 国家图书馆出版社,2013:11

6.内容、媒介、载体类型术语和代码表. [2014-07-21].http://www.loc.gov/ standards/ valuelist/ rdacontent.html

猜你喜欢
数据格式字段名称
浅谈台湾原版中文图书的编目经验
MIT—BIH心率失常数据库的识读
基于RFID的户外广告监管系统的设计与实现
一种融合多业务的信息化系统框架研究
沪港通一周成交概况
沪港通一周成交概况
沪港通一周成交概况
沪港通一周成交概况
CNMARC304字段和314字段责任附注方式解析
无正题名文献著录方法评述