基于主题地图的土家学知识组织研究

2009-10-13 03:29祝方林
现代情报 2009年7期

胡 萍 祝方林

〔摘 要〕本文利用主题地图的基本原理来构建土家学的知识组织模型,为建立以主题地图为技术支撑的土家学学科信息门户提供理论准备。

〔关键词〕知识组织;主题地图;土家学

〔中图分类号〕G302 〔文献标识码〕A 〔文章编号〕1008-0821(2009)07-0207-03

Research on Knowledge Organization of the

Subject of Tujia Based on Topic MapsHu Ping Zhu Fanglin

(Research Center for Southern Minority Ethnic Groups,Hubei University for Nationalities,Enshi 445000,China)

〔Abstract〕This paper constructed the knowledge organization model of the suject of Tujia by utilizing the basic principles of topic maps,and thus provided theoretical base for establishing the information portal of the subject of Tujia based on the technical support of topic maps.

〔Key words〕knowledge organization;topic maps;the subject of Tujia

目前与土家学有关的网站信息很多,但对土家学研究人员来说,却往往难以查找到比较满意的结果,倒不是因为这些网站的检索功能有限,而是其信息整合的深度仅停留在有关土家学信息的实体层面,没有揭示有关土家学信息实体内部的概念和语义。目前的信息系统一般以分类法、主题词表和分类主题词表组织资源,但是由于这些方法的痼疾是不能准确、完整地显示概念关联,无法实现语义层面的资源检索,也就无法完整地显示检索词的知识结构。主题地图是围绕知识组织中知识和知识间的关联进行描述、处理和表述的技术。基于主题地图的土家学知识组织研究就是利用主题地图的基本原理来构建土家学的知识组织模型,为建立以主题地图为技术支撑的土家学学科信息门户提供理论准备。

1 主题地图(Topic Maps,TM)

“知识组织”是美国著名的分类法专家布利斯(H.E.Bliss)提出的对知识的本质以及知识之间的关系进行有序揭示的思想。知识组织体系(Knowledge Organization System)是对内容概念及其相互关系进行描述和组织,支持对信息对象按照知识内容和知识结构进行描述、链接和组织,包括词汇表、分类聚类体系、语义网和本体等。知识组织体系用来组织资源以支持检索和管理资源集合。每一种知识组织体系就是一座联系读者信息需求和资源集合中资源的桥梁,是信息系统的核心。知识组织的任务是对信息知识进行整序和提供,为学科的学科导航、分类浏览和主题检索提供基础。知识组织体系对学科各个层次的信息按知识内容和知识结构进行描述、链接和组织,使我们不再依赖已知的信息单元的己知特征,而是根据自己已有的知识需要来发现、确认、检索有关的信息内容,并可利用知识组织体系来组合检索到的信息。

主题地图(Topic Maps,TM)是一种新的知识组织理论和技术,是一种非常好的基于主题的新技术,涉及知识的分类、存储和组织,广泛地应用到知识组织、信息检索、信息挖掘、信息资源整合、信息过滤等领域。它的优点在于:(1)可以以一种结构化的方式来模拟领域专家们的知识,通过将隐性地存在于专家头脑中的知识结构以可视化图形的形式体现出来,这就允许不是专家的人亦能领会到基础概念以及他们之间的关系。(2)依赖于可利用到的资源,一个主题地图能够很容易被划分开来。一些发行者就使用了一个基于主题地图的一系列资源的索引,然后当他们发表那些资源的子集时就可以动态的创建合适的索引。在一个主题地图中通过精心建模就有可能创建细节的不同层次,也有可能区分基于索引的信息产品、他们提供的一些导航特征以及产品的信息内容之间的差别。(3)索引不同资源集的主题地图能够很容易地被组合起来。这个特征能够被用来允许组织“导入”第三方数据、索引值以及紧密地集成他们自己的数据和索引值。

主题地图与信息资源的分离性,使得同一个主题地图可以被用于多个不同的信息资源,而一个信息资源亦可以拥有多个主题地图。这样,被同一个主题地图索引的不同文献资源集,或者索引同一个文献资源集的不同主题地图,就能够很容易地被组合起来,容易实现主题地图的丰富与扩展。

2 基于主题地图构建土家学知识组织

2.1 用主题地图构建土家学知识组织模型

主题地图按照主题(Topic)、联系(Association)和事件(Occurrence)这3个概念来组织知识,从而形成一个网络化的知识结构,便于知识的组织和查询。为了实现主题地图间的互操作,还用XTM(XML Topic Maps)规定了用于创建主题地图的XML标签集和相应的语法规范。

在主题地图中,知识的基本单元称为“主题”——Topic。主题可以是任何东西,只要是是能引起使用者兴趣的对象都可以成为主题。主题可以划分为群,称为主题类型(Topic Types)。

以土家族特色文化“摆手舞”为例,其内容所涵盖的主题包含:

a.历史渊源;

b.土家族;

c.锣鼓;

d.空拳斗虎;

而每一主题又都可以属于某一种主题类型,如:

a.历史渊源属于“历史”类型;

b.锣鼓属于“乐器”类型;

c.空拳斗虎属于“舞蹈”类型等。

各主题之间可以用联系(Association)来显示其语义关系,而联系的形式不拘。例如,锣、鼓和“乐器”之间就具有“种属”关系。联系也有联系类型(Association Types),联系类型把具有相同关系的主题汇集成群,有助于增强主题地图的表达能力,比如,“种属”就是一种联系类型,它可以把所有的民间音乐和乐器联系起来。同时,联系类型也保证了同一类型的所有联系具有同样的结构和实施方法。比如:

a.摆手舞中的乐器主要有锣、鼓、牛角、咚咚喹等;

b.摆手舞流行于土家族区域;

c.土家族区域位于湘鄂渝黔交界山区;

而“主要有”、“流行于”、“位于”分别属于不同的联系类型。

联系是主题地图的主要功能。因为,将存在于主题之间的各类关系,透过联系的组织与联结后,将形成某一领域知识的知识网络。如果能进一步的将知识网络和推论引擎结合起来,就能提供知识创新与知识更新的能力。

事件(Occurrence),一个主题可以联结至一个或者是多个在某种层面上被视为与该主题相关的信息资源,这样的信息资源称为该主题的事件,如摆手舞的起源传说、舞蹈形式等都可以作为事件来对待。在主题地图中,摆手舞可能是一部专著论或文章,也可能是一张照片或者一段视频等。

主题、主题类型和事件的概念使得我们能够根据主题来组织信息资源并建立索引,联系和联系类型的概念则使得我们能够描述主题间的关系,建立语义关系网络,这样就形成了最基本的主题地图。

下面就是一个以主题“摆手舞”为例构建的主题地图模型。

2.2 主题图生成模块——利用XTM语法标记

主题图的关键是建立主题图TAO与信息资源集合层之间的连接,要实现这样的关联,必须以XTM语法规范进行元数据标注。下面举例说明如何用XTM进行标注。

摆手舞

/>

摆手舞是土家族最有影响的大型歌舞,带有浓烈的祭祀色彩。歌随舞生,舞随歌而得名。土家族过“赶年”中最富民族特色的歌舞,是“舍巴日”。舍巴日“舍巴”,意为“摆手”;“日”即“做”。土家语动宾倒置,“舍巴日”汉语直译为“做摆手”,意译为摆手舞。摆手舞是一种祈求幸福、酬报祖先的舞蹈。它表现了土家族人的生产、生活、战争、神话传说等内容。歌随舞而生,舞随歌得名,起源于远古,盛行于明清。土家人祭祀仪式毕,击大鼓,鸣大锣,由“梯玛”或掌坛师带领众人,进摆手堂或摆手坪跳摆手舞,唱摆手歌,摆手歌长达数万行,气势雄浑壮阔,动人心魄,堪称土家族民族史诗。摆手舞与西兰卡普(土花铺盖)并称为土家族艺术之花。

大摆手

摆手

包含

上位概念

下位概念(/baseNameString>

本例展现了主题、资源实体和以及主题之间关系的XTM标记方法。

3 小 结

从以上可以看出,主题地图的主要优势主要表现在:一是知识结构的网络化表示。主题地图的核心技术就是利用T(topic)、A(Association)和O(Occurrence)来充分描述和组织知识的结构,揭示了概念之间的关系并能准确定位于资源。二是主题地图还能图形化显示知识。三是主题地图以TAO与资源层之间的关联是通过XTM语法进行元数据标注的。XTM是国际标准(ISO/IEC13250),这就提高了主题地图的通用性。目前基于主题地图的应用已经起步,国外已经有成熟产品,在学科信息门户领域有德国环境学科信息门户(PortalU),国内已开始考虑用此项技术。如CSDL学科信息门户等。

总的来说,主题地图技术确实能有效解决知识管理中的瓶颈问题,使文献中的知识能被充分有效地挖掘,为使用者搜寻专题知识、特别是跨学科知识提供便利。当然,主题地图也不是全能的,在目前的应用中还存在一些外围软件的支撑软肋, 例如对于各主题之间的最短路径的选择也将是需要解决的问题,特别是有效支持主题地图可 视化的软件尚待进一步完善。

参考文献

[1]胡萍,蔡清万.武陵地区地域性文化与地方文献[J].图书馆,2006,(3):97-100.

[2]胡萍,蔡清万.武陵地区非物质文化遗产及其文献集成[M].北京:民族出版社,2008.

[3]刘茜.XML主题图和资源描述框架的比较[J].现代情报,2006,(4):216-217,220.

[4]郭清蓉.德国环境学科信息门户(PortalU)中主题图技术的应用[J].新世纪图书馆,2008,(2):90-91,64.

[5]马建霞.主题图技术与相关知识组织方法的比较研究[J].图书馆杂志,2007,(2):47-53.

[6]刘丹,包平.国外主题图研究综述[J].现代图书情报技术,2007,(12):39-44.

[7]吴笑凡,周良,张磊,等.基于XML主题地图的知识仓库[J].武汉大学学报:工学版,2006,(1):121-125.

[8]严贝妮.主题图相关问题探讨[J].情报科学,2005,(4):594-596.

[9]戴锋.基于XML主题地图的知识导航技术研究与实现[D].国防科学技术大学,2004.

[10]吴玉萍.基于主题图的学科信息门户知识组织体系研究[D].华中师范大学,2008.

[11]马文峰,杜小勇.数字资源整合:理论、方法与应用[M].北京:北京图书馆出版社,2007.

[12]Kal Ahmed and Graham Moore.主题地图的介绍[OL].URL:msdn.microsoft.com/zh-cn/library/aa480048.aspx,2009-01-04.

[13]XML Topic Maps(XTM) 1.0[OL].URL:www.topicmaps.org/xtm/1.0,2009-01-04.