李海燕 ,贾李蓉 ,聂莹 ,王斌 ,孙华君 ,傅昊阳 ,李静 ,张磊 ,王广志 ,付林飞
1.中国中医科学院中医药信息研究所,北京 100700;2.中国中医科学院中医药数据中心,北京 100700;3.广东省中医院,广东 广州 510120;4.上海中医药大学,上海 201203;5.中科软科技股份有限公司,北京 100080
本文件按照GB/T 1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》起草。
本文件由中华中医药学会提出并归口。
随着中医药信息化的发展,中医药相关政府部门、医疗机构、科研机构、教育机构、产业机构等产出了大量数据,包括医疗数据、科研数据、文献数据、产业数据等各类数据资源,如此庞杂的数据资源需要进行分类组织和管理。因此,亟须建立一套描述数据资源特征的标准,即元数据规范,帮助用户从海量数据中发现符合需求的资源,从而促进数据资源的共享与利用。本文件在分析国内外有关不同类型元数据标准基础上,从规范描述中医药领域数据资源的需求出发,研究建立中医药领域数据资源元数据规范,以促进中医药领域数据资源描述的规范化和标准化。
本文件规定了中医药数据资源元数据结构,包括元数据子集、元数据实体及元数据元素,用于完整描述中医药数据资源。
本文件适用于中医药数据资源编目、归档、建库、发布、共享、交换与检索等。
下列文件对本文件的应用是必不可少的。凡是注明日期的引用文件,仅所注日期版本适用于本文件;凡是未注明日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 38327-2019 健康信息学 中医药数据集分类
GB/T 4880.2-2000 语种名称代码 第2部分:3字母代码
ISO 13119:2012 Health informatics - Clinical knowledge resources-Metadata
ISO 15836-1:2017 Information and documentation -The Dublin Core metadata element set - Part 1: Core elements
ISO/TS 17948:2014 Health informatics -Traditional Chinese medicine literature metadata
下列术语和定义适用于本文件。
能够产生经济或社会效益的数据。
中医药领域能够产生经济或社会效益的数据。
定义和描述其他数据的数据。
元数据的基本单元。
一组说明信息资源相关特性的元数据元素。
元数据的子集合,由元数据实体和元数据元素组成。
中医药数据资源元数据定义了3个层次的结构(见表1),即元数据子集、元数据实体、元数据元素。中医药数据资源元数据由7个元数据子集构成。a)标识信息子集:关于中医药数据资源外部特征的基本信息,包括名称、标识符、创建者和出版者等;b)内容信息子集:关于中医药数据资源内部特征的基本信息,包括主题、描述等;c)分发信息子集:关于用户获取中医药数据资源的信息;d)质量信息子集:关于中医药数据资源保存状态的质量信息;e)限制信息子集:关于中医药数据资源及元数据获取和使用的限制信息;f)维护信息子集:关于维护中医药数据资源的信息;g)关联信息子集:关于中医药数据资源与其他资源之间的关联关系的参考信息。
表1 中医药数据资源元数据结构
中医药数据资源元数据实体与元素引用了都柏林核心元数据(ISO 15836-1:2017)、临床知识资源元数据(ISO 13119:2012)和中医药文献元数据(ISO/TS 17948:2014)。
中医药数据资源元数据元素来源:
1)选择常用来描述中医药数据资源的一般元素;
2)描述中医药数据资源信息必要元素和特殊元素,包括资源名称(正式名称、唯一标识符)、资源来源(临床试验、古籍文献)等。
中医药数据资源元数据实体与元数据元素采用英文名称,以便于计算机标记和编码,并与国际通用的元数据标准保持语义一致性,中文标签便于对照理解。
中文标签是元素名称的一个语义属性,在具体的应用领域,允许赋予其适合的中文标签,但语义上不允许与原始定义有冲突,不允许扩大原始语义。
元素值域宜优先选取有常设机构维护的词汇表、符号集和术语受控词表。同时,为了某些特定领域内的互操作性,可以开发利用其他受控词表。
所有元素均为非限制性,如果在特定的项目或应用中使用,可进行必要的扩展,并增加使用说明,本文件中的元素描述及示例有可能涉及扩展描述。
元数据实体与元数据元素属性定义见表2。
表2 中医药数据资源元数据属性定义
6.1.1 元数据实体描述
6.1.1.1 资源名称
英文名称:data resource title;
中文标签:资源名称;
定义:简要描述中医药数据资源主题与内容的标题;
注释:其元数据元素包括正式名称,译名,名称注音,其他名称及唯一标识符;
实体类型:复合型;
约束:必选(M);
频次范围:[1,1]。
6.1.1.2 创建者
英文名称:creator;
中文标签:创建者;
定义:创建中医药数据资源的主要责任实体;
注释:其元数据元素包括创建者名称,创建者类型、创建者地址、创建者电话、创建者邮箱、创建者传真、创建者主页;
实体类型:复合型;
约束:必选(M);
频次范围:[1,N]。
6.1.1.3 贡献者
英文名称:contributor;
中文标签:贡献者;
定义:对中医药数据资源做出贡献的其他责任实体;
注释:贡献者包括个人、组织或某项服务,若有多个贡献者则全部列出;其元数据元素包括贡献者名称、贡献者地址、贡献者电话、贡献者邮箱;
实体类型:复合型;
约束:可选(O);
频次范围:[0,N]。
6.1.1.4 存储信息
英文名称:store information;
中文标签:存储信息;
定义:中医药数据资源的存储类型、格式等;
注释:其元数据元素包括存储类型、存储格式、存储量、记录数等;
实体类型:复合型;
约束:必选(M);
频次范围:[1,1]。
6.1.1.5 出版者
英文名称:publisher;
中文标签:出版者;
定义:使中医药数据资源可以获得和利用的责任实体;
注释:出版者包括个人、组织或某项服务,其元数据元素包括出版者名称、出版者地址、出版者电话、出版者邮箱;
实体类型:复合型;
约束:必选(M);
频次范围:[1,1]。
6.1.1.6 日期
英文名称:date;
中文标签:日期;
定义:记录与数据资源生命周期中某个时间相关的时间;
注释:采用由万维网联盟(W3C)制订的日期和时间编码规则--基于ISO 8601的一部分,并使用YYYY-MM-DD格式著录;元数据元素包括创建日期、更新日期、发布日期、可获得日期;
实体类型:复合型;
约束:必选(M);
频次范围:[1,N]。
6.1.1.7 来源
英文名称:source;
中文标签:来源;
定义:当前数据资源的原始出处;
注释:指当前数据资源的来源,如某个科研机构,其元数据元素包括数据来源、来源类型;
实体类型:复合型;
约束:必选(M);
频次范围:[1,1]。
6.1.2 元数据元素描述
6.1.2.1 正式名称
英文名称:formal title;
中文标签:正式名称;
定义:数据资源在共享时使用的名称;
注释:必备,数据资源在共享时规定使用的名称,不能与其他名称混用;
数据类型:字符串;
值域:自由文本;
约束:必选(M);
频次范围:[1,1];
限定实体:资源名称。
6.1.2.2 译名
英文名称:translated title;
中文标签:译名;
定义:资源名称的其他语言翻译名称;
注释:本术语有则必备,须在译名后注明语种;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:资源名称。
6.1.2.3 名称注音
英文名称:phonetic notation;
中文标签:名称注音;
定义:资源名称的汉语拼音;
注释:本术语有则必备;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:资源名称。
6.1.2.4 其他名称
英文名称:other titles;
中文标签:其他名称;
定义:资源名称的简称、别名或其他语言翻译的名称等其他非正式名称;
注释:须在其他名称后注明语种;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:资源名称。
6.1.2.5 唯一标识符
英文名称:identifier;
中文标签:唯一标识符;
定义:在特定环境中,给予数据资源一个特定的标识,使其在该环境中唯一;
注释:建议资源标识符采用正式标识体系规定的标识符;
数据类型:字符串;
值域:URI[包括统一资源定位符(URL)]、数字对象标识符(DOI)、国际标准书号(ISBN)、国际标准连续出版物号(ISSN)、开放学术出版物及学术产出的作者标识符(ORCID)等;
约束:必选(M);
频次范围:[1,1];
限定实体:资源名称。
6.1.2.6 创建者名称
英文名称:creator name;
中文标签:创建者名称;
定义:创建者的名称;
注释:创建机构、团体或个人的名称,包括科研单位、医疗机构、项目组及个人等;
数据类型:字符串;
值域:自由文本;
约束:必选(M);
频次范围:[1,N];
限定实体:创建者。
6.1.2.7 创建者类型
英文名称:creator type;
中文标签:创建者类型;
定义:根据创建者的功能,对创建者进行分类,负责建立或创建该数据资源的实体类型;
注释:采用GB/T 38327-2019《健康信息学 中医药数据集分类》的“创建者类型”进行标识;
数据类型:字符串;
值域:按GB/T 38327-2019规定取值;
约束:必选(M);
频次范围:[1,10];
限定实体:创建者。
6.1.2.8 创建者地址
英文名称:creator address;
中文标签:创建者地址;
定义:创建者的地理位置;
注释:创建者或创建机构的具体地址,采用YZ/T 0127-2006《邮政地址信息数据结构》进行标识;
数据类型:字符串;
值域:按YZ/T 0127-2006规定取值;
约束:必选(M);
频次范围:[1,N];
限定实体:创建者。
6.1.2.9 创建者电话
英文名称:creator phone number;
中文标签:创建者电话;
定义:创建者的电话;
注释:创建者或创建机构联系人的电话,可以包括座机号码、手机号码;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:创建者。
6.1.2.10 创建者邮箱
英文名称:creator e-mail;
中文标签:创建者邮箱;
定义:创建者的邮箱;
注释:创建者或创建机构联系人的邮箱;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:创建者。
6.1.2.11 创建者传真
英文名称:creator fax;
中文标签:创建者传真;
定义:创建者的传真;
注释:创建者或创建机构联系人的传真号码;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:创建者。
6.1.2.12 创建者主页
英文名称:creator homepage;
中文标签:创建者主页;
定义:创建者的主页;
注释:创建者或创建机构的主页地址;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:创建者。
6.1.2.13 贡献者名称
英文名称:contributor name;
中文标签:贡献者名称;
定义:贡献者的名称;
注释:通常是创建者名称,也可以是其他贡献者实体名称;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:贡献者。
6.1.2.14 贡献者地址
英文名称:contributor address;
中文标签:贡献者地址;
定义:贡献者的地理位置;
注释:通常是创建者地址,也可以是其他贡献者的地址,采用YZ/T 0127-2006《邮政地址信息数据结构》进行标识;
数据类型:字符串;
值域:按YZ/T 0127-2006规定取值;
约束:可选(O);
频次范围:[0,N];
限定实体:贡献者。
6.1.2.15 贡献者电话
英文名称:contributor phone number;
中文标签:贡献者电话;
定义:贡献者的电话;
注释:通常是创建者的电话,也可以是其他贡献者的电话;
出处:自定义;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:贡献者。
6.1.2.16 贡献者邮箱
英文名称:contributor e-mail;
中文标签:贡献者邮箱;
定义:贡献者的邮箱;
注释:通常是创建者的邮箱,也可以是其他贡献者的邮箱;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:贡献者。
6.1.2.17 存储类型
英文名称:type;
中文标签:存储类型;
定义:中医药数据资源的特征或类型;
注释:包括电子文件、电子表格、数据集、图像、音频等;DCMI类型词汇表提供了一个通用的、跨域的已批准术语列表,这些列表可以用作Type元素的值来标识资源的类型;
数据类型:字符串;
值域:DCMI Type Vocabulary,URI:https://www.dublincore.org/specifications/dublin-core/dcmi-type-vocabulary/2003-11-19/;
约束:必选(M);
频次范围:[1,1];
限定实体:存储信息。
6.1.2.18 存储格式
英文名称:format;
中文标签:存储格式;
定义:数据资源的计算机可读格式;
注释:数据资源的存储格式,电子文件的存储格式为OFD、TXT、WPS、XML、DOC、HTML、PPT、PDF等;电子表格的存储格式为ET、XLS、XLSX等;数据库的存储格式为DM、KingbaseES、access、DBF、Dbase、MDB、sysbase、ORACLE、SQL、DB2、HBase等;图形图像类的存储格式为JPEG、GIF、BMP、PNG等;视频格式为FLV、RMVB等;音频格式为WMA、MP3等;流媒体类的存储格式为SWF、RM、MPG等;自描述格式由提供方提出其格式;
数据类型:字符串;
值域:MIME,URI:http://www.w3school.com.cn/media/media_mimeref.asp;
约束:必选(M);
频次范围:[1,N];
限定实体:存储信息。
6.1.2.19 存储量
英文名称:storage;
中文标签:存储量;
定义:数据资源在计算机中所占的字节数;
注释:数据资源的总量,用所占字节数表示,与数据记录数不同;
数据类型:字符串;
值域:自由文本;
约束:必选(M);
频次范围:[1,1];
限定实体:存储信息。
6.1.2.20 记录数
英文名称:record count;
中文标签:记录数;定义:数据资源所包含的一组完整记录的数量;
注释:数据文件中可阅读的记录数量,与字节数不同;
数据类型:字符串;
值域:自由文本;
约束:必选(M);
频次范围:[1,N];
限定实体:存储信息。
6.1.2.21 出版者名称英文名称:publisher name;
中文标签:出版者名称;
定义:出版者的名称;
注释:可以是个人、机构、组织或某项服务的名称;
数据类型:字符串;
值域:自由文本;
约束:必选(M);
频次范围:[1,1];
限定实体:出版者。
6.1.2.22 出版者地址
英文名称:publisher address;
中文标签:出版者地址;
定义:出版者的地理位置;
注释:采用YZ/T 0127-2006《邮政地址信息数据结构》进行标识;
数据类型:字符串;
值域:按YZ/T 0127-2006规定取值;
约束:必选(M);
频次范围:[1,1];
限定实体:出版者。
6.1.2.23 出版者电话
英文名称:publisher phone number;
中文标签:出版者电话;
定义:出版者的电话;
出处:自定义;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:出版者。
6.1.2.24 出版者邮箱
英文名称:publisher e-mail;
中文标签:出版者邮箱;
定义:出版者的邮箱;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:出版者。
6.1.2.25 创建日期
英文名称:date created;
中文标签:创建日期;
定义:创建该元数据的日期;
注释:建议采用规范编码体系,如ISO 8601-1[W3C-DTF],并使用YYYY-MM-DD格式著录;
数据类型:日期型;
值域:采用YYYY-MM-DD格式;
约束:必选(M);
频次范围:[1,1];
限定实体:日期。
6.1.2.26 更新日期
英文名称:date modified;
中文标签:更新日期;
定义:数据最近更新的日期;
注释:建议采用规范编码体系,如ISO 8601-1[W3C-DTF],并使用YYYY-MM-DD格式著录;
数据类型:日期型;
值域:采用YYYY-MM-DD格式;
约束:必选(M);
频次范围:[1,1];
限定实体:日期。
6.1.2.27 发布日期
英文名称:date issued;
中文标签:发布日期/出版日期;定义:数据资源发布或出版的日期;
注释:建议采用规范编码体系,如ISO 8601-1[W3C-DTF],并使用YYYY-MM-DD格式著录;
数据类型:日期型;
值域:采用YYYY-MM-DD格式;
约束:必选(M);
频次范围:[1,1];
限定实体:日期。
6.1.2.28 可获得日期
英文名称:available date;
中文标签:可获得日期;
定义:数据资源成为可获得资源的日期;
注释:建议采用规范编码体系,如ISO 8601-1[W3C-DTF],并使用YYYY-MM-DD格式著录;
数据类型:日期型;
值域:采用YYYY-MM-DD格式;
约束:可选(O);
频次范围:[0,1];
限定实体:日期。
6.1.2.29 数据来源
英文名称:data source;
中文标签:数据来源;
定义:当前数据资源的实体;
注释:数据来源可以是个人、机构、应用程序等;
数据类型:字符串;
值域:自由文本;
约束:必选(M);
频次范围:[1,N];
限定实体:来源。
6.1.2.30 来源类型
英文名称:type of source;
中文标签:来源类型;
定义:以数据原始载体的角度,对当前数据资源的分类;
注释:建议采用GB/T 38327-2019《健康信息学中医药数据集分类》的“数据来源类型”进行标注;
数据类型:字符串;
值域:按照GB/T 38327-2019规定取值;
约束:必选(M);
频次范围:[1,4];
限定实体:来源。
6.2.1 元数据实体描述
6.2.1.1 描述
英文名称:description;
中文标签:描述;
定义:资源的说明解释;
注释:描述可以包括但不限于以下内容:文摘、目录、图形图像表示,或关于资源的文本描述;元数据元素包括资源范围、摘要、目录、资助项目、浏览图、应用、语种;
实体类型:复合型;
约束:必选(M);
频次范围:[1,N]。
6.2.1.2 资源分类
英文名称:dataset classification;
中文标签:资源分类;
定义:说明中医药数据资源相应的分类信息;
注释:采用GB/T 38327-2019《健康信息学 中医药数据集分类》的分类信息进行标识;元数据元素包括类目名称、类目代码;
实体类型:复合型;
约束:必选(M);
频次范围:[1,N]。
6.2.1.3 主题
英文名称:subject;
中文标签:主题;
定义:资源的主题;
注释:一般采用主题词、关键词、关键词短语或分类号来描述,建议使用受控词表;元数据元素包括主题词、关键词;
实体类型:复合型;
约束:必选(M);
频次范围:[1,N]。
6.2.2 元数据元素描述
6.2.2.1 资源范围
英文名称:coverage;
中文标签:资源范围;
定义:数据资源涉及的时间或空间范围,或资源适用的空间或资源所辖的范围;
注释:用文本描述数据资源包含的范围,一般包括时间、空间、主题等范围;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:描述。
6.2.2.2 摘要
英文名称:abstract;
中文标签:摘要;
定义:对数据资源主要内容的文本型概述;
注释:一般是对数据资源主要内容进行描述,也可以包括其他一些重要信息,如特殊历史信息、重要用途等;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,1];
限定实体:描述。
6.2.2.3 目录
英文名称:contents;
出处:dcterms;
中文标签:目录;
定义:组成数据资源的所有单元的列表;
注释:著录内容包括章节名称、图表清单、文档、图形、样式表等;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:描述。
6.2.2.4 资助项目
英文名称:funded project;
中文标签:资助项目;
定义:创建数据资源时,提供资金支持的项目;
注释:包括但不限于国家重点研发计划、国家自然科学基金等;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:描述。
6.2.2.5 浏览图
英文名称:graphic overview;
中文标签:浏览图;
定义:数据资源的概略图形;
注释:概要性说明数据资源的图形;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:描述。
6.2.2.6 应用
英文名称:application;
中文标签:应用;
定义:创建数据资源的目标、用途或应用领域;
注释:描述数据资源的具体用途和应用领域;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,1];
限定实体:描述。
6.2.2.7 语种
英文名称:language;
中文标签:语种;
定义:资源的语种;
注释:采用GB/T 4880.2-2000《语种名称代码第2部分:3字母代码》进行标识;
数据类型:字符串;
值域:按GB/T 4880.2-2000规定取值;
约束:必选(M);
频次范围:[1,N];
限定实体:描述。
6.2.2.8 类目名称
英文名称:dataset classification name;
出处:GB/T 38327-2019《健康信息学 中医药数据集分类》;
中文标签:类目名称;
定义:资源所属的类目名称;
注释:采用GB/T 38327-2019《健康信息学 中医药数据集分类》数据集分类名称进行标注;
数据类型:字符串;
值域:按GB/T 38327-2019规定取值;
约束:必选(M);
频次范围:[1,N];
限定实体:资源分类。
6.2.2.9 类目代码
英文名称:dataset classification code
出处:GB/T 38327-2019《健康信息学 中医药数据集分类》;
中文标签:类目代码;
定义:资源所属类目的代码;
注释:采用GB/T 38327-2019《健康信息学 中医药数据集分类》数据集分类代码进行标注;
数据类型:字符串;
值域:按GB/T 38327-2019规定取值;
约束:必选(M);
频次范围:[1,N];
限定实体:资源分类。
6.2.2.10 主题词
英文名称:subject headings;
出处:自定义;
中文标签:主题词;
定义:表达数据资源主题的受控词;
注释:参照《医学主题词表》(MeSH)、《中国中医药学主题词表》等进行标注;
数据类型:字符串;
值域:按照MeSH和《中国中医药学主题词表》规定取值;
约束:可选(O);
频次范围:[0,N];
限定:主题。
6.2.2.11 关键词
英文名称:key words;
出处:自定义;
中文标签:关键词;
定义:单个媒体在制作索引时,所适用的词汇;
注释:表达数据资源内容的词语,不使用专门的主题词,可用自由词;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定:主题。
6.3.1 元数据实体描述
6.3.1.1 分发格式
英文名称:distribution format;
中文标签:分发格式;
定义:分发数据资源的格式说明;
注释:元数据元素包括名称、版本、在线(链接)、离线(介质);
实体类型:复合型;
约束:可选(O);
频次范围:[0,N]。
6.3.1.2 分发者
英文名称:distributor;
中文标签:分发者;
定义:进行中医药数据资源分发的责任实体;
注释:元数据元素包括分发者名称、分发者地址、分发者电话、分发者邮箱;
实体类型:复合型;
约束:可选(O);
频次范围:[0,N]。
6.3.2 元数据元素描述
6.3.2.1 名称
英文名称:distribution format name;
中文标签:分发格式名称;
定义:数据资源分发的格式,一般用名称进行标识;
注释:给使用者发放时的格式,不一定是数据资源的原始格式,可以是压缩后或者转换后的格式;数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定:分发格式。
6.3.2.2 版本
英文名称:version;
出处:自定义;
中文标签:分发格式版本;
定义:数据分发格式的版本;
注释:一般是版本号或日期;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,1];
限定:分发格式。
6.3.2.3 在线(链接)
英文名称:online URL;
中文标签:在线(链接);
定义:从互联网上得到数据资源的位置和访问方法;
注释:用户通过网络可访问数据资源的一种方法;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:分发格式。
6.3.2.4 离线(介质)
英文名称:off-line medium;
中文标签:离线(介质);
定义:用户通过非网络的方式获得数据资源的方法;
注释:用户通过移动存储设备、纸质版本等介质获得数据资源;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:分发格式。
6.3.2.5 分发者名称
英文名称:distributor name;
中文标签:分发者名称;
定义:数据资源分发者的名称;
注释:数据资源分发者的名称可能与创建者一致或不一致,可为个人、组织、机构等;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定:分发者。
6.3.2.6 分发者地址
英文名称:distributor address;
中文标签:分发者地址;
定义:数据资源分发者所在的地理位置;
注释:数据资源分发者的具体地址,可定位到具体位置;采用YZ/T 0127-2006《邮政地址信息数据结构》进行标识;
数据类型:字符串;
值域:按YZ/T 0127-2006规定取值;
约束:可选(O);
频次范围:[0,N];
限定:分发者。
6.3.2.7 分发者电话
英文名称:distributor phone number;
中文标签:分发者电话;
定义:数据资源分发者电话;
注释:数据资源分发者,如机构或联系人的座机号码、手机号码;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定:分发者。
6.3.2.8 分发者邮箱
英文名称:distributor e-mail;
中文标签:分发者邮箱;
定义:数据资源分发者的邮箱;
注释:数据资源分发者,如机构或联系人的电子邮箱地址;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定:分发者。
6.4.1 元数据实体描述
6.4.1.1 数据志
英文名称:lineage;
中文标签:数据志;
定义:非量化的数据质量信息;
注释:数据创造者对数据源和处理步骤的说明,包括但不限于数据的完整性、规范性、一致性、准确性、唯一性和关联性的说明和解释;元数据元素包括数据志;
实体类型:简单型;
约束:必选(M);
频次范围:[1,N]。
6.4.1.2 质量报告
英文名称:quality report;
中文标签:质量报告;
定义:对数据集的数据质量评测行为或评测结果等有关信息的链接指向;
注释:此元素为指向数据集质量信息的链接地址,链向在数据质量相关成果规约下的数据质量评测相关元数据;元数据元素包括质量报告;
实体类型:简单型;
约束:可选(O);
频次范围:[0,N]。
6.4.2 元数据元素描述
6.4.2.1 数据志
英文名称:lineage;
中文标签:数据志;
定义:非量化的数据质量信息;
注释:数据创造者对数据源和处理步骤的说明,包含但不限于数据的完整性、规范性、一致性、准确性、唯一性和关联性的说明和解释;
数据类型:字符串;
值域:自由文本;
约束:必选(M);
频次范围:[1,N];
限定:数据志。
6.4.2.2 质量报告
英文名称:quality report;
中文标签:质量报告;
定义:对数据集的数据质量评测行为或评测结果等有关信息的链接指向;
注释:此元素为指向数据集质量信息的链接地址,链向在数据质量相关成果规约下的数据质量评测相关元数据;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定:质量报告。
6.5.1 元数据实体描述
6.5.1.1 法律限制
英文名称:legal restrictions;
中文标签:法律限制;
定义:法律层面上,对访问和使用中医药数据资源的限制;
注释:依法对中医药数据资源的使用做出限制措施;元数据元素包括访问限制、使用限制;
实体类型:复合型;
约束:必选(M);
频次范围:[1,N]。
6.5.1.2 保密限制
英文名称:confidentiality restrictions;
中文标签:保密限制;
定义:从国家、单位或个人安全的角度出发,对中医药数据资源的使用施加的限制或约束;
注释:根据《中华人民共和国保守国家秘密法》规定,对数据资源的保密级别做出不同限制;元数据元素包括保密限制;
实体类型:简单型;
约束:必选(M);
频次范围:[1,1]。
6.5.2 元数据元素描述
6.5.2.1 访问限制
英文名称:access rights;
中文标签:访问限制;
定义:为保护隐私权和知识产权,对访问中医药数据资源施加的限制或约束;
数据类型:字符串;
值域:自由文本;
约束:必选(M);
频次范围:[1,N];
限定实体:法律限制。
6.5.2.2 使用限制
英文名称:service restrictions;
中文标签:使用限制;
定义:为保护隐私权或知识产权,对使用数据资源施加的限制和约束;
数据类型:字符串;
值域:自由文本;
约束:必选(M);
频次范围:[1,N];
限定实体:法律限制。
6.5.2.3 保密限制
英文名称:confidentiality restrictions;
中文标签:保密限制;
定义:从国家、单位或个人安全的角度出发,对中医药数据资源的使用施加的限制或约束;
注释:根据《中华人民共和国保守国家秘密法》规定,对数据资源的保密级别做出不同限制;
数据类型:枚举型;
值域:绝密级、机密级、秘密级、内部非涉密、公开(见附录表A1);
约束:必选(M);
频次范围:[1,1];
限定实体:保密限制。
6.6.1 元数据实体描述
6.6.1.1 更新维护
英文名称:update and maintenance;
中文标签:更新维护;
定义:根据实际需要,中医药数据资源更新和维护的具体信息;
注释:根据中医药数据资源的应用情况,中医药数据资源创建者和维护者对数据资源更新和维护的频次、范围及具体内容的描述;元数据元素包括更新维护频率和更新维护内容;
实体类型:复合型;
约束:可选(O);
频次范围:[0,N]。
6.6.1.2 维护者
英文名称:maintainer;
中文标签:维护者;
定义:维护中医药数据资源的责任实体;
注释:包括个人、组织或某项服务;通常用维护者标识这一元素实体;元数据元素包括维护者名称、维护者地址、维护者电话、维护者邮箱;
实体类型:复合型;
约束:必选(M);
频次范围:[1,N]。
6.6.2 元数据元素描述
6.6.2.1 更新维护频率
英文名称:frequency of update and maintenance;
中文标签:更新和维护频率;
定义:在中医药数据资源元数据初次完成后,维护者对其进行更新、修改或补充的频率;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:更新维护。
6.6.2.2 更新维护内容
英文名称:details of updates and maintenance。
中文标签:更新维护内容。
定义:中医药数据资源元数据更新维护的范围、细节的说明;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:更新维护。
6.6.2.3 维护者名称
英文名称:maintainer name;
中文标签:维护者名称;
定义:中医药数据资源维护者的名称;
数据类型:字符串;
值域:自由文本;
约束:必选(M);
频次范围:[1,N];
限定实体:维护者。
6.6.2.4 维护者地址
英文名称:maintainer address;
中文标签:维护者地址;
定义:中医药数据资源维护者的地理位置;
注释:维护者或维护机构的具体地址,采用YZ/T 0127-2006《邮政地址信息数据结构》进行标识;
数据类型:字符串;
值域:按YZ/T 0127-2006规定取值;
约束:必选(M);
频次范围:[1,N];
限定实体:维护者。
6.6.2.5 维护者电话
英文名称:maintainer phone;
中文标签:维护者电话;
定义:中医药数据资源维护者的电话;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:维护者。
6.6.2.6 维护者邮箱
英文名称:maintainer e-mail;
中文标签:维护者邮箱;
定义:中医药数据资源维护者的邮箱;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:维护者。
6.7.1 元数据实体描述
关联
英文名称:relation;
中文标签:关联;
定义:中医药数据资源与其他数据资源之间的关联关系;
注释:建议采用符合正式标识体系的字符串进行标识;元数据元素包括有……版本、是……的版本、替代、被……替代、有……部分、是……的一部分、被……参考、并列、附加;
实体类型:复合型;
约束:可选(O);
频次范围:[0,N]。
6.7.2 元数据元素描述
6.7.2.1 有……版本
英文名称:has version;
中文标签:有……版本;
定义:当前数据资源的不同版本之间关联关系;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:关联。
6.7.2.2 是……的版本
英文名称:is version of;
中文标签:是……版本;
定义:当前数据资源的不同语种或不同格式之间的关联关系;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:关联。
6.7.2.3 替代
英文名称:replace;
中文标签:替代;
定义:当前数据资源替代其他数据资源,导致其他数据资源停用或不再更新的关联关系;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:关联。
6.7.2.4 被……替代
英文名称:is replaced by;
中文标签:被……替代;
定义:当前数据资源被其他数据资源替代,而导致当前数据资源不再更新或使用的关联关系;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:关联。
6.7.2.5 有……部分
英文名称:has part;
中文标签:有……部分;
定义:当前数据资源与其组成部分之间的关联关系;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:关联。
6.7.2.6 是……的一部分
英文名称:is part of;
中文标签:是……的一部分;
定义:数据资源及其组成部分之间的关联关系,从组成部分角度,构成了本关联关系;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:关联。
6.7.2.7 被……参考
英文名称:is referenced by;
中文标签:被……参考;
定义:当前数据资源被其他数据资源应用,从被参考方的角度,构成了本关联关系;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:关联。
6.7.2.8 并列
英文名称:parallel;
中文标签:并列;
定义:数据资源与其他数据资源,在一定主题或范围内具有同等地位或位置,两者之间构成本关联关系;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:关联。
6.7.2.9 附加
英文名称:addition;
中文标签:附加;
定义:一个数据资源作为另一个数据资源附带的内容时,从主数据资源角度,与另一方构成本关联关系;
数据类型:字符串;
值域:自由文本;
约束:可选(O);
频次范围:[0,N];
限定实体:关联。
附录(资料性附录)
表A1 保密限制分级
本文件起草单位:中国中医科学院中医药信息研究所、广东省中医院、上海中医药大学、中国中医科学院中医药数据中心、中科软科技股份有限公司。
本文件主要起草人:李海燕、贾李蓉、聂莹、王斌、孙华君、傅昊阳、李静、张磊、王广志、付林飞。