《中医药数据资源元数据》规范

2024-01-10 06:55李海燕贾李蓉聂莹王斌孙华君傅昊阳李静张磊王广志付林飞
中国中医药图书情报杂志 2024年1期
关键词:英文名称数据类型值域

李海燕 ,贾李蓉 ,聂莹 ,王斌 ,孙华君 ,傅昊阳 ,李静 ,张磊 ,王广志 ,付林飞

1.中国中医科学院中医药信息研究所,北京 100700;2.中国中医科学院中医药数据中心,北京 100700;3.广东省中医院,广东 广州 510120;4.上海中医药大学,上海 201203;5.中科软科技股份有限公司,北京 100080

本文件按照GB/T 1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》起草。

本文件由中华中医药学会提出并归口。

随着中医药信息化的发展,中医药相关政府部门、医疗机构、科研机构、教育机构、产业机构等产出了大量数据,包括医疗数据、科研数据、文献数据、产业数据等各类数据资源,如此庞杂的数据资源需要进行分类组织和管理。因此,亟须建立一套描述数据资源特征的标准,即元数据规范,帮助用户从海量数据中发现符合需求的资源,从而促进数据资源的共享与利用。本文件在分析国内外有关不同类型元数据标准基础上,从规范描述中医药领域数据资源的需求出发,研究建立中医药领域数据资源元数据规范,以促进中医药领域数据资源描述的规范化和标准化。

1 范围

本文件规定了中医药数据资源元数据结构,包括元数据子集、元数据实体及元数据元素,用于完整描述中医药数据资源。

本文件适用于中医药数据资源编目、归档、建库、发布、共享、交换与检索等。

2 规范性引用文件

下列文件对本文件的应用是必不可少的。凡是注明日期的引用文件,仅所注日期版本适用于本文件;凡是未注明日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

GB/T 38327-2019 健康信息学 中医药数据集分类

GB/T 4880.2-2000 语种名称代码 第2部分:3字母代码

ISO 13119:2012 Health informatics - Clinical knowledge resources-Metadata

ISO 15836-1:2017 Information and documentation -The Dublin Core metadata element set - Part 1: Core elements

ISO/TS 17948:2014 Health informatics -Traditional Chinese medicine literature metadata

3 术语和定义

下列术语和定义适用于本文件。

3.1 数据资源 data resource

能够产生经济或社会效益的数据。

3.2 中医药数据资源 data resource of traditional Chinese medicine

中医药领域能够产生经济或社会效益的数据。

3.3 元数据 metadata

定义和描述其他数据的数据。

3.4 元数据元素 metadata element

元数据的基本单元。

3.5 元数据实体 metadata entity

一组说明信息资源相关特性的元数据元素。

3.6 元数据子集 element section

元数据的子集合,由元数据实体和元数据元素组成。

4 中医药数据资源元数据结构

中医药数据资源元数据定义了3个层次的结构(见表1),即元数据子集、元数据实体、元数据元素。中医药数据资源元数据由7个元数据子集构成。a)标识信息子集:关于中医药数据资源外部特征的基本信息,包括名称、标识符、创建者和出版者等;b)内容信息子集:关于中医药数据资源内部特征的基本信息,包括主题、描述等;c)分发信息子集:关于用户获取中医药数据资源的信息;d)质量信息子集:关于中医药数据资源保存状态的质量信息;e)限制信息子集:关于中医药数据资源及元数据获取和使用的限制信息;f)维护信息子集:关于维护中医药数据资源的信息;g)关联信息子集:关于中医药数据资源与其他资源之间的关联关系的参考信息。

表1 中医药数据资源元数据结构

5 中医药数据资源元数据实体与元数据元素来源及描述属性

5.1 中医药数据资源元数据实体与元素来源

中医药数据资源元数据实体与元素引用了都柏林核心元数据(ISO 15836-1:2017)、临床知识资源元数据(ISO 13119:2012)和中医药文献元数据(ISO/TS 17948:2014)。

中医药数据资源元数据元素来源:

1)选择常用来描述中医药数据资源的一般元素;

2)描述中医药数据资源信息必要元素和特殊元素,包括资源名称(正式名称、唯一标识符)、资源来源(临床试验、古籍文献)等。

5.2 中医药数据资源元数据描述属性

中医药数据资源元数据实体与元数据元素采用英文名称,以便于计算机标记和编码,并与国际通用的元数据标准保持语义一致性,中文标签便于对照理解。

中文标签是元素名称的一个语义属性,在具体的应用领域,允许赋予其适合的中文标签,但语义上不允许与原始定义有冲突,不允许扩大原始语义。

元素值域宜优先选取有常设机构维护的词汇表、符号集和术语受控词表。同时,为了某些特定领域内的互操作性,可以开发利用其他受控词表。

所有元素均为非限制性,如果在特定的项目或应用中使用,可进行必要的扩展,并增加使用说明,本文件中的元素描述及示例有可能涉及扩展描述。

元数据实体与元数据元素属性定义见表2。

表2 中医药数据资源元数据属性定义

6 中医药数据资源元数据描述

6.1 标识信息子集

6.1.1 元数据实体描述

6.1.1.1 资源名称

英文名称:data resource title;

中文标签:资源名称;

定义:简要描述中医药数据资源主题与内容的标题;

注释:其元数据元素包括正式名称,译名,名称注音,其他名称及唯一标识符;

实体类型:复合型;

约束:必选(M);

频次范围:[1,1]。

6.1.1.2 创建者

英文名称:creator;

中文标签:创建者;

定义:创建中医药数据资源的主要责任实体;

注释:其元数据元素包括创建者名称,创建者类型、创建者地址、创建者电话、创建者邮箱、创建者传真、创建者主页;

实体类型:复合型;

约束:必选(M);

频次范围:[1,N]。

6.1.1.3 贡献者

英文名称:contributor;

中文标签:贡献者;

定义:对中医药数据资源做出贡献的其他责任实体;

注释:贡献者包括个人、组织或某项服务,若有多个贡献者则全部列出;其元数据元素包括贡献者名称、贡献者地址、贡献者电话、贡献者邮箱;

实体类型:复合型;

约束:可选(O);

频次范围:[0,N]。

6.1.1.4 存储信息

英文名称:store information;

中文标签:存储信息;

定义:中医药数据资源的存储类型、格式等;

注释:其元数据元素包括存储类型、存储格式、存储量、记录数等;

实体类型:复合型;

约束:必选(M);

频次范围:[1,1]。

6.1.1.5 出版者

英文名称:publisher;

中文标签:出版者;

定义:使中医药数据资源可以获得和利用的责任实体;

注释:出版者包括个人、组织或某项服务,其元数据元素包括出版者名称、出版者地址、出版者电话、出版者邮箱;

实体类型:复合型;

约束:必选(M);

频次范围:[1,1]。

6.1.1.6 日期

英文名称:date;

中文标签:日期;

定义:记录与数据资源生命周期中某个时间相关的时间;

注释:采用由万维网联盟(W3C)制订的日期和时间编码规则--基于ISO 8601的一部分,并使用YYYY-MM-DD格式著录;元数据元素包括创建日期、更新日期、发布日期、可获得日期;

实体类型:复合型;

约束:必选(M);

频次范围:[1,N]。

6.1.1.7 来源

英文名称:source;

中文标签:来源;

定义:当前数据资源的原始出处;

注释:指当前数据资源的来源,如某个科研机构,其元数据元素包括数据来源、来源类型;

实体类型:复合型;

约束:必选(M);

频次范围:[1,1]。

6.1.2 元数据元素描述

6.1.2.1 正式名称

英文名称:formal title;

中文标签:正式名称;

定义:数据资源在共享时使用的名称;

注释:必备,数据资源在共享时规定使用的名称,不能与其他名称混用;

数据类型:字符串;

值域:自由文本;

约束:必选(M);

频次范围:[1,1];

限定实体:资源名称。

6.1.2.2 译名

英文名称:translated title;

中文标签:译名;

定义:资源名称的其他语言翻译名称;

注释:本术语有则必备,须在译名后注明语种;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:资源名称。

6.1.2.3 名称注音

英文名称:phonetic notation;

中文标签:名称注音;

定义:资源名称的汉语拼音;

注释:本术语有则必备;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:资源名称。

6.1.2.4 其他名称

英文名称:other titles;

中文标签:其他名称;

定义:资源名称的简称、别名或其他语言翻译的名称等其他非正式名称;

注释:须在其他名称后注明语种;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:资源名称。

6.1.2.5 唯一标识符

英文名称:identifier;

中文标签:唯一标识符;

定义:在特定环境中,给予数据资源一个特定的标识,使其在该环境中唯一;

注释:建议资源标识符采用正式标识体系规定的标识符;

数据类型:字符串;

值域:URI[包括统一资源定位符(URL)]、数字对象标识符(DOI)、国际标准书号(ISBN)、国际标准连续出版物号(ISSN)、开放学术出版物及学术产出的作者标识符(ORCID)等;

约束:必选(M);

频次范围:[1,1];

限定实体:资源名称。

6.1.2.6 创建者名称

英文名称:creator name;

中文标签:创建者名称;

定义:创建者的名称;

注释:创建机构、团体或个人的名称,包括科研单位、医疗机构、项目组及个人等;

数据类型:字符串;

值域:自由文本;

约束:必选(M);

频次范围:[1,N];

限定实体:创建者。

6.1.2.7 创建者类型

英文名称:creator type;

中文标签:创建者类型;

定义:根据创建者的功能,对创建者进行分类,负责建立或创建该数据资源的实体类型;

注释:采用GB/T 38327-2019《健康信息学 中医药数据集分类》的“创建者类型”进行标识;

数据类型:字符串;

值域:按GB/T 38327-2019规定取值;

约束:必选(M);

频次范围:[1,10];

限定实体:创建者。

6.1.2.8 创建者地址

英文名称:creator address;

中文标签:创建者地址;

定义:创建者的地理位置;

注释:创建者或创建机构的具体地址,采用YZ/T 0127-2006《邮政地址信息数据结构》进行标识;

数据类型:字符串;

值域:按YZ/T 0127-2006规定取值;

约束:必选(M);

频次范围:[1,N];

限定实体:创建者。

6.1.2.9 创建者电话

英文名称:creator phone number;

中文标签:创建者电话;

定义:创建者的电话;

注释:创建者或创建机构联系人的电话,可以包括座机号码、手机号码;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:创建者。

6.1.2.10 创建者邮箱

英文名称:creator e-mail;

中文标签:创建者邮箱;

定义:创建者的邮箱;

注释:创建者或创建机构联系人的邮箱;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:创建者。

6.1.2.11 创建者传真

英文名称:creator fax;

中文标签:创建者传真;

定义:创建者的传真;

注释:创建者或创建机构联系人的传真号码;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:创建者。

6.1.2.12 创建者主页

英文名称:creator homepage;

中文标签:创建者主页;

定义:创建者的主页;

注释:创建者或创建机构的主页地址;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:创建者。

6.1.2.13 贡献者名称

英文名称:contributor name;

中文标签:贡献者名称;

定义:贡献者的名称;

注释:通常是创建者名称,也可以是其他贡献者实体名称;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:贡献者。

6.1.2.14 贡献者地址

英文名称:contributor address;

中文标签:贡献者地址;

定义:贡献者的地理位置;

注释:通常是创建者地址,也可以是其他贡献者的地址,采用YZ/T 0127-2006《邮政地址信息数据结构》进行标识;

数据类型:字符串;

值域:按YZ/T 0127-2006规定取值;

约束:可选(O);

频次范围:[0,N];

限定实体:贡献者。

6.1.2.15 贡献者电话

英文名称:contributor phone number;

中文标签:贡献者电话;

定义:贡献者的电话;

注释:通常是创建者的电话,也可以是其他贡献者的电话;

出处:自定义;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:贡献者。

6.1.2.16 贡献者邮箱

英文名称:contributor e-mail;

中文标签:贡献者邮箱;

定义:贡献者的邮箱;

注释:通常是创建者的邮箱,也可以是其他贡献者的邮箱;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:贡献者。

6.1.2.17 存储类型

英文名称:type;

中文标签:存储类型;

定义:中医药数据资源的特征或类型;

注释:包括电子文件、电子表格、数据集、图像、音频等;DCMI类型词汇表提供了一个通用的、跨域的已批准术语列表,这些列表可以用作Type元素的值来标识资源的类型;

数据类型:字符串;

值域:DCMI Type Vocabulary,URI:https://www.dublincore.org/specifications/dublin-core/dcmi-type-vocabulary/2003-11-19/;

约束:必选(M);

频次范围:[1,1];

限定实体:存储信息。

6.1.2.18 存储格式

英文名称:format;

中文标签:存储格式;

定义:数据资源的计算机可读格式;

注释:数据资源的存储格式,电子文件的存储格式为OFD、TXT、WPS、XML、DOC、HTML、PPT、PDF等;电子表格的存储格式为ET、XLS、XLSX等;数据库的存储格式为DM、KingbaseES、access、DBF、Dbase、MDB、sysbase、ORACLE、SQL、DB2、HBase等;图形图像类的存储格式为JPEG、GIF、BMP、PNG等;视频格式为FLV、RMVB等;音频格式为WMA、MP3等;流媒体类的存储格式为SWF、RM、MPG等;自描述格式由提供方提出其格式;

数据类型:字符串;

值域:MIME,URI:http://www.w3school.com.cn/media/media_mimeref.asp;

约束:必选(M);

频次范围:[1,N];

限定实体:存储信息。

6.1.2.19 存储量

英文名称:storage;

中文标签:存储量;

定义:数据资源在计算机中所占的字节数;

注释:数据资源的总量,用所占字节数表示,与数据记录数不同;

数据类型:字符串;

值域:自由文本;

约束:必选(M);

频次范围:[1,1];

限定实体:存储信息。

6.1.2.20 记录数

英文名称:record count;

中文标签:记录数;定义:数据资源所包含的一组完整记录的数量;

注释:数据文件中可阅读的记录数量,与字节数不同;

数据类型:字符串;

值域:自由文本;

约束:必选(M);

频次范围:[1,N];

限定实体:存储信息。

6.1.2.21 出版者名称英文名称:publisher name;

中文标签:出版者名称;

定义:出版者的名称;

注释:可以是个人、机构、组织或某项服务的名称;

数据类型:字符串;

值域:自由文本;

约束:必选(M);

频次范围:[1,1];

限定实体:出版者。

6.1.2.22 出版者地址

英文名称:publisher address;

中文标签:出版者地址;

定义:出版者的地理位置;

注释:采用YZ/T 0127-2006《邮政地址信息数据结构》进行标识;

数据类型:字符串;

值域:按YZ/T 0127-2006规定取值;

约束:必选(M);

频次范围:[1,1];

限定实体:出版者。

6.1.2.23 出版者电话

英文名称:publisher phone number;

中文标签:出版者电话;

定义:出版者的电话;

出处:自定义;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:出版者。

6.1.2.24 出版者邮箱

英文名称:publisher e-mail;

中文标签:出版者邮箱;

定义:出版者的邮箱;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:出版者。

6.1.2.25 创建日期

英文名称:date created;

中文标签:创建日期;

定义:创建该元数据的日期;

注释:建议采用规范编码体系,如ISO 8601-1[W3C-DTF],并使用YYYY-MM-DD格式著录;

数据类型:日期型;

值域:采用YYYY-MM-DD格式;

约束:必选(M);

频次范围:[1,1];

限定实体:日期。

6.1.2.26 更新日期

英文名称:date modified;

中文标签:更新日期;

定义:数据最近更新的日期;

注释:建议采用规范编码体系,如ISO 8601-1[W3C-DTF],并使用YYYY-MM-DD格式著录;

数据类型:日期型;

值域:采用YYYY-MM-DD格式;

约束:必选(M);

频次范围:[1,1];

限定实体:日期。

6.1.2.27 发布日期

英文名称:date issued;

中文标签:发布日期/出版日期;定义:数据资源发布或出版的日期;

注释:建议采用规范编码体系,如ISO 8601-1[W3C-DTF],并使用YYYY-MM-DD格式著录;

数据类型:日期型;

值域:采用YYYY-MM-DD格式;

约束:必选(M);

频次范围:[1,1];

限定实体:日期。

6.1.2.28 可获得日期

英文名称:available date;

中文标签:可获得日期;

定义:数据资源成为可获得资源的日期;

注释:建议采用规范编码体系,如ISO 8601-1[W3C-DTF],并使用YYYY-MM-DD格式著录;

数据类型:日期型;

值域:采用YYYY-MM-DD格式;

约束:可选(O);

频次范围:[0,1];

限定实体:日期。

6.1.2.29 数据来源

英文名称:data source;

中文标签:数据来源;

定义:当前数据资源的实体;

注释:数据来源可以是个人、机构、应用程序等;

数据类型:字符串;

值域:自由文本;

约束:必选(M);

频次范围:[1,N];

限定实体:来源。

6.1.2.30 来源类型

英文名称:type of source;

中文标签:来源类型;

定义:以数据原始载体的角度,对当前数据资源的分类;

注释:建议采用GB/T 38327-2019《健康信息学中医药数据集分类》的“数据来源类型”进行标注;

数据类型:字符串;

值域:按照GB/T 38327-2019规定取值;

约束:必选(M);

频次范围:[1,4];

限定实体:来源。

6.2 内容信息子集

6.2.1 元数据实体描述

6.2.1.1 描述

英文名称:description;

中文标签:描述;

定义:资源的说明解释;

注释:描述可以包括但不限于以下内容:文摘、目录、图形图像表示,或关于资源的文本描述;元数据元素包括资源范围、摘要、目录、资助项目、浏览图、应用、语种;

实体类型:复合型;

约束:必选(M);

频次范围:[1,N]。

6.2.1.2 资源分类

英文名称:dataset classification;

中文标签:资源分类;

定义:说明中医药数据资源相应的分类信息;

注释:采用GB/T 38327-2019《健康信息学 中医药数据集分类》的分类信息进行标识;元数据元素包括类目名称、类目代码;

实体类型:复合型;

约束:必选(M);

频次范围:[1,N]。

6.2.1.3 主题

英文名称:subject;

中文标签:主题;

定义:资源的主题;

注释:一般采用主题词、关键词、关键词短语或分类号来描述,建议使用受控词表;元数据元素包括主题词、关键词;

实体类型:复合型;

约束:必选(M);

频次范围:[1,N]。

6.2.2 元数据元素描述

6.2.2.1 资源范围

英文名称:coverage;

中文标签:资源范围;

定义:数据资源涉及的时间或空间范围,或资源适用的空间或资源所辖的范围;

注释:用文本描述数据资源包含的范围,一般包括时间、空间、主题等范围;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:描述。

6.2.2.2 摘要

英文名称:abstract;

中文标签:摘要;

定义:对数据资源主要内容的文本型概述;

注释:一般是对数据资源主要内容进行描述,也可以包括其他一些重要信息,如特殊历史信息、重要用途等;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,1];

限定实体:描述。

6.2.2.3 目录

英文名称:contents;

出处:dcterms;

中文标签:目录;

定义:组成数据资源的所有单元的列表;

注释:著录内容包括章节名称、图表清单、文档、图形、样式表等;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:描述。

6.2.2.4 资助项目

英文名称:funded project;

中文标签:资助项目;

定义:创建数据资源时,提供资金支持的项目;

注释:包括但不限于国家重点研发计划、国家自然科学基金等;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:描述。

6.2.2.5 浏览图

英文名称:graphic overview;

中文标签:浏览图;

定义:数据资源的概略图形;

注释:概要性说明数据资源的图形;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:描述。

6.2.2.6 应用

英文名称:application;

中文标签:应用;

定义:创建数据资源的目标、用途或应用领域;

注释:描述数据资源的具体用途和应用领域;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,1];

限定实体:描述。

6.2.2.7 语种

英文名称:language;

中文标签:语种;

定义:资源的语种;

注释:采用GB/T 4880.2-2000《语种名称代码第2部分:3字母代码》进行标识;

数据类型:字符串;

值域:按GB/T 4880.2-2000规定取值;

约束:必选(M);

频次范围:[1,N];

限定实体:描述。

6.2.2.8 类目名称

英文名称:dataset classification name;

出处:GB/T 38327-2019《健康信息学 中医药数据集分类》;

中文标签:类目名称;

定义:资源所属的类目名称;

注释:采用GB/T 38327-2019《健康信息学 中医药数据集分类》数据集分类名称进行标注;

数据类型:字符串;

值域:按GB/T 38327-2019规定取值;

约束:必选(M);

频次范围:[1,N];

限定实体:资源分类。

6.2.2.9 类目代码

英文名称:dataset classification code

出处:GB/T 38327-2019《健康信息学 中医药数据集分类》;

中文标签:类目代码;

定义:资源所属类目的代码;

注释:采用GB/T 38327-2019《健康信息学 中医药数据集分类》数据集分类代码进行标注;

数据类型:字符串;

值域:按GB/T 38327-2019规定取值;

约束:必选(M);

频次范围:[1,N];

限定实体:资源分类。

6.2.2.10 主题词

英文名称:subject headings;

出处:自定义;

中文标签:主题词;

定义:表达数据资源主题的受控词;

注释:参照《医学主题词表》(MeSH)、《中国中医药学主题词表》等进行标注;

数据类型:字符串;

值域:按照MeSH和《中国中医药学主题词表》规定取值;

约束:可选(O);

频次范围:[0,N];

限定:主题。

6.2.2.11 关键词

英文名称:key words;

出处:自定义;

中文标签:关键词;

定义:单个媒体在制作索引时,所适用的词汇;

注释:表达数据资源内容的词语,不使用专门的主题词,可用自由词;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定:主题。

6.3 分发信息子集

6.3.1 元数据实体描述

6.3.1.1 分发格式

英文名称:distribution format;

中文标签:分发格式;

定义:分发数据资源的格式说明;

注释:元数据元素包括名称、版本、在线(链接)、离线(介质);

实体类型:复合型;

约束:可选(O);

频次范围:[0,N]。

6.3.1.2 分发者

英文名称:distributor;

中文标签:分发者;

定义:进行中医药数据资源分发的责任实体;

注释:元数据元素包括分发者名称、分发者地址、分发者电话、分发者邮箱;

实体类型:复合型;

约束:可选(O);

频次范围:[0,N]。

6.3.2 元数据元素描述

6.3.2.1 名称

英文名称:distribution format name;

中文标签:分发格式名称;

定义:数据资源分发的格式,一般用名称进行标识;

注释:给使用者发放时的格式,不一定是数据资源的原始格式,可以是压缩后或者转换后的格式;数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定:分发格式。

6.3.2.2 版本

英文名称:version;

出处:自定义;

中文标签:分发格式版本;

定义:数据分发格式的版本;

注释:一般是版本号或日期;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,1];

限定:分发格式。

6.3.2.3 在线(链接)

英文名称:online URL;

中文标签:在线(链接);

定义:从互联网上得到数据资源的位置和访问方法;

注释:用户通过网络可访问数据资源的一种方法;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:分发格式。

6.3.2.4 离线(介质)

英文名称:off-line medium;

中文标签:离线(介质);

定义:用户通过非网络的方式获得数据资源的方法;

注释:用户通过移动存储设备、纸质版本等介质获得数据资源;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:分发格式。

6.3.2.5 分发者名称

英文名称:distributor name;

中文标签:分发者名称;

定义:数据资源分发者的名称;

注释:数据资源分发者的名称可能与创建者一致或不一致,可为个人、组织、机构等;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定:分发者。

6.3.2.6 分发者地址

英文名称:distributor address;

中文标签:分发者地址;

定义:数据资源分发者所在的地理位置;

注释:数据资源分发者的具体地址,可定位到具体位置;采用YZ/T 0127-2006《邮政地址信息数据结构》进行标识;

数据类型:字符串;

值域:按YZ/T 0127-2006规定取值;

约束:可选(O);

频次范围:[0,N];

限定:分发者。

6.3.2.7 分发者电话

英文名称:distributor phone number;

中文标签:分发者电话;

定义:数据资源分发者电话;

注释:数据资源分发者,如机构或联系人的座机号码、手机号码;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定:分发者。

6.3.2.8 分发者邮箱

英文名称:distributor e-mail;

中文标签:分发者邮箱;

定义:数据资源分发者的邮箱;

注释:数据资源分发者,如机构或联系人的电子邮箱地址;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定:分发者。

6.4 质量信息子集

6.4.1 元数据实体描述

6.4.1.1 数据志

英文名称:lineage;

中文标签:数据志;

定义:非量化的数据质量信息;

注释:数据创造者对数据源和处理步骤的说明,包括但不限于数据的完整性、规范性、一致性、准确性、唯一性和关联性的说明和解释;元数据元素包括数据志;

实体类型:简单型;

约束:必选(M);

频次范围:[1,N]。

6.4.1.2 质量报告

英文名称:quality report;

中文标签:质量报告;

定义:对数据集的数据质量评测行为或评测结果等有关信息的链接指向;

注释:此元素为指向数据集质量信息的链接地址,链向在数据质量相关成果规约下的数据质量评测相关元数据;元数据元素包括质量报告;

实体类型:简单型;

约束:可选(O);

频次范围:[0,N]。

6.4.2 元数据元素描述

6.4.2.1 数据志

英文名称:lineage;

中文标签:数据志;

定义:非量化的数据质量信息;

注释:数据创造者对数据源和处理步骤的说明,包含但不限于数据的完整性、规范性、一致性、准确性、唯一性和关联性的说明和解释;

数据类型:字符串;

值域:自由文本;

约束:必选(M);

频次范围:[1,N];

限定:数据志。

6.4.2.2 质量报告

英文名称:quality report;

中文标签:质量报告;

定义:对数据集的数据质量评测行为或评测结果等有关信息的链接指向;

注释:此元素为指向数据集质量信息的链接地址,链向在数据质量相关成果规约下的数据质量评测相关元数据;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定:质量报告。

6.5 限制信息子集

6.5.1 元数据实体描述

6.5.1.1 法律限制

英文名称:legal restrictions;

中文标签:法律限制;

定义:法律层面上,对访问和使用中医药数据资源的限制;

注释:依法对中医药数据资源的使用做出限制措施;元数据元素包括访问限制、使用限制;

实体类型:复合型;

约束:必选(M);

频次范围:[1,N]。

6.5.1.2 保密限制

英文名称:confidentiality restrictions;

中文标签:保密限制;

定义:从国家、单位或个人安全的角度出发,对中医药数据资源的使用施加的限制或约束;

注释:根据《中华人民共和国保守国家秘密法》规定,对数据资源的保密级别做出不同限制;元数据元素包括保密限制;

实体类型:简单型;

约束:必选(M);

频次范围:[1,1]。

6.5.2 元数据元素描述

6.5.2.1 访问限制

英文名称:access rights;

中文标签:访问限制;

定义:为保护隐私权和知识产权,对访问中医药数据资源施加的限制或约束;

数据类型:字符串;

值域:自由文本;

约束:必选(M);

频次范围:[1,N];

限定实体:法律限制。

6.5.2.2 使用限制

英文名称:service restrictions;

中文标签:使用限制;

定义:为保护隐私权或知识产权,对使用数据资源施加的限制和约束;

数据类型:字符串;

值域:自由文本;

约束:必选(M);

频次范围:[1,N];

限定实体:法律限制。

6.5.2.3 保密限制

英文名称:confidentiality restrictions;

中文标签:保密限制;

定义:从国家、单位或个人安全的角度出发,对中医药数据资源的使用施加的限制或约束;

注释:根据《中华人民共和国保守国家秘密法》规定,对数据资源的保密级别做出不同限制;

数据类型:枚举型;

值域:绝密级、机密级、秘密级、内部非涉密、公开(见附录表A1);

约束:必选(M);

频次范围:[1,1];

限定实体:保密限制。

6.6 维护信息子集

6.6.1 元数据实体描述

6.6.1.1 更新维护

英文名称:update and maintenance;

中文标签:更新维护;

定义:根据实际需要,中医药数据资源更新和维护的具体信息;

注释:根据中医药数据资源的应用情况,中医药数据资源创建者和维护者对数据资源更新和维护的频次、范围及具体内容的描述;元数据元素包括更新维护频率和更新维护内容;

实体类型:复合型;

约束:可选(O);

频次范围:[0,N]。

6.6.1.2 维护者

英文名称:maintainer;

中文标签:维护者;

定义:维护中医药数据资源的责任实体;

注释:包括个人、组织或某项服务;通常用维护者标识这一元素实体;元数据元素包括维护者名称、维护者地址、维护者电话、维护者邮箱;

实体类型:复合型;

约束:必选(M);

频次范围:[1,N]。

6.6.2 元数据元素描述

6.6.2.1 更新维护频率

英文名称:frequency of update and maintenance;

中文标签:更新和维护频率;

定义:在中医药数据资源元数据初次完成后,维护者对其进行更新、修改或补充的频率;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:更新维护。

6.6.2.2 更新维护内容

英文名称:details of updates and maintenance。

中文标签:更新维护内容。

定义:中医药数据资源元数据更新维护的范围、细节的说明;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:更新维护。

6.6.2.3 维护者名称

英文名称:maintainer name;

中文标签:维护者名称;

定义:中医药数据资源维护者的名称;

数据类型:字符串;

值域:自由文本;

约束:必选(M);

频次范围:[1,N];

限定实体:维护者。

6.6.2.4 维护者地址

英文名称:maintainer address;

中文标签:维护者地址;

定义:中医药数据资源维护者的地理位置;

注释:维护者或维护机构的具体地址,采用YZ/T 0127-2006《邮政地址信息数据结构》进行标识;

数据类型:字符串;

值域:按YZ/T 0127-2006规定取值;

约束:必选(M);

频次范围:[1,N];

限定实体:维护者。

6.6.2.5 维护者电话

英文名称:maintainer phone;

中文标签:维护者电话;

定义:中医药数据资源维护者的电话;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:维护者。

6.6.2.6 维护者邮箱

英文名称:maintainer e-mail;

中文标签:维护者邮箱;

定义:中医药数据资源维护者的邮箱;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:维护者。

6.7 关联信息子集

6.7.1 元数据实体描述

关联

英文名称:relation;

中文标签:关联;

定义:中医药数据资源与其他数据资源之间的关联关系;

注释:建议采用符合正式标识体系的字符串进行标识;元数据元素包括有……版本、是……的版本、替代、被……替代、有……部分、是……的一部分、被……参考、并列、附加;

实体类型:复合型;

约束:可选(O);

频次范围:[0,N]。

6.7.2 元数据元素描述

6.7.2.1 有……版本

英文名称:has version;

中文标签:有……版本;

定义:当前数据资源的不同版本之间关联关系;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:关联。

6.7.2.2 是……的版本

英文名称:is version of;

中文标签:是……版本;

定义:当前数据资源的不同语种或不同格式之间的关联关系;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:关联。

6.7.2.3 替代

英文名称:replace;

中文标签:替代;

定义:当前数据资源替代其他数据资源,导致其他数据资源停用或不再更新的关联关系;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:关联。

6.7.2.4 被……替代

英文名称:is replaced by;

中文标签:被……替代;

定义:当前数据资源被其他数据资源替代,而导致当前数据资源不再更新或使用的关联关系;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:关联。

6.7.2.5 有……部分

英文名称:has part;

中文标签:有……部分;

定义:当前数据资源与其组成部分之间的关联关系;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:关联。

6.7.2.6 是……的一部分

英文名称:is part of;

中文标签:是……的一部分;

定义:数据资源及其组成部分之间的关联关系,从组成部分角度,构成了本关联关系;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:关联。

6.7.2.7 被……参考

英文名称:is referenced by;

中文标签:被……参考;

定义:当前数据资源被其他数据资源应用,从被参考方的角度,构成了本关联关系;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:关联。

6.7.2.8 并列

英文名称:parallel;

中文标签:并列;

定义:数据资源与其他数据资源,在一定主题或范围内具有同等地位或位置,两者之间构成本关联关系;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:关联。

6.7.2.9 附加

英文名称:addition;

中文标签:附加;

定义:一个数据资源作为另一个数据资源附带的内容时,从主数据资源角度,与另一方构成本关联关系;

数据类型:字符串;

值域:自由文本;

约束:可选(O);

频次范围:[0,N];

限定实体:关联。

附录(资料性附录)

表A1 保密限制分级

本文件起草单位:中国中医科学院中医药信息研究所、广东省中医院、上海中医药大学、中国中医科学院中医药数据中心、中科软科技股份有限公司。

本文件主要起草人:李海燕、贾李蓉、聂莹、王斌、孙华君、傅昊阳、李静、张磊、王广志、付林飞。

猜你喜欢
英文名称数据类型值域
函数的值域与最值
详谈Java中的基本数据类型与引用数据类型
常见基金项目的英文名称(二)
常见基金项目的英文名称(一)
如何理解数据结构中的抽象数据类型
多角度求解函数值域
值域求解——一个“少”字了得
破解函数值域的十招
基于SeisBase模型的地震勘探成果数据管理系统设计
Fruit Maze水果迷宫