先进制造与自动化科学数据元数据标准

内容与适用范围

      本标准规定了先进制造与自动化科学数据共享网元数据的内容,包括资源对象元数据和资源集合元数据。通过元数据标准的规范,可为用户提供数据资源的检索服务,动态的数据目录服务以及为用户提供动态的相关资源信息,为实现共享服务打下基础。本标准适用于国家科技基础条件平台《先进制造与自动化科学数据共享网》项目。

参考标准

       Dublin Core

       Zcollection

       国家信息中心的元数据管理系统

       中国可持续发展信息共享元数据内容标准体系

术语

1 .元数据:元数据是关于数据的数据,是说明数据的来源、内容、格式、质量、状态及结构等特征的信息。

2 .资源集合:用于任何物理对象和数字对象集合,本项目中资源集合主要指数字资源对象或子集合按一定体系组成的整体。

3 .资源对象:本项目中,资源对象指文本、图形、图像 、数据表格、软件等相对独立的数字对象。

4 .性质/条件:说明元数据元素是“可选”项,还是“必选”项,“M”表示必选,“O”表示可选。

5 .DCMITYPE : DCMI 类型词表提供了一组通用的、跨领域的术语,由DCMI(Dublin Core Metadata Initiative)推荐使用,可以被用来认定一种数据资源是属于哪种类型。(详见http://dublincore.org/documents/dcmi-terms/)

元数据元素特征

类别:元数据元素的分类,如一般性描述信息类、关联信息类、访问信息类等

元素 :元素名称

性质/条件:说明元数据元素是必须使用的还是可选择使用的,描述符号分为:M--必选,O--可选。

说明:对元素概念与内涵的说明

数据类型:元素值中所表现的数据类型,主要有文本、整型、日期型、 DCMITYPE 和 MIME 。

资源集合元数据说明

表一 资源集合元数据主要内容

一般描述信息
元素
性质/条件
说    明
标题
M
资源集合的名称。
标识符
M
用于识别该资源的唯一标识。
简要说明
M
关于资源集合内容的一个简洁描述,包括资源所要表达的重要信息,并提供内容关键字。
主题
M
资源集合主题关键字,并注明主题词表来源。(请参考国家或行业主题词表)
日期
M
资源集合开始提供使用的日期, 采用 ISO 8601 日期表示方法 , 如 2004-1-20 。
收集者
M
资源集合收集过程中主要责任人员或机构编号。
拥有者
M
拥有资源集合的人员或机构编号。
保管历史
M
关于资源集合的档案资料,如地点、保存期限、介质等。
关联信息
父集合
M
资源的父集合标识及说明。
成员
M
资源集合的成员标识及说明。
相关资源
0
提供相关资源的标识,关系名称,以及对关系的说明,并按相关度从大到小排序。
结合资源
0
提供分散在不同地域的同一技术领域的资源集合的标识及简要说明。
访问信息
访问地址
M

如果资源可通过地理位置访问,则填写邮政地址,包括地址及邮编(如果已登记在机构信息表中,也可直接填写机构编号);

如果资源可通过网络获取,则另外填写该资源的 URL 地址。
访问权限
M
关于资源集合访问权限的说明,选填“保密”或“公开”,并说明开放范围,用户权限等。
负责人
M
数据机构中负责数据访问的人员编号。

可访问时间说明

M
说明数据资源可提供访问的时间段。


资源对象元数据说明

表二  资源对象元数据主要内容

一般描述信息
元素
性质/条件
说    明
标题
M
数据资源的名称。
主题
M
数据资源主题关键字,并注明主题词表来源。(请参考国家或行业主题词表)
简要说明
M
关于数据资源内容的一个简洁描述,包括资源所要表达的重要信息。
数据生产信息
M
提供数据来源信息,如手册、实测、试验、统计、国际交流等;以及对数据生产条件、生产方法等方面的描述,例如,试验方法、数据采集方法、手段、试样、试验设备等。
数据加工维护历史
M
提供数据加工、维护历史信息,如数字化加工信息,数据资源补充、更新等信息。
背景信息
M
获得该数据资源的项目背景信息,包括项目名称、类型、水平、负责单位、负责人等信息,以及其他相关背景信息。
质量信息
M
生产数据时的质量保证措施、所依据的标准、数据精度、专家评判意见等信息。
资源状态
M
资源的制作状态,选填“制作中”或“完成”。
实例信息
日期
M
采用ISO 8601日期表示方法,如 2004-1-20 。
标识符
M
用于区分该资源的唯一标识。
表征信息
0
关于数据资源内容表达方面的信息,包括资源的类型与资源的格式。类型取值“数据集”、“图像”、“软件”、“文本”等(参考 DCMI 类型词表说明 );格式取值参考“数据资源格式说明”。
产权信息
创建者
M
数据获得过程中的主要责任人员或机构编号。
产权说明
M
关于数据资源的知识产权、版权等方面的说明。
关联信息
父集合
M
资源的父集合标识及说明。
相关资源
o
提供与资源为相关关系的资源标识,关系名称,以及对关系的说明,并按相关度排序。
结合资源
o
提供分散在不同地域的同一技术领域的资源对象的标识及说明
访问信息
访问地址
M

如果资源可通过地理位置访问,则填写邮政地址,包括地址及邮编(如果已登记在机构信息表中,也可直接填写机构编号); 如果资源可通过网络获取,则另外填写该资源的 URL 地址。

访问权限
M
关于数据资源访问权限的说明,选填 7级数据(1~7级): 1----初加工数据:经元数据规范的数据。 2----精加工数据:经元数据规范、质量检验规范的数据。 3----获取难度较大的加工数据。 4----有自筹资金投入的数据。 5----应用户需求,专门为之整理、加工和生产的科学数据。 6----为使用者带来直接或巨大商业利益的关键数据。 7----影响国际竞争力的关键数据;影响国家安全的重要数据。
负责人
M
数据机构中负责数据访问的人员编号。

可访问时间说明

M
说明数据资源可提供访问的时间段。
使用信息
使用限制
M
说明数据的应用范围和使用过程中的限制。
使用方法
M
关于数据如何使用的说明。
使用历史记录
M
数据的用户使用记录,如数据用途、使用效果,以及用户反馈信息等。


其他说明

1 .标识符

资源集合标识符由11位阿拉伯数字组成,资源对象标识符长13位,是在资源集合标识符的基础上增加2位数字构成。

标识符具体标识内容如下:

 

标识符的第1位表示资源大类。

标识符的第1位表示资源大类。目前共有五大类:现代设计技术、先进制造工艺、自动化技术、通用技术和现代管理。

标识符的第2、3位表示资源所属技术领域,如现代设计技术大类中第1个技术领域为机械强度与振动设计技术(请参考“先进制造与自动化科学数据共享网”项目任务书),则“机械强度与振动设计技术”资源集合的标识符为:10100000000。

标识符的第4~11位(共8位数字)标识某技术领域所含的资源集合(子集合),每两位数字标识一层资源集合(子集合),因此最多可将数据资源细分为四层:

第4、5位数字标识资源所属技术领域的第一层数据资源,称为领域第一层资源集合。例如:10101000000标识“机械强度与振动设计技术”中的第一层第一部分的资源子集合,“强度评价设计”资源子集合;

第6、7位数字标识资源所属技术领域的第二层数据资源,称为领域第二层资源集合。例如:10101040000表示“机械强度与振动设计技术”中的第二层第四部分的资源子集合,“概率强度评价方法”资源子集合;

第8、9位数字标识资源所属技术领域的第三层数据资源,称为领域第三层资源集合。例如:10101040500表示“机械强度与振动设计技术”中的第三层第五部分的资源子集合,“断裂强度评价方法”资源子集合;

第10、11位数字标识资源所属技术领域的第四层数据资源,称为领域第四层资源集合。例如:10101010101表示“机械强度与振动设计技术”中第四层第一部分的资源子集合,“常规静强度”资源子集合。

第12、13位数字用于标识资源对象,如:1010204000004表示机械强度与振动设计技术中第一层第二方面资源集合“静强度/刚度设计”中的第四个资源子集合“静刚度设计”的第四个资源对象“薄壳变形计算”。

2 .人员 / 机构信息

为方便元数据填写,将人员信息和机构信息单独制表、编号,并分别以大写“ A ”、“ B ”为编号首字符。

人员标号用7位数表示:A××××××

第2、3、4位沿用数据资源所属技术领域的标识符,如203代表模具技术;

第5、6、7位是人员序列号。如A203001代表模具技术数据资源访问的负责人之一。

机构编号共4位:Bxxx,后3位是序列号。如机械科学研究院、沈阳铸造研究所、哈尔滨焊接研究所的机构编号分别是B001、B002、B003。

表 3 人员信息表

人员编号

Axxxxxx

姓名

联系方式

地址、邮编、电话、 E-mail 等

简历

 

表 4 机构信息表

机构编号

Bxxx 

名称

联系方式

地址、邮编、电话、 E-mail 等

简介

 

3 . DCMI 类型词表说明

以下内容引自 DCMI 应用委员会 2003 年 2 月 12 日 创建的 DCMI 类型词表 [1] (上海图书馆翻译 [2] )。该类型词表是 DCMI 的推荐规范,并于 2003 年 3 月 3 日 生效。

DCMI 类型词表提供了一组通用的、跨领域的术语,由 DCMI 推荐使用,可以用来作为表征信息中资源类型的值,从而可以认定一种资源属于哪种类型。这里所列的术语都包含在文档“ DCMI 元数据术语” [3] 之中。

表 5 DCMI 类型词表说明

术语名称

标签

定义

资源集合

Collection

资源集合是个体资源对象的集合。术语“资源集合”指作为整体进行描述的资源,其组成部分可以分别描述并被链接。

数据集

Dataset

数据集是指为便于计算机直接处理而以特定结构进行编码的信息 ( 例如表格、数据库等 ) 。

事件

Event

事件是指基于时间的、非永久存在的一种现象。事件元数据提供描述性信息以揭示事件的目标、地点、时间、责任实体等并链接到其他的相关事件或资源。如果被描述的实例已经过期或者还未发生,类型事件的资源是有可能检索不到的。事件的例子有:展览会、网站广播、会议、工作组等。

图像

Image

图像是不同于文本的一种主要的符号视觉表现,可以包括电子的和物理的两种表现形式,例如:物理实体的图画或照片、印刷品、其他图像和图形、动画和活动图像、电影、图表等。

交互资源

Interactive Resource

交互资源是一种需要和用户交流而获得理解、运行和体验的资源。例如: web 页面上的表格、 java 小程序、多媒体学习对象等。

服务

Service

服务是提供一种或多种有价值的功能给最终用户的系统。例如:影印服务、银行服务、认证服务、 Z39.50 或者 web 服务器。

软件

Software

软件是一种以源代码或编译形式存在的计算机程序,可以永久安装在其他计算机上。对于只是用于创造一种交互环境的软件,可归入“交互资源”类型。

声音

Sound

声音是一种主要用来生成音频的资源。例如:音乐回放文件格式,音频光盘和被录制的语音和声音。

文本

Text

文本是一种内容主要用来阅读的资源,比如各种文档。需要注意的是文本的摹本或图像也是属于文本。

物理对象

Physical Object

物理对象是指一种没有生命的三维对象或物质。需要注意的是这些对象的数字表现或摹本应该用图像,文本或其它类型中的某一种来标识。

注: [1]http://dublincore.org/documents/dcmi-type-vocabulary/

[2]http://www.dc.library.sh.cn/DC/dcmi-terms.htm

[3]http://dublincore.org/documents/dcmi-terms/

4 .数据资源格式说明

表 6 数据资源格式说明

格式

说明

text/plain

无格式文本

text/html

HTML 网页

text/sgml

SGML 文档

text/xml

XML 文档

application/rtf

Rich Text Format 文档

application/wordperfect

WordPerfect 文档

application/pdf

Portable Data Format 文档

application/msword

Microsoft Word 文档

image/jpeg

JPEG 编码图像

image/gif

GIF 编码图像

image/png

PNG 编码图像

video/mpeg

MPEG 视频

video/quicktime

Quicktime 编码视频

database/databaseName

databaseName 数据库



     



copyright © 机械科学研究院信息中心