首页 > 政策法规 > 正文 文章搜索:
数据元标准化的基本原则与方法
发布时间:2006/8/15  来源:  浏览次数:10391

前 言

 

科学数据共享活动既涉及科学数据的汇交、分发、服务和应用环节,也涉及科学数据的采集、加工和处理环节。在这一系列环节中,常见的工作内容之一是用数据元(如数据库中的数据字段)的形式确立某种类别的数据在其名称、含意、表示格式、标识等方面的特征,用数据的分类与编码(如科学数据分类与代码)的形式确立对某种类别的数据所作的进一步的分类并对分类结果赋予特定代码,以达到对该种数据类别或其分类结果在语义上的无歧义理解。但需要特别强调的是:一方面,数据元遴选和确立的好坏,将直接影响数据组织、生产、交换和共享的效率和质量,严重时还会导致重复的投入和建设;

另一方面,数据元的遴选和确立结果要被不同的信息系统或应用系统所共享,就必须在各相关方之间建立大家一致认可的相关标准或规范,否则会导致大量的转换工作甚至无法实现共享。为此,采用何种原则和方法开展数据元标准化工作,可有效规避风险,提高数据组织和生产的效率和质量,达到共享目标,是科学数据共享活动面临的任务之一。

本标准正是基于上述现实要求而提出和制定的,其目的是确立面向科学数据共享活动的数据元标准化的基本原则与方法,指导和规范科学数据共享工程各建设单位研究和制定与各种科学数据的采集、加工、处理、汇集、分发、服务和应用相关的通用或专用的数据元目录(又称字典)标准,推动和促进科学数据的集成与共享。

按照向上积极采用适宜的国际标准或国家标准,向下突出科学数据共享活动的特点和需求的原则,本标准参考了包括GB/T 18391《数据元的规范与标准化》在内的大量国家标准,并结合了各种类型的科学数据库建设和整合以及科学数据交换、共享、服务和应用对数据元标准化工作的特定需求。

 

(全文见附件)

  附件1:数据元标准化的基本原则和方法(点击右键可另存为)