Standard
     

 标准规范研究

 

    科学数据共享工程是一项跨学科、跨部门、跨地区、跨行业的大型科学数据基础设施建设工程,它涉及到众多学科领域的科学工程、科研项目的数据成果,涉及到各个专业部门、地区和行业通过多年的科学调查、观测、探测和生产活动所积累的海量科学数据。充分开发利用科学数据资源,是提高国家科技创新能力和国际竞争力的重要手段和战略措施。多年来,传统的条块管理体制,使得大量的科学数据资源都处在分散管理、封闭使用的状态下,同时也造成了科学数据资源共享标准的严重缺乏,从而使科学数据资源很难形成有效的流通和共享,极大地限制了跨学科、跨部门、跨地区、跨行业的广泛应用。因此,建立科学数据共享标准体系,统一科学数据共享过程中所必需的标准和技术规范已成为科学数据共享工程中的重要任务。

    建立科学数据共享标准体系的必要性主要体现以下几个方面:

 

    1.    标准化是科学数据共享的前提。科学数据共享标准体系是制定科学数据共享标准规划的指南,它的作用是在科学数据范畴内促进科学数据共享标准达到科学化、合理化和工程化。它的建立将使正在起步的科学数据共享工程建设在一开始就能够自上而下地遵循规范化的途径有序地进行,减少无效的建库劳动,从而提高科学数据共享工程建设的效率。只有在统一标准的前提下,科学数据共享的总体目标才能够有效地实现。
    2.    科学数据共享标准体系的建立为科学数据进入国家信息基础设施做好准备,它将结合现代信息技术的发展成果指导科学共享相关标准的制定,为科学数据的高度共享及其与其他应用系统的高速通信、联网创造必要的条件。
    3.    建立综合性的科学数据标准体系涉及到跨学科、跨部门、跨地区、跨行业的科学数据获取、收集、汇交、存储、管理和分发等科学数据生产和共享活动的大量标准化工作,这实际上是一项极其复杂的系统工程。建立综合性的科学数据标准体系是科学、完整、有序地制定和贯彻科学数据生产和共享活动的标准和技术规范的重要基础,它将推动科学数据共享工程技术体系的建立和标准化进程,从而在技术层面上促进科学共享的快速发展。

    科学数据共享标准体系分为三方面:指导标准、通用标准和专用标准,共32项标准。

(一)  指导标准

    指导标准是与科学数据共享标准的制定、应用和理解等方面相关的总体性标准,用来阐述科学数据共享标准化的总体需求、概念、组成和相互关系,以及使用的基本原则和方法等。科学数据共享工程中的指导标准包括:《标准体系及参考模型》、《标准化指南》、《科学数据共享概念与术语》、《标准一致性测试》。

(二)  通用标准

    通用标准是科学数据共享活动中具有共性的基础性标准。通用标准分为三类:数据类标准、服务类标准和管理与建设类标准。
    数据类标准包括有元数据标准、分类与编码标准、数据内容标准这三方面标准。元数据标准用于规范元数据的采集、建库、共享以及应用,包括《元数据内容》、《元数据XML/XSD置标规则》和《元数据标准化基本原则和方法》;分类与编码标准是科学数据分类与编码时需要遵守的指定规则,包括《科学数据分类与编码原则与方法》、《科学数据分类与编码》;数据内容标准用于数据的规范化改造、建库、共享以及应用,包括《数据元标准化原则与方法》、《数据元目录》、《数据模式描述规则和方法》、《数据交换格式设计规则》、《数据图示表达规则和方法》、《空间框架数据标准》。
    服务类标准是提供科学数据共享服务的相关标准的总称,涉及了数据和信息的发布、表达、交换和共享等多个环节,规范了科学数据的转换格式和方法,互操作的方法和规则,以及认证、目录服务、服务接口、图示表达等各方面。服务类标准包括有数据发现服务标准、数据访问服务标准、数据表示服务标准和数据操作服务标准这四方面标准。
    管理与建设类标准用于指导系统的建设,规范系统的运行。管理与建设类标准包括《质量管理规范》、《数据发布管理规则》、《运行管理规定》、《信息安全管理规范》、《共享效益评价规范》、《工程验收规范》、《科学数据中心建设规范》和《科学数据网建设规范》。

(三)  专用标准

    专用标准就是根据通用标准制定出来的满足特定领域数据共享需求的标准,重点是反映具体领域数据特点的数据类标准,包括领域数据类标准、领域服务类标准、领域管理与建设类标准。
领域数据类标准包括领域元数据、领域分类与编码、领域数据内容等方面的标准。
    领域服务类标准是指领域根据自身的特殊需求,对通用标准中的数据访问服务、数据表示服务和数据操作服务标准进行必要的修订和扩充,形成具有自己领域特点的专用数据发现服务、数据访问服务、数据表示服务和数据操作服务。同样可以依据现有的通用标准中的服务类标准,结合新的功能需求,增加新的功能性标准。
    领域管理与建设类标准分为两种类型:一是领域可以直接采用的标准,例如《国家科学数据中心建设规范》和《国家科学数据网建设规范》;另一类是需要领域根据具体情况,可以进一步修订、细化的标准,例如《质量管理规范》和《运行管理规定》。
    目前,已完成指导标准和部分通用标准共23项标准的制定工作,包括:《标准体系及参考模型》、《标准化指南》、《概念与术语》、《元数据标准化基本原则和方法》、《元数据内容》、《元数据XML/XSD置标规则》、《科学数据分类与编码原则与方法》、《科学数据分类与编码》、《数据元标准化原则与方法》、《数据元目录》、《数据模式描述规则和方法》、《数据交换格式设计规则》、《目录服务规范》、《数据与服务注册规范》、《数据访问服务接口规范》、《元数据检索和提取协议》、《数据分发服务指南与规范》、《质量管理规范》、《数据发布管理规则》、《运行管理规定》、《共享效益评价规范》、《科学数据中心建设规范》和《科学数据网建设规范》。各领域依托现已制定完成的通用标准,也已展开了专用标准的研制工作,如《医药卫生科学数据共享元数据标准》等。