GB/T 26499.4-2011 机械 科学数据 第4部分:交换格式
- 名 称:GB/T 26499.4-2011 机械 科学数据 第4部分:交换格式 - 下载地址1
- 下载地址:[下载地址1]
- 提 取 码:
- 浏览次数:3
发表评论
加入收藏夹
错误报告
目录| 新闻评论(共有 0 条评论) |
资料介绍
ICS 25. 010 J 04
中 华 人 民 共 和 国 国 家 标 准
GB/T 26499.4—2011
机械 科学数据
第 4 部分:交换格式
Machinery—Sciencedata—Part4:Exchange format
2011-05-12发布 2011-10-01实施
中华人民共和国国家质量监督检验检疫总局中 国 国 家 标 准 化 管 理 委 员 会
发
布
GB/T26499.4—2011
前 言
GB/T 26499《机械 科学数据》分为四个部分 :
— 第 1部分 :分级分类方法 ;
— 第 2部分 :数据元目录 ;
— 第 3部分 :元数据 ;
— 第 4部分 :交换格式 。
本部分为 GB/T 26499的第 4部分 。
本部分的附录 B为规范性附录 , 附录 A为资料性附录 。
本部分由中国机械工业联合会提出 。
本部分由全国 自动化系统与集成标准化技术委员会(SAC/TC159)归 口 。
本部分起草单位 :北京中机科海科技发展有限公司 、安徽京诺科技发展有限公司 。
本部分主要起草人 :李春梅 、李丽亚 、李艾丹 、郭秋梅 、吴来 、薛中玉 、李莹 、王芳 。
Ⅰ
GB/T26499.4—2011
引 言
GB/T 26499《机械 科学数据》分为四个部分 。
第 1部分 :分级分类方法 , 旨在通过对机械科学数据的分级分类进行规范 , 以便形成良好的机械科学数据共享机制 ,保护国家安全 、社会公众利益和数据生产者的合法权益 ,促进机械科学数据的价值在广泛应用中得到更大的发挥和增值 。
第 2部分 :数据元目录 , 旨在通过对机械科学数据的属性进行一致性和精确性的规范描述 ,保证具有相同概念的数据元在语义上统一 、规范 、无歧义 ,最大限度地消除数据描述的混乱现象 。
第 3部分 :元数据 , 旨在通过对机械科学数据的来源 、内容 、质量以及用途等信息提供一套规范描述 ,为科研人员 、相关用户等提供高效的检索 、获取 、使用和评价服务 ,促进机械科学数据的保存 、管理 、交流 、共享和维护 。
第 4部分 :交换格式 。 旨在通过确立面向机械科学数据共享活动的 、结构化和预定义的数据交换结构和格式 ,实现数据在采集 、加工 、汇交 、分发 、服务和应用等多个环节中的自动交换 ,从而推动和促进机械科学数据的高度共享 。
机械科学数据标准的四个部分分别规范了机械科学数据共享管理的四个方面 ,构成了一个有机整体 ,缺一不可 。
在科技部和中国机械工业联合会的组织协调下 , 机械领域已经初步整合了覆盖现代设计 、制造工艺 、自动化 、通用技术和 现 代 管 理 5 个 方 面 、数 十 个 技 术 领 域 的 机 械 科 学 数 据 资 源 , 数 据 量 累 计 达 到500多万个 , 初步实现了国家机械科学数据资源汇交 、整合与共享的要求 。
机械科学数据共享活动主要涉及科学数据采集 、加工 、汇交 、分发 、服务和应用等多个环节 。在众多环节中 ,必然会在同构或异构信息系统之间发生大量结构化或非结构化的科学数据交换 。 当要求以无人工或最少人工干预的形式进行科学数据交换时 ,对数据进行预定义和结构化处理便成为无法回避的问题 。
本部分正是基于上述需求提出的 ,其目的在于确立面向机械科学数据共享活动的 、结构化和预定义的数据交换结构和格式 ,从而推动和促进机械科学数据的高度共享 。
Ⅱ
GB/T26499.4—2011
机械 科学数据
第 4 部分:交换格式
1 范围
GB/T 26499的本部分规定了机械科学数据的交换格式 。
本部分适用于机械科学数据共享系统与子系统之间的数据交换 。
2 规范性引用文件
下列文件中的条款通过 GB/T 26499的本部分的引用而成为本部分的条款 。凡是注日期的引用文件 ,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本部分 ,然而 ,鼓励根据本部分达成协议的各方研究是否 可 使 用 这 些 文 件 的 最 新 版 本 。 凡 是 不 注 日 期 的 引 用 文 件 , 其 最 新 版 本 适 用 于 本部分 。
GB 2312 信息交换用汉字编码字符集基本集
GB 18030—2005 信息技术 中文编码字符集
3 术语和定义
下列术语和定义适用于 GB/T 26499的本部分 。
3. 1
数据交换格式 data interchange format
一个预定义 、结构化 、在功能上相互关联的聚合数据元或数据元的集合 ,它涵盖了对某类数据的交换要求 , 旨在双边或多边的数据交换中 ,确保各方对所交换数据的无歧义理解和自动处理 。
3. 2
XML ExtensibleMarkup Language
可扩展标记语言 ,是一种与平台无关的描述和存储数据的方法 ,也是用来定义其他语言的一种元标记语言 。
3. 3
数据包 data packet
本部分中的数据包指在 XML形式的数据文件中 ,用于分类封装具体数据记录或数据内容的一个基本单元 。
3. 4
数据项 data item
数据结构中讨论的最小单位 ,是数据记录中最基本的 、不可再分的数据单位 ,数据项可以通过数据类型(逻辑型 、数值型 、字符型等)及数据长度来描述 。
3. 5
数据记录 data record
将逻辑上相关的数据元组合在一起就形成一条数据记录 ,数据记录是数据库中存取的最低层逻辑单位 。
1
GB/T26499.4—2011
3. 6
数据类型 data type
字段的取值范围 ,字段必须具有数据类型 ,如字符型 、数值型 、日期型 、时间型等 。
4 交换数据文件命名规则
交换数据文件名由领域标识 、单位代码 、数据包类型 、日期 、顺序号等五部分组成 :
a) 领域标识 :描述该数据交换文件 ,属于机械科学数据 ,用“JXSD”表示 ;
b) 单位代码 :数据文件发送方的单位代码 , 由 4个字符组成 , 由共享单位统一分配编码 ;
c) 数据包类型 :数据包分类代码 , 由 4个字符组成 ,在 6. 1处做了规定 ;
d) 日期 :数据交换的 日期 , 由 8个字符组成 ,格式为 CCYYMMDD;
e) 顺序号 :数据文件的次序号 , 由 5位字符组成 。
主文件名占 25个字符长度 ,文件后缀为“. XML”,结构如图 1所示 。
JXSD ×××× ×××× ×××××××× ×××××. XML
顺序号 日期
数据包类型
单位代码
固定字母 ,表示机械科学数据
图 1 交换数据文件命名图示
5 交换数据文件结构
5. 1 结构
机械科学数据信息采用数据文件方式交换 。交换数据文件采用 XML标准格式 , 由声明部分和包体部分组成 ,如图 2所示 。
声 明
包 体
图 2 交换数据文件结构
5. 2 声明部分
声明数据交换数据文 件 符 合 XML1. 0 规 范 , 文 字 编 码 采 用 GB 2312标 准 。 使 用 XML语 言 表 述如下 :
5. 3 包体部分
包体部分由数据包描述和交换数据组成 。交换数据由多条数据记录组成 ,每条数据记录由第 7 章规定的数据项组成 ,如图 3所示 。
图 3 包体部分
包体部分的几点说明如下 :
a) 包体部分的所有内容放置在标记…之间 ;
2
GB/T26499.4—2011
b) 数据包描述中的所有内容放置在标记〈PackageDes〉…〈/PackageDes〉之间 ,数据包描述部分的内容由第 6章规定 ;
c) 所有的交换数据放置在标记〈Data〉…〈/Data〉之间 ;
d) 每一条数据记录放置在标记〈Record〉…〈/Record〉之间 ;
e) 每一个交换数据项放置在由第 7章规定的交换数据项的标记之间 。
5. 4 交换数据文件结构示例
交换数据文件结构示例如下 :
〈? xml version=“1. 0”encoding=“gb2312”?〉
〈Package〉
〈PackageDes〉…〈/PackageDes〉
〈Data〉
〈Record〉…〈/Record〉
…
〈/Data〉 〈/Package〉
6 数据包信息
6. 1 数据包类型
数据包类型分为 2种 ,如表 1所示 :
表 1 数据包类型
数据包类型代码
数据包名称
数据包说明
ZYJH
资源集合
主要指机械科学数据资源对象或子集合按一定体系组成的整体
ZYDX
资源对象
指文本 、图形 、图像 、数据表格 、软件等相对独立的数字对象
6. 2 数据包描述
数据包描述部分包含版本 、数据包类型代码 、单位代码 、单位名称 、记录数 、发送时间等内容 ,规格要求如表 2所示 。
表 2 数据包描述
标 记
含 义
长度(字节)
备 注
Version
版 本
3
暂定为 1. 0
PackageCode
数据包类型代码
4
符合 6. 1关于数据包类型代码的规定
DepartmentCode
单位代码
4
数据文件发送方的单位代码 , 由 4个字符组成 , 由共享单位统一分配编码
DepartmentName
单位名称
50
中文书写单位全称 ,与组织机构证书名称保持一致
RecordCount
记录数
5
由不超过 5 位数字字符组成
SendTime
发送时间
14
年月 日 时分秒
数据包描述示例如下 :
〈PackageDes〉
〈Version〉1. 0〈/Version〉
〈PackageCode〉ZYJH〈PackageCode〉
〈DepartmentCode〉0005〈/DepartmentCode〉
〈DepartmentName〉北京中机科海科技发展有限公司〈DepartmentName〉
3
GB/T26499.4—2011
50
20080809133045
7 交换数据项
7. 1 格式说明
格式说明如下 :
a) 所有字符采用 GB 2312中规定的字符 ,GB 2312 中没有规定的字符 ,采用 GB 18030—2005 中规定的字符 。其中汉字用 2个字节表示 ,其余字符用 1个字节表示 。
b) 如果备注部分没有特殊说明 ,所有数据项长度均为可变长度 , 规定的长度值均为可达到的最大长度 。
c) 所有数据项从左起填写 ,对于固定长度的数据项 ,数据项长度不足时 ,用半角空格(0x20)补足 ;对于可变长度的数据项 ,数据长度不能超过规定长度的最大值 ,小于最大值时 ,采用其实际长度。
d) 数据交换时 ,各数据项按序号顺序排列 ,凡数据项可用代码表示的 ,一律采用代码 。
e) 每条基本数据交换格式的数据项代码在本数据交换文件中具有唯一性 。
f) “性质/条件 ”用于说明一个数据项是否应当总是在数据交换中选用或有时选用 ,该字段可以有如下的值 :M(必选) ,C(条件必选) ,O(可选) 。
7. 2 资源集合(ZYJH)
机械科学数据资源集合交换数据项如表 3所示 。
表 3 资源集合交换数据项
序 号
标记
数据项
性质/条件
数据类型
长度 (字节)
备 注
1
ZyjhBt
标 题
M
字符串
100
机械科学数据资源集合的名称
2
ZyjhBsf
标识符
M
字符串
11
用于识别机械科学数据资源集合的唯一标识
3
ZyjhZt
主 题
M
字符串
100
提供机械科学数据资源集合内容或主题的关键字
4
ZyjhRq
日 期
M
日期型
8
资源集合开始提供使用的 日期
5
ZyjhJysm
简要说明
M
字符串
255
关于机械科学 数 据 资 源 集 合 内 容 的 简 洁 描 述 , 包 括 资 源 所要表达的机械领域信息的描述
6
ZyjhSjz
收集者
M
字符串
10
资源集合收集过程中主要责任人员或机构
7
ZyjhYyz
拥有者
M
字符串
10
拥有资源集合的人员或机构
8
ZyjhFzr
负责人
M
字符串
10
数据机构中负责数据访问的人员
9
ZyjhFjh
父集合
M
字符串
11
资源的父集合标识及说明
10
ZyjhCy
成员
M
字符串
13
资源集合的子成员
11
ZyjhXgzy
相关资源
O
字符串
13
资源集合的相关资源 ,按照相关度进行排序
12
ZyjhJhzy
结合资源
O
字符串
13
提供分散在不同地域的同 一 技 术 领 域 的 资 源 集 合 的 标 识 及简要说明
13
ZyjhSjjb
数据级别
M
字符串
20
见附录 B 的 B. 1
4
GB/T26499.4—2011
表 3 (续)
序 号
标记
数据项
性质/条件
数据类型
长度 (字节)
备 注
14
ZyjhFwdz
访问地址
M
字符串
100
如果资源可通过地理位置访问 ,则填写邮政地址,包括地址及
邮编(如果已登记在 机 构 信 息 表 中 ,也 可 直 接 填 写 机 构 编 号) ;
如果资源可通过网络获取 ,则另外填写该资源的 URL地址
15
ZyjhKfwsj
可访问时间说明
M
字符串
255
说明数据资源可提供访问的时间段
7. 3 资源对象(ZYDX)
机械科学数据资源对象交换数据项如表 4所示 。
表 4 资源对象交换数据项
序 号
标记
数据项
性质/条件
数据类型
长度 (字节)
说 明
1
ZydxBt
标 题
M
字符串
100
机械科学数据资源对象的名称
2
ZydxBsf
标识符
M
字符串
13
用于识别机械科学数据资源对象的唯一标识
3
ZydxZt
主 题
M
字符串
100
提供机械科学数据资源对象内容或主题的关键字
4
ZydxRq
日 期
M
日期型
8
资源对象开始提供使用的 日期
5
ZydxJysm
简要说明
M
字符串
255
关 于 机 械 科 学 数 据 资 源 对 象 的 简 洁 描 述 , 包 括 资 源 基本属性 ,如应用方向 、技术数据 、规格 、尺寸 、牌号等
6
ZydxSjz
收集者
M
字符串
10
资源集合收集过程中主要责任人员或机构
7
ZydxYyz
拥有者
M
字符串
10
拥有资源集合的人员或机构
8
ZydxFzr
负责人
M
字符串
10
数据机构中负责数据访问的人员
9
ZydxBcdz
保存地点
O
字符串
100
资源对象保存的地点
10
ZydxBcqx
保存期限
O
字符串
50
资源对象有保存期限说明
11
ZydxBcjz
保存介质
O
字符串
50
资源对象保存的介质
12
ZydxSjgs
数据格式
M
字符串
10
数据资源的类型与资源的格式
类型取值 “数 据 集 ”、“图 像 ”、“软 件 ”、“文 本 ”等 (参 考DCMI类型词表说明 ) 。见附录 B 的 B. 3 和 B. 4
13
ZydxSjrl
数据容量
O
字符串
10
资源对象的大小
14
ZydxSjly
数据来源
O

