国家安全生产监督管理总局档案馆 数据信息交互平台通用数据接口规范
国家安全生产监督管理总局档案馆
数据信息交互平台通用数据接口规范
1. 范围
本规范规定了国家安全监管总局统一部署的档案馆数据信息交互平台(以下简称交互平台)通用数据接口模式。
本规范适用于国家安全生产监督管理总局、各省级煤矿安全监察局及所属分局的OA系统及其他业务信息系统(以下统称信息系统)与交互平台通用数据接口建设。
信息系统要求设在国家安全监管总局安全生产信息专网环境中,并且能与DMZ区服务器会话。
2. 规范性引用文件
信息系统开发适用以下标准中的核心内容要求。
2.1 DA/T 18-1999 档案著录规则
2.2 DA/T 22-2015 归档文件整理规则
2.3 GB/T 17678.1-1999 CAD电子文件光盘存储、归档与档案管理要求 第一部分:电子文件归档与档案管理
2.4 GB/T 18894-2016 电子文件归档与电子档案管理规范
2.5 DA/T 46-2009 文书类电子文件元数据方案
2.6 DA/T 47-2009 版式电子文件长期保存格式需求
2.7 DA/T 48-2009 基于XML的电子文件封装规范
3. 元数据元素描述
3.1 电子文件封装包
封装电子文件全部数据及其元数据的数据单元,简称EEP。
3.2 文件组合类型
文件级聚合层次上文档聚合状况的分类,分为单件和组合文件,单件表示文件由一个文档构成,组合文件表示文件由两个或两个以上的文档构成。
3.3 文档序号
文档在组合文件中的排列顺序号,一般用阿拉伯数字表示。
3.4 文档标识符
唯一标识文档的一组代码。表示方法为,修改R-文档D。其中“R”为EEP修改次数,原始EEP的R值为0,EEP每修改一次,R的值增加1。当文件组合类型的值为“单件”时,“D”的值为1;当文件组合类型的值为“组合文件”时,“D”用文档序号表示。示例:修改0-文档2
3.5 编码
描述编码数据和编码元数据的一组元素。一个编码包含一个计算机文件。
当一个文档数据中仅有一个计算机文件时,本元素不重复;当一个文档数据中包含两个或两个以上的计算机文件时,每增加封装一个计算机文件,本元素重复一次。
3.6 文档数据
存放编码的容器。
3.7 反编码关键字
可以用计算机程序解析的、用于调用相关程序呈现编码数据内容的一组关键字。使用结构化方式著录,格式定义为:base64-×××。其中“×××”文件扩展名。示例:base64-tif。
3.8 电子文件内容
本元素的值是Base64编码文本串。
3.9 版本
EEP封装采用DA/T48的版本。由封装电子文件的系统通过预定义值自动生成。
3.10 封装包类型
封装包按是否修订进行分类的结果。值域包括原始型和修改型。原始型表示未经修改的封装包,修改型表示对原始型封装包的修改或再修改的封装包。
3.11 封装包类型描述
对封装包类型的简要说明。值域包括:本封装包包含电子文件数据及其元数据,原始封装,未经修改;本封装包包含电子文件数据及其元数据,系修改封装,在保留原封装包的基础上,添加了修改层。
当封装包类型为原始型时,著录为:本封装包包含电子文件数据及其元数据,原始封装,未经修改;当封装包类型为修改型时,著录为:本封装包包含电子文件数据及其元数据,系修改封装,在保留原封装包的基础上,添加了修改层。
3.12 封装包创建时间
EEP创建或修改时间。时间可以是标准时间戳、服务器时间等。时间应精确到秒。采用GB/T7408-2005中
3.13 封装包创建单位
创建或修改EEP的团体或个人。
3.14 封装包部分元素说明
<Path>
<Province>山东省煤矿安全监察局</Province>
<Archive>文书档案</Archive>
<YearType>2012</YearType>
<OrganType>人事处 </OrganType>
<ArchiveType>文书档案目录</ArchiveType>
<OtherType>其他</OtherType>
</Path>
其中:Province标签表示归档单位全宗名称,按照单位规范全称命名;Archive标签表示归档文件对应的档案门类,YearType标签表示归档年度,OrganType标签表示归档的部门,按照《档案馆数据信息交互平台档案著录与数据格式规范》命名;ArchiveType标签表示归档的文种类型,OtherType表示备用字段。
4. 系统信息交互流程
4.1 信息系统
4.2 交互平台系统
5.1 信息系统中一条数据生成一个基于XML的电子文件封装包,包含元数据信息、条目数据、电子文件。
5.2 信息系统归档电子文件内容及格式要求为:电子文件正本、定稿、公文处理单应以PDF格式归档,草稿(集中记录修改历史的彩色留痕稿)以DOC、RTF或WPS格式归档,日志文件(公文流转记录)以LOG格式归档。
5.3 电子文件封装包命名规则:流水号+时间戳。示例:00000100_20121105121524.xml,其中,00000100表示流水号,从000000001开始,最大支持999999999,20121105121524表示当前时间。
5.4为保证电子文件封装包在归档过程中的真实性、完整性,需信息系统对电子文件封装包本身使用MD5算法,生成唯一的MD5值,并通过WebService传递给交互平台系统,以供校验文件的真实性,确保未被篡改。
5.5 电子文件封装包中电子文件以Base64编码方式存放(基于XML的电子文件封装包的信息组织结构符合ISO 14721:2003定义的档案信息包(AIP)模型。规范所称的电子文件数据是指计算机文件的二进制流,因应XML技术特点,在封装包中用Base64编码表示)。
5.7 信息系统中电子文件封装包传输时间段为20:00 - 06:00。
5.8 日期型字段值应为8位,如
附件:1.交互平台信息交互流程图
2.XML样例数据包
3.XML样例源码
4.归档条目字段表
5.归档电子文件字段表