DB35/T 1777-2018
政务数据汇聚 数据集的规范化描述
发布时间:2018-05-22 实施时间:2018-08-22


政务数据汇聚是指将来自不同部门、不同领域、不同格式的政务数据进行整合、清洗、加工、分析、挖掘等处理,形成可供决策、应用的数据集。政务数据汇聚的数据集规范化描述是保证政务数据汇聚质量的重要保障。

1. 数据集的命名
数据集的命名应当简洁明了,能够准确反映数据集的内容和用途。命名应当遵循以下原则:
- 采用英文命名,不得使用中文或拼音;
- 采用小写字母,不得使用大写字母;
- 采用下划线分隔单词,不得使用空格或其他符号。

2. 数据集的描述
数据集的描述应当包括以下内容:
- 数据集的目的和用途;
- 数据集的来源和采集方式;
- 数据集的时间范围和更新频率;
- 数据集的格式和存储方式;
- 数据集的使用限制和安全要求。

3. 数据集的结构
数据集的结构应当清晰明了,能够准确反映数据集的组成和关系。结构应当遵循以下原则:
- 采用树形结构,不得使用环形结构或其他复杂结构;
- 采用标准数据类型,不得使用自定义数据类型;
- 采用标准编码方式,不得使用非标准编码方式。

4. 数据集的元数据
数据集的元数据应当包括以下内容:
- 数据集的名称和描述;
- 数据集的结构和字段定义;
- 数据集的数据类型和编码方式;
- 数据集的数据质量和完整性;
- 数据集的使用限制和安全要求。

5. 数据集的质量要求
数据集的质量要求应当包括以下内容:
- 数据集的准确性和完整性;
- 数据集的一致性和可靠性;
- 数据集的时效性和更新频率;
- 数据集的安全性和保密性;
- 数据集的可用性和易用性。

相关标准
- GB/T 20975-2007 数据元和数据元组的定义规范
- GB/T 2828.1-2012 抽样程序及抽样表的制定 第1部分:按计数抽样程序
- GB/T 2828.2-2012 抽样程序及抽样表的制定 第2部分:按质量限制抽样程序
- GB/T 2828.3-2013 抽样程序及抽样表的制定 第3部分:按接收质量限制抽样程序
- GB/T 2829-2002 产品抽样检验程序