数据质量是指数据在其整个生命周期中所具有的适用性、准确性、完整性、一致性、可靠性、及时性、可理解性和可信度等特性。数据质量管理是指通过一系列的管理活动和措施,保证数据质量的高水平,以满足组织的业务需求和决策需要。数据质量管理的过程参考模型是指在数据质量管理过程中,按照一定的流程和步骤,实施数据质量管理活动和措施的模型。
GB/T 42381.61-2023标准提供了一种通用的数据质量管理过程参考模型,包括以下六个过程:
1. 规划过程:确定数据质量管理的目标、范围、策略和计划,制定数据质量管理的组织结构和职责,明确数据质量管理的资源需求和风险管理措施。
2. 数据采集过程:收集数据并记录数据的来源、格式、精度、完整性和一致性等信息,确保数据采集的过程符合数据质量管理的要求。
3. 数据存储过程:将数据存储在适当的位置,并记录数据的存储位置、存储方式、存储周期和存储安全等信息,确保数据存储的过程符合数据质量管理的要求。
4. 数据处理过程:对数据进行清洗、转换、集成、分析和建模等处理,确保数据处理的过程符合数据质量管理的要求。
5. 数据分析过程:对数据进行统计、分析和挖掘等操作,提取有价值的信息和知识,确保数据分析的过程符合数据质量管理的要求。
6. 数据应用过程:将数据应用于业务决策、产品开发、服务提供和管理监控等领域,确保数据应用的过程符合数据质量管理的要求。
在每个过程中,标准都提供了详细的流程和步骤,以及相应的输入、输出和控制措施。同时,标准还强调了数据质量管理的持续性和改进性,要求组织不断监控和评估数据质量管理的效果,及时调整和改进数据质量管理的过程和措施。
相关标准
GB/T 42381.1-2023 数据质量 第1部分:概述和术语
GB/T 42381.2-2023 数据质量 第2部分:数据质量评估
GB/T 42381.3-2023 数据质量 第3部分:数据质量规范
GB/T 42381.4-2023 数据质量 第4部分:数据质量控制
GB/T 42381.5-2023 数据质量 第5部分:数据质量监控