数据质量是指数据是否满足其预期用途的程度。随着数据在各个领域的广泛应用,数据质量问题越来越受到关注。数据质量问题可能导致企业决策错误、客户投诉、法律诉讼等严重后果。因此,评估和提高数据质量已成为企业和组织的重要任务。
ISO/IEC 25012:2008是一项关于数据质量的国际标准,也是SQuaRE(Software product Quality Requirements and Evaluation)系列标准之一。该标准定义了数据质量模型,包括13个数据质量特征和46个数据质量子特征,以及相应的度量标准和评估方法。这些数据质量特征和子特征如下:
1. 适用性:数据是否满足用户需求。
2. 准确性:数据是否准确无误。
3. 可靠性:数据是否可靠,即是否能够在一定时间内保持一致性。
4. 完整性:数据是否完整,是否包含所有必要的信息。
5. 可用性:数据是否易于访问和使用。
6. 可理解性:数据是否易于理解和解释。
7. 一致性:数据是否与其他数据和规则保持一致。
8. 可比性:数据是否可比较,是否具有相同的度量标准。
9. 可追溯性:数据是否可追溯到其来源和处理过程。
10. 可解释性:数据是否能够被解释和解释其含义。
11. 可信度:数据是否可信,即是否能够被信任。
12. 安全性:数据是否安全,是否受到保护。
13. 合规性:数据是否符合法律、法规和标准要求。
每个数据质量特征都包含若干个数据质量子特征,如下:
1. 适用性
1.1. 适用性范围
1.2. 适用性准确性
1.3. 适用性一致性
1.4. 适用性可理解性
1.5. 适用性可用性
2. 准确性
2.1. 准确性范围
2.2. 准确性精度
2.3. 准确性一致性
2.4. 准确性可理解性
2.5. 准确性可用性
3. 可靠性
3.1. 可靠性范围
3.2. 可靠性一致性
3.3. 可靠性可理解性
3.4. 可靠性可用性
4. 完整性
4.1. 完整性范围
4.2. 完整性准确性
4.3. 完整性一致性
4.4. 完整性可理解性
4.5. 完整性可用性
5. 可用性
5.1. 可用性范围
5.2. 可用性可理解性
5.3. 可用性可用性
6. 可理解性
6.1. 可理解性范围
6.2. 可理解性可用性
7. 一致性
7.1. 一致性范围
7.2. 一致性准确性
7.3. 一致性可理解性
7.4. 一致性可用性
8. 可比性
8.1. 可比性范围
8.2. 可比性准确性
8.3. 可比性一致性
8.4. 可比性可理解性
8.5. 可比性可用性
9. 可追溯性
9.1. 可追溯性范围
9.2. 可追溯性准确性
9.3. 可追溯性一致性
9.4. 可追溯性可理解性
9.5. 可追溯性可用性
10. 可解释性
10.1. 可解释性范围
10.2. 可解释性可用性
11. 可信度
11.1. 可信度范围
11.2. 可信度准确性
11.3. 可信度一致性
11.4. 可信度可理解性
11.5. 可信度可用性
12. 安全性
12.1. 安全性范围
12.2. 安全性可用性
13. 合规性
13.1. 合规性范围
13.2. 合规性可用性
每个数据质量子特征都有相应的度量标准和评估方法。例如,对于准确性子特征“准确性精度”,可以使用以下度量标准:
1. 绝对误差:数据值与真实值之间的差异。
2. 相对误差:数据值与真实值之间的差异除以真实值。
3. 误差率:绝对误差或相对误差的百分比。
评估数据质量时,可以根据实际需求选择相应的数据质量特征和子特征,并使用相应的度量标准和评估方法进行评估。评估结果可以用于改进数据质量,提高数据价值。
相关标准
ISO/IEC 25010:2011 软件产品质量要求和评估——质量特征和子特征
ISO/IEC 25023:2016 软件工程——软件产品质量要求和评估——数据质量模型
ISO/IEC 25024:2016 软件工程——软件产品质量要求和评估——质量特征和评估方法
ISO/IEC 25030:2014 软件工程——软件产品质量要求和评估——数据质量需求和评估
ISO/IEC 25040:2011 软件工程——软件产品质量要求和评估——外部质量特征