ASTM D7915 - 22
Standard Practice for Application of Generalized Extreme Studentized Deviate (GESD) Technique to Simultaneously Identify Multiple Outliers in a Data Set
发布时间:2022-05-01 实施时间:


在数据分析中,异常值是指与其他数据点明显不同的数据点。异常值可能是由于测量误差、数据输入错误、设备故障或其他原因引起的。在数据分析中,异常值可能会导致错误的结论和预测,因此需要识别和处理异常值。

ASTM D7915 - 22标准提供了一种使用广义极值学生化偏差(GESD)技术来识别数据集中的多个异常值的方法。GESD技术是一种基于统计学的方法,可以在不知道异常值数量的情况下,同时识别多个异常值。该技术基于极值理论,假设数据集中的异常值是由于极端事件引起的。GESD技术通过计算每个数据点与平均值的偏差,并将偏差与标准差相比较,来确定是否存在异常值。如果存在异常值,则将其从数据集中删除,并重新计算平均值和标准差,直到不存在异常值为止。

使用ASTM D7915 - 22标准的步骤如下:

1. 收集数据集,并计算平均值和标准差。
2. 计算每个数据点与平均值的偏差,并将偏差与标准差相比较。
3. 如果存在异常值,则将其从数据集中删除,并重新计算平均值和标准差。
4. 重复步骤2和3,直到不存在异常值为止。

ASTM D7915 - 22标准适用于任何类型的数据集,包括实验室测试数据、生产数据、环境监测数据等。该标准提供了一种简单而有效的方法来识别数据集中的异常值,从而提高数据分析的准确性和可靠性。

相关标准
- ASTM E178 - 16:标准实践:统计分析过程控制(SPC)系统的使用
- ASTM E456 - 13:标准实践:统计分析过程控制(SPC)系统的应用
- ASTM E2282 - 19:标准指南:使用统计方法进行数据分析和解释
- ASTM E1655 - 05(2019):标准实践:使用统计方法进行数据分析和解释
- ASTM E2709 - 19:标准实践:使用统计方法进行数据分析和解释