ISO/TS 22692:2020
Genomics informatics— Quality control metrics for DNA sequencing
发布时间:2020-10-05 实施时间:


DNA测序技术的发展使得基因组信息学成为了现代生物学研究的重要组成部分。然而,由于DNA测序数据的复杂性和多样性,如何评估测序数据的质量一直是一个挑战。ISO/TS 22692:2020提供了一组可用于评估DNA测序数据质量的指标,以帮助研究人员和实验室确定其测序数据的可靠性和准确性。

数据质量指标是DNA测序质量控制的核心内容。测序质量指标包括测序质量值、测序深度、GC含量、错误率等指标。测序质量值是指每个碱基的测序质量,通常用Phred质量值表示。测序深度是指每个碱基被测序的次数,通常用平均测序深度表示。GC含量是指DNA序列中GC碱基的比例,通常用GC含量分布表示。错误率是指测序数据中错误碱基的比例,通常用错误率分布表示。

数据处理指标是指在测序数据处理过程中需要考虑的指标。这些指标包括去除低质量序列、去除接头序列、去除重复序列等指标。去除低质量序列是指去除测序质量值低于一定阈值的序列。去除接头序列是指去除测序过程中添加的接头序列。去除重复序列是指去除测序数据中重复的序列,以避免在后续分析中引入偏差。

数据比对指标是指在测序数据比对过程中需要考虑的指标。这些指标包括比对率、比对质量、比对深度等指标。比对率是指测序数据中成功比对到参考基因组的比例。比对质量是指比对结果的质量,通常用比对质量值表示。比对深度是指每个碱基被比对到的次数,通常用平均比对深度表示。

数据变异检测指标是指在测序数据变异检测过程中需要考虑的指标。这些指标包括SNP检测、InDel检测、CNV检测等指标。SNP检测是指检测测序数据中的单核苷酸多态性。InDel检测是指检测测序数据中的插入/缺失变异。CNV检测是指检测测序数据中的拷贝数变异。

相关标准
ISO 15189:2012 医学实验室——质量和能力要求
ISO 18385:2016 生物技术——DNA检测——DNA检测实验室的要求和能力
ISO 21090:2011 健康信息学——数据类型
ISO 21550:2019 基因组信息学——基因组数据格式
ISO 27799:2016 健康信息学——信息安全管理在医疗保健中的应用