GB/T 35890-2018
高通量测序数据序列格式规范
发布时间:2018-02-06 实施时间:2018-09-01


高通量测序技术是一种高效、快速、准确的DNA/RNA分析技术,已广泛应用于生物医学研究、生物信息学等领域。高通量测序技术的发展,使得测序数据量大幅度增加,数据处理和存储成为瓶颈。为了规范高通量测序数据序列的格式,提高数据处理和存储的效率,GB/T 35890-2018 高通量测序数据序列格式规范应运而生。

本标准规定了高通量测序数据序列的基本结构,包括序列头、序列体和序列尾三部分。其中,序列头包括版本号、序列类型、序列长度等信息;序列体包括序列数据、质量值等信息;序列尾包括校验和等信息。此外,本标准还规定了高通量测序数据序列的数据类型、数据格式和数据编码等方面的要求。

在数据类型方面,本标准规定了高通量测序数据序列的数据类型包括DNA序列、RNA序列和蛋白质序列等。在数据格式方面,本标准规定了高通量测序数据序列的数据格式包括FASTQ格式、SAM格式和BAM格式等。在数据编码方面,本标准规定了高通量测序数据序列的数据编码包括ASCII编码、二进制编码和压缩编码等。

本标准的实施,有利于提高高通量测序数据序列的互操作性和可读性,促进高通量测序数据的共享和交流,推动高通量测序技术的发展和应用。

相关标准
- GB/T 35889-2018 生物信息学数据格式规范
- GB/T 35891-2018 生物信息学数据交换格式规范
- GB/T 35892-2018 生物信息学数据存储格式规范
- GB/T 35893-2018 生物信息学数据处理格式规范
- GB/T 35894-2018 生物信息学数据分析格式规范