数字化加工是将实体文献转化为数字形式的过程,是数字图书馆建设的重要环节。文本资源是数字化加工的主要对象之一,包括书籍、期刊、报纸、手稿、档案等。本标准针对文本资源的数字化加工进行规范,以保证数字化资源的质量和可持续性。
1. 技术要求
本标准规定了文本资源数字化加工的技术要求,包括数字化设备的选择、扫描分辨率、图像格式、OCR技术、校对和校验等方面。其中,OCR技术是文本资源数字化加工的核心技术之一,本标准对OCR技术的要求进行了详细说明,包括OCR软件的选择、OCR识别率、OCR后处理等方面。
2. 加工流程
本标准规定了文本资源数字化加工的加工流程,包括文献准备、扫描、OCR识别、校对和校验、后处理和元数据录入等环节。其中,元数据录入是数字化资源管理的重要环节之一,本标准对元数据的录入进行了详细说明,包括元数据的种类、元数据的格式、元数据的标准等方面。
3. 质量控制
本标准规定了文本资源数字化加工的质量控制要求,包括质量控制的目标、质量控制的方法、质量控制的指标等方面。其中,质量控制的指标是数字化资源质量评估的重要依据之一,本标准对质量控制的指标进行了详细说明,包括OCR识别率、校对和校验的错误率、元数据的准确性等方面。
4. 元数据规范
本标准规定了文本资源数字化加工的元数据规范,包括元数据的种类、元数据的格式、元数据的标准等方面。其中,元数据的标准是数字化资源管理的重要依据之一,本标准对元数据的标准进行了详细说明,包括元数据的命名规则、元数据的编码规则、元数据的分类等方面。
相关标准
GB/T 31219.1-2014 图书馆馆藏资源数字化加工规范 第1部分:概述和通用要求
GB/T 31219.3-2014 图书馆馆藏资源数字化加工规范 第3部分:音频资源
GB/T 31219.4-2014 图书馆馆藏资源数字化加工规范 第4部分:视频资源
GB/T 31219.5-2014 图书馆馆藏资源数字化加工规范 第5部分:图像资源
GB/T 31219.6-2014 图书馆馆藏资源数字化加工规范 第6部分:地图资源