GB/T 13715-1992
信息处理用现代汉语分词规范
发布时间:1992-10-04 实施时间:1993-06-01


现代汉语分词是指将汉语文本按照一定的规则和方法,将其切分成一个个有意义的词语。在信息处理领域中,现代汉语分词是非常重要的一项技术,它可以帮助计算机更好地理解和处理汉语文本。

GB/T 13715-1992规定了现代汉语分词的基本原则、分词方法、分词规则和分词结果的表示方法。其中,基本原则包括:以词为单位、以语境为依据、以最大化为原则、以最小化为原则、以一致性为原则、以可扩充性为原则。分词方法包括:正向最大匹配法、逆向最大匹配法、双向最大匹配法、最小匹配法、最大概率法等。分词规则包括:词典规则、语法规则、语义规则等。分词结果的表示方法包括:词性标注、词义标注等。

GB/T 13715-1992的发布,对于推动信息处理领域中的汉语文本处理技术的发展具有重要意义。它为现代汉语分词提供了一个统一的规范,使得不同的分词系统可以在相同的基础上进行开发和应用,提高了分词的准确性和效率。

相关标准
GB/T 28181-2011 信息技术 中文分词算法评测标准
GB/T 28180-2011 信息技术 中文分词算法性能测试规范
GB/T 26930-2011 信息技术 中文分词词典规范
GB/T 26929-2011 信息技术 中文分词术语
GB/T 26165-2010 信息技术 中文分词应用规范