GB/T 21023-2007
中文语音识别系统通用技术规范
发布时间:2007-06-29 实施时间:2007-11-01


中文语音识别技术是一种将人类语音转换为计算机可识别的数字信号的技术,是人机交互的重要手段之一。中文语音识别系统的通用性、准确性和可靠性是其应用的关键。为了保证中文语音识别系统的质量,GB/T 21023-2007 中文语音识别系统通用技术规范提出了以下要求:

1.基本要求
中文语音识别系统应具有良好的通用性、准确性和可靠性,能够适应不同的语音环境和使用场景,能够识别不同说话人的语音,并能够正确识别各种语音信号。

2.性能指标
中文语音识别系统的性能指标包括识别率、误识率、漏识率、响应时间等。其中,识别率是指系统正确识别的语音占总语音数的比例;误识率是指系统错误识别的语音占总语音数的比例;漏识率是指系统未能正确识别的语音占总语音数的比例;响应时间是指系统从接收语音信号到输出识别结果的时间。

3.测试方法
中文语音识别系统的测试方法包括语音数据采集、测试数据集的构建、测试环境的搭建、测试指标的计算等。测试数据集应包括不同说话人、不同语音环境、不同语音内容等多种情况,以保证测试结果的准确性和可靠性。

4.评价标准
中文语音识别系统的评价标准应包括系统的通用性、准确性和可靠性等方面。评价标准应具有客观性、可重复性和可比性,以便对不同系统进行评价和比较。

相关标准
GB/T 21022-2007 语音识别术语
GB/T 21024-2007 语音识别系统性能测试方法
GB/T 21025-2007 语音识别系统性能评价标准
GB/T 21026-2007 语音识别系统测试数据集
GB/T 21027-2007 语音识别系统测试环境