ISO/IEC TR 15938-8:2002/AMD4:2009
Amendment 4 - Information technology -- Multimedia content description interface -- Part 8: Extraction and use of MPEG-7 descriptions - Extraction of audio features from compressed formats
发布时间:2009-11-11 实施时间:


ISO/IEC TR 15938-8标准的主要目的是提供一种方法,可以从MPEG-1、MPEG-2、MPEG-4和其他压缩格式的音频数据中提取出有用的音频特征。这些特征可以用于多媒体内容的描述和检索,例如音乐、语音、环境声音等。

该标准定义了一些基本的音频特征,包括音高、节奏、音量、谐波、噪声等。这些特征可以通过不同的算法和技术来提取,例如快速傅里叶变换(FFT)、小波变换、自相关函数等。提取出的特征可以用XML格式进行描述,并与MPEG-7描述符一起使用。

除了基本的音频特征,ISO/IEC TR 15938-8还定义了一些高级的音频特征,例如音色、韵律、语调等。这些特征需要更复杂的算法和技术来提取,但它们可以提供更准确和详细的音频描述。

该标准还提供了一些示例应用程序,演示了如何使用提取出的音频特征来实现多媒体内容的描述和检索。这些应用程序包括音乐检索、语音识别、环境声音分类等。

总的来说,ISO/IEC TR 15938-8标准为多媒体内容的描述和检索提供了一种有效的方法,可以从压缩格式的音频数据中提取出有用的音频特征。这些特征可以用于各种应用程序,例如音乐检索、语音识别、环境声音分类等。

相关标准
- ISO/IEC 15938-1:2002 Information technology -- Multimedia content description interface -- Part 1: Systems
- ISO/IEC 15938-2:2002 Information technology -- Multimedia content description interface -- Part 2: Descriptors
- ISO/IEC 15938-3:2002 Information technology -- Multimedia content description interface -- Part 3: Visual
- ISO/IEC 15938-4:2002 Information technology -- Multimedia content description interface -- Part 4: Audio
- ISO/IEC 15938-5:2002 Information technology -- Multimedia content description interface -- Part 5: Multimedia description schemes