ISO/IEC TR 15938-8:2002/Amd 4:2009
Information technology — Multimedia content description interface — Part 8: Extraction and use of MPEG-7 descriptions — Amendment 4: Extraction of audio features from compressed formats
发布时间:2009-11-11 实施时间:


ISO/IEC TR 15938-8:2002/Amd 4:2009是MPEG-7多媒体内容描述接口的一部分,旨在提供一种标准化的方法来描述和检索多媒体内容。该标准定义了一组描述符,用于描述多媒体内容的各个方面,包括音频、视频、图像、文本等。其中,ISO/IEC TR 15938-8规定了从压缩格式中提取音频特征的方法。

音频特征是指从音频信号中提取的一些特征参数,用于描述音频的各个方面,如音调、节奏、音色等。在MPEG-7中,音频特征被用于描述音频内容的各个方面,如音乐、语音、环境声音等。由于音频信号通常是以压缩格式存储的,因此需要一种方法来从压缩格式中提取音频特征。

ISO/IEC TR 15938-8:2002/Amd 4:2009规定了从压缩格式中提取音频特征的方法,包括以下步骤:

1. 解压缩音频信号,将其转换为未压缩的PCM格式;
2. 对PCM信号进行预处理,如去噪、均衡化等;
3. 提取音频特征,如音调、节奏、音色等;
4. 将音频特征转换为MPEG-7描述符。

该标准还规定了一些具体的音频特征提取方法,如基于短时傅里叶变换的音调提取方法、基于小波变换的节奏提取方法等。这些方法可以根据具体的应用场景进行选择和组合。

ISO/IEC TR 15938-8:2002/Amd 4:2009的发布,为从压缩格式中提取音频特征提供了一种标准化的方法,有助于提高多媒体内容的描述和检索的准确性和效率。

相关标准
- ISO/IEC TR 15938-1:2002 Multimedia content description interface - Part 1: Systems
- ISO/IEC TR 15938-2:2002 Multimedia content description interface - Part 2: Descriptors
- ISO/IEC TR 15938-3:2002 Multimedia content description interface - Part 3: Visual
- ISO/IEC TR 15938-4:2002 Multimedia content description interface - Part 4: Audio
- ISO/IEC TR 15938-5:2002 Multimedia content description interface - Part 5: Multimedia description schemes