YD/T 2673-2013
面向舆情分析的互联网数据采集与交换格式定义
发布时间:2013-10-17 实施时间:2014-01-01


随着互联网的发展,舆情分析逐渐成为了一个重要的领域。而互联网上的数据量庞大,如何采集和交换数据成为了一个重要的问题。为了解决这个问题,[YD/T 2673-2013]标准应运而生。

该标准主要包括数据采集格式和数据交换格式两部分。其中,数据采集格式主要用于采集互联网上的数据,而数据交换格式则用于在不同系统之间交换数据。

数据采集格式主要包括以下内容:

1. 数据源定义:定义数据采集的来源,包括网站、博客、微博等。

2. 数据采集规则:定义数据采集的规则,包括采集的时间、频率、内容等。

3. 数据采集方式:定义数据采集的方式,包括手动采集、自动采集等。

4. 数据采集结果:定义数据采集的结果,包括数据格式、数据量等。

数据交换格式主要包括以下内容:

1. 数据格式定义:定义数据交换的格式,包括数据结构、数据类型等。

2. 数据交换协议:定义数据交换的协议,包括HTTP、FTP等。

3. 数据交换方式:定义数据交换的方式,包括同步交换、异步交换等。

4. 数据交换结果:定义数据交换的结果,包括数据格式、数据量等。

该标准的实施可以提高数据采集和交换的效率,减少数据采集和交换的错误率,提高数据的准确性和可靠性。同时,该标准也可以促进不同系统之间的数据交换和共享,提高数据的利用价值。

相关标准:
1. GB/T 20975-2007 信息技术 互联网信息搜索引擎 术语和定义
2. GB/T 20976-2007 信息技术 互联网信息搜索引擎 技术要求
3. GB/T 20977-2007 信息技术 互联网信息搜索引擎 测试方法
4. GB/T 20978-2007 信息技术 互联网信息搜索引擎 用户指南
5. GB/T 20979-2007 信息技术 互联网信息搜索引擎 安全要求