大数据与云计算的关系及其对通信行业的影响
以2011年5月麦肯锡发布《大数据的下一个前沿创新、竞争和生产力》为起点大数据概念开始持续发酵。2012年大数据从技术圈进入主流市场得到许多国家、社会组织和企业的看好和广泛应用。2012年1月达沃斯世界经济论坛发布了一份题为《大数据大影响》BigDataBigImpact的报告3月美国政府发布《大数据开发倡议》之后英国、日本、德国、加拿大等国纷纷效仿推出与大数据应用相关的战略研究自此一场关于“大数据”的战略争夺已经拉开战幕那么到底什么是大数据它与云计算是什么关系对通信行业又意味着什么呢
一、认识大数据
1大数据的含义与特征
地球上的煤炭、石油、天然气等自然资源在消耗中不断减少面临枯竭而数据随着应用的不断创新在使用中生长和丰富。大数据的出现就是数据的快速增长带来质的变化的结果。
对于大数据还没有一个正式的定义目前最为普遍的定义就是“用传统方法或工具不能处理或分析的数据”。大数据具有大量、速度快和多样性三大特征这些特征是传统数据处理方法和工具所无法胜任的。
大量Volume是指数据量非常庞大主要体现在数据存储量大和计算量大。根据IDC《数字宇宙膨胀到2010年全球信息增长预测》中统计的数据2006年全球每年制造、复制出的数字信息量共计161万PB当年信息产生量大约是历史上图书信息总量的3000倍至2010年数字信息总量达988万PB。专家指出2020年年度数据将增加43倍。因此大数据中的数据不再以几个GB或几个TB为单位来衡量而是以PB1千个T、EB1百万个T或ZB10亿个T为计量单位。
速度Velocity一方面是指数据在不断更新增长的速度快另一方面是指数据存储、传输等处理速度很快。短短60秒YouTube用户会上传48小时的视频Google会收到200万次搜索请求并极快地返回结果Twitter要处理100万条Tweets
f信息网购产生272万美元的交易AppStore有47万次下载全球新增网页571个。数据处理的速度也要求越来越快甚至是实时处理比如灾难的预测需很快的对灾难发生的程度、影响的区域范围等进行量化。如日本大地震发生后仅9分钟美国国家海洋和大气管理局NOAA就发布了详细的海啸预警。
多样性Variety指数据包含结构化的数据表和半结构化、非结构化的文本、视频、图像等信息而且数据之间的交互非常频繁和广泛。具体包括三个方面一是数据来源多企业所面对的传统数据主要是交易数据而互联网和物联网的发展带r