全球旧事资料 分类
词汇。“大数据”的存在将实实在在地改变我们的工作、生活以及整个社会。与大数据时代之前数据匮乏的时代相比,“大数据”主要体现为三个特点:“”;“”和“相关性”。②“大数据”的一个特点是:围绕任何一个特定问题,都可以比过去任何时候获取更多的数据。大数据时代和传统数据时代的区别,就像分辨率在200万像素的旧数码照片,一下子提高到2400万像素那样。后者是一个非常非常大的文件。它可以提供更多细节。它可以让我们不断放大,看清楚小到颗粒状的细部,而具有较低分辨率的图像在这些细节方面就会非常模糊。③基因信息就是一个很好的例子。美国有一家叫23a
dMe的新公司提供个人的DNA测试分析,以发现一些疾病征兆,并提醒客户关注会发展成严重疾病的个人癖好。苹果公司的史蒂夫〃乔布斯进行了尝试。他得了癌症后,花费了超过l0万美元的成本让医生完整地洞察他的基因密码,获取了数十亿的碱基对测序。每当药物由于乔布斯的癌症病变面失去有效性,医生就根据乔布斯特定的基因信息,寻找到有效的替代药物。遗憾的是,这也没有保住乔布斯的命。但是在这一过程中获得的大数据,已经延长了他的生命。④由于技术创新,现在收集大量信息的成本变得越来越低。数年前,史蒂夫〃乔布斯花费了六位数的金额才做到的事情,今天,不到1000美元就可以获得同样的服务了。⑤“大数据”的另一个特点是:相比较小数据时代数据点的准确,大数据往往是凌乱和..质量参差不齐的。但是,在大数据时代,人们将接受这种杂乱。因为人们通常需要的只是一个大方向,而不是努力了解一种现象的细枝末节;人们并不是要完全放弃精确性,只是放弃对精确性的热衷;人们失去微观层面上的精确度,为的是获取在宏观层面上的洞察力。⑥电脑翻译就是其中一个例子。上一世纪九十年代,IBM的研究人员使用了一套非常精确的文件加拿大议会记录的法语和英语版来训练计算机。尽管计算机完全按照规则行事,但基于此的翻译质量却非常低。然后,谷歌在2006年开始介入这一领域,他们没有使用来自加拿大政府的几百万句标准翻译,而是使用随手可得的任何语言。他们在整个互联网上,利用数十亿页质量参差不齐的翻译,这些翻译不怎么标准但是,这是一个小的权衡他们能够使用的数据大大增加了,结果翻译质量反而提高了。与更少、更标准的数据相比,更多凌乱的资料完胜了。⑦“更多”和“更乱”组合到一起,产生了第三个特点“相关性”。这也是r
好听全球资料 返回顶部