您的位置: 首页 >> 大数据

大数据时代what比why更重要

2019.07.15 来源: 浏览:15次

大数据时代:what比why更重要

当我们知道了大数据的特性,也找到了相关性,接下来就是靠着它创造出价值来。

什么是大数据?、跟我有什么关系?很多人第一次听到大数据,心中一定会有这样的疑问。

据《30杂志》报道,麦尔荀伯格在千余名想了解未来趋势的观众面前,做了一场精彩易懂的演说,告诉了企业及民众,什么是大数据。

大数据找出相关性

2009年,全球出现一种新的流感病毒H1N1,当时美国也无法幸免,疾病管制局(CDC)要求第一线的医师遇到H1N1流感病例,必须立刻通报。即使如此,通报速度仍总是慢一步,会晚1到2个星期。这样的时效让疾管局无法掌握真实情况,对症下药。

当时有几位Google 工程师在着名的《自然》科学期刊中发表了一篇论文。他们透过美国最常使用的前5000万个搜寻关键字,再与疾管局年间的流感传播资料加以比对,用高达4.5亿种不同的数学模型,找出这些字出现的频率、时间及地点,有没有统计上的相关性(correlation)。最后被他们挖到宝了,这套软件找出了45个流感关键字眼,放进数学模型之后,预测结果与官方公布的真实资料吻合,有强烈的相关性。

Google 运用这套数学模型,再一次精准地掌握了流感发生的高峰及地区,让防疫工作同步进行,不落后。

再说另一例子,天文学来说,美国太空总署执行一项叫史隆数码巡天计划(Sloan Digital Sky Survey),从2000年开始,他们用位于美国新墨西哥州的天文望远镜去收集资料,计划开始不过几星期,收到的天文资料量就已超过了过去所有天文学历史的总和。到了2010年,这个计划收到了140TB 的资料量。但是接续的新计划,预计2016年登场,未来的巡天望远镜在5天内,就可收到这些资料量。

荀伯格说,当资料进入天文数字时代,荀伯格提醒:到底大数据有多大?其实不是那么重要

大数据时代what比why更重要

,重点是在放大,扩大资料量等级,就能做出少量资料做不到的事。

举例来说,画一张马的图画,不是太难的事,但如果画了很多张马的图画,再以每秒24帧来呈现这些图画,就成了动画。这里要强调的是量变产生了质变,巨量就是这个道理,量的不同,也改变了本质。

what比why重要

量增加了,就出现另一项大数据的特色:乱(messy)。巨量资料的内容常是混乱不齐,质量不一。这是因为,巨量资料的收集过程中,它只要一个大方向即可,不需要讲究到一寸、一分。这并不是说我们放弃了精准这件事,只是不再将精准奉为圭臬,荀伯格说。

123

Tags:
友情链接
福州物联网