大数据很重要,尤其是从国家战略的高度来看这个问题就更是如此。国家要做决策需要很多事实作为依据,尤其需要大量的数据作为参考。数据的获取有很多途径,而成本较高的也许莫过于派出专门的调查小组去做访谈和总结了。这种方式缺点显而易见——时间周期长,人工成本高,协调工作难度大。其实根本没有必要派出很多调查小组去调查能从大数据网络中得到的信息,正所谓“一叶知秋”。
从广泛部署的物联网来看,很多以前不可想象的问题到现在已经逐步得到了解决。
想知道一个地区繁荣程度如何?最简单的就看用电和用水就可以了,带有远程抄表功能的智能电表、水表可以进行实时数据归集,每天都能看到数字的变化。做做同比、环比就知道这个地区的电器和人口活跃程度有没有变化,不管是常驻的还是流动的,而且还能区分是民用水电的增加还是工业水电的增加。
想知道一个地区交通状况如何?看看那些高速公路和国道、省道上的测速摄像头记录就能知道。什么时间,车流通过多少,车速如何,就能够从一定程度反映出交通的情况,是人迹寥寥还是车水马龙,是风驰电掣还是拥堵不堪。如果做路段改造,成果也能从这些数据里直接得到体现,而且都是立竿见影。
想知道一个地区的水文信息、气候信息,也没问题,传感网络可以遍及到每个人迹罕至的地方,不管是江河湖海还是沙漠沼泽,无人值守的传感器可以为人们代劳数据收集和上报的工作。
总而言之,这些原本需要大量花费人力物力才能进行收集和统计的数据,做起来已经越来越轻松——在这背后是大数据中心的功劳。这样的工作量在大数据时代到来之前是根本没办法想象的。
一个一个独立的大数据中心能够在某一个分领域或者一个地区做到数据收集,数据存储,数据分析,但这还不是数据的终极价值。因为人类社会客观上来说是广泛联系的,这种联系既然存在于人与人、人与物、物与物之间,那必定能够体现于广泛联系的数据之中。因此,一个孤立的大数据中心建得再好也是无法从割裂的数据去诠释全局的数据全貌的。如果想要了解这种广泛的联系,那必定会产生广泛的数据交换的需求,这就是大数据网络——由大数据中心彼此连接形成的数据交换网络。