这一两年一直沉溺于各类大数据思潮和大数据相关的项目中。这几天静下心来,反思了下那些成功的,失败的,让我拍案叫绝的,或是嗤之以鼻的各类在“大数据”外衣下的项目,左思右想,脑里只留下了四个字:数据如水。。。。。。
我们不妨把整个互联网想象成一座城市。那么,一个个数据中心毫无疑问就是城市里一座座高楼大厦;连接各数据中心的光纤网络则自然就是城市里纵横交错的各类管线通道。那么,数据是什么呢?最恰当的比喻自然就是在管道里流动着的水了。很难想象一座没有水的城市是怎么样,同样,数据至于互联网和各个企业的价值也如是。但是,一座充满活力的城市,其水资源也必然是生机勃勃流动循环着的。同样,数据真正的意义,也在于其的“流动”。
如果我告诉你,有这么一座城市,水源充足。但水都在各家浴缸水箱里存着,不在水管下水道里流动着你会有什么感觉?你肯定会觉得不可思议,甚至还会想:靠!那这些数据这么放着不就臭了啊。。。。。。数据也如是,不流动的数据在互联网时代是没有意义的!我们现在要做的,是把数据开放出来,让数据在互联网上有机的流动起来,而不是用浴缸水桶之类东西把数据机械的存放起来等它发臭。所以说:数据如水,你“用”数据就好了,而没必要浪费太多资源精力去“装”数据。
那么,怎么“用”数据呢?其实和用水一样。你是怎么用水来洗手洗澡洗碗饮用的呢?不就是简单的通过各种规格的水龙头,花洒,还有净水器嘛。然后,再从这些设备中获取相应容量的水,烧开了泡茶烧咖啡等等。其实“用”数据也一样,我们不需要去“储存”大量的数据,只需要安装合适自己企业用途的各类“水龙头”, “净水器”(数据清洗,ETL工具)就好了。通过这类设备,你就可以获得满足你需求的数据了,然后将数据再“烧开”(数据挖掘,商业智能)就可以满足你更高层次的需求,比如饮用等等。当然,用完了,别忘了像你大小便,或者将污水倒入下水道一样,让使用完了的筛选完了的数据继续“流动”出去,循环再利用。
我觉得,这才是大数据时代,各个企业利用数据产生价值的正确方法。即做大数据的使用者,而不是大数据的私藏者。“流动”着,“循环”着的数据才是真正的互联网时代的大数据。一旦数据真的这么“流动”起来了,那数据的价值就出来了,那些扮演着“水源”角色的数据中心也会运转得更快更高效,互联网这座“大城市”也必将会更具魅力更具活力。可惜,现在大数据口号叫的响,但大多数企业大多数项目只是在做自己家的“浴缸”“水桶”,盲目的囤积数据,最多自己家里装个“水表”,时不时查一下自己家里存了多少水,哪个水桶里的水是一个礼拜前的云云。。。。。。殊不知流水才不腐,没有水龙头,净水器的帮忙,你存的那几箱几桶水很快就会变丑没有任何价值的。到时候可能你想倒掉都没那个力气没那个地方倒。所以,写这么多,无非是想呼吁两个事情:1. 各位老总CTO们在上大数据项目时,可以先考虑为自己企业安装“水龙头”,“净水器”,而不必先去考虑是否安置个“更大的浴缸”。2. 企业里面闲置的,准备丢弃的数据,不妨让它们开放出来,让它们“流动”起来。说不定这样一循环它们就会产生出新的价值了呢。不知道这些比喻恰不恰当,反正我这人就是有了些想法不吐不快。要是您看了觉得一派胡言的一笑而过就是了,别和我一般计较,我其实啥都不太懂呵呵。
原文转自:http://jianshu.io/p/2b5666b20d59