专家视点 首页 > 学术信息中心 > 专家视点

刘志亮:闲话大数据(一)


发布人:    审批人:    点击数:0    发布时间:2014-06-03


如今大数据掀起的风暴正在席卷各行各业,从春运迁徙图,到两会大数据,再到社交网络的热门话题,大数据已经从IT技术的热点走向社会热点,逐渐融入到人们的日常生活中。但到底什么是大数据,至今还没有一个统一的权威的定义。现在所流行的大数据的4个V--Volume(大量)、Velocity(高速)、Variety(多样)、Veracity(准确),只是不痛不痒生搬硬套、人云亦云,对于深入思考大数据有阻碍的作用,同时也庸俗化了大数据的意义!这种定义只是站在IT技术的角度对大数据的一种浅显的描述,而所谓的4V从来都是信息技术发展的方向,而不是大数据的主要特征。“大量存储、高速运算、异构处理、准确计算”从人类有计算这件事情以来就没有变化过。大数据其实是建立在IT技术发展到一定阶段后,对IT技术的一种颠覆性的整合应用,以此来对社会创造巨大价值的应用。

首先,大数据的基础是IT的发展,刚才所提到的4V,实际上就是大数据能够产生的背景。数十年来,随着信息科技和网络技术的发展,信息产生、组织和流通方式革命性的变化,企业、个人在生产生活中有意无意的创造了巨大的痕迹,这一切都将转化为数据存储在世界的各个角落。不论是产生的信息量,可以获取的信息量,还是流通交换的信息量,都一直呈指数增长。仅仅十余年,很多企业爬过MB时代,走过GB时代,现在正被赶着跑过TB时代,去迎接PB时代。事实上,如中国移动、联通、电信这样的移动通讯运营商,如谷歌、百度、阿里巴巴、腾迅、新浪这样的大互联网公司,如国家电网、交通运输部这样的职能部门,每天数据的更新量已经接近或达到了PB量级。虽然有了大量的数据,而且出现了处理海量数据的技术,但是过去很长的一段时间,还没能充分发挥数据的价值,于是有学者认为,数据规模爆炸性增长的同时,数据产生的附加价值似乎没有与之同步增长,还有学者认为数据价值的密度会随着数据量增加而降低。因此仅仅是IT技术上的“大数据”还不能称作真正意义上的大数据。

其次,要真正进入大数据时代,还需要让海量数据产生价值。随着科技的发展,探索出许多从海量数据中挖掘价值的高效方法,譬如google用户某些搜索关键词预测流感,手机的定位可以判断交通拥挤状况,淘宝销售数据可以用来做金融信贷的信誉评估,还有我们深度网做的通过用户在互联网对产品的感知来评价产品质量……以用户为中心,结合用户在不同系统留下的数据,充分利用个性化的数据挖掘技术,是实现通过数据交叉而产生巨大价值。如果每一个数据都是一个孤岛,只能在其直接关联的领域发挥自身的价值,那么这不是一个值得我们兴奋和期待的新时代。我们要找到和实现数据之间一加一远大于二的价值,其中最关键的问题是综合运用不同学科的知识、发挥数据的外部性,发现若干数据之间新的组织和应用形式,挖掘数据的价值。

因此大数据的关键之所在就是发挥海量数据的价值,这也是深度网一直追求的目标!







首页 | 期刊简介 | 本刊导读 | 新闻公告 | 电子版期刊 | 期刊订阅 | 英文期刊 | 推荐文献 | 我要投稿 | 联系我们