对大数据的多维度解读研究

2019-05-06 09:27沈娟
现代企业文化·理论版 2019年36期
关键词:解读大数据维度

沈娟

中图分类号:C37 文献标识:A 文章编号:1674-1145(2019)12-157-02

摘 要 随着科技的飞速发展,各种数据蜂拥而来,大数据时代已然来临,深刻地影响着社会的各个方面。大众并不是数据专家,对数据的了解不够深入。通过对大数据的特征进行分析,多维度解读大数据的内涵,清楚认识到大数据面临的困境,从而更好的利用大数据服务于社会,建设数据化国家。

关键词 大数据 维度 解读

自从2015年国务院印发《促进大数据发展行动纲要》之后,大数据已经上升为国家战略,大数据逐渐被大众所熟悉。但是“何为大数据”,大数据如何在生活中应用,普通大众并不是很清楚,因此对大数据的全方位解读是很有必要的。

一、大数据的特征

关于大数据的定义,目前并没有统一的定论,各个领域对其都有自己的专业定义。世界著名思想库麦肯锡( MGI) 认为: “大数据是指大小超出了典型数据软件工具收集、存储、管理和分析能力的数据集。”[1]盖特纳( Gartner) 公司认为: “大数据是大容量、高速度和形式多样的信息资产,它需要低成本的、形式创新的信息处理,以增强洞察力和辅助决策。”涂子沛认为:“大数据”之“大”,并不仅仅指“容量大”。??更多的意义在于:人类可以‘分析和使用的数据在大量增加,通过这些数据的交换、整合和分析,人类可以发现新的知识,创造新的价值,带来 “大知识”、“大科技”、“大利润”和“大发展”。[2]有学者认为,大数据有广义和狭义之分,广义是指所有可以在电脑上储存的数据,而狭义上所指传统的数字类,比如1、2、3、4等小数据。可见,基于不同的视角,对大数据的定义也是各有偏重。

(一)大数据规模巨大

随着计算机技术的飞速发展,计算机硬件的处理速度和储存能力,一到两年就会提升一倍。硬盘的容量是越来越大,而价格却在不断下降,可见计算机硬件的技术将持续发展,而价格将会下跌。计算机硬件的发展速度,使全世界的数据处理和存储速度越来越快,越来越便捷,还越来越便宜,这让海量数据的存储成为了可能。

另外,数据的规模越来越大。2011年的时候,美国国家安全局电话监控的数据量就已经是非常惊人的了,它每六个小时产生的数据量就相当于美国国会图书馆所有印刷体藏书的信息总量。而美国国会图书馆是世界上馆藏量最大的图书馆。而在今天的大数据时代,无处不在的传感器收集到的数据规模更是呈几何式暴增,大数据已经从几个TB发展到了几个PB(数千TB)。

(二)大数据种类繁多

在大数据时代,万物皆是数据,只要能存储在计算机上的都可以称之为数据,包括文字、音频、视频、图片、地理位置信息等等。随着互联网的迅速发展,智能手机的普及,新的数据来源和新的数据种类在不断增加。从传感器、摄像头到微博、微信、网购等信息,来自于不同渠道的数据正以不同的形式展现出来。这些数据以不同的格式存储在不同的平台上。

从数据的种类来看,包括结构化数据、半结构化数据和非结构化数据。结构化数据指的是传统意义上的小数据,而半结构化数据和非结构化数据意指类似于文本、音频视频、图片等非传统意义上的数据。其中,半结构数据和非结构数据所占比例越来越大。

(三)大数据价值重大

大数据作为一个单独的个体是没有什么意义的,但是数据的不断组合、不断重组,会发现其新的价值。收集的数据越多,得到的信息也就越多,可以对主体进行准确的描述。只要愿意,对一个人从出生到死亡的数据都可以收集到,从而可以完整地描述出这个人的一生。

通过对大量的数据信息进行分析汇总,可以从看似没有关联的事物当中获取有价值的规律。商业公司可以从大数据中发现利润增长点,比如每年的支付宝账单都可以看出消费的偏好,不难发现,女性的支出会比较多,并且发现在服装、鞋帽、化妆品等都是高利润的商品。这对一个商业公司来说,数据无疑帮它挖掘出了商业价值。

(四)大数据速度快

大数据具有高速的特点,1秒定律,可从各种类型的数据中快速获得高价值的信息,大数据产生的速度很快,现在只需要两天就能够创造出自文明诞生以来到今天所产生的数据总和。现在的数据每天呈一种爆炸状态:同一类型的数据量在快速增长;不同类型的数据量也在飞速增长;数据增长的速度在加快。

另外大数据也具有即时性的特点,能够更快地满足实时性的要求。现在大多数人开车的时候都会启动导航,而地图导航软件收到用户的导航需求时,会即时开始导航。同时也会搜集同一时刻用户的信息,能够预测拥堵路段,包括还要拥堵的时间,同时进行路线新的规划,绕开拥堵路段。

二、大数据的内涵

大数据时代悄然而至,每个人都在每时每刻不停地产生数据,同时也在运用各种数据,人们逐渐认识到大数据给自己带来的改变,对大数据的认识也日益清晰。

(一)大数据是一种战略资源

大数据作为信息革命的核心,是犹如石油一样宝贵的战略物资。大数据的核心是预测,通过对大量的数据的分析建模,可以对有些事情进行精准预测,大数据将是决策的重要依据。谁掌握了大数据,谁就占了先机。谷歌公司就是根据用户的搜索访问数据,比当地防疫部门还要早一步预测出流感的爆发。

另外,通过大数据,可以完整的还原出一个人的行为轨迹,甚至能够了解其思想的演变轨迹,那么对社会的主流意识形态应该能够掌握其发展趋势,把控住社会意识形态的安全。

再者,数据会成为社会财富增长的支撑点。通过对顾客的消费数据进行分析,可以清楚地知道顾客的消费喜好,从而针对性地投放广告,自然会让销售额不断提升。

(二)大数据是一种思维方法

以前的思维方式是执着于追究因果关系,而大数据时代却只看相关关系,从事物的相关关系中找出规律,预测出未来的事物走向。这完全突破了以前固有的苦苦追寻因果关系思维模式,让工作更有效率。畢竟有些事情知道是什么就够了,没有必要一定知道为什么。在淘宝主页面的推荐往往是根据你平时的搜索记录来进行关联性推荐,这种算法模型就是梳理出各种有趣的相关关系,背后的原因反而并不重要。

相关关系,是预测的关键。在海量的数据中,寻找相关关系,能够更容易、更迅速、更清晰地分析事物,从而预测可能发生的事情。

(三)大数据是一种科学工具

在小数据时代,只能依靠一小部分的数据来进行研究,主要是样本研究。通过一小部分的数据进行样本研究,来证实某些发现。这些数据的采集都是随机采样,期望用最少的数据获得最多的信息,而且由于技术的原因,也没有办法收集所有的数据,但是小部分并不能完全代表所有可能的情况。

在大数据时代,技术的发展,让全部数据的收集成为了可能,大数据就是全部。虽然不可能真的研究所有的数据,但是只要想,可以尽可能的收集最多、最完善的数据。通过对大规模的数据进行搜集,然后建立数据模型,进行算法分析,找出相关规律,最终得出精准预测。

(四)大数据是一种话语权

在大数据时代,谁拥有数据,谁就有话语权。人可能会撒谎,但是数据不会撒谎,数据是客观的,数据能够真实的反映事物规律。人们相信数据,出行会问导航那条路最快,哪里不堵车;出去吃饭,会打开美食网站,看看餐馆评分和顾客评价;遇到不了解的问题,首先就会问百度。

当人们相信数据,甚至是迷信数据的时候,谁掌握了大数据,谁就拥有了话语权。因为人们永远不可能掌握全部的数据,那么数据拥有者給出什么数据,人们就看到什么数据,也就相信那些数据所反映的所谓事实。

三、大数据的困境

大数据的优势显而易见,但是也会有些困境需要去面对。

(一)数据的价值密度

海量的数据,是否全部都有价值呢?应该来说,价值密度低。警察寻找嫌疑人也许需要从成千上万的监控视频中找出那一帧,当年整个南京市的硬盘和眼药水脱销,就是因为警察为了找出那个杀人通缉犯周克华把所有的监控视频看了个遍。为了在视频中找到周克华,全市1000多名民警在两个月的时间里观看了近30万GB的监控视频,这相当于每名干警每周看100多部电影。

所以,不是所有的数据都有价值,那就需要建立好比较精准的模型,找对参数,找准关键变量,这样才能从海量的数据中快速、准确的挖掘出所需要的信息。

(二)数据的可信度

虽然数据越来越大,但并不是所有的数据都是真实的。网络数据真伪难辨,特别是微博上经常出现各种谣言,还有一些移花接木的图片,总是容易迷惑普通大众,所以大家现在习惯“坐等反转”。

为了让数据尽可能真实,就需要搜集数据的时候确定更多的维度,不同的源头、不同的结构都需要涉及到,同时要与历史数据相对比,多角度、多层面地搜集数据,也可以建立数学模型来鉴别真假。

(三)数据的隐私性

大数据存在着一定的安全和隐私隐患,虽然用户产生数据,但是并不拥有数据,数据储存在各个云端,当云端被攻破就有了信息泄露的危险。前段时间,万豪酒店发布声明,其酒店的客房预定数据库被黑客入侵,最多有约5亿名客人的信息或被泄露。酒店客户的信息被大规模泄露就表明了这个数据存在安全隐患,客户的个人信息甚至被明码标价地售卖。

另外,数据的挖掘是否征求了用户的同意,对数据的使用是否获得了用户的许可?一般来说,数据平台在用户使用的时候都有一个协议,但是大多数用户并没有仔细阅读,即使阅读了,为了使用平台,也不得不勾选“同意”,而这并不是真正意义上的同意,因为用户并不知道这些数据会被如何搜集、怎样使用、会有怎样的后果,毕竟不是每一个用户都是数据专家。

【基金项目:武汉市教育科学“十三五”规划2 0 1 7年度立项课题《大数据与大学生思想政治教育的融合性研究》(2 0 1 7 C 1 4 4)和2 0 1 8年湖北省教育厅人文社会科学研究专项任务项目《新媒体背景下高校思想政治教育话语权的重构研究》(1 8 Z 1 2 7)阶段性研究成果】

参考文献:

[1]麦肯锡.大数据: 下一个创新、竞争和生产力的前沿报告.2011.5.

[2]涂子沛.大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活[M].广西: 广西师范大学出版社,2015.4:219.

猜你喜欢
解读大数据维度
我国电视新闻评论节目特色的解读
光的维度
“五个维度”解有机化学推断题
人生三维度