码迷,mamicode.com
首页 > 其他好文 > 详细

第七周作业:关于我对大数据的两点误解

时间:2016-04-20 21:35:40      阅读:182      评论:0      收藏:0      [点我收藏+]

标签:

    上周在写一份材料时,其中写到了“将大数据技术更好地应用于高校就业指导与服务”,后来在上交材料时,老师问我“你知道大数据”是指什么吗?当时我只知道应该就是指数据多、信息量大吧,后来老师给我做了一些简单的解释,我才明白原来并不是我想的那样。

    作为一个计算机系的学生,对此是应该了解的,于是我查了一些有关大数据的资料来加深我的理解。

以下是我以前的两点误解:

1.数据不等于信息

    数据指的是一个原始的数据点,信息则直接与内容挂钩,数据多,不一定就代表信息多。比如我们玩微博的时候,有时会转发别人的微博,有时会看到很多相似的微博,虽然文字内容会有所不同,但表达的意义却是一样的,此时,虽然数据增多,但信息量并没有增加。

2.信息不等于智慧

    即使除去数据中重复的部分,最后所剩下的数据也不一定有用,信息要转变为智慧,至少需要满足以下三个标准:

可破译性:人们的行为使得每天会产生大量的信息,在未对信息处理分析之前,一般将这些数据暂时非结构化的存储起来,这些非结构化的数据不一定可破译。比如我们在逛淘宝时,阿里的系统可能会将用户的操作过程,在某网页的浏览时间等记录下来,比如记录客户3次切换物品的时间间隔分别为5秒、10秒、17秒,但却只记录了5秒、10秒、17秒,忘记标注这些时间代表的是什么,那么我们无法对这些数据处理分析,即不可破译,因此不能成为智慧。

关联性:无关的信息,至多只是噪音,比如当阿里想分析逛淘宝的用户喜欢进的店铺类型,物品类型时,这时用户切换网页的时间信息对其就是无关的,而用户打开的店铺链接及物品链接则是有关的。

新颖性:新颖性很多时候无法根据我们手上的数据和信息进行判断,(继续上面的例子)比如我们用不同组数据得出了客户喜欢的店铺类型和物品类型,那么后者就是不具有新颖性的,然而,我们往往需要将大量的数据和信息处理之后,才能得知其是否具有新颖性。

大数据应用案例之:零售业以下数据来源于网页http://wiki.mbalib.com/wiki/大数据)

      "我们的某个客户,是一家领先的专业时装零售商,通过当地的百货商店、网络及其邮购目录业务为客户提供服务。公司希望向客户提供差异化服务,如何定位公司的差异化,他们通过从 Twitter 和 Facebook 上收集社交信息,更深入的理解化妆品的营销模式,随后他们认识到必须保留两类有价值的客户:高消费者和高影响者。希望通过接受免费化妆服务,让用户进行口碑宣传,这是交易数据与交互数据的完美结合,为业务挑战提供了解决方案。"Informatica的技术帮助这家零售商用社交平台上的数据充实了客户主数据,使他的业务服务更具有目标性。

  [2] 零售企业也监控客户的店内走动情况以及与商品互动。它们将这些数据与交易记录相结合来展开分析,从而在销售哪些商品、如何摆放货品以及何时调整售价上给出意见,此类方法已经帮助某领先零售企业减少了17%的存货,同时在保持市场份额的前提下,增加了高利润率自有品牌商品的比例。

 

 

第七周作业:关于我对大数据的两点误解

标签:

原文地址:http://www.cnblogs.com/herosmiling/p/5414369.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!