首页 > 教育 > 问答 > 教育知识 > 大数据和创构认识论,为什么要数据挖掘 论

大数据和创构认识论,为什么要数据挖掘 论

来源:整理 时间:2022-04-09 12:31:15 编辑:教育知识 手机版

大数据、数据分析和数据挖掘的区别是什么?

大数据、数据分析和数据挖掘的区别是什么

对于很多人来讲,这几个概念经常分不清,我当初入门的时候也一样,只不过那时候没有大数据的概念,作为一个数据分析从业者,其实并不需要关注这些名字直接的本质区别,只要明白一件事,数据最终是为了决策服务。鉴于大家对此还是有些好奇,这里我大概说说我的理解,希望和各位有所交流,不足之处还望大家指正。先看看数据分析与数据挖掘的区别:首先要搞懂,什么是数据,什么是信息,这两者本质的区别就是数据是存在的,不用人脑,而信息是需要人脑进行处理,上面意思呢?比如你装修完了房子,打算开始买家具,那么第一件事就是用尺子量房屋各处的长度和宽度,这些都是可以主观的看到的,客观存在的,这就是数据,而信息则不同,例如你要去买沙发,你会说,我们放5米的沙发刚好,4米的有些短,看着不大气,6米的太大了,看着不美观,那这种就属于信息,是需要人们经过大脑去判断的,属于主观,判断的依据就是数据(客观存在)。

其次,数据分析是对客观存在的已知的数据,通过各类维度的分析,得出一个结论,例如我们发现用户注册量下降:可以从:区域上看,某区域的注册量下降了x%渠道方面,搜索引擎带来的注册了下降了X%年龄来看,20岁~30岁的注册量下降了X%等等,这样不同的业务类型去看过去一段时间发展的趋势来做结论判断。数据挖掘则更注重洞察数据本身的关系,从而获得一些非显型的结论,这是我们从数据分析中无法得到了,例如关联分析可以知道啤酒与尿布的关系、决策树可以知道你购买的概率、聚类分析可以知道你和谁类似,等等,重在从各个维度去发现数据之间的内在联系因此两者的目的不一样,数据分析是有明确的分析群体,就是对群体进行各个维度的拆、分、组合,来找到问题的所在,而数据发挖掘的目标群体是不确定的,需要我们更多是是从数据的内在联系上去分析,从而结合业务、用户、数据进行更多的洞察解读。

举个例子来理解一下:比如一个分析师一直单身,想去找一个女朋友,他可以很迅速的知道这个女孩的身高、收入、学历等,但无法从这些数据中获知这个女孩是不是适合自己、她的性格如何,这时我们就需要从一些日常行为的数据进行推断,一种是主观的推断,我觉得、我估计、我认为,不可能在一起另一种是客观 主观的推断,比如整合微博数据(可以知道微博的内容、发送行为、关注的领域等),和自己的行为进行数据挖掘,来看看数据内在的匹配度有多高,这时候,你会说,我们在一起的概率有90%,从而建立信心,开始行动.....当然统计学上讲,100%的概率都未必发生,0%的概率都未必不发生,这只是小概率事件,不要让这个成为你脱单的绊脚石。

文章TAG:数据挖掘创构认识论数据大数据和创构认识论为什么要数据挖掘

最近更新