美文网首页统计算法
聊一聊统计学和数据挖掘的区别(四)

聊一聊统计学和数据挖掘的区别(四)

作者: CDA数据分析师培训 | 来源:发表于2019-02-13 16:45 被阅读17次

前几篇文章中我们都是从统计学的角度给大家讲解数据挖掘和统计学的区别所在,但是对于统计学来说,数据挖掘中的核心就是准则,数据挖掘意味着数据集的规模,它常常标示着传统的准则不可用,我们在这篇文章中给大家详细地介绍一下这些内容。

相对于统计学而言,数据挖掘中准则起着更为核心的作用,数据挖掘所继承的学科如计算机科学及相关学科也是如此。数据集的规模常常意味着传统的统计学准则不适合数据挖掘问题,不得不重新设计。部分地,当数据点被逐一应用以更新估计量,适应性和连续性的准则常常是必须的。尽管一些统计学的准则已经得到发展,但更多的应用是机器学习。

在很多情况下,数据挖掘的本质是很偶然的发现非预期但很有价值的信息。这说明数据挖掘过程本质上是实验性的。这和确定性的分析是不同的。实际上,一个人是不能完全确定一个理论的,只能提供证据和不确定的证据。确定性分析着眼于最适合的模型建立一个推荐模型,这个模型也许不能很好的解释观测到的数据。很多,或许是大部分统计分析提出的是确定性的分析。然而,实验性的数据分析对于统计学并不是一个新生事务,或许这是统计学家应该考虑作为统计学的另一个基础,而这已经是数据挖掘的基础。所有这些都是正确的,但事实上,数据挖掘所遇到的数据集按统计标准来看都是巨大的。在这种情况下,如果使用统计工具可能会得出一个不准确的结果,这是因为百万个偶然因素可能就会使其失效。

而且,如果数据挖掘的主要目的是发现,那数据挖掘就不关心统计学领域中的在回答一个特定的问题之前,如何很好的搜集数据,例如实验设计和调查设计。数据挖掘本质上假想数据已经被搜集好,关注的只是如何发现其中的秘密。这些秘密往往就是数据分析工作中要找到的规律。

在这篇文章中我们给大家介绍了数据挖掘和统计学中的不同点,数据挖掘中的准则起着核心的作用,而统计学不是这样的。当然,数据挖掘的本质就是发现非预期但很有价值的信息,懂得了这些才能够发现数据挖掘工作的意义。

相关文章

  • 聊一聊统计学和数据挖掘的区别(四)

    前几篇文章中我们都是从统计学的角度给大家讲解数据挖掘和统计学的区别所在,但是对于统计学来说,数据挖掘中的核心就是准...

  • 聊一聊RPA和RDA的区别

  • 什么是数据分析,啥叫挖掘?

    上一个话题聊了“什么是大数据”,这次聊一聊什么是数据分析,啥叫挖掘。 数据分析关键是分析,词义既分和析,分有分层...

  • 北京零基础大数据培训多少钱?

    最近很多在北京的朋友都会问我“北京零基础大数据挖掘培训费用一般需要多少钱?”,今天我们就来聊一聊北京大数据挖掘的培...

  • 认识数据挖掘

    数据挖掘的方向 数据库技术角度统计学角度机器学习角度 一,数据挖掘的发展动力 1,数据量的增长 自动数据收集工具和...

  • TCGA数据库挖掘分析,这个网站好用到爆!

    小张聊科研TCGA数据库挖掘分析,这个网站好用到爆!

  • Apriori算法

    一. 介绍大体上看,数据挖掘可以视为数据库、机器学习和统计学三者的交叉。简单来说,对数据挖掘而言,数据库提供了数据...

  • 数据挖掘、机器学习和深度学习的关系

    数据挖掘受到很多学科领域的影响,其中数据库技术、机器学习、统计学无疑影响最大。机器学习和统计学提供的数据分析技术,...

  • Python数据挖掘入门

    数据挖掘概况 数据挖掘定义 数据挖掘是指从大量的数据中,通过统计学、人工智能、机器学习等方法挖掘出未知的且具有价值...

  • MBR 与 GPT的区别-1.分区

    从今天开始,我们来聊一聊MBR和GPT的区别 MBR 与 GPT:分区 分区是驱动器上存储数据的部分。您始终需要在...

网友评论

    本文标题:聊一聊统计学和数据挖掘的区别(四)

    本文链接:https://www.haomeiwen.com/subject/lppdeqtx.html