美文网首页
【理论】数据挖掘知识入门

【理论】数据挖掘知识入门

作者: needrunning | 来源:发表于2018-08-19 18:49 被阅读19次

    数据挖掘比较专业化的解释如下
    Data mining (knowledge discovery from data)

    KDD 是一个以知识使用者为中心,人机交互的探索过程,包括了在指定的数据库中用数据挖掘算法提取模型,以及围绕数据挖掘所进行的预处理和结果表达等一系列的步骤

    什么是模型

    比较官方的说法是通过数据挖掘过程所得到的知识通常被称为模型(model)或模式(pattern)
    模型或者模式是数据挖掘的结果。

    我对模型或者模式的理解是这样的,当你面对一个实际的数据分析需求时,首先你要做的就是如何获取和整理你的数据集,使之有用的呈现出来,并且合理的服务于之后的分析。如何进行数据集的获取,存储,呈现就是建立模型的过程,类比于Web应用程序开发中的数据建模,同数据表创建,定义实体及关联。

    image

    引用知乎中对ETL的解释

    ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。 ETL是BI项目重要的一个环节。 通常情况下,在BI项目中ETL会花掉整个项目的1/3的时间,ETL设计的好坏直接关接到BI项目的成败。

    作者:李晓文

    链接:https://www.zhihu.com/question/26528031/answer/57860607

    来源:知乎

    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

    相关文章

      网友评论

          本文标题:【理论】数据挖掘知识入门

          本文链接:https://www.haomeiwen.com/subject/bpbfuxtx.html