美文网首页
认识大数据挖掘

认识大数据挖掘

作者: gracexinxin | 来源:发表于2019-06-26 17:20 被阅读0次

大数据:特点(4V,volume,variety,value,velocity),即体量大、多样性、价值密度低、速度快。

大数据分为 大数据的存储及大数据的应用

存储包括:关系数据库,云存储,分布式存储

应用包括:数据管理,统计分析,数据挖掘,并行计算,分布式计算.

OLAP:联机分析处理,广义的数据挖掘

数据挖掘与传统数据分析的本质区别:数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。

数据挖掘核心:利用算法对处理好的输入和输出数据进行训练,并得到模型,然后再对模型进行验证,使得模型能够在一定程度上刻画出数据由输入到输出的关系,然后再利用该模型,对新输入的数据进行计算,从而得到新的输出。

数据挖掘内容六方面:关联、回归、分类、聚类、预测、诊断。

回归:线性回归、非线性回归、逐步回归、logistic回归

经典分类方法:决策树、神经网络、贝叶斯、K-近邻算法、判别分析、支持向量机(SVM)

常用聚类方法:K-means、层次聚类、神经网络聚类、高斯聚类、模糊C-均值聚类

预测:因果关系分析中包括 回归、计量经济模型、神经网络预测法、灰色预测、马尔科夫预测

诊断:诊断对象是离群点或孤立点

并行计算:同时使用多种计算资源姐姐计算问题的过程

分布式计算:研究如何把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分,然后把这些部分分配给许多计算机进行处理,最后把这些计算结果综合起来得到最终的结果。

数据挖掘项目的生命周期包含六阶段:业务理解、数据理解、数据建模、评估、部署。

数据的质量分析通常包括:缺失数据、数据错误、度量标准错误、编码不一致、无效的元数据

数据预处理包括:数据清洗、数据集成、数据规约、数据变换

相关文章

  • 记-数据挖掘-数据挖掘概述认识

    数据挖掘概述 数据挖掘概念 随着爆炸性的数据增长,我们拥有丰富大量的数据,但却不足以提供有用的信息。我们亟需一些工...

  • 数据挖掘-认识数据

    数据对象与属性类型 数据集由数据对象组成。一个数据对象代表一个实体。例如销售数据库中,对象可以是顾客、商品。属性是...

  • 认识数据挖掘

    数据挖掘的方向 数据库技术角度统计学角度机器学习角度 一,数据挖掘的发展动力 1,数据量的增长 自动数据收集工具和...

  • 认识大数据挖掘

    大数据:特点(4V,volume,variety,value,velocity),即体量大、多样性、价值密度低、速...

  • Python数据分析与数据挖掘思路

    Python数据分析与数据挖掘思路分为四大模块:数据获取、数据探索、数据预处理、挖掘建模

  • 数据挖掘之认识数据

    第二章 什么是数据集 数据集是数据对象的集合,由许许多多的数据对象组成,一个数据对象代表一个实体 数据对象的属性 ...

  • 数据挖掘之认识数据

    本文您将要了解: 1、数据由什么类型的属性或字段组成? 2、每个属性具有何种类型的数据值? 3、哪些属性是离散的?...

  • 数据挖掘 数据属性的认识

    原始数据分散在各个业务系统,它们使用的不同的数据库。当我们把数据纳入数据中心进行统一管理如就需要对数据类型属性进行...

  • 数据挖掘工程师-学习路线

    不管是数据分析师还是数据挖掘工程师,我们的目标都是认识数据,从数据中发现需要的信息。 数据挖掘的技术过程: 数据清...

  • 数据处理和特征工程(一)

    1. 数据挖掘五大流程 数据挖掘有4大步骤,分别为 获取数据 数据预处理 特征工程 建模其中特征工程是指将原始数据...

网友评论

      本文标题:认识大数据挖掘

      本文链接:https://www.haomeiwen.com/subject/sngxcctx.html