数据挖掘

数据挖掘

作者: 清水包哟 | 来源:发表于2018-10-24 18:43 被阅读6次

时空数据挖掘
学习笔记--(移动数据挖掘引言)
大数据、数据分析和数据挖掘的区别
Python学习笔记-3群18组-杜杜狼-2017.8.1
为什么说企业需要做文本挖掘呢？
读书计划- 数据分析实战45讲 | 02丨学习数据挖掘的最佳路径
数据挖掘与可视化学习网址大全
了解数据挖掘
软件设计师考试 | 第八章算法设计与分析 | 数据挖掘算法
python生成数据

流程

商业理解

对现行商业问题的剖析，根据网络数据，文档等对商业问题的一个初步理解，为数据挖掘提供方向。

比如对旧有商业模型的理解，对现行趋势的分析等。
数据理解

对现有数据的初步分析，使用统计，探测等方法对现有数据有一个大致上的了解，为下一步骤做准备。

比如根据统计结果查看属性的可用性与分布情况。
数据准备

对现有数据采取过滤无效数据、转换数据值、生成新属性、异常处理等操作来产生出可用于数据挖掘模型建立的数据。

具体流程：
- 清洗数据：处理数据中缺失和无效值，
- 构建数据：根据已有数据，构建更适合与数据挖掘的新数据字段，
- 选择数据：分析与过滤掉与商业问题不相关的数据字段，
- 格式化数据：根据算法不同改变数据形式
建立模型

将数据分成训练集与检验集，使用训练集建立模型，使用检验集检验模型得出结果

模型训练算法

聚类算法K-means

顾名思义，这个算法是与K相关的一个方法，事实也是如此。

对于一个大的集群，该方法通过对以下三步的不停迭代得出结果：

确定K值，K值表示需要将这个大的集群分成多少个小的簇（聚类）。然后虚拟K个中心位于集群坐标系内。
计算集群坐标系内所有点与K个中心点的位置，将距离中心点最近的点划归一簇。
根据每一簇的所有点计算这一簇的重心，将其作新的K个中心点重复这一过程。

为何要迭代

经过证明，算法是必然收敛的。意思也就是说，在N次迭代后，K个中心点都趋于稳定，不会发生大的变动。

缺点

不适合在坐标系中呈现形状怪异的集群，比如月亮型此类的非凸形状的聚类
不适合有属性参数值间差异过大（连续值之间跨度过大）的集群

适用范围

小规模的球形或圆形数据
高纬度数据（属性多），纬度越高聚类效果越好

相关文章

时空数据挖掘
数据挖掘已经成为当代显学，只要是个公司可能都需要数据挖掘，由此也衍生除了金融数据挖掘、生物数据挖掘、时空数据挖掘、...
学习笔记--(移动数据挖掘引言)
移动数据挖掘的定义移动数据挖掘研究的是基于移动数据的数据挖掘算法。这些数据算法需要更多地利用移动数据特性，挖掘与...
大数据、数据分析和数据挖掘的区别
大数据、数据分析、数据挖掘的区别是，大数据是互联网的海量数据挖掘，而数据挖掘更多是针对内部企业行业小众化的数据挖掘...
Python学习笔记-3群18组-杜杜狼-2017.8.1
What a heck! 终于开始学习数据挖掘实战课程了！！！ Lesson 2 数据挖掘概况数据挖掘（data...
为什么说企业需要做文本挖掘呢？
首先何为文本挖掘：文本挖掘是从文本中进行数据挖掘(Data Mining)。从这个意义上讲，文本数据挖掘是数据挖掘...
读书计划- 数据分析实战45讲 | 02丨学习数据挖掘的最佳路径
一，数据挖掘的基本流程在正式讲数据挖掘知识清单之前，我先和你聊聊数据挖掘的基本流程。数据挖掘的过程可以分成以下...
数据挖掘与可视化学习网址大全
数据挖掘学习博客： kdnuggets 数据挖掘入门数据可视化学习博客： processing官网文本挖掘数...
了解数据挖掘
数据挖掘涉及的方面很广，可以是从数据中挖掘知识，提取知识，数据/模式分析，数据考古和数据捕捞。数据挖掘是从已有数据...
软件设计师考试 | 第八章算法设计与分析 | 数据挖掘算法
1. 数据挖掘概述数据挖掘利用机器学习方法对多种数据，包括数据库数据、数据仓库数据、Web数据等进行分析和挖掘。...
python生成数据
数据可视化指：数据可视化指的是通过可视化表示来探索数据，它与数据挖掘紧密相关。数据挖掘：数据挖掘指的是使用代...

网友评论

Coding

本文标题：数据挖掘

本文链接：https://www.haomeiwen.com/subject/fmuxtqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

Coding

关于我们|服务条款|联系我们|数据挖掘|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！