搜索引擎的作用是根据用户输入的关键词返回给用户与关键词相关的信息。但有时用户无法准确描述自己的需求时,这种关键词搜...[作者空间]
在系统运维中,经常会遇到某个具体组件发生故障,进而导致整个应用系统瘫痪的情况,所以要及时对这些具体组件进行跟踪和预...[作者空间]
本项目主要实现目标为:1根据热水器采集的数据,划分一次完整用水事件。2在划分好的一次完整用水事件中,识别出洗浴事件...[作者空间]
本案例是基于水质图像来对水质进行分类,所以是图像分类问题,一般的,可以直接构建CNN深度模型来分析,效果会非常好,...[作者空间]
项目目标:根据乳腺癌患者的病理信息,挖掘患者的症状与中医证型之间的关联关系,特别是各中医证素与乳腺癌TNM分期之间...[作者空间]
本项目的目标是通过电量异常数据,负荷异常数据,终端报警数据,主站报警,线损异常数据等信息,建立数据分析模型,来实时...[作者空间]
时序模式是数据挖掘中的第四种应用类别。 时序模式是基于时间序列的历史数据,来预测未来短期内的可能值。 1. 时间序...[作者空间]
关联规则挖掘是数据挖掘中第三个比较大的类别。 关联规则分析也称为购物篮分析,最早是为了发现超市销售数据库中不同的商...[作者空间]
参考资料: 《Python数据分析和挖掘实战》张良均等[作者空间]
数据规约是产生更小但保持元数据完整性的新数据集的过程,好处在于:降低无效,错误数据对建模的影响,提高建模的准确性。...[作者空间]
数据变换主要是对数据进行规范化处理,将数据转换成“适当的”形式,以适用于挖掘任务和算法的需要。 1. 简单函数变换...[作者空间]
数据集成就是间来源于多个不同数据源的数据合并存放在一个一致的数据存储(比如数据仓库)中的过程。 不同数据源的数据之...[作者空间]
数据预处理包括有数据清洗,数据集成,数据转换,数据规约等过程。 数据预处理的目的是提高数据的质量,同时让数据更好的...[作者空间]
主要依赖于pandas和matplotlib进行数据探索,而这些数据探索函数可大致分为统计特征函数和统计作图函数。...[作者空间]
高质量的数据集才能得到高质量的模型,垃圾数据集只能产生垃圾 通过检样数据集的数据质量,绘制图表,计算某些特征量等,...[作者空间]
1. 一些基本概念 数据挖掘:简而言之,就是从大量数据中中淘金,发掘出隐含的,未知的,对决策有潜在应用价值的关系,...[作者空间]