设为所有项目的集合,为事务数据库,事物是一个项目子集()。每一个事务具有唯一的事务标识。设是一个由项目构成的集合,...[作者空间]
岭回归 huber回归 第一幅图使用loss总和来评估回归效果,delta=1,损失最少,从第三幅图来看也是拟合效...[作者空间]
kaggle赛题链接Home Depot Product Search Relevance,这个题目关键点就是特征...[作者空间]
操作词汇的库很多nltk,jieba等等,gensim处理语言步骤一般是先用gensim.utils工具包预处理,...[作者空间]
加载数据 特征选择 为了方便后面可视化,我们只选取2个特征,通过自变量与因变量y相关系数来选择 还可以通过PCA降...[作者空间]
1、泊松分布 泊松分布适合于描述单位时间(或空间)内随机事件发生的次数。如某一服务设施在一定时间内到达的人数,电话...[作者空间]
scipy sin(x)/x算出来积分误差很大,即使近似值已经很接近pi了,注意我乘2了[作者空间]
DNN算法的基本思想 多层感知器在如何获取隐层的权值的问题上遇到了瓶颈。既然我们无法直接得到隐层的权值,能否先通过...[作者空间]
之前无标签数据降维PCA,那么像下图带有标签数据,如果用PCA降维将会投影到v轴上,这个投影方差最大,数据将变成不...[作者空间]
基尼不纯度的大概意思是 一个随机事件变成它的对立事件的概率例如 一个随机事件X , 那么基尼不纯度就为 一个随机事...[作者空间]
决策树归纳的基本算法是贪心算法,它以自顶向下递归各个击破的方式构造决策树。 贪心算法:在每一步选择中都采取在当前状...[作者空间]
原文 1、什么是元类 通过上文的描述,我们知道了Python中的类也是对象。元类就是用来创建这些类(对象)的,元类...[作者空间]
二层装饰器函数 把@log放到now()函数的定义处,相当于执行了语句: 三层装饰器函数 由于log()是一个de...[作者空间]
Python中,如果在创建class的时候写了call()方法, 那么该class实例化出实例后, 实例名()就是...[作者空间]
一、如何度量信息 信息量是对信息的度量,香农不仅对信息作了定性描述,还进行了定量分析。信源发出的信息常常是随机的,...[作者空间]
之前写矩阵奇异分解理论部分,应用在图片上可以起到去噪压缩的作用,灰度图片可以二维矩阵表示,可以取奇异值比较大部分,...[作者空间]
想要降维,随意丢弃数据显然不可取,降维可以降低程序计算复杂度,代价是丢弃了原始数据一些信息,那么降维的同时,又保留...[作者空间]
定理 设 的特征值 注意 一般的对称矩阵的特征值没有这个性质 称式(3)为正交矩阵A的正交对角分解 引理: 定义 ...[作者空间]
说明 如无特别说明都是实对称矩阵 定理 对称矩阵的特征值为实数 证明 设复数 定理的意义 由于对称矩阵A的特征值 ...[作者空间]