交叉验证(Cross-Validation)可能是数据科学家在进行统计分析时最重要的技术之一,因为在实际中经常...[作者空间]
sklearn.metrics.explained_variance_score()若为预测值,为实际值,则该回归...[作者空间]
截断正态分布(Truncated_normal_distribution)是在正太分布中界定随机变量进而从正态...[作者空间]
决策树(Decision Tree)是一种基本的分类与回归方法,其模型呈树状结构,在分类问题中,表示基于特征对...[作者空间]
penalty:正则化参数,可选l1或l2,分别对应l1正则化和l2正则化,默认为l2正则化。一般来说l2正则化可...[作者空间]
概述 对于普通最小二乘的参数估计问题,当模型的各项是相关时,最小二乘估计对于随机误差非常敏感,会产生很大的方差...[作者空间]
概述 最小二乘法是一种是一种数学优化技术,它通过最小化误差来寻找数据的最佳匹配函数,在曲线拟合中有广泛应用。在...[作者空间]
io:字符串,文件的路径对象。 sheet_name:None、string、int、字符串列表或整数列表,默认为...[作者空间]
数据预处理 sklearn.preprocessing包提供了几个数据预处理中常用的功能和变换器,用于将原始特征向...[作者空间]
Pandas是Python下最强大的数据分析和探索工具,它包含高级数据结构和一些精巧的工具,使得在Python...[作者空间]
Scikit-learn是专门面向机器学习的Python开源框架,它实现了各种成熟的算法,并且易于安装与使用。...[作者空间]
Matplotlib是Python中最常用的可视化工具,可以非常方便的生成出版质量级的图片,只需几行代码,就可...[作者空间]
Scipy是一个用于数学、科学、工程领域的常用软件包,可以处理插值、积分、优化、图像处理、常微分方程数值解的求...[作者空间]
人工智能(Artificial Intelligence,AI)时代,简单易学,同时拥有着丰富模块库的Pyth...[作者空间]
什么是机器学习? 前些年AlphaGo与中韩围棋大师的世纪决战至今仍历历在目,AlpahGo的压倒性胜利象征着...[作者空间]
一、学习率衰减的概念和必要性 学习率过大,在算法优化的前期会加速学习,使得模型更容易接近局部或全局最优解。但是在后...[作者空间]