美文网首页
逻辑回归(鸢尾花案例)

逻辑回归(鸢尾花案例)

作者: 浪客先生 | 来源:发表于2020-08-19 21:18 被阅读0次

    一、什么是逻辑回归?

    逻辑回归是机器学习中的一个基础的算法,他与线性回归类似,与线性回归不同的是它预测的分类问题。例如根据疾病影像学的病理特征来预测患有某种疾病的概率,邮件垃圾的分类等,逻辑回归广泛应用于医学和社会各领域。

    二、逻辑回归的原理:

    逻辑回归是监督学习中的一种,它根据大量带有分类标签的特征变量来训练优化模型,在根据模型来预测只有特征变量的分类标签。在鸢尾花案例中,我们通过许多带有分类标签(鸢尾花的三种类别)的特征变量数据来训练预测鸢尾花类别的模型,这些特征变量有:花瓣的长度、花瓣的宽度、花萼的长度、花萼的宽度。为实现预测分类问题的目的我们利用了Logistic函数(或者成为Sigmoid函数):

    logi(z)=\frac{1}{1+e^{-z} }

    整个函数的图象如下:

    Sigmoid函数有一些特点,比如当z=0是logi(z)=0.5,当z<0时,0<logi(z)<0.5;当z>0时,0.5<logi(z)<1.所以logi(z)函数的取值范围为(0,1)。

    其中回归的基本方程为:z=w_{0} + {\textstyle \sum_{i}^{N}} w_{i} x_{i}

    我们可以把logi(z)的函数值看成类别为1的概率预测值,当logi(z)<0.5时,我们预测的分类为0;当logi(z)>=0.5时,我们预测的分类为1.

    对于多分类,将多个二分类的逻辑回归组合即可实现。

    三、鸢尾花案例

    1、机器学习通常有以下几个步骤:(1)数据获取和预处理 (2)建立模型 (3)训练优化模型(4)利用模型预测未知问题

    所以在这个案例中我们也有相对应的几个步骤:

    (1)鸢尾花数据集的获取和预处理 (2)建立逻辑回归模型 (3)向模型“喂”鸢尾花数据从而达到训练优化模型的目的 (4)预测

    具体的代码的链接如下:

    https://static.app.yinxiang.com/embedded-web/profile/#/join?guid=98bda7ef-5a34-44cb-a9f7-011a1a3c9772&channel=copylink&shardId=s22&ownerId=26956767

    四、鸢尾花案例涉及到的类、属性

    python语言是一门强对象的编程语言,所以在使用python编程时弄清楚对象之间的层次关系就变得尤为重要了。思维导图就是理解这种层次特别合适的工具。下面就是我对这个案例中模块、属性之间层次关系的梳理。其中蓝色部分的字体代表的是字段,其余的是模块或者是方法。

    相关文章

      网友评论

          本文标题:逻辑回归(鸢尾花案例)

          本文链接:https://www.haomeiwen.com/subject/zmvdjktx.html