美文网首页
初始逻辑回归(Python)

初始逻辑回归(Python)

作者: 学人工智能的菜菜 | 来源:发表于2020-04-28 12:09 被阅读0次

    在前面的垃圾邮件分类中,可知贝叶斯起到了很好的作用,但是其是离散型的,效果就很好,对于连续型的特征,贝叶斯可以用高斯贝叶斯去实现,就是数据特征服从正态分布。但是效果没有离散型的好,是否还有其他算法可以实现连续性特征呢?当然有。

    要处理连续性特征的得到概率值判断是哪一类问题的情况下,核⼼心问题是怎么去表达 𝒑(𝒙|𝒚) , 这⾥𝒙是连续性特征,𝑦是标签(垃圾/正常)

    那么我们围绕这个问题展开如何计算这个概率。
    该算法就是逻辑回归

    逻辑回归的介绍

    先来看看逻辑回归可以处理哪些分类问题,一些现实生活中常用的案例。

    • 贷款违约情况(会违约/不会违约)
    • 广告点击率问题(会点击/不会点击) CTR PREDICTION
    • 商品推荐 (会购买/不会购买)
    • 情感分析 (正面/负面)
    • 疾病诊断(阴性/阳性)
      等其他分类问题
      下面来看一个分类问题
    年龄 工资 学历 逾期
    20 4000 本科 YES
    25 5000 专科 NO
    21 6000 本科 NO
    25 5000 专科 YES
    28 8000 本科 NO
    27 7000 本科

    学习输入到输出的映射f(X-Y) 其中 X表示特征值 (年龄,工资,学历) Y表示是否逾期

    • X输入
    • Y输出
      定义条件概率:P(y|x)
      PS:为什么不直接计算出Y的大小值去去判断是否逾期呢?
    • 假设我们明确知道条件概率 𝑃(𝑌|𝑋),怎么做分类?
    • 怎么去表示 𝑃(𝑌|𝑋) ?这相当于⽤用模型来捕获输⼊入𝑋和输出𝑌之间的关系
      由于这是连续性变量X,那么如何可以得到概率𝑃(𝑌|𝑋)呢?
      连续性变量的得到Y用的是线性回归Y= 𝒘 𝜯 𝒙 + 𝒃。
      可不不可以⽤用线性回归来表示𝑃(𝑌|𝑋) = 𝒘 𝜯 𝒙 + 𝒃? 为什什么?
      答:不可以,因为𝑃(𝑌|𝑋)是0~1之间的值,而 𝒘 𝜯 𝒙 + 𝒃的取值是负无穷到正无穷
      既然又是连续性变量,结果又是0~1,那有没有办法让这两者相等呢,达到目的呢?
      也就是可不可以把线性回归 𝒘 𝜯 𝒙 + 𝒃 改进⼀一下使得值域映射到 0,1 区间
      来个彩蛋 ,到这里,我们知道逻辑回归是根据线性回归演变而来,那为什么叫逻辑回归呢?,答案下面揭晓
      是因为为了达到概率值0~1之间,给线性回归函数添加到逻辑函数里面,就可以实现我们想要的结果,所以才叫做逻辑回归 该逻辑函数也叫激活函数Sigmoid
    逻辑函数

    逻辑函数


    image.png

    Y= 1/(1+e^-x) 其中x就是𝒘 𝜯 𝒙 + 𝒃


    image.png

    最后可以总结成:


    image.png

    相关文章

      网友评论

          本文标题:初始逻辑回归(Python)

          本文链接:https://www.haomeiwen.com/subject/khtmwhtx.html