【原创】逻辑回归基本概念梳理

作者: Gaafung峰 | 来源:发表于2020-05-19 22:47 被阅读0次

【原创】逻辑回归基本概念梳理
【原创】线性回归基本概念梳理
逻辑回归
机器学习实践系列3——二项逻辑回归
机器学习分享——逻辑回归推导以及 numpy 的实现
多类逻辑回归 (Multinomial Logistic Reg
TORCH02-03:Torch的损失函数与逻辑回归实现
逻辑回归算法梳理
【面试】逻辑回归
机器学习理论系列3——逻辑回归

逻辑回归

前言

1、逻辑回归是经典二分类方法、不是回归方法

2、机器算法中，先选简单算法、后复杂，逻辑回归特别简单，所以说 ==经典==

3、逻辑回归的边界可以是非线性，取决于传参

基本公式入门

Sigmoid函数

image.png

$g(z) = \frac{1}{1+e^{-z}}$

代码实现

def sigmoid(z):
    return 1 / (1 + np.exp(-z))

存在以下特性：

自变量取值为任意实数，值域:[0,1]
区间
- $g:\mathbb{R} \to [0,1]$
- $g(0)=0.5$
- $g(- \infty)=0$
- $g(+ \infty)=1$

解释：将任意的输入映射到了[0,1]区间我们在线性回归中可以得到一个预测值，再将该值映射到Sigmoid 函数中这样就完成了由值到概率的转换，也就是分类任务

套入预测函数

$h_\theta(x) = g(\theta^Tx) = \frac{1}{1+e^{-{\theta^Tx}}}$

def model(X, theta):
    return sigmoid(np.dot(X, theta.T))

image.png

将值转为概率，多个X样本则实现边界是非线性的

分类任务：

$P(y=1|x;\theta) = h_\theta(x)$

$P(y=0|x;\theta) = 1-h_\theta(x)$

进行整合：

$P(y|x;\theta) = h_\theta(x)^y(1-h_\theta(x))^{1-y}$

$y$ 取0时，只有 $(1-h_\theta(x))^{1-y}$ ， $y$ 取1时，只有 $h_\theta(x)^y$ ，如此==二分类任务(0,1)==整合为一个公式

似然函数，与线性回归相同，将 $P(y|x;\theta)$ 传入

似然函数：

$L(\theta) = \prod_{i=1}^m p(y_i|x_i;\theta) = \prod_{i=1}^m h_\theta(x_i)^{y_i}(1-h_\theta(x_i))^{1-y_i}$

对数似然函数：

$l(\theta) = \log L(\theta) = \sum_{i=1}^m (y_i\log h_\theta(x_i)+(1-y_i)\log(1-h_\theta(x_i)))$

转化梯度上升为梯度下降函数

$J(\theta)=-\frac{1}{m}l(\theta)$

先将对数似然函数去除负号

$D(h_\theta(x), y) = -y\log(h_\theta(x)) - (1-y)\log(1-h_\theta(x))$

求平均损失

$J(\theta)=\frac{1}{n}\sum_{i=1}^{n} D(h_\theta(x_i), y_i)$

代码实现

def cost(X, y, theta):
    left = np.multiply(-y, np.log(model(X, theta)))
    right = np.multiply(1 - y, np.log(1 - model(X, theta)))
    return np.sum(left - right) / (len(X))

求偏导：

$\frac{\partial}{\partial\theta_j}J(\theta) = -\frac{1}{m}\sum_{i=1}^m (y_i \frac{1}{h_\theta(x_i)} \frac{\partial}{\partial\theta_j}h_\theta(x_i)-(1-y_i)\frac{1}{1-h_\theta(x_i)} \frac{\partial}{\partial\theta_j}h_\theta(x_i))$

$= -\frac{1}{m}\sum_{i=1}^m(y_i - h_\theta(x_i))x_i^j$

def gradient(X, y, theta):
    """
    计算梯度
    """
    grad = np.zeros(theta.shape)    # 初始化参数数组
    error = (model(X, theta)- y).ravel()    # 求误差，ravel是把多维变为一维
    for j in range(len(theta.ravel())): #for each parmeter
        term = np.multiply(error, X[:,j])
        grad[0, j] = np.sum(term) / len(X)  # X代表含义不太理解
    
    return grad

过程复杂推导有些复杂，直接附图

image.png

参数更新：

$\theta_j: =\theta_j-\frac{1}{m}\sum_{i=1}^m(h_\theta(x_i)-y_i)x_i^j$

theta = theta - alpha*grad
# grad调用函数gradient

降维（归一化）操作：

一般数据是有自己特征，去除后再进行回归算法会更简便

例如：Z-score规范化（标准差标准化 / 零均值标准化）

$x' = (x - μ)／σ$

from sklearn import preprocessing as pp

scaled_data = orig_data.copy()
scaled_data[:, 1:3] = pp.scale(orig_data[:, 1:3])

【原创】逻辑回归基本概念梳理
逻辑回归前言 1、逻辑回归是经典二分类方法、不是回归方法 2、机器算法中，先选简单算法、后复杂，逻辑回归特别简单...
【原创】线性回归基本概念梳理
线性回归基本公式入门假设函数、误差符合高斯分布、似然函数、目标函数使用场景: 1、存在已知的数据及结果，根据...
逻辑回归
逻辑回归(logistic regression) 基本概念逻辑回归虽然名字中带有回归，但应该是历史遗留问题。他...
机器学习实践系列3——二项逻辑回归
本文主要介绍逻辑回归的基本概念，并结合实际案例说明逻辑回归的应用。从线性回归到逻辑回归在【机器学习系列2——线...
机器学习分享——逻辑回归推导以及 numpy 的实现
逻辑回归基本概念什么是逻辑回归？逻辑回归就是这样的一个过程：面对一个回归或者分类问题，建立代价函数，然后通过优化...
多类逻辑回归 (Multinomial Logistic Reg
多类逻辑回归 (Multinomial Logistic Regression) 基本概念解释与数学背景知识回归...
TORCH02-03:Torch的损失函数与逻辑回归实现
本主题主要梳理损失函数，并同时使用损失函数实现逻辑回归。本主题内容结构： 1. 逻辑回归模型； 2. 逻辑回归...
逻辑回归算法梳理
逻辑回归算法梳理 1、逻辑回归的原理逻辑回归就是这样的一个过程：面对一个回归或者分类问题，建立代价函数，然后通...
【面试】逻辑回归
逻辑回归的常见面试点总结(博客园)LR（逻辑回归）为什么使用sigmoid函数 1. 基本概念一句话概括：逻辑...
机器学习理论系列3——逻辑回归
之前在机器学习实践系列3——二项逻辑回归中，描述了逻辑回归算法的基本概念和原理，并用Python结合实际案例讲解了...