美文网首页
用Python实现机器学习算法—Logistic 回归算法

用Python实现机器学习算法—Logistic 回归算法

作者: 公子曼步 | 来源:发表于2020-09-26 10:24 被阅读0次

在 Logistic 回归中,我们试图对给定输入特征的线性组合进行建模,来得到其二元变量的输出结果。例如,我们可以尝试使用竞选候选人花费的金钱和时间信息来预测选举的结果(胜或负)。Logistic 回归算法的工作原理如下。

免费视频教程:www.mlxs.top

与线性回归不同,Logistic 回归没有封闭解。但由于损失函数是凸函数,因此我们可以使用梯度下降法来训练模型。事实上,在保证学习速率足够小且使用足够的训练迭代步数的前提下,梯度下降法(或任何其他优化算法)可以是能够找到全局最小值。

训练 Logistic 回归模型有不同的步骤。首先(在步骤 0 中),模型的参数将被初始化。在达到指定训练次数或参数收敛前,重复以下其他步骤。

第 0 步:用 0 (或小的随机值)来初始化权重向量和偏置值

第 1 步:计算输入的特征与权重值的线性组合,这可以通过矢量化和矢量传播来对所有训练样本进行处理:

免费视频教程:www.mlxs.top


第 3 步:计算整个训练集的损失值。

我们希望模型得到的目标值概率落在 0 到 1 之间。因此在训练期间,我们希望调整参数,使得模型较大的输出值对应正标签(真实标签为 1),较小的输出值对应负标签(真实标签为 0 )。这在损失函数中表现为如下形式:


第 4 步:对权重向量和偏置量,计算其对损失函数的梯度。

关于这个导数实现的详细解释,可以参见这里(https://stats.stackexchange.com/questions/278771/how-is-the-cost-function-from-logistic-regression-derivated)。

一般形式如下:

免费视频教程:www.mlxs.top

In [24]:

importnumpyasnpfromsklearn.model_selectionimporttrain_test_splitfromsklearn.datasetsimportmake_blobsimportmatplotlib.pyplotaspltnp.random.seed(123)% matplotlib inline

数据集

In [25]:

# We will perform logistic regression using a simple toy dataset of two classesX, y_true = make_blobs(n_samples= 1000, centers=2)

fig = plt.figure(figsize=(8,6))

plt.scatter(X[:,0], X[:,1], c=y_true)plt.title("Dataset")

plt.xlabel("First feature")

plt.ylabel("Second feature")

plt.show()

免费视频教程:www.mlxs.top

In [26]:

Shape X_train: (750, 2)

Shape y_train: (750, 1)

Shape X_test: (250, 2)

Shape y_test: (250, 1)

初始化并训练模型

In [29]:

regressor = LogisticRegression()w_trained, b_trained, 

costs = regressor.train(X_train, y_train, n_iters=600, learning_rate=0.009)

fig = plt.figure(figsize=(8,6))

plt.plot(np.arange(600), costs)

plt.title("Development of cost over training")

plt.xlabel("Number of iterations")

plt.ylabel("Cost")

plt.show()

Cost after iteration 0: 0.6931471805599453

Cost after iteration 100: 0.046514002935609956

Cost after iteration 200: 0.02405337743999163

Cost after iteration 300: 0.016354408151412207

Cost after iteration 400: 0.012445770521974634

Cost after iteration 500: 0.010073981792906512

免费视频教程:www.mlxs.top

文章详情:用Python实现机器学习算法—Logistic 回归算法

相关文章

网友评论

      本文标题:用Python实现机器学习算法—Logistic 回归算法

      本文链接:https://www.haomeiwen.com/subject/nosfuktx.html