深度学习之感知机

作者: 水之心 | 来源:发表于2018-11-14 14:01 被阅读0次

感知机
1、深度学习入门-感知机
深度学习入门系列，用白话文的方式让你看得懂学的快（第五章）
深度学习入门(1)感知机
反馈神经网络
深度学习理论笔记（感知机）
深度学习瞎学之路--感知器
统计学习方法笔记(第二章个人笔记)
2018-05-27
深度学习之感知机

感知机是由美国学者 Frank Rosenblatt 于 1957 年发明的, 它是神经网络和深度学习的起源算法。

什么是感知机？

我们考虑输入信号 $x = (x_1, \cdots, x_n)^T$ , 输出信号 $y$ , 权重 $w = (w_1, \cdots, w_n)^T$ , 其中 $x, w \in \mathbb{R}^{n\times 1}, y \in \{0, 1\}$ , 则感知机的定义为

$y = \begin{cases} 0 & (w^Tx \leq \theta)\\ 1 & (w^Tx > \theta) \end{cases}$

其中 $\theta$ 被称为阈值，用来控制“神经元是否被激活”（ $1$ 表示激活）。感知机接收多个信号，输出一个信号。这里的“信号”可以当作电流等具有“流动性”的东西。 $x_i$ 与 $y$ 被称为节点, 箭头的指向表示信号流动的方向。权重 $w_i$ 可以看作“电流”对应的“”电阻。下面画出了二节点输入的感知机结构图：

二元输入的感知机

下面我们看看逻辑运算的定义：

输入 $x_1$	输入 $x_2$	OR	AND	NAND
0	0	0	0	1
0	1	1	0	1
1	0	1	0	1
1	1	1	1	0

下面我们将使用 Python 来实现感知机型的逻辑运算。为了和后面的深度学习模型一致，我们可以将上面的感知机模型改写为

$y = \begin{cases} 0 & (w^Tx + b \leq 0)\\ 1 & (w^Tx + b> 0) \end{cases}$

下面我们使用 Numpy 来手动设计逻辑运算：

import numpy as np

class Gate:
    '''
    逻辑运算的输入 x1, x2 只能是 0 或 1
    '''
    @staticmethod
    def AND(x1, x2):
        '''
        与门
        '''
        x = np.array([x1, x2])
        w = np.array([.5, .5])
        b = -.7
        tmp = np.dot(x.T, w) + b
        if tmp <= 0:
            return 0
        else:
            return 1

    @staticmethod
    def NAND(x1, x2):
        '''
        与非门
        '''
        x = np.array([x1, x2])
        w = np.array([-.5, -.5])
        b = .7
        tmp = np.dot(x.T, w) + b
        if tmp <= 0:
            return 0
        else:
            return 1

    @staticmethod
    def OR(x1, x2):
        '''
        或门
        '''
        x = np.array([x1, x2])
        w = np.array([.5, .5])
        b = -.2
        tmp = np.dot(x.T, w) + b
        if tmp <= 0:
            return 0
        else:
            return 1

gate = Gate()

将逻辑运算的不同状态看作四个不同的样本：

X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
X

array([[0, 0],
       [0, 1],
       [1, 0],
       [1, 1]])

for x1, x2 in X:
    y = gate.AND(x1, x2)
    print(x1, 'and', x2, '-->', y)
    y1 = gate.OR(x1, x2)
    print(x1, 'or', x2, '-->', y1)
    y2 = gate.NAND(x1, x2)
    print(x1, 'not and', x2, '-->', y2)
    print('^'*18)

0 and 0 --> 0
0 or 0 --> 0
0 not and 0 --> 1
^^^^^^^^^^^^^^^^^^
0 and 1 --> 0
0 or 1 --> 1
0 not and 1 --> 1
^^^^^^^^^^^^^^^^^^
1 and 0 --> 0
1 or 0 --> 1
1 not and 0 --> 1
^^^^^^^^^^^^^^^^^^
1 and 1 --> 1
1 or 1 --> 1
1 not and 1 --> 0
^^^^^^^^^^^^^^^^^^

从上面的结果我们可以看出：感知机可以实现与门、与非门、或门运算。

感知机的局限性

单层感知机无法实现异或运算，下面我们利用 Matplotlib 来说明单层感知机的局限性：

import numpy as np
import matplotlib.pyplot as plt

x, y = X.T
fig = plt.figure()
ax1 = fig.add_axes([0.6, 0, .5, .5])
ax1.scatter(x, y, s=75, c=[1, 1, 0, 1], alpha=0.5)
ax1.plot(x, x-.2)
plt.title('NAND')
plt.xticks([])
plt.yticks([])

ax2 = fig.add_axes([0, 0, .5, .5])
ax2.scatter(x, y, s=75, c=[0, 0, 1, 0], alpha=0.5)
ax2.plot(x, x-.5)
plt.title('AND')
plt.xticks([])
plt.yticks([])

ax3 = fig.add_axes([0, 0.6, .5, .5])
ax3.scatter(x, y, s=75, c=[0, 1, 1, 1], alpha=0.5)
ax3.plot(x, - x + .7)
plt.title('OR')
plt.xticks([])
plt.yticks([])

ax4 = fig.add_axes([.6, 0.6, .5, .5])
ax4.scatter(x, y, s=75, c=[1, 0, 0, 1], alpha=0.5)
ax4.plot(x, x-.5)
plt.title('XOR')
plt.xticks([])
plt.yticks([])
plt.show()

逻辑运算.png

图中黄色的点代表“正例”，紫色的点代表“负例”。从上图可以看出 XOR 无法使用一条直线将“正例”与“负例”分隔开。在机器学习中，一般称可以使用一条“直线”将“正例”与“负例”分隔开的数据集为线性可分的，否则称为线性不可分的。

从上面的分析，我们发现单层感知机的局限性：无法解决异或问题（线性不可分的问题）。

多层感知机

虽然单层感知机无法解决异或问题，但是多层感知机便可以解决异或问题。

def XOR(x1, x2):
    s1 = gate.NAND(x1, x2)
    s2 = gate.OR(x1, x2)
    y = gate.AND(s1, s2)
    return y

for x1, x2 in X:
    y = XOR(x1, x2)
    print(x1, 'xor', x2, '-->', y)

0 xor 0 --> 0
0 xor 1 --> 1
1 xor 0 --> 1
1 xor 1 --> 0

上面的 XOR 求解过程可以使用如下的图像来表示。

捕获.PNG

小结

我们已经完成了感知机的学习，感知机是十分简单的算法，已经有理论证明，2 层（使用了非线性激活函数的）感知机可以表示任意函数。但是，使用 2 层感知机的构造，需要我们手工设定权重，这是令人十分绝望的，而神经网络的自动设定参数机制为此带来了福音。

感知机
感知机感知机算法是很多算法的鼻祖，比如支持向量机算法，神经网络与深度学习。在学习感知机的构造时可以学习到深度学习...
1、深度学习入门-感知机
感知机是什么？感知机（perceptron）：感知机是神经网络（深度学习）的起源算法，学习感知机的构造是通向神...
深度学习入门系列，用白话文的方式让你看得懂学的快（第五章）
Hello World感知机，懂你我心才安息 (深度学习入门系列之五) 原文再续，书接上回。 5.1 网之初，感知...
深度学习入门(1)感知机
感知机感知机基础知识感知机是神经网络（深度学习）的起源算法。感知机可以接收多个输入信息，输出一个信号。感知...
反馈神经网络
1、Reference 多层感知机MLP（机器学习5）多层感知机原理详解 & Python与R实现深度学习笔记——...
深度学习理论笔记（感知机）
学习韩老师的文章，笔记如下：深度学习的入门不得不谈感知机，何为感知机？感知机其实就是神经元，神经网络的组成单位...
深度学习瞎学之路--感知器
标签：深度学习、感知器 [TOC] 本文将介绍感知机这一算法。感知机是由美国学者Frank Rosenblatt...
统计学习方法笔记(第二章个人笔记)
统计学习方法笔记(第二章个人笔记) 标签：机器学习深度学习感知机（P25）感知机是神经网络与支持向量机的基础...
2018-05-27
Deep Learning ：感知机的前世今生 1.什么是深度学习 2.什么是感知机 3.感知机能够做什么 4.感...
深度学习之感知机
感知机是由美国学者 Frank Rosenblatt 于 1957 年发明的, 它是神经网络和深度学习的起源算法。...

深度学习之感知机

什么是感知机？

感知机的局限性

多层感知机

小结

相关文章

感知机

1、深度学习入门-感知机

深度学习入门系列，用白话文的方式让你看得懂学的快（第五章）

深度学习入门(1)感知机

反馈神经网络

深度学习理论笔记（感知机）

深度学习瞎学之路--感知器

统计学习方法笔记(第二章个人笔记)

2018-05-27

深度学习之感知机

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

深度学习