自然语言处理——3.2 有限自动机与正则文法

作者: SpareNoEfforts | 来源:发表于2018-10-02 16:04 被阅读141次

确定的有限自动机(definite automata, DFA)

1. 定义

确定的有限自动机 $M$ 是一个五元组：
$M = (\Sigma ,Q,\delta ,{q_0},F)$

$\Sigma$ 是输入符号的有穷集合；
$Q$ 是状态的有限集合；
${q_0} \in Q$ 是初始状态；
$F$ 是终止状态集合， $F \subseteq Q$ ；
$\delta$ 是 $Q$ 与 $\Sigma$ 的直积 $Q×\Sigma$ 到 $Q$ (下一个状态) 的映射。它支配着有限状态控制的行为，有时也称为状态转移函数。

2. DFA示意图

处在状态

为了明确起见，终止状态用双圈表示，起始状态用有“开始”标记的箭头表示。如:

4. DFA 定义的语言

如果一个句子 $x$ 使得有限自动机 $M$ 有 $\delta (q_0,a) = p,p \in F$ ，那么，称句子 $x$ 被 $M$ 接受。
由 $M$ 定义的语言 $T(M)$ 就是被 $M$ 接受的句子的全集。即：
$T(M) = \{ x|\delta ({q_0},x) \in F\}$

例子：

链 $x = 110101$ 被 $M$ 接受。 $T(M)$ = {含偶数个 $0$ 和偶数个 $1$ 的链}

不确定的有限自动机(non-definite automata, NFA)

1. 定义

不确定的有限自动机 $M$ 是一个五元组：
$M = (\Sigma ,Q,\delta ,{q_0},F)$

$\Sigma$ 是输入符号的有穷集合；
$Q$ 是状态的有限集合；
${q_0} \in Q$ 是初始状态；
$F$ 是终止状态集合， $F \subseteq Q$ ；
$\delta$ 是 $Q$ 与 $\Sigma$ 的直积 $Q×\Sigma$ 到 $Q$ 的幂集 $2^Q$ 的映射。

DFA与NFA

1. DFA与NFA的唯一区别

NFA 与 DFA 的唯一区别是：在 NFA中 $\delta(q, a)$ 是一个状态集合，而在 DFA 中 $\delta(q, a)$ 是一个状态。

例子

该自动机为不确定自动机；句子 $x =01011$ 可以被接受。

1. DFA与NFA的关系

设 $L$ 是一个被 NFA 所接受的句子的集合，则存在一个 DFA它能够接受 $L$ 。

正则文法与有限自动机的关系

1. 正则文法 $\to$ 自动机

定理
若 $G = (V_N,V_T, P, S )$ 是一个正则文法，则存在一个有限自动机 $M=(\Sigma ,Q,\delta , q_0, F)$ ，使得： $T(M) = L(G)$ 。
由 $G$ 构造 $M$ 的一般步骤：
(1) 令 $\Sigma ＝V_T, Q＝V_N \cup { T }，q_0＝S$ ，其中， $T$ 是一个新增加的非终结符。
(2) 如果在 $P$ 中有产生式 $S \to \varepsilon$ ，则 $F＝{S, T}$ ，否则 $F={T}$ 。
(3) 如果在 $P$ 中有产生式 $B \to a$ ， $B \in V_N$ ， $a \in V_T$ ，则 $T \in \delta(B, a)$ 。
(4) 如果在 $P$ 中有产生式 $B \to aC，B, C \in V_N，a \in V_T$ , 则 $C \in \delta(B, a)$
(5) 对于每一个 $a \in V_T$ ，有 $\delta(T, a) ＝ \emptyset$ 。

1. 自动机 $\to$ 正则文法

定理
若 $M=(\Sigma ,Q,\delta , q_0, F)$ 是一有限自动机，则存在正则文法 $G = (V_N,V_T, P, S )$ ,使 $L(G)＝T(M)$ 。
由 $M$ 构造 $G$ 的一般步骤：
(1) 令 $V_N ＝ Q，V_T = \Sigma，S ＝q_0$ ；
(2) 如果 $C \in \delta(B, a)，B, C \in Q，a \in \Sigma$ ，则在 $P$ 中有产生式 $B \to aC$ ；
(3) 如果 $C \in \delta(B, a)，C \in F$ ，则在 $P$ 中有产生式 $B \to a$ 。

自然语言处理——3.2 有限自动机与正则文法

确定的有限自动机(definite automata, DFA)

1. 定义

2. DFA示意图

4. DFA 定义的语言

不确定的有限自动机(non-definite automata, NFA)

1. 定义

DFA与NFA

1. DFA与NFA的唯一区别

1. DFA与NFA的关系

正则文法与有限自动机的关系

1. 正则文法 $\to$ 自动机

1. 自动机 $\to$ 正则文法

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

NLP

自然语言处理——3.2 有限自动机与正则文法

确定的有限自动机(definite automata, DFA)

1. 定义

2. DFA示意图

4. DFA 定义的语言

不确定的有限自动机(non-definite automata, NFA)

1. 定义

DFA与NFA

1. DFA与NFA的唯一区别

1. DFA与NFA的关系

正则文法与有限自动机的关系

1. 正则文法 自动机

1. 自动机 正则文法

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

NLP

1. 正则文法 $\to$ 自动机

1. 自动机 $\to$ 正则文法