Algorisme de Kleene

En informàtica teòrica, en particular en teoria de llenguatges formals, l'algorisme de Kleene transforma un autòmat finit no determinista (AFND) en una expressió regular. Juntament amb altres algorismes de conversió, estableix l'equivalència de diversos formats de descripció per llenguatges regulars. Presentacions alternatives del mateix mètode inclouen el "mètode d'eliminació" atribuït a Brzozowski i McCluskey, l'algorisme de McNaughton i Yamada, i l'ús del lema d'Arden.^[1]

Descripció de l'algorisme

Segons Brut i Yellen (2004),^[2] l'algoritme pot ser remuntat a Kleene (1956).^[3] Una presentació de l'algorisme en el cas de l'autòmat determinista finit (ADF) és donat a Hopcroft i Ullman (1979).^[4] La presentació de l'algorisme per AFNDs a sota segueix Brut i Yellen (2004).

Donat un autòmat finit no determinista $M = (Q, Σ, δ, q_{0}, F)$ , amb $Q = {q_{0}, \dots, q_{n}}$ el seu conjunt d'estats, l'algorisme computa els conjunts $R_{i j}^{k}$ de totes les entrades que porten $M$ de l'estat $q_{i}$ a $q_{j}$ sense passar per cap estat superior a $k$ . Aquí, "passar per un estat" vol dir entrar-hi i sortir-ne, així que ambdós $i$ i $j$ poden ser superiors a $k$ , però no cap estat intermedi. Cada conjunt $R_{i j}^{k}$ és representat per una expressió regular; l'algorisme els computa pas a pas per $k = - 1, 0, \dots, n$ . Com no hi ha cap estat superior a $n$ , l'expressió regular $R_{0 j}^{n}$ representa el conjunt de totes les entrades que porten $M$ del seu estat inicial $q_{0}$ a $q_{j}$ . Si $F = {q_{1}, \dots, q_{f}}$ és el conjunt d'estats finals, l'expressió regular $R_{01}^{n} ∣ \dots ∣ R_{0 f}^{n}$ representa el llenguatge acceptat per $M$ .

Les expressions regulars inicials, per a $k = - 1$ , es computen de la següent manera per a $i \neq j$ :

R_{i j}^{- 1} = a_{1} ∣ \dots ∣ a_{m}

on

q_{j} \in δ (q_{i}, a_{1}), \dots, q_{j} \in δ (q_{i}, a_{m})

i com segueix per a $i = j$ :

R_{i i}^{- 1} = a_{1} ∣ \dots ∣ a_{m} ∣ ϵ

on

q_{i} \in δ (q_{i}, a_{1}), \dots, q_{i} \in δ (q_{i}, a_{m})

És a dir, $R_{i j}^{- 1}$ representa tots els símbols d'entrada que causen una transició d' $q_{i}$ a $q_{j}$ , i també incloem $ϵ$ quan $i = j$ .

Seguidament, en cada pas les expressions $R_{i j}^{k}$ es calculen a partir de les anteriors mitjançant:

R_{i j}^{k} = R_{i k}^{k - 1} {(R_{k k}^{k - 1})}^{*} R_{k j}^{k - 1} ∣ R_{i j}^{k - 1}

Una altra manera d'entendre el procediment de l'algorisme és com un "mètode d'eliminació", on els estats de $0$ a $n$ s'eliminen successivament: quan s'elimina l'estat $k$ , l'expressió regular $R_{i j}^{k - 1}$ , que descriu les paraules d'entrada que generen un camí de l'estat $i > k$ a l'estat $j > k$ , és reescrita dins $R_{i j}^{k}$ a fi de tenir en compte la possibilitat de passar per l'estat "eliminat" $k$ .

Per inducció en $k$ , es pot veure que la longitud^[5] de cada expressió $R_{i j}^{k}$ és com a màxim $\frac{1}{3} (4^{k + 1} (6 s + 7) - 4)$ símbols, on $s$ denota el nombre de caràcters dins l'alfabet $Σ$ . Per tant, la longitud de l'expressió regular que representa la llengua acceptada per $M$ és com a màxim $\frac{1}{3} (4^{n + 1} (6 s + 7) f - f - 3)$ símbols, on $f$ denota el nombre d'estats finals. Aquest creixement exponencial és inevitable, ja que existeixen famílies d'AFDs pels quals qualsevol expressió regular equivalent ha de ser de mida exponencial.^[6]

A la pràctica, la mida de l'expressió regular obtinguda per l'algorisme pot ser molt diferent depenent en l'ordre en què es consideren els estats, i.e. l'ordre amb el qual són numerats de $0$ a $n$ .

Exemple

L'autòmat donat a l'esquema pot ser descrit com $M = (Q, Σ, δ, q_{0}, F)$ amb

$Q = {q_{0}, q_{1}, q_{2}}$ el conjunt d'estats,
$Σ = {a, b}$ l'alfabet d'entrada,
$δ$ la funció de transició amb $δ (q_{0}, a) = q_{0}$ , $δ (q_{0}, b) = q_{1}$ , $δ (q_{1}, a) = q_{2}$ , $δ (q_{1}, b) = q_{1}$ , $δ (q_{2}, a) = q_{1}$ , $δ (q_{0}, b) = q_{1}$ ,
$q_{0}$ l'estat inicial,
$F = {q_{1}}$ el conjunt d'estats finals o d'acceptació.

L'algorisme de Kleene computa les expressions regulars inicials de la següent forma:

$\begin{matrix} R_{00}^{- 1} & = a ∣ ϵ \\ R_{01}^{- 1} & = b \\ R_{02}^{- 1} & = \emptyset \\ R_{10}^{- 1} & = \emptyset \\ R_{11}^{- 1} & = b ∣ ϵ \\ R_{12}^{- 1} & = a \\ R_{20}^{- 1} & = \emptyset \\ R_{21}^{- 1} & = a ∣ b \\ R_{22}^{- 1} & = ϵ \end{matrix}$

Seguidament, les $R_{i j}^{k}$ es computen a partir de les $R_{i j}^{k - 1}$ pas a pas per $k = 0, 1, 2$ . S'utilitzen igualtats de l'àlgebra de Kleene per a simplificar les expressions regulars tant com sigui possible.

Pas 0

$\begin{matrix} R_{00}^{0} & = & R_{00}^{- 1} {(R_{00}^{- 1})}^{*} R_{00}^{- 1} ∣ R_{00}^{- 1} & = & (a ∣ ϵ) & (a ∣ ϵ)^{*} & (a ∣ ϵ) & ∣ & a ∣ ϵ & = & a^{*} \\ R_{01}^{0} & = & R_{00}^{- 1} {(R_{00}^{- 1})}^{*} R_{01}^{- 1} ∣ R_{01}^{- 1} & = & (a ∣ ϵ) & (a ∣ ϵ)^{*} & b & ∣ & b & = & a^{*} b \\ R_{02}^{0} & = & R_{00}^{- 1} {(R_{00}^{- 1})}^{*} R_{02}^{- 1} ∣ R_{02}^{- 1} & = & (a ∣ ϵ) & (a ∣ ϵ)^{*} & \emptyset & ∣ & \emptyset & = & \emptyset \\ R_{10}^{0} & = & R_{10}^{- 1} {(R_{00}^{- 1})}^{*} R_{00}^{- 1} ∣ R_{10}^{- 1} & = & \emptyset & (a ∣ ϵ)^{*} & (a ∣ ϵ) & ∣ & \emptyset & = & \emptyset \\ R_{11}^{0} & = & R_{10}^{- 1} {(R_{00}^{- 1})}^{*} R_{01}^{- 1} ∣ R_{11}^{- 1} & = & \emptyset & (a ∣ ϵ)^{*} & b & ∣ & b ∣ ϵ & = & b ∣ ϵ \\ R_{12}^{0} & = & R_{10}^{- 1} {(R_{00}^{- 1})}^{*} R_{02}^{- 1} ∣ R_{12}^{- 1} & = & \emptyset & (a ∣ ϵ)^{*} & \emptyset & ∣ & a & = & a \\ R_{20}^{0} & = & R_{20}^{- 1} {(R_{00}^{- 1})}^{*} R_{00}^{- 1} ∣ R_{20}^{- 1} & = & \emptyset & (a ∣ ϵ)^{*} & (a ∣ ϵ) & ∣ & \emptyset & = & \emptyset \\ R_{21}^{0} & = & R_{20}^{- 1} {(R_{00}^{- 1})}^{*} R_{01}^{- 1} ∣ R_{21}^{- 1} & = & \emptyset & (a ∣ ϵ)^{*} & b & ∣ & a ∣ b & = & a ∣ b \\ R_{22}^{0} & = & R_{20}^{- 1} {(R_{00}^{- 1})}^{*} R_{02}^{- 1} ∣ R_{22}^{- 1} & = & \emptyset & (a ∣ ϵ)^{*} & \emptyset & ∣ & ϵ & = & ϵ \end{matrix}$

Pas 1

$\begin{matrix} R_{00}^{1} & = & R_{01}^{0} {(R_{11}^{0})}^{*} R_{10}^{0} ∣ R_{00}^{0} & = & a^{*} b & (b ∣ ϵ)^{*} & \emptyset & ∣ & a^{*} & = & a^{*} \\ R_{01}^{1} & = & R_{01}^{0} {(R_{11}^{0})}^{*} R_{11}^{0} ∣ R_{01}^{0} & = & a^{*} b & (b ∣ ϵ)^{*} & (b ∣ ϵ) & ∣ & a^{*} b & = & a^{*} b^{*} b \\ R_{02}^{1} & = & R_{01}^{0} {(R_{11}^{0})}^{*} R_{12}^{0} ∣ R_{02}^{0} & = & a^{*} b & (b ∣ ϵ)^{*} & a & ∣ & \emptyset & = & a^{*} b^{*} b a \\ R_{10}^{1} & = & R_{11}^{0} {(R_{11}^{0})}^{*} R_{10}^{0} ∣ R_{10}^{0} & = & (b ∣ ϵ) & (b ∣ ϵ)^{*} & \emptyset & ∣ & \emptyset & = & \emptyset \\ R_{11}^{1} & = & R_{11}^{0} {(R_{11}^{0})}^{*} R_{11}^{0} ∣ R_{11}^{0} & = & (b ∣ ϵ) & (b ∣ ϵ)^{*} & (b ∣ ϵ) & ∣ & b ∣ ϵ & = & b^{*} \\ R_{12}^{1} & = & R_{11}^{0} {(R_{11}^{0})}^{*} R_{12}^{0} ∣ R_{12}^{0} & = & (b ∣ ϵ) & (b ∣ ϵ)^{*} & a & ∣ & a & = & b^{*} a \\ R_{20}^{1} & = & R_{21}^{0} {(R_{11}^{0})}^{*} R_{10}^{0} ∣ R_{20}^{0} & = & (a ∣ b) & (b ∣ ϵ)^{*} & \emptyset & ∣ & \emptyset & = & \emptyset \\ R_{21}^{1} & = & R_{21}^{0} {(R_{11}^{0})}^{*} R_{11}^{0} ∣ R_{21}^{0} & = & (a ∣ b) & (b ∣ ϵ)^{*} & (b ∣ ϵ) & ∣ & a ∣ b & = & (a ∣ b) b^{*} \\ R_{22}^{1} & = & R_{21}^{0} {(R_{11}^{0})}^{*} R_{12}^{0} ∣ R_{22}^{0} & = & (a ∣ b) & (b ∣ ϵ)^{*} & a & ∣ & ϵ & = & (a ∣ b) b^{*} a ∣ ϵ \end{matrix}$

Pas 2

$\begin{matrix} R_{00}^{2} & = & R_{02}^{1} {(R_{22}^{1})}^{*} R_{10}^{1} ∣ R_{00}^{1} & = & a^{*} b^{*} b a & ((a ∣ b) b^{*} a ∣ ϵ)^{*} & \emptyset & ∣ & a^{*} & = & a^{*} \\ R_{01}^{2} & = & R_{02}^{1} {(R_{22}^{1})}^{*} R_{11}^{1} ∣ R_{01}^{1} & = & a^{*} b^{*} b a & ((a ∣ b) b^{*} a ∣ ϵ)^{*} & (a ∣ b) b^{*} & ∣ & a^{*} b^{*} b & = & a^{*} b (a (a ∣ b) ∣ b)^{*} \\ R_{02}^{2} & = & R_{02}^{1} {(R_{22}^{1})}^{*} R_{12}^{1} ∣ R_{02}^{1} & = & a^{*} b^{*} b a & ((a ∣ b) b^{*} a ∣ ϵ)^{*} & ((a ∣ b) b^{*} a ∣ ϵ) & ∣ & a^{*} b^{*} b a & = & a^{*} b^{*} b (a (a ∣ b) b^{*})^{*} a \\ R_{10}^{2} & = & R_{12}^{1} {(R_{22}^{1})}^{*} R_{10}^{1} ∣ R_{10}^{1} & = & b^{*} a & ((a ∣ b) b^{*} a ∣ ϵ)^{*} & \emptyset & ∣ & \emptyset & = & \emptyset \\ R_{11}^{2} & = & R_{12}^{1} {(R_{22}^{1})}^{*} R_{11}^{1} ∣ R_{11}^{1} & = & b^{*} a & ((a ∣ b) b^{*} a ∣ ϵ)^{*} & (a ∣ b) b^{*} & ∣ & b^{*} & = & (a (a ∣ b) ∣ b)^{*} \\ R_{12}^{2} & = & R_{12}^{1} {(R_{22}^{1})}^{*} R_{12}^{1} ∣ R_{12}^{1} & = & b^{*} a & ((a ∣ b) b^{*} a ∣ ϵ)^{*} & ((a ∣ b) b^{*} a ∣ ϵ) & ∣ & b^{*} a & = & (a (a ∣ b) ∣ b)^{*} a \\ R_{20}^{2} & = & R_{22}^{1} {(R_{22}^{1})}^{*} R_{10}^{1} ∣ R_{20}^{1} & = & ((a ∣ b) b^{*} a ∣ ϵ) & ((a ∣ b) b^{*} a ∣ ϵ)^{*} & \emptyset & ∣ & \emptyset & = & \emptyset \\ R_{21}^{2} & = & R_{22}^{1} {(R_{22}^{1})}^{*} R_{11}^{1} ∣ R_{21}^{1} & = & ((a ∣ b) b^{*} a ∣ ϵ) & ((a ∣ b) b^{*} a ∣ ϵ)^{*} & (a ∣ b) b^{*} & ∣ & (a ∣ b) b^{*} & = & (a ∣ b) (a (a ∣ b) ∣ b)^{*} \\ R_{22}^{2} & = & R_{22}^{1} {(R_{22}^{1})}^{*} R_{12}^{1} ∣ R_{22}^{1} & = & ((a ∣ b) b^{*} a ∣ ϵ) & ((a ∣ b) b^{*} a ∣ ϵ)^{*} & ((a ∣ b) b^{*} a ∣ ϵ) & ∣ & (a ∣ b) b^{*} a ∣ ϵ & = & ((a ∣ b) b^{*} a)^{*} \end{matrix}$

Com $q_{0}$ és l'estat inicial i $q_{1}$ és l'únic estat final, l'expressió regular $R_{01}^{2}$ denota el conjunt de totes les paraules d'entrada acceptades per l'autòmat.

Referències

Plantilla:Referències

↑ Plantilla:Ref-publicació
↑ Plantilla:Ref-llibre Here: sect.2.1, remark R13 on p.65
↑ Plantilla:Ref-publicació Here: sect.9, p.37-40
↑ Plantilla:Ref-llibre Here: Section 3.2.1 pages 91-96
↑ More precisely, the number of regular-expression symbols, "a_i", "ε", "|", "^*", "·"; not counting parentheses.
↑ Plantilla:Ref-publicació. Theorem 16.

[1] Plantilla:Ref-publicació

[gross2004handbook-2] Plantilla:Ref-llibre Here: sect.2.1, remark R13 on p.65

[3] Plantilla:Ref-publicació Here: sect.9, p.37-40

[4] Plantilla:Ref-llibre Here: Section 3.2.1 pages 91-96

[5] More precisely, the number of regular-expression symbols, "a_i", "ε", "|", "^*", "·"; not counting parentheses.

[6] Plantilla:Ref-publicació. Theorem 16.

[1]

[2]

[3]

[4]

[5]

[6]

Algorisme de Kleene

Descripció de l'algorisme

Exemple

Referències

Menú de navegació

Cerca