blob: ef17c460c99828808a025847082f835eccaa8edc (
plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
|
##### LM #####
context tags
# Open and close tags by rewriting to generic close tags. Won't work if
# interested in unclosed tags because a token can start as not close_id, but
# then become a close id during the course of parsing.
#
# Regular Definitions
#
rl rl_ws /[ \t\n\r\v]+/
rl rl_id /[a-zA-Z_][a-zA-Z0-9_]*/
#
# Tokens
#
# Any single character can be a literal
lex
token BANG_NL /'!\n'/
token SEMI_NL /';\n'/
# Ignore whitespace.
ignore /rl_ws/
# Open and close id
token id /rl_id/
end
#
# Global Data
#
def tag_stack
[id tag_stack]
| []
TS: tag_stack
#
# Productions
#
def open_tag
[id]
{
match lhs [Id:id]
match TS [Top:id Rest:tag_stack]
if Id.data == Top.data {
reject
} else {
TS = construct tag_stack [Id TS]
}
}
def close_tag
[id]
{
match lhs [Id: id]
match TS [Top: id Rest: tag_stack]
if Id.data == Top.data
TS = construct tag_stack [Rest]
else
reject
}
def tag
[open_tag tag* close_tag]
def start
[tag* SEMI_NL]
{
print_xml( TS )
print_xml( lhs )
print( 'got structure\n' )
}
| [id* SEMI_NL]
{
print_xml( TS )
print_xml( lhs )
print( 'failed\n' )
}
end # tags
cons Tags: tags[]
Tags.TS = cons tags::tag_stack ["sentinal"]
parse tags::start(Tags)[stdin]
##### IN #####
y y a i i b c c m m n n b a;
##### EXP #####
<tags::tag_stack><tags::id>sentinal</tags::id><tags::tag_stack></tags::tag_stack></tags::tag_stack><tags::start><tags::_repeat_tag><tags::tag><tags::open_tag><tags::id>y</tags::id></tags::open_tag><tags::_repeat_tag></tags::_repeat_tag><tags::close_tag><tags::id>y</tags::id></tags::close_tag></tags::tag><tags::tag><tags::open_tag><tags::id>a</tags::id></tags::open_tag><tags::_repeat_tag><tags::tag><tags::open_tag><tags::id>i</tags::id></tags::open_tag><tags::_repeat_tag></tags::_repeat_tag><tags::close_tag><tags::id>i</tags::id></tags::close_tag></tags::tag><tags::tag><tags::open_tag><tags::id>b</tags::id></tags::open_tag><tags::_repeat_tag><tags::tag><tags::open_tag><tags::id>c</tags::id></tags::open_tag><tags::_repeat_tag></tags::_repeat_tag><tags::close_tag><tags::id>c</tags::id></tags::close_tag></tags::tag><tags::tag><tags::open_tag><tags::id>m</tags::id></tags::open_tag><tags::_repeat_tag></tags::_repeat_tag><tags::close_tag><tags::id>m</tags::id></tags::close_tag></tags::tag><tags::tag><tags::open_tag><tags::id>n</tags::id></tags::open_tag><tags::_repeat_tag></tags::_repeat_tag><tags::close_tag><tags::id>n</tags::id></tags::close_tag></tags::tag></tags::_repeat_tag><tags::close_tag><tags::id>b</tags::id></tags::close_tag></tags::tag></tags::_repeat_tag><tags::close_tag><tags::id>a</tags::id></tags::close_tag></tags::tag></tags::_repeat_tag><tags::SEMI_NL>;
</tags::SEMI_NL></tags::start>got structure
|