checkpoint
[sbp.git] / TODO
1 _____________________________________________________________________________
2 Immediately
3
4   * we can nuke Atom.toAtom() now!
5   - Topology crap is kinda messed up
6
7   - do Forest/Tree still need a Region?
8   - reconsider the degree of genericization
9   - GraphViz stuff pollutes the API...
10   - Forest needs a "manual access" API
11       - the unwrap bit in Forest makes it really hard to expose an API for forests
12
13   - evil problems with      (x y? z /ws)
14   - ParseFailed, GSS, Walk, Parser, Sequence, Forest
15   - copyright notices
16   - documentation
17
18   - grammar highlighting?
19   - comment indentation vs block indentation?
20   - { and } in <pre>
21   - recursive { { foo } }
22
23 ______________________________________________________________________________
24 v1.1
25
26   - finalize metagrammar and rdp-op's
27   - write some grammars
28       - Java grammar
29       - TeX (math?)
30       - URL (RFC)
31       - RFC2822 (email message/headers)
32   - clean up the whole Walk situation (?)
33
34
35 ______________________________________________________________________________
36 Soon
37
38   - serialization of parse tables
39
40   - "ambiguity modulo dropped fragments"?
41        - can this be checked statically?
42        - eliminated statically?
43
44   - substring parsing for better error messages
45
46   - Parameterized LR
47   - "Regular Right Part" grammars (NP Chapman, etc)
48   - Attribute unification
49
50   - inference of rejections for literals
51   - "prefer whitespace higher up" (?)
52
53   - Labeled edges on trees (associate a label with each slot in the
54     child array in Forest.Body?  might make equality tough) --
55     equivalent to Feature Structures.  Colon-labeling.
56
57 ______________________________________________________________________________
58 Later
59
60   - Partly-Linear-PATR? (O(n^6) unification grammar)
61
62   - Implement a k-token peek buffer (for each state, see if it "dead
63     ends" during the next k Phases based solely on state -- ignoring
64     result SPPF)
65
66   - Arrange for the SPPF corresponding to dropped subtrees to never be
67     generated (or merged, etc)
68
69   - Is there any way we can avoid creating a GSS.Node instance for
70     nodes which are transient in the sense that they have only one
71     eligible reduction?
72
73   - Re-read Rekers, particularly the stuff on optimal sharing
74
75   - Isolate the Element objects from Parse.Table/GSS so we can move
76     towards compilation.
77
78   - consider allowing a Forest.Body to represent some other Tree whose
79     Body's should be [recursively] considered part of this Forest.
80
81       - perhaps not: right now we have a nice situation where
82         Forest.Ref instances become immutable once iterator()ed.  This
83         also gives us a strong place to to culling with the certainty
84         that we won't throw out a Body which would later be salvaged
85         by some yet-to-be-added dependency.
86
87   - Figure out if there is a way to:
88
89       - allow unwrapping of children other than the very last one.
90
91       - fold repetitions into an array form in Forest, before
92         conversion to Tree.  The major problem here is that multiple
93         tree-arrays are possible, all of different lengths.  Worse,
94         even if they're all the same length, not all elements belong
95         in the same "possibility vector" as all others.  You
96         essentially need a GSS to represent the array, which perhaps
97         is what the unfolded form was in the first place.
98
99   - Wikipedia grammar (needs to be both lexerless and boolean)
100
101   - Boolean Parsing
102       => Ordered Choice (";" operator)
103
104   - bring back in parse-table phase resolution of precedence (just
105     like associativity).  This can be inferred from the use of ">"
106     when the rules are in one of these special forms:
107
108        E ::=  E     _
109            >  _     E
110
111        E ::=  _     E
112            >  E  _  E
113
114        E ::=  E  _  E
115            >  E  _  E
116
117     where "_" is anything and "E" is the defining nonterminal.
118     Essentially what we're looking for is the situation where the
119     leftmost portion of one rule produces another rule, and the
120     rightmost portion of the latter produces the former.
121
122     I'm not 100% certain that this is as "strong" as the prefer/avoid
123     form (try to prove this, you probably can), but it's "what people
124     intend" most of the time.
125
126   - implement Johnstone's algorithm for "reduced, resolved LR
127     tables" to eliminate superfluous reductions on
128     epsilon-transitions.
129
130 ______________________________________________________________________________
131 Neat Ideas
132
133   - Rekers & Koorn note that GLR Substring Parsing can be used to do
134     really elegant and generalized "autocompletion".
135
136
137 ______________________________________________________________________________
138 Ideas for the Future
139
140 - Incremental parse table construction
141 - "lazy GLR" and "lazy trees" -> language with first-class CF matching
142     - perhaps linear boolean grammars instead? (linear time, quad space)
143 - Forest parsing => chained parsers
144 - unification parsing, attributes, etc
145 - RRP grammars?
146 - Take another stab at maximal-match?  Nonterminal not-followed-by is
147   too strong.
148 - Error recovery based on substring parsing