a8ebafc8c79b90ed80603818a5a09eefb06dc1c6
[sbp.git] / src / edu / berkeley / sbp / misc / CharToken.java
1 package edu.berkeley.sbp.misc;
2 import java.io.*;
3 import java.util.*;
4 import java.lang.reflect.*;
5 import java.lang.ref.*;
6 import edu.berkeley.sbp.*;
7 import edu.berkeley.sbp.Token.Location;
8 import edu.berkeley.sbp.util.*;
9
10 /** an implementation of Token for streams of Java <tt>char</tt> values */
11 public class CharToken implements IntegerMappable {
12
13     public static class CharRange extends Atom<CharToken> {
14         private String esc(char c) { return StringUtil.escapify(c+"", "[]-~\\\"\'"); }
15         private Topology<CharToken> t;
16         public CharRange(Topology<CharToken> t) { this.t = t; }
17         public Topology<CharToken> top() { return t; }
18         public String toString() {
19             StringBuffer sb = new StringBuffer();
20             sb.append('[');
21             Range.Set ranges = ((IntegerTopology)top()).getRanges();
22             if (ranges.size() == -1 || ranges.size() > Character.MAX_VALUE/2) {
23                 sb.append('~');
24                 ranges = ranges.complement();
25             }
26             ranges = ranges.intersect(all);
27             for(Range r : ranges) {
28                 if (r.isMinNegInf() || r.isMaxPosInf()) throw new Error("should not happen");
29                 if (r.getMin()==r.getMax()) {
30                     sb.append(esc((char)r.getMin()));
31                 } else{
32                     sb.append(esc((char)r.getMin()));
33                     sb.append('-');
34                     sb.append(esc((char)r.getMax()));
35                 }
36             }
37             sb.append(']');
38             return sb.toString();
39         }
40     }
41
42     /** returns an element matching all characters between <tt>start</tt> and <tt>end</tt>, inclusive */
43     public static Atom positiveRange(char start, char end) {
44         return new CharRange(new IntegerTopology<CharToken>(new Range.Set(new Range((int)start, (int)end))));
45     }
46
47     /** returns an element matching all characters <b>not</b> between <tt>start</tt> and <tt>end</tt>, inclusive */
48     public static Atom negativeRange(char start, char end) {
49         return new CharRange(new IntegerTopology<CharToken>(new Range.Set(new Range((int)start, (int)end)).complement().intersect(all)));
50     }
51
52     public static final Atom leftBrace  = new CharRange(new IntegerTopology<CharToken>(9998)) { public String toString() { return "{"; } };
53     public static final Atom rightBrace = new CharRange(new IntegerTopology<CharToken>(9999)) { public String toString() { return "}"; } };
54     public static final CharToken left       = new CharToken((char)9998);
55     public static final CharToken right      = new CharToken((char)9999);
56
57     private static final Range.Set all = new Range.Set(new Range(0, Character.MAX_VALUE));
58     public  static final Atom      any = new CharRange(new IntegerTopology<CharToken>(all));
59     public  static final Atom     none = new CharRange(new IntegerTopology<CharToken>());
60     public static IntegerTopology<CharToken> range(Range r) { return new IntegerTopology<CharToken>(r); }
61     public static Atom set(Range.Set r) { return new CharRange(new IntegerTopology<CharToken>(r)); }
62
63     /** returns an element which exactly matches the string given */
64     public static Element string(String s) {
65         if (s.length() == 0) return Union.epsilon;
66         final String escapified = "\""+StringUtil.escapify(s, "\"\r\n\\")+"\"";
67         Element ret;
68         if (s.length() == 1) {
69             ret =
70                 new CharRange(new IntegerTopology<CharToken>((int)s.charAt(0))) {
71                     public String toString() { return escapified; } };
72         } else {
73             Union ret2 = new Union("\""+s+"\"_str", true) {
74                     public String toString() { return escapified; } };
75             Element[] refs = new Element[s.length()];
76             for(int i=0; i<refs.length; i++) refs[i] = new CharRange(new IntegerTopology<CharToken>((int)s.charAt(i)));
77             ret2.add(Sequence.constant(refs, s, null, null));
78             ret = ret2;
79         }
80         return ret;
81     }
82
83     /** FIXME */
84     public static Topology<CharToken> top() { return new IntegerTopology<CharToken>(); }
85     public static Topology<CharToken> top(String s) throws java.text.ParseException {
86         return new IntegerTopology<CharToken>(Range.Set.parse(s));
87     }
88
89     // Private //////////////////////////////////////////////////////////////////////////////
90
91     public final char c;
92     public CharToken(char c)        { this.c = c; }
93     public String result()          { return c+""; }
94     public String  toString()       { return "\'"+StringUtil.escapify(c+"")+"\'"; }
95
96     //////////////////////////////////////////////////////////////////////////////////////////
97
98     public int toInt() { return (int)c; }
99
100     public static class Stream extends CartesianInput<CharToken> {
101         private final Reader r;
102         
103         public Stream(String s)                { this(new StringReader(s)); }
104         public Stream(Reader r)                { this(r, null); }
105         public Stream(Reader r,      String s) { this.r = r; }
106         public Stream(InputStream i)           { this(i, null); }
107         public Stream(InputStream i, String s) { this(new InputStreamReader(i), s); }
108
109         boolean cr = false;
110         public boolean   isCR() { return cr; }
111         public CharToken next() throws IOException {
112             cr = false;
113             int i = r.read();
114             if (i==-1) return null;
115             char c = (char)i;
116             cr = c=='\n';
117             return new CharToken(c);
118         }
119     }
120 }