2003/06/09 06:38:36
[org.ibex.core.git] / src / org / xwt / js / Lexer.java
index 123491c..4752c64 100644 (file)
-// This file was derived from org.mozilla.javascript.TokenStream; it\r
-// is covered by the NPL 1.1.\r
-\r
-/**\r
- * The contents of this file are subject to the Netscape Public\r
- * License Version 1.1 (the "License"); you may not use this file\r
- * except in compliance with the License. You may obtain a copy of\r
- * the License at http://www.mozilla.org/NPL/\r
- *\r
- * Software distributed under the License is distributed on an "AS\r
- * IS" basis, WITHOUT WARRANTY OF ANY KIND, either express or\r
- * implied. See the License for the specific language governing\r
- * rights and limitations under the License.\r
- *\r
- * The Initial Developer of the Original Code is Netscape\r
- * Communications Corporation.\r
- *\r
- * Contributor(s): Roger Lawrence, Mike McCabe\r
- */\r
-\r
-package org.xwt.js;\r
-import java.io.*;\r
-\r
-class Lexer {\r
-\r
-    SmartReader in;\r
-    int op;\r
-    Number number;\r
-    String string;\r
-    public Lexer(Reader r) { in = new SmartReader(r); }\r
-\r
-    // Token Constants //////////////////////////////////////////////////////////\r
-\r
-    public final static int\r
-        EOL         = 1,   // end of line\r
-        RETURN      = 5,\r
-        GOTO        = 6,\r
-        BITOR       = 11,\r
-        BITXOR      = 12,\r
-        BITAND      = 13,\r
-        EQ          = 14,\r
-        NE          = 15,\r
-        LT          = 16,\r
-        LE          = 17,\r
-        GT          = 18,\r
-        GE          = 19,\r
-        LSH         = 20,\r
-        RSH         = 21,\r
-        URSH        = 22,\r
-        ADD         = 23,\r
-        SUB         = 24,\r
-        MUL         = 25,\r
-        DIV         = 26,\r
-        MOD         = 27,\r
-        BITNOT      = 28,\r
-        DELPROP     = 31,\r
-        TYPEOF      = 32,\r
-        NAME        = 44,\r
-        NUMBER      = 45,\r
-        STRING      = 46,\r
-        NULL        = 49,\r
-        THIS        = 50,\r
-        FALSE       = 51,\r
-        TRUE        = 52,\r
-        SHEQ        = 53,   // shallow equality (===)\r
-        SHNE        = 54,   // shallow inequality (!==)\r
-        THROW       = 62,\r
-        IN          = 63,\r
-        INSTANCEOF  = 64,\r
-        TRY         = 75,\r
-        SEMI        = 89,  // semicolon\r
-        LB          = 90,  // left bracket\r
-        RB          = 91,  // right bracket\r
-        LC          = 92,  // left curly brace\r
-        RC          = 93,  // right curly brace\r
-        LP          = 94,  // left paren\r
-        RP          = 95,  // right paren\r
-        COMMA       = 96,  // comma operator\r
-        ASSIGN      = 97,  // assignment ops (= += -= etc.)\r
-        HOOK        = 98,  // conditional (?:)\r
-        COLON       = 99,  // colon\r
-        OR          = 100, // logical or (||)\r
-        AND         = 101, // logical and (&&)\r
-        EQOP        = 102, // equality ops (== !=)\r
-        RELOP       = 103, // relational ops (< <= > >=)\r
-        SHOP        = 104, // shift ops (<< >> >>>)\r
-        UNARYOP     = 105, // unary prefix operator\r
-        INC         = 106, // increment (++)\r
-        DEC         = 107, // decrement (--)\r
-        DOT         = 108, // member operator (.)\r
-        PRIMARY     = 109, // true, false, null, this\r
-        FUNCTION    = 110, // function keyword\r
-        \r
-        IF          = 113, // if keyword\r
-        ELSE        = 114, // else keyword\r
-        SWITCH      = 115, // switch keyword\r
-        CASE        = 116, // case keyword\r
-        DEFAULT     = 117, // default keyword\r
-        WHILE       = 118, // while keyword\r
-        DO          = 119, // do keyword\r
-        FOR         = 120, // for keyword\r
-        BREAK       = 121, // break keyword\r
-        CONTINUE    = 122, // continue keyword\r
-        VAR         = 123, // var keyword\r
-        WITH        = 124, // with keyword\r
-        CATCH       = 125, // catch keyword\r
-        FINALLY     = 126, // finally keyword\r
-        RESERVED    = 127, // reserved keywords\r
-        NOP         = 128, // NOP\r
-        VOID        = 132, // void keyword\r
-        ASSERT      = 150; // assert keyword\r
-\r
-\r
-    // Predicates ///////////////////////////////////////////////////////////////////////\r
-\r
-    protected static boolean isJSIdentifier(String s) {\r
-        int length = s.length();\r
-        if (length == 0 || !Character.isJavaIdentifierStart(s.charAt(0))) return false;\r
-        for (int i=1; i<length; i++) {\r
-            char c = s.charAt(i);\r
-            if (!Character.isJavaIdentifierPart(c) && c == '\\' && !((i + 5) < length) &&\r
-                (s.charAt(i + 1) == 'u') && 0 <= xDigitToInt(s.charAt(i + 2)) && 0 <= xDigitToInt(s.charAt(i + 3)) && \r
-                0 <= xDigitToInt(s.charAt(i + 4)) && 0 <= xDigitToInt(s.charAt(i + 5)))\r
-                return false;\r
-        }\r
-        return true;\r
-    }\r
-\r
-    private static boolean isAlpha(int c) { return ((c >= 'a' && c <= 'z') || (c >= 'A' && c <= 'Z')); }\r
-    private static boolean isDigit(int c) { return (c >= '0' && c <= '9'); }\r
-    private static boolean isLineBreak(int c) { return (c == '\n' || c == '\r' || c == 0x2028 || c == 0x2029); }\r
-    private static int xDigitToInt(int c) {\r
-        if ('0' <= c && c <= '9') return c - '0';\r
-        if ('a' <= c && c <= 'f') return c - ('a' - 10);\r
-        if ('A' <= c && c <= 'F') return c - ('A' - 10);\r
-        return -1;\r
-    }\r
-    public static boolean isWhiteSpace(int c) {\r
-        if (c == '\u0020' || c == '\u0009' || c == '\u000C' || c == '\u000B' || c == '\u00A0') return true;\r
-        return Character.getType((char)c) == Character.SPACE_SEPARATOR;\r
-    }\r
-\r
-    \r
-    // Token Subtype Handlers /////////////////////////////////////////////////////////\r
-\r
-    private int getKeyword(String name) throws IOException {\r
-        final int    \r
-            Id_break         = BREAK,\r
-            Id_case          = CASE,\r
-            Id_continue      = CONTINUE,\r
-            Id_default       = DEFAULT,\r
-            Id_delete        = DELPROP,\r
-            Id_do            = DO,\r
-            Id_else          = ELSE,\r
-            Id_false         = PRIMARY | (FALSE << 8),\r
-            Id_for           = FOR,\r
-            Id_function      = FUNCTION,\r
-            Id_if            = IF,\r
-            Id_in            = RELOP | (IN << 8),\r
-            Id_null          = PRIMARY | (NULL << 8),\r
-            Id_return        = RETURN,\r
-            Id_switch        = SWITCH,\r
-            Id_this          = PRIMARY | (THIS << 8),\r
-            Id_true          = PRIMARY | (TRUE << 8),\r
-            Id_typeof        = UNARYOP | (TYPEOF << 8),\r
-            Id_var           = VAR,\r
-            Id_void          = UNARYOP | (VOID << 8),\r
-            Id_while         = WHILE,\r
-            Id_with          = WITH,\r
-\r
-            // the following are #ifdef RESERVE_JAVA_KEYWORDS in jsscan.c\r
-            Id_abstract      = RESERVED,\r
-            Id_boolean       = RESERVED,\r
-            Id_byte          = RESERVED,\r
-            Id_catch         = CATCH,\r
-            Id_char          = RESERVED,\r
-            Id_class         = RESERVED,\r
-            Id_const         = RESERVED,\r
-            Id_debugger      = RESERVED,\r
-            Id_double        = RESERVED,\r
-            Id_enum          = RESERVED,\r
-            Id_extends       = RESERVED,\r
-            Id_final         = RESERVED,\r
-            Id_finally       = FINALLY,\r
-            Id_float         = RESERVED,\r
-            Id_goto          = RESERVED,\r
-            Id_implements    = RESERVED,\r
-            Id_instanceof    = RELOP | (INSTANCEOF << 8),\r
-            Id_int           = RESERVED,\r
-            Id_interface     = RESERVED,\r
-            Id_long          = RESERVED,\r
-            Id_native        = RESERVED,\r
-            Id_package       = RESERVED,\r
-            Id_private       = RESERVED,\r
-            Id_protected     = RESERVED,\r
-            Id_public        = RESERVED,\r
-            Id_assert        = ASSERT,\r
-            Id_short         = RESERVED,\r
-            Id_static        = RESERVED,\r
-            Id_super         = RESERVED,\r
-            Id_synchronized  = RESERVED,\r
-            Id_throw         = THROW,\r
-            Id_throws        = RESERVED,\r
-            Id_transient     = RESERVED,\r
-            Id_try           = TRY,\r
-            Id_volatile      = RESERVED;\r
-        \r
-        int id;\r
-        String s = name;\r
-        L0: { id = -1; String X = null; int c;\r
-            L: switch (s.length()) {\r
-            case 2: c=s.charAt(1);\r
-                if (c=='f') { if (s.charAt(0)=='i') {id=Id_if; break L0;} }\r
-                else if (c=='n') { if (s.charAt(0)=='i') {id=Id_in; break L0;} }\r
-                else if (c=='o') { if (s.charAt(0)=='d') {id=Id_do; break L0;} }\r
-                break L;\r
-            case 3: switch (s.charAt(0)) {\r
-                case 'f': if (s.charAt(2)=='r' && s.charAt(1)=='o') {id=Id_for; break L0;} break L;\r
-                case 'i': if (s.charAt(2)=='t' && s.charAt(1)=='n') {id=Id_int; break L0;} break L;\r
-                case 'n': if (s.charAt(2)=='w' && s.charAt(1)=='e')\r
-                    throw new IOException("the new keyword is not permitted in XWT scripts");\r
-                    break L;\r
-                case 't': if (s.charAt(2)=='y' && s.charAt(1)=='r') {id=Id_try; break L0;} break L;\r
-                case 'v': if (s.charAt(2)=='r' && s.charAt(1)=='a') {id=Id_var; break L0;} break L;\r
-                } break L;\r
-            case 4: switch (s.charAt(0)) {\r
-                case 'b': X="byte";id=Id_byte; break L;\r
-                case 'c': c=s.charAt(3);\r
-                    if (c=='e') { if (s.charAt(2)=='s' && s.charAt(1)=='a') {id=Id_case; break L0;} }\r
-                    else if (c=='r') { if (s.charAt(2)=='a' && s.charAt(1)=='h') {id=Id_char; break L0;} }\r
-                    break L;\r
-                case 'e': c=s.charAt(3);\r
-                    if (c=='e') { if (s.charAt(2)=='s' && s.charAt(1)=='l') {id=Id_else; break L0;} }\r
-                    else if (c=='m') { if (s.charAt(2)=='u' && s.charAt(1)=='n') {id=Id_enum; break L0;} }\r
-                    break L;\r
-                case 'g': X="goto";id=Id_goto; break L;\r
-                case 'l': X="long";id=Id_long; break L;\r
-                case 'n': X="null";id=Id_null; break L;\r
-                case 't': c=s.charAt(3);\r
-                    if (c=='e') { if (s.charAt(2)=='u' && s.charAt(1)=='r') {id=Id_true; break L0;} }\r
-                    else if (c=='s') { if (s.charAt(2)=='i' && s.charAt(1)=='h') {id=Id_this; break L0;} }\r
-                    break L;\r
-                case 'v': X="void";id=Id_void; break L;\r
-                case 'w': X="with";id=Id_with; break L;\r
-                } break L;\r
-            case 5: switch (s.charAt(2)) {\r
-                case 'a': X="class";id=Id_class; break L;\r
-                case 'e': X="break";id=Id_break; break L;\r
-                case 'i': X="while";id=Id_while; break L;\r
-                case 'l': X="false";id=Id_false; break L;\r
-                case 'n': c=s.charAt(0);\r
-                    if (c=='c') { X="const"; throw new IOException("the const keyword is not permitted in XWT"); }\r
-                    else if (c=='f') { X="final";id=Id_final; }\r
-                    break L;\r
-                case 'o': c=s.charAt(0);\r
-                    if (c=='f') { X="float";id=Id_float; }\r
-                    else if (c=='s') { X="short";id=Id_short; }\r
-                    break L;\r
-                case 'p': X="super";id=Id_super; break L;\r
-                case 'r': X="throw";id=Id_throw; break L;\r
-                case 't': X="catch";id=Id_catch; break L;\r
-                } break L;\r
-            case 6: switch (s.charAt(1)) {\r
-                case 'a': X="native";id=Id_native; break L;\r
-                case 'e': c=s.charAt(0);\r
-                    if (c=='d') { X="delete"; throw new IOException("the delete keyword is not permitted in XWT scripts"); }\r
-                    else if (c=='r') { X="return";id=Id_return; }\r
-                    break L;\r
-                case 'h': X="throws";id=Id_throws; break L;\r
-                case 'o': X="double";id=Id_double; break L;\r
-                case 's': X="assert";id=Id_assert; break L;\r
-                case 'u': X="public";id=Id_public; break L;\r
-                case 'w': X="switch";id=Id_switch; break L;\r
-                case 'y': X="typeof";id=Id_typeof; break L;\r
-                } break L;\r
-            case 7: switch (s.charAt(1)) {\r
-                case 'a': X="package";id=Id_package; break L;\r
-                case 'e': X="default";id=Id_default; break L;\r
-                case 'i': X="finally";id=Id_finally; break L;\r
-                case 'o': X="boolean";id=Id_boolean; break L;\r
-                case 'r': X="private";id=Id_private; break L;\r
-                case 'x': X="extends";id=Id_extends; break L;\r
-                } break L;\r
-            case 8: switch (s.charAt(0)) {\r
-                case 'a': X="abstract";id=Id_abstract; break L;\r
-                case 'c': X="continue";id=Id_continue; break L;\r
-                case 'd': X="debugger";id=Id_debugger; break L;\r
-                case 'f': X="function";id=Id_function; break L;\r
-                case 'v': X="volatile";id=Id_volatile; break L;\r
-                } break L;\r
-            case 9: c=s.charAt(0);\r
-                if (c=='i') { X="interface";id=Id_interface; }\r
-                else if (c=='p') { X="protected";id=Id_protected; }\r
-                else if (c=='t') { X="transient";id=Id_transient; }\r
-                break L;\r
-            case 10: c=s.charAt(1);\r
-                if (c=='m') { X="implements";id=Id_implements; }\r
-                else if (c=='n') { X="instanceof"; throw new IOException("the instanceof keyword is not permitted in XWT scripts"); }\r
-                break L;\r
-            case 12: X="synchronized";id=Id_synchronized; break L;\r
-            }\r
-            if (X!=null && X!=s && !X.equals(s)) id = -1;\r
-        }\r
-        if (id == -1) { return -1; }\r
-        this.op = id >> 8;\r
-        return id & 0xff;\r
-    }\r
-\r
-    private int getIdentifier(int c) throws IOException {\r
-        in.startString();\r
-        while (Character.isJavaIdentifierPart((char)(c = in.read())));\r
-        in.unread();\r
-        String str = in.getString();\r
-        int result = getKeyword(str);\r
-        if (result != -1) return result;\r
-        this.string = str;\r
-        return NAME;\r
-    }\r
-    \r
-    private int getNumber(int c) throws IOException {\r
-        int base = 10;\r
-        in.startString();\r
-        double dval = Double.NaN;\r
-        long longval = 0;\r
-        boolean isInteger = true;\r
-        \r
-        // figure out what base we're using\r
-        if (c == '0') {\r
-            if (Character.toLowerCase((char)(c = in.read())) == 'x') { base = 16; in.startString(); }\r
-            else if (isDigit(c)) base = 8;\r
-        }\r
-        \r
-        while (0 <= xDigitToInt(c) && !(base < 16 && isAlpha(c))) c = in.read();\r
-        if (base == 10 && (c == '.' || c == 'e' || c == 'E')) {\r
-            isInteger = false;\r
-            if (c == '.') do { c = in.read(); } while (isDigit(c));\r
-            if (c == 'e' || c == 'E') {\r
-                c = in.read();\r
-                if (c == '+' || c == '-') c = in.read();\r
-                if (!isDigit(c)) throw new IOException("msg.missing.exponent");\r
-                do { c = in.read(); } while (isDigit(c));\r
-            }\r
-        }\r
-        in.unread();\r
-\r
-        String numString = in.getString();\r
-        if (base == 10 && !isInteger) {\r
-            try { dval = (Double.valueOf(numString)).doubleValue(); }\r
-            catch (NumberFormatException ex) { throw new IOException("msg.caught.nfe"); }\r
-        } else {\r
-            if (isInteger) {\r
-                longval = Long.parseLong(numString, base);\r
-                dval = (double)longval;\r
-            else {\r
-                // FIXME: we're not handling hex/octal fractions... does that matter?\r
-                dval = Double.parseDouble(numString);\r
-                longval = (long) dval;\r
-                if (longval == dval) isInteger = true;\r
-            }\r
-        }\r
-        \r
-        if (!isInteger) this.number = new Double(dval);\r
-        else if (Byte.MIN_VALUE <= longval && longval <= Byte.MAX_VALUE) this.number = new Byte((byte)longval);\r
-        else if (Short.MIN_VALUE <= longval && longval <= Short.MAX_VALUE) this.number = new Short((short)longval);\r
-        else if (Integer.MIN_VALUE <= longval && longval <= Integer.MAX_VALUE) this.number = new Integer((int)longval);\r
-        else this.number = new Double(longval);\r
-        return NUMBER;\r
-    }\r
-    \r
-    private int getString(int c) throws IOException {\r
-        StringBuffer stringBuf = null;\r
-        int quoteChar = c;\r
-        int val = 0;\r
-        c = in.read();\r
-        in.startString(); // start after the first "\r
-        while(c != quoteChar) {\r
-            if (c == '\n' || c == -1) throw new IOException("msg.unterminated.string.lit");\r
-            if (c == '\\') {\r
-                if (stringBuf == null) {\r
-                    in.unread();   // Don't include the backslash\r
-                    stringBuf = new StringBuffer(in.getString());\r
-                    in.read();\r
-                }\r
-                switch (c = in.read()) {\r
-                case 'b': c = '\b'; break;\r
-                case 'f': c = '\f'; break;\r
-                case 'n': c = '\n'; break;\r
-                case 'r': c = '\r'; break;\r
-                case 't': c = '\t'; break;\r
-                case 'v': c = '\u000B'; break;\r
-                default: throw new IOException("\\u and \\0 escapes not currently supported -- use XML entities");\r
-                }\r
-            }\r
-            if (stringBuf != null) stringBuf.append((char) c);\r
-            c = in.read();\r
-        }\r
-        if (stringBuf != null) this.string = stringBuf.toString();\r
-        else {\r
-            in.unread(); // miss the trailing "\r
-            this.string = in.getString();\r
-            in.read();\r
-        }\r
-        return STRING;\r
-    }\r
-\r
-    // hack because you can't do "foo ? 1 : (bar(); 2)" in Java\r
-    final int op(int set, int ret) { this.op = set; return ret; }\r
-\r
-    public int getToken() throws IOException {\r
-        int c;\r
-        do { if ((c = in.read()) == '\n') break; } while (isWhiteSpace(c) || c == '\n');\r
-        if (c == -1) return -1;\r
-        if (c == '\\' && in.peek() == 'u') throw new IOException("\\u and \\0 escapes not currently supported -- use XML entities");\r
-        if (Character.isJavaIdentifierStart((char)c)) return getIdentifier(c);\r
-        if (isDigit(c) || (c == '.' && isDigit(in.peek()))) return getNumber(c);\r
-        if (c == '"' || c == '\'') return getString(c);\r
-        switch (c) {\r
-        case '\n': return EOL;\r
-        case ';': return SEMI;\r
-        case '[': return LB;\r
-        case ']': return RB;\r
-        case '{': return LC;\r
-        case '}': return RC;\r
-        case '(': return LP;\r
-        case ')': return RP;\r
-        case ',': return COMMA;\r
-        case '?': return HOOK;\r
-        case ':': return COLON;\r
-        case '.': return DOT;\r
-        case '|': return in.match('|') ? OR : (in.match('=') ? op(BITOR, ASSIGN) : BITOR);\r
-        case '^': return in.match('=') ? op(BITXOR, ASSIGN) : BITXOR;\r
-        case '&': return in.match('&') ? AND : in.match('=') ? op(BITAND, ASSIGN) : BITAND;\r
-        case '=': return !in.match('=') ? op(NOP, ASSIGN) : op(in.match('=') ? SHEQ : EQ, EQOP);\r
-        case '!': return !in.match('=') ? op(NOP, UNARYOP) : op(in.match('=') ? SHNE : NE, EQOP);\r
-        case '%': return op(MOD, in.match('=') ? ASSIGN : MOD);\r
-        case '~': return op(BITNOT, UNARYOP);\r
-        case '+': return in.match('=') ? op(ADD, ASSIGN) : in.match('+') ? INC : ADD;\r
-        case '-': return in.match('=') ? op(SUB, ASSIGN) : in.match('-') ? DEC : SUB;\r
-        case '*': return in.match('=') ? op(MUL, ASSIGN) : MUL;\r
-        case '<': return !in.match('<') ?\r
-                      op(in.match('=') ? LE : LT, RELOP) :\r
-                      in.match('=') ? op(LSH, ASSIGN) : op(LSH, SHOP);\r
-        case '>': return !in.match('>') ?\r
-                      op(in.match('=') ? GE : GT, RELOP) :\r
-                      in.match('>') ?\r
-                          op(URSH, in.match('=') ? ASSIGN : SHOP) :\r
-                          op(RSH, in.match('=') ? ASSIGN : SHOP);\r
-        case '/':\r
-            if (in.match('=')) { op(DIV, ASSIGN); }\r
-            if (in.match('/')) { while ((c = in.read()) != -1 && c != '\n'); in.unread(); return getToken(); }\r
-            if (!in.match('*')) return DIV;\r
-            while ((c = in.read()) != -1 && !(c == '*' && in.match('/'))) {\r
-                if (c == '\n' || c != '/' || !in.match('*')) continue;\r
-                if (in.match('/')) return getToken();\r
-                throw new IOException("msg.nested.comment");\r
-            }\r
-            if (c == -1) throw new IOException("msg.unterminated.comment");\r
-            return getToken();  // `goto retry'\r
-        default: throw new IOException("illegal character: " + c);\r
-        }\r
-    }\r
-\r
-    private static class SmartReader {\r
-        PushbackReader reader = null;\r
-        int lastread = -1;\r
-\r
-        public SmartReader(Reader r) { reader = new PushbackReader(r); }\r
-        public void unread() throws IOException { reader.unread(lastread); }\r
-        public boolean match(char c) throws IOException { if (peek() == c) { reader.read(); return true; } else return false; }\r
-        public int peek() throws IOException {\r
-            int peeked = reader.read();\r
-            if (peeked != -1) reader.unread((char)peeked);\r
-            return peeked;\r
-        }\r
-        public int read() throws IOException {\r
-            lastread = reader.read();\r
-            if (accumulator != null) accumulator.append(lastread);\r
-            return lastread;\r
-        }\r
-\r
-        // FIXME: could be much more efficient\r
-        StringBuffer accumulator = null;\r
-        public void startString() { accumulator = new StringBuffer(); }\r
-        public String getString() throws IOException {\r
-            String ret = accumulator.toString();\r
-            accumulator = null;\r
-            return ret;\r
-        }\r
-    }\r
-\r
-}\r
+// Derived from org.mozilla.javascript.TokenStream [NPL]
+
+/**
+ * The contents of this file are subject to the Netscape Public
+ * License Version 1.1 (the "License"); you may not use this file
+ * except in compliance with the License. You may obtain a copy of
+ * the License at http://www.mozilla.org/NPL/
+ *
+ * Software distributed under the License is distributed on an "AS
+ * IS" basis, WITHOUT WARRANTY OF ANY KIND, either express or
+ * implied. See the License for the specific language governing
+ * rights and limitations under the License.
+ *
+ * The Initial Developer of the Original Code is Netscape
+ * Communications Corporation.
+ *
+ * Contributor(s): Roger Lawrence, Mike McCabe
+ */
+
+package org.xwt.js;
+import java.io.*;
+
+/** Lexes a stream of characters into a stream of Tokens */
+class Lexer implements Tokens {
+
+    /** for debugging */
+    public static void main(String[] s) throws Exception {
+       Lexer l = new Lexer(new InputStreamReader(System.in), "stdin", 0);
+       int tok = 0;
+       while((tok = l.getToken()) != -1) System.out.println(codeToString[tok]);
+    }
+
+    /** the token that was just parsed */
+    protected int op;
+
+    /** if the token just parsed was a NUMBER, this is the numeric value */
+    protected Number number = null;
+
+    /** if the token just parsed was a NAME or STRING, this is the string value */
+    protected String string = null;
+
+    /** the line number of the current token */
+    protected int line = 0;
+
+    /** the column number of the current token */
+    protected int col = 0;
+
+    /** the name of the source code file being lexed */
+    protected String sourceName;
+
+    private SmartReader in;
+    public Lexer(Reader r, String sourceName, int line) throws IOException {
+       this.sourceName = sourceName;
+       this.line = line;
+       in = new SmartReader(r);
+    }
+
+
+    // Predicates ///////////////////////////////////////////////////////////////////////
+
+    private static boolean isAlpha(int c) { return ((c >= 'a' && c <= 'z') || (c >= 'A' && c <= 'Z')); }
+    private static boolean isDigit(int c) { return (c >= '0' && c <= '9'); }
+    private static int xDigitToInt(int c) {
+        if ('0' <= c && c <= '9') return c - '0';
+        else if ('a' <= c && c <= 'f') return c - ('a' - 10);
+        else if ('A' <= c && c <= 'F') return c - ('A' - 10);
+        else return -1;
+    }
+
+    
+    // Token Subtype Handlers /////////////////////////////////////////////////////////
+
+    private int getKeyword(String s) throws IOException {
+       char c;
+       switch (s.length()) {
+            case 2: c=s.charAt(1);
+                if (c=='f') { if (s.charAt(0)=='i') return IF; }
+                else if (c=='n') { if (s.charAt(0)=='i') return IN; }
+                else if (c=='o') { if (s.charAt(0)=='d') return DO; }
+                break;
+            case 3: switch (s.charAt(0)) {
+                case 'a': if (s.charAt(2)=='d' && s.charAt(1)=='n') return AND; break;
+                case 'f': if (s.charAt(2)=='r' && s.charAt(1)=='o') return FOR; break;
+                case 'i': if (s.charAt(2)=='t' && s.charAt(1)=='n') return RESERVED;
+                case 'n': if (s.charAt(2)=='w' && s.charAt(1)=='e') return RESERVED;
+                case 't': if (s.charAt(2)=='y' && s.charAt(1)=='r') return TRY; break;
+                case 'v': if (s.charAt(2)=='r' && s.charAt(1)=='a') return VAR; break;
+                } break;
+            case 4: switch (s.charAt(0)) {
+                case 'b': return s.equals("byte") ? RESERVED : -1;
+                case 'c': c=s.charAt(3);
+                    if (c=='e') { if (s.charAt(2)=='s' && s.charAt(1)=='a') return CASE; }
+                    else if (c=='r') { if (s.charAt(2)=='a' && s.charAt(1)=='h') return RESERVED; }
+                   return -1;
+                case 'e': c=s.charAt(3);
+                    if (c=='e') { if (s.charAt(2)=='s' && s.charAt(1)=='l') return ELSE; }
+                    else if (c=='m') { if (s.charAt(2)=='u' && s.charAt(1)=='n') return RESERVED; }
+                   return -1;
+                case 'g': return s.equals("goto") ? RESERVED : -1;
+               case 'l': return s.equals("long") ? RESERVED : -1;
+                case 'n': return s.equals("null") ? NULL : -1;
+                case 't': c=s.charAt(3);
+                    if (c=='e') { if (s.charAt(2)=='u' && s.charAt(1)=='r') return TRUE; }
+                    else if (c=='s') { if (s.charAt(2)=='i' && s.charAt(1)=='h') return THIS; }
+                   return -1;
+               case 'w': if (s.equals("with")) return RESERVED; else return -1;
+               case 'v': if (s.equals("void")) return RESERVED; else return -1;
+                } break;
+            case 5: switch (s.charAt(2)) {
+                case 'a': return s.equals("class") ? RESERVED : -1;
+               case 'e': return s.equals("break") ? BREAK : -1;
+                case 'i': return s.equals("while") ? WHILE : -1;
+               case 'l': return s.equals("false") ? FALSE : -1;
+                case 'n': c=s.charAt(0);
+                   if (s.equals("const")) return RESERVED;
+                    else if (s.equals("final")) return RESERVED;
+                   return -1;
+               case 'o': c=s.charAt(0);
+                   if (c == 'c') return s.equals("float") ? RESERVED : -1;
+                   else if (c=='s') return s.equals("final") ? RESERVED : -1;
+                   break;
+               case 'p': return s.equals("super") ? RESERVED : -1;
+                case 'r': return s.equals("throw") ? THROW : -1;
+                case 't': return s.equals("catch") ? CATCH : -1;
+                } break;
+            case 6: switch (s.charAt(1)) {
+               case 'a': return s.equals("class") ? RESERVED : -1;
+                case 'e': c=s.charAt(0);
+                    if (s.equals("delete")) return RESERVED;
+                    else if (c=='r') return s.equals("return") ? RETURN : -1;
+                    break;
+               case 'h': return s.equals("throws") ? RESERVED : -1;
+                case 'o': return s.equals("double") ? RESERVED : -1;
+                case 's': return s.equals("assert") ? ASSERT : -1;
+                case 'u': return s.equals("public") ? RESERVED : -1;
+                case 'w': return s.equals("switch") ? SWITCH : -1;
+                case 'y': return s.equals("typeof") ? TYPEOF : -1;
+                } break;
+            case 7: switch (s.charAt(1)) {
+                case 'a': return s.equals("package") ? RESERVED : -1;
+                case 'e': return s.equals("default") ? DEFAULT : -1;
+                case 'i': return s.equals("finally") ? FINALLY : -1;
+                case 'o': return s.equals("boolean") ? RESERVED : -1;
+                case 'r': return s.equals("private") ? RESERVED : -1;
+                case 'x': return s.equals("extends") ? RESERVED : -1;
+                } break;
+            case 8: switch (s.charAt(0)) {
+                case 'a': return s.equals("abstract") ? RESERVED : -1;
+                case 'c': return s.equals("continue") ? CONTINUE : -1;
+                case 'd': return s.equals("debugger") ? RESERVED : -1;
+                case 'f': return s.equals("function") ? FUNCTION : -1;
+                case 'v': return s.equals("volatile") ? RESERVED : -1;
+                } break;
+            case 9: c=s.charAt(0);
+                if (c=='i') return s.equals("interface") ? RESERVED : -1;
+                else if (c=='p') return s.equals("protected") ? RESERVED : -1;
+                else if (c=='t') return s.equals("transient") ? RESERVED : -1;
+                break;
+            case 10: c=s.charAt(1);
+                if (c=='m') return s.equals("implements") ? RESERVED : -1;
+                else if (c=='n' && s.equals("instanceof")) return RESERVED;
+                break;
+            case 12: return s.equals("synchronized") ? RESERVED : -1;
+            }
+       return -1;
+    }
+
+    private int getIdentifier(int c) throws IOException {
+        in.startString();
+        while (Character.isJavaIdentifierPart((char)(c = in.read())));
+        in.unread();
+        String str = in.getString();
+        int result = getKeyword(str);
+       if (result == RESERVED) throw new LexerException("The reserved word \"" + str + "\" is not permitted in XWT scripts");
+        if (result != -1) return result;
+        this.string = str.intern();
+        return NAME;
+    }
+    
+    private int getNumber(int c) throws IOException {
+        int base = 10;
+        in.startString();
+        double dval = Double.NaN;
+        long longval = 0;
+        boolean isInteger = true;
+        
+        // figure out what base we're using
+        if (c == '0') {
+            if (Character.toLowerCase((char)(c = in.read())) == 'x') { base = 16; in.startString(); }
+            else if (isDigit(c)) base = 8;
+        }
+        
+        while (0 <= xDigitToInt(c) && !(base < 16 && isAlpha(c))) c = in.read();
+        if (base == 10 && (c == '.' || c == 'e' || c == 'E')) {
+            isInteger = false;
+            if (c == '.') do { c = in.read(); } while (isDigit(c));
+            if (c == 'e' || c == 'E') {
+                c = in.read();
+                if (c == '+' || c == '-') c = in.read();
+                if (!isDigit(c)) throw new LexerException("float listeral did not have an exponent value");
+                do { c = in.read(); } while (isDigit(c));
+            }
+        }
+        in.unread();
+
+        String numString = in.getString();
+        if (base == 10 && !isInteger) {
+            try { dval = (Double.valueOf(numString)).doubleValue(); }
+            catch (NumberFormatException ex) { throw new LexerException("invalid numeric literal: \"" + numString + "\""); }
+        } else {
+            if (isInteger) {
+                longval = Long.parseLong(numString, base);
+                dval = (double)longval;
+           } else {
+                dval = Double.parseDouble(numString);
+                longval = (long) dval;
+                if (longval == dval) isInteger = true;
+            }
+        }
+        
+        if (!isInteger) this.number = new Double(dval);
+        else if (Byte.MIN_VALUE <= longval && longval <= Byte.MAX_VALUE) this.number = new Byte((byte)longval);
+        else if (Short.MIN_VALUE <= longval && longval <= Short.MAX_VALUE) this.number = new Short((short)longval);
+        else if (Integer.MIN_VALUE <= longval && longval <= Integer.MAX_VALUE) this.number = new Integer((int)longval);
+        else this.number = new Double(longval);
+        return NUMBER;
+    }
+    
+    private int getString(int c) throws IOException {
+        StringBuffer stringBuf = null;
+        int quoteChar = c;
+        int val = 0;
+        c = in.read();
+        in.startString(); // start after the first "
+        while(c != quoteChar) {
+            if (c == '\n' || c == -1) throw new LexerException("unterminated string literal");
+            if (c == '\\') {
+                if (stringBuf == null) {
+                    in.unread();   // Don't include the backslash
+                    stringBuf = new StringBuffer(in.getString());
+                    in.read();
+                }
+                switch (c = in.read()) {
+                case 'b': c = '\b'; break;
+                case 'f': c = '\f'; break;
+                case 'n': c = '\n'; break;
+                case 'r': c = '\r'; break;
+                case 't': c = '\t'; break;
+                case 'v': c = '\u000B'; break;
+                case '\\': c = '\\'; break;
+               case 'u': {
+                   int v = 0;
+                   for(int i=0; i<4; i++) {
+                       int ci = in.read();
+                       if (!((ci >= '0' && ci <= '9') || (ci >= 'a' && ci <= 'f') || (ci >= 'A' && ci <= 'F')))
+                           throw new LexerException("illegal character '" + ((char)c) + "' in \\u unicode escape sequence");
+                       v = (v << 8) | Integer.parseInt(ci + "", 16);
+                   }
+                   c = (char)v;
+                   break;
+               }
+                default:
+                   // just use the character that was escaped
+                   break;
+                }
+            }
+            if (stringBuf != null) stringBuf.append((char) c);
+            c = in.read();
+        }
+        if (stringBuf != null) this.string = stringBuf.toString().intern();
+        else {
+            in.unread(); // miss the trailing "
+            this.string = in.getString().intern();
+            in.read();
+        }
+        return STRING;
+    }
+
+    public int _getToken() throws IOException {
+        int c;
+        do { c = in.read(); } while (c == '\u0020' || c == '\u0009' || c == '\u000C' || c == '\u000B' || c == '\n' );
+        if (c == -1) return -1;
+        if (c == '\\' || Character.isJavaIdentifierStart((char)c)) return getIdentifier(c);
+        if (isDigit(c) || (c == '.' && isDigit(in.peek()))) return getNumber(c);
+        if (c == '"' || c == '\'') return getString(c);
+        switch (c) {
+        case ';': return SEMI;
+        case '[': return LB;
+        case ']': return RB;
+        case '{': return LC;
+        case '}': return RC;
+        case '(': return LP;
+        case ')': return RP;
+        case ',': return COMMA;
+        case '?': return HOOK;
+        case ':': return COLON;
+        case '.': return DOT;
+        case '|': return in.match('|') ? OR : (in.match('=') ? ASSIGN_BITOR : BITOR);
+        case '^': return in.match('=') ? ASSIGN_BITXOR : BITXOR;
+        case '&': return in.match('&') ? AND : in.match('=') ? ASSIGN_BITAND : BITAND;
+        case '=': return !in.match('=') ? ASSIGN : in.match('=') ? SHEQ : EQ;
+        case '!': return !in.match('=') ? BANG : in.match('=') ? SHNE : NE;
+        case '%': return in.match('=') ? ASSIGN_MOD : MOD;
+        case '~': return BITNOT;
+        case '+': return in.match('=') ? ASSIGN_ADD : in.match('+') ? INC : ADD;
+        case '-': return in.match('=') ? ASSIGN_SUB: in.match('-') ? DEC : SUB;
+        case '*': return in.match('=') ? ASSIGN_MUL : MUL;
+        case '<': return !in.match('<') ? (in.match('=') ? LE : LT) : in.match('=') ? ASSIGN_LSH : LSH;
+        case '>': return !in.match('>') ? (in.match('=') ? GE : GT) :
+           in.match('>') ? (in.match('=') ? ASSIGN_URSH : URSH) : (in.match('=') ? ASSIGN_RSH : RSH);
+        case '/':
+            if (in.match('=')) return ASSIGN_DIV;
+            if (in.match('/')) { while ((c = in.read()) != -1 && c != '\n'); in.unread(); return getToken(); }
+            if (!in.match('*')) return DIV;
+            while ((c = in.read()) != -1 && !(c == '*' && in.match('/'))) {
+                if (c == '\n' || c != '/' || !in.match('*')) continue;
+                if (in.match('/')) return getToken();
+                throw new LexerException("nested comments are not permitted");
+            }
+            if (c == -1) throw new LexerException("unterminated comment");
+            return getToken();  // `goto retry'
+        default: throw new LexerException("illegal character: \'" + ((char)c) + "\'");
+        }
+    }
+
+
+    // SmartReader ////////////////////////////////////////////////////////////////
+
+    /** a Reader that tracks line numbers and can push back tokens */
+    private class SmartReader {
+        PushbackReader reader = null;
+        int lastread = -1;
+
+        public SmartReader(Reader r) { reader = new PushbackReader(r); }
+        public void unread() throws IOException { unread((char)lastread); }
+        public void unread(char c) throws IOException {
+           reader.unread(c);
+           if (accumulator != null) accumulator.setLength(accumulator.length() - 1);
+       }
+        public boolean match(char c) throws IOException { if (peek() == c) { reader.read(); return true; } else return false; }
+        public int peek() throws IOException {
+            int peeked = reader.read();
+            if (peeked != -1) reader.unread((char)peeked);
+            return peeked;
+        }
+        public int read() throws IOException {
+            lastread = reader.read();
+            if (accumulator != null) accumulator.append((char)lastread);
+           if (lastread != '\n' && lastread != '\r') col++;
+           if (lastread == '\n') { line++; col = 0; }
+            return lastread;
+        }
+
+        // FEATURE: could be much more efficient
+        StringBuffer accumulator = null;
+        public void startString() {
+           accumulator = new StringBuffer();
+           accumulator.append((char)lastread);
+       }
+        public String getString() throws IOException {
+            String ret = accumulator.toString();
+            accumulator = null;
+            return ret;
+        }
+    }
+
+
+    // Token PushBack code ////////////////////////////////////////////////////////////
+
+    private int pushBackDepth = 0;
+    private int[] pushBackInts = new int[10];
+    private Object[] pushBackObjects = new Object[10];
+
+    /** push back a token */
+    public void pushBackToken(int op, Object obj) {
+       if (pushBackDepth >= pushBackInts.length - 1) {
+           int[] newInts = new int[pushBackInts.length * 2];
+           System.arraycopy(pushBackInts, 0, newInts, 0, pushBackInts.length);
+           pushBackInts = newInts;
+           Object[] newObjects = new Object[pushBackObjects.length * 2];
+           System.arraycopy(pushBackObjects, 0, newObjects, 0, pushBackObjects.length);
+           pushBackObjects = newObjects;
+       }
+       pushBackInts[pushBackDepth] = op;
+       pushBackObjects[pushBackDepth] = obj;
+       pushBackDepth++;
+    }
+
+    /** push back the most recently read token */
+    public void pushBackToken() { pushBackToken(op, number != null ? (Object)number : (Object)string); }
+
+    /** read a token but leave it in the stream */
+    public int peekToken() throws IOException {
+       int ret = getToken();
+       pushBackToken();
+       return ret;
+    }
+
+    /** read a token */
+    public int getToken() throws IOException {
+       number = null;
+       string = null;
+       if (pushBackDepth == 0) return op = _getToken();
+       pushBackDepth--;
+       op = pushBackInts[pushBackDepth];
+       if (pushBackObjects[pushBackDepth] != null) {
+           number = pushBackObjects[pushBackDepth] instanceof Number ? (Number)pushBackObjects[pushBackDepth] : null;
+           string = pushBackObjects[pushBackDepth] instanceof String ? (String)pushBackObjects[pushBackDepth] : null;
+       }
+       return op;
+    }
+
+    class LexerException extends IOException {
+       public LexerException(String s) { super(sourceName + ":" + line + "," + col + ": " + s); }
+    }
+}