Treat the Unicode "Letter, Other" class as lowercase letters (#1103)
authorSimon Marlow <marlowsd@gmail.com>
Wed, 9 Jul 2008 09:12:52 +0000 (09:12 +0000)
committerSimon Marlow <marlowsd@gmail.com>
Wed, 9 Jul 2008 09:12:52 +0000 (09:12 +0000)
This is an arbitrary choice, but it's strictly more useful than the
current situation, where these characters cannot be used in
identifiers at all.

In Haskell' we may revisit this decision (it's on my list of things to
discuss), but for now this is an improvement for those using caseless
languages.

compiler/parser/Lexer.x

index 2b86fd7..b9abf7a 100644 (file)
@@ -1492,7 +1492,7 @@ alexGetChar (AI loc ofs s)
                  LowercaseLetter       -> lower
                  TitlecaseLetter       -> upper
                  ModifierLetter        -> other_graphic
-                 OtherLetter           -> other_graphic
+                 OtherLetter           -> lower -- see #1103
                  NonSpacingMark        -> other_graphic
                  SpacingCombiningMark  -> other_graphic
                  EnclosingMark         -> other_graphic