[project @ 2003-12-15 17:59:05 by panne]
[ghc-base.git] / Text / Regex / Posix.hsc
index 8c84dbd..56544e1 100644 (file)
@@ -1,23 +1,34 @@
 -----------------------------------------------------------------------------
 -- |
 -- Module      :  Text.Regex.Posix
--- Copyright   :  (c) The University of Glasgow 2001
--- License     :  BSD-style (see the file libraries/core/LICENSE)
+-- Copyright   :  (c) The University of Glasgow 2002
+-- License     :  BSD-style (see the file libraries/base/LICENSE)
 -- 
 -- Maintainer  :  libraries@haskell.org
 -- Stability   :  experimental
--- Portability :  non-portable (only on platforms that provide POSIX regexps)
+-- Portability :  non-portable (needs POSIX regexps)
 --
 -- Interface to the POSIX regular expression library.
--- ToDo: should have an interface using PackedStrings.
 --
 -----------------------------------------------------------------------------
 
+-- ToDo: should have an interface using PackedStrings.
+#include "config.h"
+
 module Text.Regex.Posix (
+       -- * The @Regex@ type
        Regex,          -- abstract
 
+#if !defined(__HUGS__) || defined(HAVE_REGEX_H)
+       -- * Compiling a regular expression
        regcomp,        -- :: String -> Int -> IO Regex
 
+       -- ** Flags for regcomp
+       regExtended,    -- (flag to regcomp) use extended regex syntax
+       regIgnoreCase,  -- (flag to regcomp) ignore case when matching
+       regNewline,     -- (flag to regcomp) '.' doesn't match newline
+
+       -- * Matching a regular expression
        regexec,        -- :: Regex                  -- pattern
                        -- -> String                 -- string to match
                        -- -> IO (Maybe (String,     -- everything before match
@@ -25,49 +36,60 @@ module Text.Regex.Posix (
                        --               String,     -- everything after match
                        --               [String]))  -- subexpression matches
 
-       regExtended,    -- (flag to regcomp) use extended regex syntax
-       regIgnoreCase,  -- (flag to regcomp) ignore case when matching
-       regNewline      -- (flag to regcomp) '.' doesn't match newline
+#endif
   ) where
 
+#if !defined(__HUGS__) || defined(HAVE_REGEX_H)
 #include <sys/types.h>
 #include "regex.h"
+#endif
 
 import Prelude
 
 import Foreign
 import Foreign.C
 
+type CRegex    = ()
+
+-- | A compiled regular expression
 newtype Regex = Regex (ForeignPtr CRegex)
 
+#if !defined(__HUGS__) || defined(HAVE_REGEX_H)
+-- to the end
 -- -----------------------------------------------------------------------------
 -- regcomp
 
-regcomp :: String -> Int -> IO Regex
+-- | Compiles a regular expression
+regcomp
+  :: String    -- ^ The regular expression to compile
+  -> Int       -- ^ Flags (summed together)
+  -> IO Regex          -- ^ Returns: the compiled regular expression
 regcomp pattern flags = do
-  regex_ptr <- mallocBytes (#const sizeof(regex_t))
-  regex_fptr <- newForeignPtr regex_ptr (regfree regex_ptr)
+  regex_fptr <- mallocForeignPtrBytes (#const sizeof(regex_t))
   r <- withCString pattern $ \cstr ->
         withForeignPtr regex_fptr $ \p ->
            c_regcomp p cstr (fromIntegral flags)
   if (r == 0)
-     then return (Regex regex_fptr)
+     then do addForeignPtrFinalizer ptr_regfree regex_fptr
+            return (Regex regex_fptr)
      else error "Text.Regex.Posix.regcomp: error in pattern" -- ToDo
 
-regfree :: Ptr CRegex -> IO ()
-regfree p_regex = do
-  c_regfree p_regex
-  free p_regex
-
 -- -----------------------------------------------------------------------------
 -- regexec
 
-regexec :: Regex                       -- pattern
-       -> String                       -- string to match
-       -> IO (Maybe (String,           -- everything before match
-                     String,           -- matched portion
-                     String,           -- everything after match
-                     [String]))        -- subexpression matches
+-- | Matches a regular expression against a string
+regexec :: Regex                       -- ^ Compiled regular expression
+       -> String                       -- ^ String to match against
+       -> IO (Maybe (String, String, String, [String]))
+               -- ^ Returns: 'Nothing' if the regex did not match the
+               -- string, or:
+               --
+               -- @
+               --   'Just' (everything before match,
+               --         matched portion,
+               --         everything after match,
+               --         subexpression matches)
+               -- @
 
 regexec (Regex regex_fptr) str = do
   withCString str $ \cstr -> do
@@ -90,17 +112,17 @@ regexec (Regex regex_fptr) str = do
 
 matched_parts :: String -> Ptr CRegMatch -> IO (String, String, String)
 matched_parts string p_match = do
-  start <- (#peek regmatch_t, rm_so) p_match :: IO CInt
-  end   <- (#peek regmatch_t, rm_eo) p_match :: IO CInt
+  start <- (#peek regmatch_t, rm_so) p_match :: IO (#type regoff_t)
+  end   <- (#peek regmatch_t, rm_eo) p_match :: IO (#type regoff_t)
   let s = fromIntegral start; e = fromIntegral end
-  return ( take (s-1) string, 
+  return ( take s string, 
           take (e-s) (drop s string),
           drop e string )  
 
 unpack :: String -> Ptr CRegMatch -> IO (String)
 unpack string p_match = do
-  start <- (#peek regmatch_t, rm_so) p_match :: IO CInt
-  end   <- (#peek regmatch_t, rm_eo) p_match :: IO CInt
+  start <- (#peek regmatch_t, rm_so) p_match :: IO (#type regoff_t)
+  end   <- (#peek regmatch_t, rm_eo) p_match :: IO (#type regoff_t)
   -- the subexpression may not have matched at all, perhaps because it
   -- was optional.  In this case, the offsets are set to -1.
   if (start == -1) then return "" else do
@@ -112,7 +134,7 @@ unpack string p_match = do
 -- Flags for regexec
 #enum Int,, \
        REG_NOTBOL, \
-       REG_NOTEOL \
+       REG_NOTEOL
 
 -- Return values from regexec
 #enum Int,, \
@@ -141,15 +163,16 @@ unpack string p_match = do
        REG_ERANGE, \
        REG_ESPACE
 
-type CRegex    = ()
 type CRegMatch = ()
 
 foreign import ccall unsafe "regcomp"
   c_regcomp :: Ptr CRegex -> CString -> CInt -> IO CInt
 
-foreign import ccall  unsafe "regfree"
-  c_regfree :: Ptr CRegex -> IO ()
+foreign import ccall  unsafe "&regfree"
+  ptr_regfree :: FunPtr (Ptr CRegex -> IO ())
 
 foreign import ccall unsafe "regexec"
   c_regexec :: Ptr CRegex -> CString -> CSize
            -> Ptr CRegMatch -> CInt -> IO CInt
+
+#endif /* HAVE_REGEX_H */