warning police
[ghc-hetmet.git] / utils / ghctags / GhcTags.hs
index fb79a6a..89cd2b3 100644 (file)
@@ -1,19 +1,28 @@
+{-# OPTIONS_GHC -XCPP #-}
 module Main where
-import Bag
-import Char
-import DynFlags(GhcMode, defaultDynFlags)
-import FastString
+
 import GHC
+import BasicTypes
+import Digraph  ( flattenSCCs )
+import DriverPhases ( isHaskellSrcFilename )
 import HscTypes (msHsFilePath)
-import List
-import IO
 import Name
 import Outputable
+import ErrUtils ( printBagOfErrors )
+import DynFlags(GhcMode, defaultDynFlags)
 import SrcLoc
+import Bag
+import Util ( handle, handleDyn )
+import FastString
+
+import Control.Monad
 import System.Environment
 import System.Console.GetOpt
 import System.Exit
-
+import Data.Char
+import System.IO
+import Data.List as List
+import Data.Maybe
 
 -- search for definitions of things 
 -- we do this by parsing the source and grabbing top-level definitions
@@ -21,12 +30,22 @@ import System.Exit
 -- We generate both CTAGS and ETAGS format tags files
 -- The former is for use in most sensible editors, while EMACS uses ETAGS
 
-{-
-placateGhc :: IO ()
-placateGhc = defaultErrorHandler defaultDynFlags $ do
-  GHC.init (Just "/usr/local/lib/ghc-6.5")  -- or your build tree!
-  s <- newSession mode
--}
+----------------------------------
+---- CENTRAL DATA TYPES ----------
+
+type FileName = String
+type ThingName = String -- name of a defined entity in a Haskell program
+
+-- A definition we have found (we know its containing module, name, and location)
+data FoundThing = FoundThing ModuleName ThingName SrcLoc
+
+-- Data we have obtained from a file (list of things we found)
+data FileData = FileData FileName [FoundThing]
+--- invariant (not checked): every found thing has a source location in that file?
+
+
+------------------------------
+-------- MAIN PROGRAM --------
 
 main :: IO ()
 main = do
@@ -35,171 +54,146 @@ main = do
               "Usage: " ++ progName ++ " [OPTION...] [-- GHC OPTION... --] [files...]"
        args <- getArgs
         let (ghcArgs, ourArgs, unbalanced) = splitArgs args
-       let (modes, filenames, errs) = getOpt Permute options ourArgs
-       if unbalanced || errs /= [] || elem Help modes || filenames == []
+       let (flags, filenames, errs) = getOpt Permute options ourArgs
+        let (hsfiles, otherfiles) = List.partition isHaskellSrcFilename filenames
+        let ghc_topdir = case [ d | FlagTopDir d <- flags ] of
+                                [] -> ""
+                                (x:_) -> x
+        mapM_ (\n -> putStr $ "Warning: ignoring non-Haskellish file " ++ n ++ "\n")
+              otherfiles
+       if unbalanced || errs /= [] || elem FlagHelp flags || hsfiles == []
          then do
            putStr $ unlines errs 
           putStr $ usageInfo usageString options
           exitWith (ExitFailure 1)
          else return ()
-        let mode = getMode (Append `delete` modes)
-        let openFileMode = if elem Append modes
-                          then AppendMode
-                          else WriteMode
-        GHC.init (Just "/usr/local/lib/ghc-6.5")
+
+        let modes = getMode flags
+        let openFileMode = if elem FlagAppend flags
+                    then AppendMode
+                    else WriteMode
+        ctags_hdl <-  if CTags `elem` modes
+                           then Just `liftM` openFile "tags" openFileMode
+                           else return Nothing
+        etags_hdl <- if ETags `elem` modes
+                           then Just `liftM` openFile "TAGS" openFileMode
+                           else return Nothing
+
         GHC.defaultErrorHandler defaultDynFlags $ do
-          session <- newSession JustTypecheck
-          print "created a session"
+          session <- newSession (Just ghc_topdir)
           flags <- getSessionDynFlags session
-          (pflags, _) <- parseDynamicFlags flags ghcArgs
-          let flags = pflags { hscTarget = HscNothing }
+          (pflags, _) <- parseDynamicFlags flags{ verbosity=1 } ghcArgs
+          let flags = pflags { hscTarget = HscNothing } -- don't generate anything
           GHC.defaultCleanupHandler flags $ do
-            flags <- initPackages flags
-            setSessionDynFlags session flags
-          setTargets session (map fileTarget filenames)
-          print "set targets"
-          success <- load session LoadAllTargets  --- bring module graph up to date
-          filedata <- case success of
-                        Failed -> do { putStr "Load failed"; exitWith (ExitFailure 2) }
-                        Succeeded -> do
-                                     print "loaded all targets"
-                                     graph <- getModuleGraph session
-                                     print "got modules graph"
-                                     graphData session graph
-          if mode == BothTags || mode == CTags
-           then do 
-             ctagsfile <- openFile "tags" openFileMode
-             writectagsfile ctagsfile filedata
-             hClose ctagsfile
-           else return ()
-          if mode == BothTags || mode == ETags 
-           then do
-             etagsfile <- openFile "TAGS" openFileMode
-             writeetagsfile etagsfile filedata
-             hClose etagsfile
-           else return ()
-
--- | getMode takes a list of modes and extract the mode with the
---   highest precedence.  These are as follows: Both, CTags, ETags
---   The default case is Both.
-getMode :: [Mode] -> Mode
-getMode [] = BothTags
-getMode [x] = x
-getMode (x:xs) = max x (getMode xs)
+  
+          setSessionDynFlags session flags
+          targetsAtOneGo session hsfiles (ctags_hdl,etags_hdl)
+
+----------------------------------------------
+----------  ARGUMENT PROCESSING --------------
+
+data Flag
+   = FlagETags
+   | FlagCTags
+   | FlagBoth
+   | FlagAppend
+   | FlagHelp
+   | FlagTopDir FilePath
+  deriving (Ord, Eq, Show)
+  -- ^Represents options passed to the program
 
+data Mode = ETags | CTags deriving Eq
+
+getMode :: [Flag] -> [Mode]
+getMode fs = go (concatMap modeLike fs)
+ where go []     = [ETags,CTags]
+       go [x]    = [x]
+       go more   = nub more
+
+       modeLike FlagETags = [ETags]
+       modeLike FlagCTags = [CTags]
+       modeLike FlagBoth  = [ETags,CTags]
+       modeLike _         = []
 
 splitArgs :: [String] -> ([String], [String], Bool)
--- pull out arguments between -- for GHC
+-- ^Pull out arguments between -- for GHC
 splitArgs args = split [] [] False args
     where split ghc' tags' unbal ("--" : args) = split tags' ghc' (not unbal) args
           split ghc' tags' unbal (arg : args) = split ghc' (arg:tags') unbal args
           split ghc' tags' unbal [] = (reverse ghc', reverse tags', unbal)
 
-data Mode = ETags | CTags | BothTags | Append | Help deriving (Ord, Eq, Show)
-
-options :: [OptDescr Mode]
-options = [ Option "c" ["ctags"]
-           (NoArg CTags) "generate CTAGS file (ctags)"
+options :: [OptDescr Flag]
+-- supports getopt
+options = [ Option "" ["topdir"] 
+            (ReqArg FlagTopDir "DIR") "root of GHC installation (optional)"
+          , Option "c" ["ctags"]
+           (NoArg FlagCTags) "generate CTAGS file (ctags)"
          , Option "e" ["etags"]
-           (NoArg ETags) "generate ETAGS file (etags)"
+           (NoArg FlagETags) "generate ETAGS file (etags)"
          , Option "b" ["both"]
-           (NoArg BothTags) ("generate both CTAGS and ETAGS")
+           (NoArg FlagBoth) ("generate both CTAGS and ETAGS")
          , Option "a" ["append"]
-           (NoArg Append) ("append to existing CTAGS and/or ETAGS file(s)")
-         , Option "h" ["help"] (NoArg Help) "This help"
+           (NoArg FlagAppend) ("append to existing CTAGS and/or ETAGS file(s)")
+         , Option "h" ["help"] (NoArg FlagHelp) "This help"
          ]
 
-type FileName = String
-
-type ThingName = String
-
--- A definition we have found
-data FoundThing = FoundThing ModuleName ThingName SrcLoc
-
--- Data we have obtained from a file
-data FileData = FileData FileName [FoundThing]
-
--- stuff for dealing with ctags output format
-
-writectagsfile :: Handle -> [FileData] -> IO ()
-writectagsfile ctagsfile filedata = do
-       let things = concat $ map getfoundthings filedata
-       mapM_ (\x -> hPutStrLn ctagsfile $ dumpthing x) things
-
-getfoundthings :: FileData -> [FoundThing]
-getfoundthings (FileData filename things) = things
 
-dumpthing :: FoundThing -> String
-dumpthing (FoundThing modname name loc) =
-       name ++ "\t" ++ filename ++ "\t" ++ (show $ line + 1)
-    where line = srcLocLine loc
-          filename = unpackFS $ srcLocFile loc
+----------------------------------------------------------------
+--- LOADING HASKELL SOURCE
+--- (these bits actually run the compiler and produce abstract syntax)
 
+safeLoad :: Session -> LoadHowMuch -> IO SuccessFlag
+-- like GHC.load, but does not stop process on exception
+safeLoad session mode = do
+  dflags <- getSessionDynFlags session
+  handle (\exception -> return Failed ) $
+    handleDyn (\dyn -> do printBagOfErrors dflags (unitBag dyn)
+                         return Failed) $ load session mode
 
--- stuff for dealing with etags output format
-
-writeetagsfile :: Handle -> [FileData] -> IO ()
-writeetagsfile etagsfile filedata = do
-       mapM_ (\x -> hPutStr etagsfile $ e_dumpfiledata x) filedata
 
-e_dumpfiledata :: FileData -> String
-e_dumpfiledata (FileData filename things) = 
-       "\x0c\n" ++ filename ++ "," ++ (show thingslength) ++ "\n" ++ thingsdump
-       where 
-               thingsdump = concat $ map e_dumpthing things 
-               thingslength = length thingsdump
+targetsAtOneGo :: Session -> [FileName] -> (Maybe Handle, Maybe Handle) -> IO ()
+-- load a list of targets
+targetsAtOneGo session hsfiles handles = do
+  targets <- mapM (\f -> guessTarget f Nothing) hsfiles
+  setTargets session targets
+  putStrLn $ "Load it all:"
+  flag <- load session LoadAllTargets
+  when (failed flag) $ exitWith (ExitFailure 1)
+  modgraph <- getModuleGraph session
+  let mods = flattenSCCs $ topSortModuleGraph False modgraph Nothing
+  graphData session mods handles
 
-e_dumpthing :: FoundThing -> String
-e_dumpthing (FoundThing modname name loc) =
-    tagline name ++ tagline (moduleNameString modname ++ "." ++ name)
-    where tagline n = n ++ "\x7f" ++ (show line) ++ "," ++ (show $ line+1) ++ "\n"
-          line = srcLocLine loc
-       
-       
-       
--- like "words", but keeping the whitespace, and so letting us build
--- accurate prefixes   
-       
-spacedwords :: String -> [String]
-spacedwords [] = []
-spacedwords xs = (blanks ++ wordchars):(spacedwords rest2)
-       where 
-               (blanks,rest) = span Char.isSpace xs
-               (wordchars,rest2) = span (\x -> not $ Char.isSpace x) rest
-       
-       
--- Find the definitions in a file      
-       
-modsummary :: ModuleGraph -> FileName -> Maybe ModSummary
-modsummary graph n = 
-  List.find matches graph
-  where matches ms = n == msHsFilePath ms
-
-modname :: ModSummary -> ModuleName
-modname summary = moduleName $ ms_mod $ summary
+  where targetInfo [hs] = "target " ++ hs
+        targetInfo hss  = show (length hss) ++ " targets at one go"
 
 fileTarget :: FileName -> Target
 fileTarget filename = Target (TargetFile filename Nothing) Nothing
 
-graphData :: Session -> ModuleGraph -> IO [FileData]
-graphData session graph =
-    mapM foundthings graph
+---------------------------------------------------------------
+----- CRAWLING ABSTRACT SYNTAX TO SNAFFLE THE DEFINITIONS -----
+
+graphData :: Session -> ModuleGraph -> (Maybe Handle, Maybe Handle) -> IO ()
+graphData session graph handles = do
+    mapM_ foundthings graph
     where foundthings ms =
               let filename = msHsFilePath ms
                   modname = moduleName $ ms_mod ms
-              in  do mod <- checkModule session modname
-                     return $ maybe (FileData filename []) id $ do
-                       m <- mod
-                       s <- renamedSource m
-                       return $ fileData filename modname s
+              in  do mod <- checkModule session modname False
+                     let fd = maybe (FileData filename []) id $ do
+                                m <- mod
+                                s <- renamedSource m
+                                return $ fileData filename modname s
+                     writeTagsData handles fd
 
 fileData :: FileName -> ModuleName -> RenamedSource -> FileData
-fileData filename modname (group, imports, lie) =
+fileData filename modname (group, _imports, _lie, _doc, _haddock) =
     -- lie is related to type checking and so is irrelevant
     -- imports contains import declarations and no definitions
+    -- doc and haddock seem haddock-related; let's hope to ignore them
     FileData filename (boundValues modname group)
 
 boundValues :: ModuleName -> HsGroup Name -> [FoundThing]    
+-- ^Finds all the top-level definitions in a module
 boundValues mod group =
   let vals = case hs_valds group of
                ValBindsOut nest sigs ->
@@ -252,12 +246,58 @@ boundThings modname lbinding =
                ConPatIn _ conargs -> conArgs conargs tl
                ConPatOut _ _ _ _ conargs _ -> conArgs conargs tl
                LitPat _ -> tl
+#if __GLASGOW_HASKELL__ > 608
+               NPat _ _ _ -> tl -- form of literal pattern?
+#else
                NPat _ _ _ _ -> tl -- form of literal pattern?
+#endif
                NPlusKPat id _ _ _ -> thing id : tl
                TypePat _ -> tl -- XXX need help here
                SigPatIn p _ -> patThings p tl
                SigPatOut p _ -> patThings p tl
-               DictPat _ _ -> tl
         conArgs (PrefixCon ps) tl = foldr patThings tl ps
-        conArgs (RecCon pairs) tl = foldr (\(_id, p) tl -> patThings p tl) tl pairs
+        conArgs (RecCon (HsRecFields { rec_flds = flds })) tl 
+             = foldr (\f tl -> patThings (hsRecFieldArg f) tl) tl flds
         conArgs (InfixCon p1 p2) tl = patThings p1 $ patThings p2 tl
+
+
+-- stuff for dealing with ctags output format
+
+writeTagsData (mb_ctags_hdl, mb_etags_hdl) fd = do 
+  maybe (return ()) (\hdl -> writectagsfile hdl fd) mb_ctags_hdl
+  maybe (return ()) (\hdl -> writeetagsfile hdl fd) mb_etags_hdl
+
+writectagsfile :: Handle -> FileData -> IO ()
+writectagsfile ctagsfile filedata = do
+       let things = getfoundthings filedata
+       mapM_ (\x -> hPutStrLn ctagsfile $ dumpthing False x) things
+       mapM_ (\x -> hPutStrLn ctagsfile $ dumpthing True  x) things
+
+getfoundthings :: FileData -> [FoundThing]
+getfoundthings (FileData filename things) = things
+
+dumpthing :: Bool -> FoundThing -> String
+dumpthing showmod (FoundThing modname name loc) =
+       fullname ++ "\t" ++ filename ++ "\t" ++ (show $ line + 1)
+    where line = srcLocLine loc
+          filename = unpackFS $ srcLocFile loc
+          fullname = if showmod then moduleNameString modname ++ "." ++ name
+                     else name
+
+-- stuff for dealing with etags output format
+
+writeetagsfile :: Handle -> FileData -> IO ()
+writeetagsfile etagsfile = hPutStr etagsfile . e_dumpfiledata
+
+e_dumpfiledata :: FileData -> String
+e_dumpfiledata (FileData filename things) = 
+       "\x0c\n" ++ filename ++ "," ++ (show thingslength) ++ "\n" ++ thingsdump
+       where 
+               thingsdump = concat $ map e_dumpthing things 
+               thingslength = length thingsdump
+
+e_dumpthing :: FoundThing -> String
+e_dumpthing (FoundThing modname name loc) =
+    tagline name ++ tagline (moduleNameString modname ++ "." ++ name)
+    where tagline n = n ++ "\x7f" ++ (show line) ++ "," ++ (show $ line+1) ++ "\n"
+          line = srcLocLine loc