[project @ 2000-10-25 13:51:50 by simonpj]
[ghc-hetmet.git] / ghc / compiler / simplCore / SimplCore.lhs
index fda56fe..723b776 100644 (file)
@@ -10,30 +10,27 @@ module SimplCore ( core2core ) where
 
 import CmdLineOpts     ( CoreToDo(..), SimplifierSwitch(..), 
                          SwitchResult(..), intSwitchSet,
-                         opt_D_dump_occur_anal, opt_D_dump_rules,
-                         opt_D_dump_simpl_iterations,
-                         opt_D_dump_simpl_stats,
-                         opt_D_dump_rules,
-                         opt_D_verbose_core2core,
-                         opt_D_dump_occur_anal,
                           opt_UsageSPOn,
+                         DynFlags, DynFlag(..), dopt
                        )
 import CoreLint                ( beginPass, endPass )
 import CoreSyn
+import CoreFVs         ( ruleSomeFreeVars )
+import HscTypes                ( PackageRuleBase, HomeSymbolTable, ModDetails(..) )
 import CSE             ( cseProgram )
-import Rules           ( RuleBase, ProtoCoreRule(..), pprProtoCoreRule, prepareLocalRuleBase,
-                          prepareOrphanRuleBase, unionRuleBase, localRule )
+import Rules           ( RuleBase, emptyRuleBase, ruleBaseFVs, ruleBaseIds, extendRuleBaseList, addRuleBaseFVs )
+import Module          ( moduleEnvElts )
 import CoreUnfold
-import PprCore         ( pprCoreBindings )
+import PprCore         ( pprCoreBindings, pprIdCoreRule )
 import OccurAnal       ( occurAnalyseBinds )
-import CoreUtils       ( exprIsTrivial, etaReduceExpr, coreBindsSize )
+import CoreUtils       ( etaReduceExpr, coreBindsSize )
 import Simplify                ( simplTopBinds, simplExpr )
 import SimplUtils      ( simplBinders )
 import SimplMonad
-import ErrUtils                ( dumpIfSet )
+import ErrUtils                ( dumpIfSet, dumpIfSet_dyn )
 import FloatIn         ( floatInwards )
 import FloatOut                ( floatOutwards )
-import Id              ( isDataConWrapId )
+import Id              ( Id, isDataConWrapId, setIdNoDiscard )
 import VarSet
 import LiberateCase    ( liberateCase )
 import SAT             ( doStaticArgs )
@@ -57,139 +54,198 @@ import List             ( partition )
 %************************************************************************
 
 \begin{code}
-core2core :: [CoreToDo]                -- Spec of what core-to-core passes to do
+core2core :: DynFlags 
+         -> PackageRuleBase    -- Rule-base accumulated from imported packages
+         -> HomeSymbolTable
+         -> [CoreToDo]         -- Spec of what core-to-core passes to do
          -> [CoreBind]         -- Binds in
-         -> [ProtoCoreRule]    -- Rules in
-         -> IO ([CoreBind], RuleBase)  -- binds, local orphan rules out
+         -> [IdCoreRule]       -- Rules in
+         -> IO ([CoreBind], [IdCoreRule])  -- binds, local orphan rules out
 
-core2core core_todos binds rules
+core2core dflags pkg_rule_base hst core_todos binds rules
   = do
        us <-  mkSplitUniqSupply 's'
-       let (cp_us, us1)   = splitUniqSupply us
-           (ru_us, ps_us) = splitUniqSupply us1
+       let (cp_us, ru_us) = splitUniqSupply us
 
-        let (local_rules, imported_rules) = partition localRule rules
+               -- COMPUTE THE RULE BASE TO USE
+       (rule_base, binds1, orphan_rules)
+               <- prepareRules dflags pkg_rule_base hst ru_us binds rules
 
-        better_local_rules <- simplRules ru_us local_rules binds
 
-        let (binds1, local_rule_base) = prepareLocalRuleBase binds better_local_rules
-            imported_rule_base        = prepareOrphanRuleBase imported_rules
+               -- DO THE BUSINESS
+       (stats, processed_binds)
+               <- doCorePasses dflags rule_base (zeroSimplCount dflags) cp_us binds1 core_todos
 
-       -- Do the main business
-       (stats, processed_binds, processed_local_rules)
-            <- doCorePasses zeroSimplCount cp_us binds1 local_rule_base
-                           imported_rule_base Nothing core_todos
-
-       dumpIfSet opt_D_dump_simpl_stats
+       dumpIfSet_dyn dflags Opt_D_dump_simpl_stats
                  "Grand total simplifier statistics"
                  (pprSimplCount stats)
 
        -- Return results
         -- We only return local orphan rules, i.e., local rules not attached to an Id
-       return (processed_binds, processed_local_rules)
+       -- The bindings cotain more rules, embedded in the Ids
+       return (processed_binds, orphan_rules)
 
 
-doCorePasses :: SimplCount      -- simplifier stats
+doCorePasses :: DynFlags
+             -> RuleBase        -- the main rule base
+            -> SimplCount      -- simplifier stats
              -> UniqSupply      -- uniques
              -> [CoreBind]      -- local binds in (with rules attached)
-             -> RuleBase        -- local orphan rules
-             -> RuleBase        -- imported and builtin rules
-             -> Maybe RuleBase  -- combined rulebase, or Nothing to ask for it to be rebuilt
              -> [CoreToDo]      -- which passes to do
-             -> IO (SimplCount, [CoreBind], RuleBase)  -- stats, binds, local orphan rules
+             -> IO (SimplCount, [CoreBind])  -- stats, binds, local orphan rules
 
-doCorePasses stats us binds lrb irb rb0 []
-  = return (stats, binds, lrb)
+doCorePasses dflags rb stats us binds []
+  = return (stats, binds)
 
-doCorePasses stats us binds lrb irb rb0 (to_do : to_dos) 
+doCorePasses dflags rb stats us binds (to_do : to_dos) 
   = do
        let (us1, us2) = splitUniqSupply us
 
-        -- recompute rulebase if necessary
-        let rb         = maybe (irb `unionRuleBase` lrb) id rb0
-
-       (stats1, binds1, mlrb1) <- doCorePass us1 binds lrb rb to_do
-
-        -- request rulebase recomputation if pass returned a new local rulebase
-        let (lrb1,rb1) = maybe (lrb, Just rb) (\ lrb1 -> (lrb1, Nothing)) mlrb1
-
-       doCorePasses (stats `plusSimplCount` stats1) us2 binds1 lrb1 irb rb1 to_dos
-
-doCorePass us binds lrb rb (CoreDoSimplify sw_chkr) = _scc_ "Simplify"      simplifyPgm rb sw_chkr us binds
-doCorePass us binds lrb rb CoreCSE                 = _scc_ "CommonSubExpr" noStats (cseProgram binds)
-doCorePass us binds lrb rb CoreLiberateCase        = _scc_ "LiberateCase"  noStats (liberateCase binds)
-doCorePass us binds lrb rb CoreDoFloatInwards       = _scc_ "FloatInwards"  noStats (floatInwards binds)
-doCorePass us binds lrb rb (CoreDoFloatOutwards f)  = _scc_ "FloatOutwards" noStats (floatOutwards f us binds)
-doCorePass us binds lrb rb CoreDoStaticArgs        = _scc_ "StaticArgs"    noStats (doStaticArgs us binds)
-doCorePass us binds lrb rb CoreDoStrictness        = _scc_ "Stranal"       noStats (saBinds binds)
-doCorePass us binds lrb rb CoreDoWorkerWrapper      = _scc_ "WorkWrap"      noStats (wwTopBinds us binds)
-doCorePass us binds lrb rb CoreDoSpecialising       = _scc_ "Specialise"    noStats (specProgram us binds)
-doCorePass us binds lrb rb CoreDoCPResult          = _scc_ "CPResult"      noStats (cprAnalyse binds)
-doCorePass us binds lrb rb CoreDoPrintCore         = _scc_ "PrintCore"     noStats (printCore binds)
-doCorePass us binds lrb rb CoreDoUSPInf
-  = _scc_ "CoreUsageSPInf" 
-    if opt_UsageSPOn then
-      do
-         (binds1, rules1) <- doUsageSPInf us binds lrb
-         return (zeroSimplCount, binds1, rules1)
-    else
-      trace "WARNING: ignoring requested -fusagesp pass; requires -fusagesp-on" $
-      return (zeroSimplCount, binds, Nothing)
+       (stats1, binds1) <- doCorePass dflags rb us1 binds to_do
+
+       doCorePasses dflags rb (stats `plusSimplCount` stats1) us2 binds1 to_dos
+
+doCorePass dfs rb us binds (CoreDoSimplify sw_chkr) 
+   = _scc_ "Simplify"      simplifyPgm dfs rb sw_chkr us binds
+doCorePass dfs rb us binds CoreCSE                     
+   = _scc_ "CommonSubExpr" noStats dfs (cseProgram dfs binds)
+doCorePass dfs rb us binds CoreLiberateCase            
+   = _scc_ "LiberateCase"  noStats dfs (liberateCase dfs binds)
+doCorePass dfs rb us binds CoreDoFloatInwards       
+   = _scc_ "FloatInwards"  noStats dfs (floatInwards dfs binds)
+doCorePass dfs rb us binds (CoreDoFloatOutwards f)  
+   = _scc_ "FloatOutwards" noStats dfs (floatOutwards dfs f us binds)
+doCorePass dfs rb us binds CoreDoStaticArgs            
+   = _scc_ "StaticArgs"    noStats dfs (doStaticArgs us binds)
+doCorePass dfs rb us binds CoreDoStrictness            
+   = _scc_ "Stranal"       noStats dfs (saBinds dfs binds)
+doCorePass dfs rb us binds CoreDoWorkerWrapper      
+   = _scc_ "WorkWrap"      noStats dfs (wwTopBinds dfs us binds)
+doCorePass dfs rb us binds CoreDoSpecialising       
+   = _scc_ "Specialise"    noStats dfs (specProgram dfs us binds)
+doCorePass dfs rb us binds CoreDoCPResult              
+   = _scc_ "CPResult"      noStats dfs (cprAnalyse dfs binds)
+doCorePass dfs rb us binds CoreDoPrintCore             
+   = _scc_ "PrintCore"     noStats dfs (printCore binds)
+doCorePass dfs rb us binds CoreDoUSPInf             
+   = _scc_ "CoreUsageSPInf" noStats dfs (doUsageSPInf dfs us binds)
+doCorePass dfs rb us binds CoreDoGlomBinds             
+   = noStats dfs (glomBinds dfs binds)
 
 printCore binds = do dumpIfSet True "Print Core"
                               (pprCoreBindings binds)
                     return binds
 
 -- most passes return no stats and don't change rules
-noStats thing = do { binds <- thing; return (zeroSimplCount, binds, Nothing) }
+noStats dfs thing = do { binds <- thing; return (zeroSimplCount dfs, binds) }
 \end{code}
 
 
+
 %************************************************************************
 %*                                                                     *
 \subsection{Dealing with rules}
 %*                                                                     *
 %************************************************************************
 
-We must do some gentle simplifiation on the template (but not the RHS)
-of each rule.  The case that forced me to add this was the fold/build rule,
-which without simplification looked like:
-       fold k z (build (/\a. g a))  ==>  ...
-This doesn't match unless you do eta reduction on the build argument.
+-- prepareLocalRuleBase takes the CoreBinds and rules defined in this module.
+-- It attaches those rules that are for local Ids to their binders, and
+-- returns the remainder attached to Ids in an IdSet.  It also returns
+-- Ids mentioned on LHS of some rule; these should be blacklisted.
+
+-- The rule Ids and LHS Ids are black-listed; that is, they aren't inlined
+-- so that the opportunity to apply the rule isn't lost too soon
 
 \begin{code}
-simplRules :: UniqSupply -> [ProtoCoreRule] -> [CoreBind] -> IO [ProtoCoreRule]
-simplRules us rules binds
-  = do  let (better_rules,_) = initSmpl sw_chkr us bind_vars black_list_all (mapSmpl simplRule rules)
-       
-       dumpIfSet opt_D_dump_rules
-                 "Transformation rules"
-                 (vcat (map pprProtoCoreRule better_rules))
-
-       return better_rules
+prepareRules :: DynFlags -> PackageRuleBase -> HomeSymbolTable
+            -> UniqSupply
+            -> [CoreBind] -> [IdCoreRule]              -- Local bindings and rules
+            -> IO (RuleBase,                           -- Full rule base
+                   [CoreBind],                         -- Bindings augmented with rules
+                   [IdCoreRule])                       -- Orphan rules
+
+prepareRules dflags pkg_rule_base hst us binds rules
+  = do { let (better_rules,_) = initSmpl dflags sw_chkr us local_ids black_list_all 
+                                         (mapSmpl simplRule rules)
+
+       ; dumpIfSet_dyn dflags Opt_D_dump_rules "Transformation rules"
+                       (vcat (map pprIdCoreRule better_rules))
+
+       ; let (local_id_rules, orphan_rules) = partition ((`elemVarSet` local_ids) . fst) better_rules
+              (binds1, local_rule_fvs)      = addRulesToBinds binds local_id_rules
+             imp_rule_base                  = foldl add_rules pkg_rule_base (moduleEnvElts hst)
+             rule_base                      = extendRuleBaseList imp_rule_base orphan_rules
+             final_rule_base                = addRuleBaseFVs rule_base local_rule_fvs
+               -- The last step black-lists the free vars of local rules too
+
+       ; return (final_rule_base, binds1, orphan_rules)
+    }
   where
+    sw_chkr any             = SwBool False                     -- A bit bogus
     black_list_all v = not (isDataConWrapId v)
                -- This stops all inlining except the
                -- wrappers for data constructors
 
-    sw_chkr any = SwBool False                 -- A bit bogus
+    add_rules rule_base mds = extendRuleBaseList rule_base (md_rules mds)
 
        -- Boringly, we need to gather the in-scope set.
-       -- Typically this thunk won't even be force, but the test in
-       -- simpVar fails if it isn't right, and it might conceivably matter
-    bind_vars = foldr (unionVarSet . mkVarSet . bindersOf) emptyVarSet binds
+       -- Typically this thunk won't even be forced, but the test in
+       -- simpVar fails if it isn't right, and it might conceiveably matter
+    local_ids = foldr (unionVarSet . mkVarSet . bindersOf) emptyVarSet binds
+
+addRulesToBinds :: [CoreBind] -> [(Id,CoreRule)] -> ([CoreBind], IdSet)
+       -- A horrible function
+
+       -- Attach the rules for each locally-defined Id to that Id.
+       --      - This makes the rules easier to look up
+       --      - It means that transformation rules and specialisations for
+       --        locally defined Ids are handled uniformly
+       --      - It keeps alive things that are referred to only from a rule
+       --        (the occurrence analyser knows about rules attached to Ids)
+       --      - It makes sure that, when we apply a rule, the free vars
+       --        of the RHS are more likely to be in scope
+       --
+       -- Both the LHS and RHS Ids are marked 'no-discard'. 
+       -- This means that the binding won't be discarded EVEN if the binding
+       -- ends up being trivial (v = w) -- the simplifier would usually just 
+       -- substitute w for v throughout, but we don't apply the substitution to
+       -- the rules (maybe we should?), so this substitution would make the rule
+       -- bogus.
+
+addRulesToBinds binds local_rules
+  = (map zap_bind binds, rule_lhs_fvs)
+  where
+       -- rule_fvs is the set of all variables mentioned in this module's rules
+    rule_fvs     = unionVarSets [ ruleSomeFreeVars    isId rule | (_,rule) <- local_rules ]
 
+    rule_base    = extendRuleBaseList emptyRuleBase local_rules
+    rule_lhs_fvs = ruleBaseFVs rule_base
+    rule_ids    = ruleBaseIds rule_base
+
+    zap_bind (NonRec b r) = NonRec (zap_bndr b) r
+    zap_bind (Rec prs)    = Rec [(zap_bndr b, r) | (b,r) <- prs]
+
+    zap_bndr bndr = case lookupVarSet rule_ids bndr of
+                         Just bndr'                           -> setIdNoDiscard bndr'
+                         Nothing | bndr `elemVarSet` rule_fvs -> setIdNoDiscard bndr
+                                 | otherwise                  -> bndr
+\end{code}
+
+
+We must do some gentle simplification on the template (but not the RHS)
+of each rule.  The case that forced me to add this was the fold/build rule,
+which without simplification looked like:
+       fold k z (build (/\a. g a))  ==>  ...
+This doesn't match unless you do eta reduction on the build argument.
 
-simplRule rule@(ProtoCoreRule is_local id (BuiltinRule _))
+\begin{code}
+simplRule rule@(id, BuiltinRule _)
   = returnSmpl rule
-simplRule rule@(ProtoCoreRule is_local id (Rule name bndrs args rhs))
-  | not is_local
-  = returnSmpl rule    -- No need to fiddle with imported rules
-  | otherwise
+simplRule rule@(id, Rule name bndrs args rhs)
   = simplBinders bndrs                 $ \ bndrs' -> 
     mapSmpl simpl_arg args             `thenSmpl` \ args' ->
     simplExpr rhs                      `thenSmpl` \ rhs' ->
-    returnSmpl (ProtoCoreRule is_local id (Rule name bndrs' args' rhs'))
+    returnSmpl (id, Rule name bndrs' args' rhs')
 
 simpl_arg e 
 --  I've seen rules in which a LHS like 
@@ -203,6 +259,49 @@ simpl_arg e
     returnSmpl (etaReduceExpr e')
 \end{code}
 
+
+%************************************************************************
+%*                                                                     *
+\subsection{Glomming}
+%*                                                                     *
+%************************************************************************
+
+\begin{code}
+glomBinds :: DynFlags -> [CoreBind] -> IO [CoreBind]
+-- Glom all binds together in one Rec, in case any
+-- transformations have introduced any new dependencies
+--
+-- NB: the global invariant is this:
+--     *** the top level bindings are never cloned, and are always unique ***
+--
+-- We sort them into dependency order, but applying transformation rules may
+-- make something at the top refer to something at the bottom:
+--     f = \x -> p (q x)
+--     h = \y -> 3
+--     
+--     RULE:  p (q x) = h x
+--
+-- Applying this rule makes f refer to h, 
+-- although it doesn't appear to in the source program.  
+-- This pass lets us control where it happens.
+--
+-- NOTICE that this cannot happen for rules whose head is a locally-defined
+-- function.  It only happens for rules whose head is an imported function
+-- (p in the example above).  So, for example, the rule had been
+--     RULE: f (p x) = h x
+-- then the rule for f would be attached to f itself (in its IdInfo) 
+-- by prepareLocalRuleBase and h would be regarded by the occurrency 
+-- analyser as free in f.
+
+glomBinds dflags binds
+  = do { beginPass dflags "GlomBinds" ;
+        let { recd_binds = [Rec (flattenBinds binds)] } ;
+        return recd_binds }
+       -- Not much point in printing the result... 
+       -- just consumes output bandwidth
+\end{code}
+
+
 %************************************************************************
 %*                                                                     *
 \subsection{The driver for the simplifier}
@@ -210,57 +309,41 @@ simpl_arg e
 %************************************************************************
 
 \begin{code}
-simplifyPgm :: RuleBase
+simplifyPgm :: DynFlags 
+           -> RuleBase
            -> (SimplifierSwitch -> SwitchResult)
            -> UniqSupply
-           -> [CoreBind]                                   -- Input
-           -> IO (SimplCount, [CoreBind], Maybe RuleBase)  -- New bindings
+           -> [CoreBind]                   -- Input
+           -> IO (SimplCount, [CoreBind])  -- New bindings
 
-simplifyPgm (imported_rule_ids, rule_lhs_fvs) 
+simplifyPgm dflags rule_base
            sw_chkr us binds
   = do {
-       beginPass "Simplify";
+       beginPass dflags "Simplify";
 
-       -- Glom all binds together in one Rec, in case any
-       -- transformations have introduced any new dependencies
-       --
-       -- NB: the global invariant is this:
-       --      *** the top level bindings are never cloned, and are always unique ***
-       --
-       -- We sort them into dependency order, but applying transformation rules may
-       -- make something at the top refer to something at the bottom:
-       --      f = \x -> p (q x)
-       --      h = \y -> 3
-       --      
-       --      RULE:  p (q x) = h x
-       --
-       -- Applying this rule makes f refer to h, although it doesn't appear to in the
-       -- source program.  Our solution is to do this occasional glom-together step,
-       -- just once per overall simplfication step.
+       (termination_msg, it_count, counts_out, binds') 
+          <- iteration us 1 (zeroSimplCount dflags) binds;
 
-       let { recd_binds = [Rec (flattenBinds binds)] };
-
-       (termination_msg, it_count, counts_out, binds') <- iteration us 1 zeroSimplCount recd_binds;
-
-       dumpIfSet (opt_D_verbose_core2core && opt_D_dump_simpl_stats)
+       dumpIfSet (dopt Opt_D_verbose_core2core dflags 
+                   && dopt Opt_D_dump_simpl_stats dflags)
                  "Simplifier statistics"
                  (vcat [text termination_msg <+> text "after" <+> ppr it_count <+> text "iterations",
                         text "",
                         pprSimplCount counts_out]);
 
-       endPass "Simplify" 
-               (opt_D_verbose_core2core && not opt_D_dump_simpl_iterations)
+       endPass dflags "Simplify" 
+               (dopt Opt_D_verbose_core2core dflags 
+                 && not (dopt Opt_D_dump_simpl_iterations dflags))
                binds' ;
 
-       return (counts_out, binds', Nothing)
+       return (counts_out, binds')
     }
   where
-    max_iterations = getSimplIntSwitch sw_chkr MaxSimplifierIterations
-    black_list_fn  = blackListed rule_lhs_fvs (intSwitchSet sw_chkr SimplInlinePhase)
-
-    core_iter_dump binds | opt_D_verbose_core2core = pprCoreBindings binds
-                        | otherwise               = empty
-
+    max_iterations    = getSimplIntSwitch sw_chkr MaxSimplifierIterations
+    black_list_fn     = blackListed rule_lhs_fvs (intSwitchSet sw_chkr SimplInlinePhase)
+    imported_rule_ids = ruleBaseIds rule_base
+    rule_lhs_fvs      = ruleBaseFVs rule_base
     iteration us iteration_no counts binds
       -- Try and force thunks off the binds; significantly reduces
       -- space usage, especially with -O.  JRS, 000620.
@@ -269,7 +352,7 @@ simplifyPgm (imported_rule_ids, rule_lhs_fvs)
                -- Occurrence analysis
           let { tagged_binds = _scc_ "OccAnal" occurAnalyseBinds binds } ;
 
-          dumpIfSet opt_D_dump_occur_anal "Occurrence analysis"
+          dumpIfSet_dyn dflags Opt_D_dump_occur_anal "Occurrence analysis"
                     (pprCoreBindings tagged_binds);
 
                -- SIMPLIFY
@@ -283,7 +366,7 @@ simplifyPgm (imported_rule_ids, rule_lhs_fvs)
                --      case t of {(_,counts') -> if counts'=0 then ...
                -- So the conditional didn't force counts', because the
                -- selection got duplicated.  Sigh!
-          case initSmpl sw_chkr us1 imported_rule_ids black_list_fn 
+          case initSmpl dflags sw_chkr us1 imported_rule_ids black_list_fn 
                         (simplTopBinds tagged_binds)
                of { (binds', counts') -> do {
                        -- The imported_rule_ids are used by initSmpl to initialise
@@ -299,14 +382,15 @@ simplifyPgm (imported_rule_ids, rule_lhs_fvs)
           else do {
 
                -- Dump the result of this iteration
-          dumpIfSet opt_D_dump_simpl_iterations
+          dumpIfSet_dyn dflags Opt_D_dump_simpl_iterations
                     ("Simplifier iteration " ++ show iteration_no 
                      ++ " out of " ++ show max_iterations)
                     (pprSimplCount counts') ;
 
-          if opt_D_dump_simpl_iterations then
-               endPass ("Simplifier iteration " ++ show iteration_no ++ " result")
-                       opt_D_verbose_core2core
+          if dopt Opt_D_dump_simpl_iterations dflags then
+               endPass dflags 
+                        ("Simplifier iteration " ++ show iteration_no ++ " result")
+                       (dopt Opt_D_verbose_core2core dflags)
                        binds'
           else
                return [] ;