Completely new treatment of INLINE pragmas (big patch)
[ghc-hetmet.git] / compiler / simplCore / SimplCore.lhs
1 %
2 % (c) The GRASP/AQUA Project, Glasgow University, 1992-1998
3 %
4 \section[SimplCore]{Driver for simplifying @Core@ programs}
5
6 \begin{code}
7 {-# OPTIONS -w #-}
8 -- The above warning supression flag is a temporary kludge.
9 -- While working on this module you are encouraged to remove it and fix
10 -- any warnings in the module. See
11 --     http://hackage.haskell.org/trac/ghc/wiki/Commentary/CodingStyle#Warnings
12 -- for details
13
14 module SimplCore ( core2core, simplifyExpr ) where
15
16 #include "HsVersions.h"
17
18 import DynFlags         ( CoreToDo(..), SimplifierSwitch(..),
19                           SimplifierMode(..), DynFlags, DynFlag(..), dopt,
20                           getCoreToDo, shouldDumpSimplPhase )
21 import CoreSyn
22 import HscTypes
23 import CSE              ( cseProgram )
24 import Rules            ( RuleBase, emptyRuleBase, mkRuleBase, unionRuleBase,
25                           extendRuleBaseList, pprRuleBase, pprRulesForUser,
26                           ruleCheckProgram, rulesOfBinds,
27                           addSpecInfo, addIdSpecialisations )
28 import PprCore          ( pprCoreBindings, pprCoreExpr, pprRules )
29 import OccurAnal        ( occurAnalysePgm, occurAnalyseExpr )
30 import IdInfo           ( setNewStrictnessInfo, newStrictnessInfo, 
31                           setUnfoldingInfo, unfoldingInfo, setSpecInfoHead,
32                           setInlinePragInfo, inlinePragInfo,
33                           setSpecInfo, specInfo, specInfoRules )
34 import CoreUtils        ( coreBindsSize )
35 import Simplify         ( simplTopBinds, simplExpr )
36 import SimplEnv         ( SimplEnv, simplBinders, mkSimplEnv, setInScopeSet )
37 import SimplMonad
38 import CoreMonad
39 import qualified ErrUtils as Err        ( dumpIfSet_dyn, dumpIfSet, showPass )
40 import CoreLint         ( showPass, endPass, endPassIf, endIteration )
41 import FloatIn          ( floatInwards )
42 import FloatOut         ( floatOutwards )
43 import FamInstEnv
44 import Id
45 import DataCon
46 import TyCon            ( tyConSelIds, tyConDataCons )
47 import Class            ( classSelIds )
48 import BasicTypes       ( CompilerPhase, isActive )
49 import VarSet
50 import VarEnv
51 import NameEnv          ( lookupNameEnv )
52 import LiberateCase     ( liberateCase )
53 import SAT              ( doStaticArgs )
54 import Specialise       ( specProgram)
55 import SpecConstr       ( specConstrProgram)
56 import DmdAnal          ( dmdAnalPgm )
57 import WorkWrap         ( wwTopBinds )
58 #ifdef OLD_STRICTNESS
59 import StrictAnal       ( saBinds )
60 import CprAnalyse       ( cprAnalyse )
61 #endif
62 import Vectorise        ( vectorise )
63 import FastString
64 import Util
65
66 import UniqSupply       ( UniqSupply, mkSplitUniqSupply, splitUniqSupply )
67 import IO               ( hPutStr, stderr )
68 import Outputable
69 import Control.Monad
70 import List             ( partition, intersperse )
71 import Maybes
72 \end{code}
73
74 %************************************************************************
75 %*                                                                      *
76 \subsection{The driver for the simplifier}
77 %*                                                                      *
78 %************************************************************************
79
80 \begin{code}
81 core2core :: HscEnv
82           -> ModGuts
83           -> IO ModGuts
84
85 core2core hsc_env guts = do
86     let dflags = hsc_dflags hsc_env
87
88     us <- mkSplitUniqSupply 's'
89     let (cp_us, ru_us) = splitUniqSupply us
90
91     -- COMPUTE THE ANNOTATIONS TO USE
92     ann_env <- prepareAnnotations hsc_env (Just guts)
93
94     -- COMPUTE THE RULE BASE TO USE
95     (imp_rule_base, guts1) <- prepareRules hsc_env guts ru_us
96
97     -- Get the module out of the current HscEnv so we can retrieve it from the monad.
98     -- This is very convienent for the users of the monad (e.g. plugins do not have to
99     -- consume the ModGuts to find the module) but somewhat ugly because mg_module may
100     -- _theoretically_ be changed during the Core pipeline (it's part of ModGuts), which
101     -- would mean our cached value would go out of date.
102     let mod = mg_module guts
103     (guts, stats) <- runCoreM hsc_env ann_env imp_rule_base cp_us mod $ do
104         -- FIND BUILT-IN PASSES
105         let builtin_core_todos = getCoreToDo dflags
106
107         -- Note [Injecting implicit bindings]
108         let implicit_binds = getImplicitBinds (mg_types guts1)
109             guts2 = guts1 { mg_binds = implicit_binds ++ mg_binds guts1 }
110
111         -- DO THE BUSINESS
112         doCorePasses builtin_core_todos guts2
113
114     Err.dumpIfSet_dyn dflags Opt_D_dump_simpl_stats
115         "Grand total simplifier statistics"
116         (pprSimplCount stats)
117
118     return guts
119
120
121 type CorePass = CoreToDo
122
123 simplifyExpr :: DynFlags -- includes spec of what core-to-core passes to do
124              -> CoreExpr
125              -> IO CoreExpr
126 -- simplifyExpr is called by the driver to simplify an
127 -- expression typed in at the interactive prompt
128 simplifyExpr dflags expr
129   = do  {
130         ; Err.showPass dflags "Simplify"
131
132         ; us <-  mkSplitUniqSupply 's'
133
134         ; let (expr', _counts) = initSmpl dflags emptyRuleBase emptyFamInstEnvs us $
135                                  simplExprGently gentleSimplEnv expr
136
137         ; Err.dumpIfSet_dyn dflags Opt_D_dump_simpl "Simplified expression"
138                         (pprCoreExpr expr')
139
140         ; return expr'
141         }
142
143 gentleSimplEnv :: SimplEnv
144 gentleSimplEnv = mkSimplEnv SimplGently  (isAmongSimpl [])
145
146 doCorePasses :: [CorePass] -> ModGuts -> CoreM ModGuts
147 doCorePasses passes guts = foldM (flip doCorePass) guts passes
148
149 doCorePass :: CorePass -> ModGuts -> CoreM ModGuts
150 doCorePass (CoreDoSimplify mode sws) = {-# SCC "Simplify" #-}
151                                        simplifyPgm mode sws
152
153 doCorePass CoreCSE                   = {-# SCC "CommonSubExpr" #-}   
154                                        describePass "Common sub-expression" Opt_D_dump_cse $ 
155                                        doPass cseProgram
156
157 doCorePass CoreLiberateCase          = {-# SCC "LiberateCase" #-}
158                                        describePass "Liberate case" Opt_D_verbose_core2core $ 
159                                        doPassD liberateCase
160
161 doCorePass CoreDoFloatInwards        = {-# SCC "FloatInwards" #-}
162                                        describePass "Float inwards" Opt_D_verbose_core2core $ 
163                                        doPass floatInwards
164
165 doCorePass (CoreDoFloatOutwards f)   = {-# SCC "FloatOutwards" #-}
166                                        describePassD (text "Float out" <+> parens (ppr f)) 
167                                                      Opt_D_verbose_core2core $ 
168                                        doPassDUM (floatOutwards f)
169
170 doCorePass CoreDoStaticArgs          = {-# SCC "StaticArgs" #-}
171                                        describePass "Static argument" Opt_D_verbose_core2core $ 
172                                        doPassU doStaticArgs
173
174 doCorePass CoreDoStrictness          = {-# SCC "Stranal" #-}
175                                        describePass "Demand analysis" Opt_D_dump_stranal $
176                                        doPassDM dmdAnalPgm
177
178 doCorePass CoreDoWorkerWrapper       = {-# SCC "WorkWrap" #-}
179                                        describePass "Worker Wrapper binds" Opt_D_dump_worker_wrapper $
180                                        doPassU wwTopBinds
181
182 doCorePass CoreDoSpecialising        = {-# SCC "Specialise" #-}
183                                        describePassR "Specialise" Opt_D_dump_spec $ 
184                                        doPassU specProgram
185
186 doCorePass CoreDoSpecConstr          = {-# SCC "SpecConstr" #-}
187                                        describePassR "SpecConstr" Opt_D_dump_spec $
188                                        doPassDU  specConstrProgram
189
190 doCorePass (CoreDoVectorisation be)  = {-# SCC "Vectorise" #-}
191                                        describePass "Vectorisation" Opt_D_dump_vect $ 
192                                        vectorise be
193
194 doCorePass CoreDoGlomBinds              = dontDescribePass $ doPassDM  glomBinds
195 doCorePass CoreDoPrintCore              = dontDescribePass $ observe   printCore
196 doCorePass (CoreDoRuleCheck phase pat)  = dontDescribePass $ ruleCheck phase pat
197
198 #ifdef OLD_STRICTNESS
199 doCorePass CoreDoOldStrictness          = {-# SCC "OldStrictness" #-} doOldStrictness
200 #endif
201
202 doCorePass CoreDoNothing                = return
203 doCorePass (CoreDoPasses passes)        = doCorePasses passes
204
205 #ifdef OLD_STRICTNESS
206 doOldStrictness :: ModGuts -> CoreM ModGuts
207 doOldStrictness guts
208   = do dfs <- getDynFlags
209        guts'  <- describePass "Strictness analysis" Opt_D_dump_stranal $ 
210                  doPassM (saBinds dfs) guts
211        guts'' <- describePass "Constructed Product analysis" Opt_D_dump_cpranal $ 
212                  doPass cprAnalyse guts'
213        return guts''
214 #endif
215
216 \end{code}
217
218 %************************************************************************
219 %*                                                                      *
220 \subsection{Core pass combinators}
221 %*                                                                      *
222 %************************************************************************
223
224 \begin{code}
225
226 dontDescribePass :: (ModGuts -> CoreM ModGuts) -> ModGuts -> CoreM ModGuts
227 dontDescribePass = ($)
228
229 describePass :: String -> DynFlag -> (ModGuts -> CoreM ModGuts) -> ModGuts -> CoreM ModGuts
230 describePass name dflag pass guts = do
231     dflags <- getDynFlags
232     
233     liftIO $ showPass dflags name
234     guts' <- pass guts
235     liftIO $ endPass dflags name dflag (mg_binds guts')
236     
237     return guts'
238
239 describePassD :: SDoc -> DynFlag -> (ModGuts -> CoreM ModGuts) -> ModGuts -> CoreM ModGuts
240 describePassD doc = describePass (showSDoc doc)
241
242 describePassR :: String -> DynFlag -> (ModGuts -> CoreM ModGuts) -> ModGuts -> CoreM ModGuts
243 describePassR name dflag pass guts = do
244     guts' <- describePass name dflag pass guts
245     dumpIfSet_dyn Opt_D_dump_rules "Top-level specialisations"
246                 (pprRulesForUser (rulesOfBinds (mg_binds guts')))
247     return guts'
248
249 printCore _ binds = Err.dumpIfSet True "Print Core" (pprCoreBindings binds)
250
251 ruleCheck :: CompilerPhase -> String -> ModGuts -> CoreM ModGuts
252 ruleCheck current_phase pat guts = do
253     let is_active = isActive current_phase
254     rb <- getRuleBase
255     dflags <- getDynFlags
256     liftIO $ Err.showPass dflags "RuleCheck"
257     liftIO $ printDump (ruleCheckProgram is_active pat rb (mg_binds guts))
258     return guts
259
260
261 doPassDMS :: (DynFlags -> [CoreBind] -> IO (SimplCount, [CoreBind])) -> ModGuts -> CoreM ModGuts
262 doPassDMS do_pass = doPassM $ \binds -> do
263     dflags <- getDynFlags
264     liftIOWithCount $ do_pass dflags binds
265
266 doPassDUM :: (DynFlags -> UniqSupply -> [CoreBind] -> IO [CoreBind]) -> ModGuts -> CoreM ModGuts
267 doPassDUM do_pass = doPassM $ \binds -> do
268     dflags <- getDynFlags
269     us     <- getUniqueSupplyM
270     liftIO $ do_pass dflags us binds
271
272 doPassDM :: (DynFlags -> [CoreBind] -> IO [CoreBind]) -> ModGuts -> CoreM ModGuts
273 doPassDM do_pass = doPassDUM (\dflags -> const (do_pass dflags))
274
275 doPassD :: (DynFlags -> [CoreBind] -> [CoreBind]) -> ModGuts -> CoreM ModGuts
276 doPassD do_pass = doPassDM (\dflags -> return . do_pass dflags)
277
278 doPassDU :: (DynFlags -> UniqSupply -> [CoreBind] -> [CoreBind]) -> ModGuts -> CoreM ModGuts
279 doPassDU do_pass = doPassDUM (\dflags us -> return . do_pass dflags us)
280
281 doPassU :: (UniqSupply -> [CoreBind] -> [CoreBind]) -> ModGuts -> CoreM ModGuts
282 doPassU do_pass = doPassDU (const do_pass)
283
284 -- Most passes return no stats and don't change rules: these combinators
285 -- let us lift them to the full blown ModGuts+CoreM world
286 doPassM :: Monad m => ([CoreBind] -> m [CoreBind]) -> ModGuts -> m ModGuts
287 doPassM bind_f guts = do
288     binds' <- bind_f (mg_binds guts)
289     return (guts { mg_binds = binds' })
290
291 doPassMG :: Monad m => (ModGuts -> m [CoreBind]) -> ModGuts -> m ModGuts
292 doPassMG bind_f guts = do
293     binds' <- bind_f guts
294     return (guts { mg_binds = binds' })
295
296 doPass :: ([CoreBind] -> [CoreBind]) -> ModGuts -> CoreM ModGuts
297 doPass bind_f guts = return $ guts { mg_binds = bind_f (mg_binds guts) }
298
299 -- Observer passes just peek; don't modify the bindings at all
300 observe :: (DynFlags -> [CoreBind] -> IO a) -> ModGuts -> CoreM ModGuts
301 observe do_pass = doPassM $ \binds -> do
302     dflags <- getDynFlags
303     liftIO $ do_pass dflags binds
304     return binds
305 \end{code}
306
307
308 %************************************************************************
309 %*                                                                      *
310         Implicit bindings
311 %*                                                                      *
312 %************************************************************************
313
314 Note [Injecting implicit bindings]
315 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
316 We used to inject the implict bindings right at the end, in CoreTidy.
317 But some of these bindings, notably record selectors, are not
318 constructed in an optimised form.  E.g. record selector for
319         data T = MkT { x :: {-# UNPACK #-} !Int }
320 Then the unfolding looks like
321         x = \t. case t of MkT x1 -> let x = I# x1 in x
322 This generates bad code unless it's first simplified a bit.
323 (Only matters when the selector is used curried; eg map x ys.)
324 See Trac #2070.
325
326 \begin{code}
327 getImplicitBinds :: TypeEnv -> [CoreBind]
328 getImplicitBinds type_env
329   = map get_defn (concatMap implicit_con_ids (typeEnvTyCons type_env)
330                   ++ concatMap other_implicit_ids (typeEnvElts type_env))
331         -- Put the constructor wrappers first, because
332         -- other implicit bindings (notably the fromT functions arising 
333         -- from generics) use the constructor wrappers.  At least that's
334         -- what External Core likes
335   where
336     implicit_con_ids tc = mapCatMaybes dataConWrapId_maybe (tyConDataCons tc)
337     
338     other_implicit_ids (ATyCon tc) = filter (not . isNaughtyRecordSelector) (tyConSelIds tc)
339         -- The "naughty" ones are not real functions at all
340         -- They are there just so we can get decent error messages
341         -- See Note  [Naughty record selectors] in MkId.lhs
342     other_implicit_ids (AClass cl) = classSelIds cl
343     other_implicit_ids _other      = []
344     
345     get_defn :: Id -> CoreBind
346     get_defn id = NonRec id (unfoldingTemplate (idUnfolding id))
347 \end{code}
348
349
350 %************************************************************************
351 %*                                                                      *
352         Dealing with rules
353 %*                                                                      *
354 %************************************************************************
355
356 -- prepareLocalRuleBase takes the CoreBinds and rules defined in this module.
357 -- It attaches those rules that are for local Ids to their binders, and
358 -- returns the remainder attached to Ids in an IdSet.  
359
360 \begin{code}
361 prepareRules :: HscEnv 
362              -> ModGuts
363              -> UniqSupply
364              -> IO (RuleBase,           -- Rule base for imported things, incl
365                                         -- (a) rules defined in this module (orphans)
366                                         -- (b) rules from other modules in home package
367                                         -- but not things from other packages
368
369                     ModGuts)            -- Modified fields are 
370                                         --      (a) Bindings have rules attached,
371                                         --              and INLINE rules simplified
372                                         --      (b) Rules are now just orphan rules
373
374 prepareRules hsc_env@(HscEnv { hsc_dflags = dflags, hsc_HPT = hpt })
375              guts@(ModGuts { mg_binds = binds, mg_deps = deps 
376                            , mg_rules = local_rules, mg_rdr_env = rdr_env })
377              us 
378   = do  { us <- mkSplitUniqSupply 'w'
379
380         ; let   -- Simplify the local rules; boringly, we need to make an in-scope set
381                 -- from the local binders, to avoid warnings from Simplify.simplVar
382               local_ids        = mkInScopeSet (mkVarSet (bindersOfBinds binds))
383               env              = setInScopeSet gentleSimplEnv local_ids 
384               (simpl_rules, _) = initSmpl dflags emptyRuleBase emptyFamInstEnvs us $
385                                  mapM (simplRule env) local_rules
386
387         ; let (rules_for_locals, rules_for_imps) = partition isLocalRule simpl_rules
388
389               home_pkg_rules = hptRules hsc_env (dep_mods deps)
390               hpt_rule_base  = mkRuleBase home_pkg_rules
391               imp_rule_base  = extendRuleBaseList hpt_rule_base rules_for_imps
392
393               binds_w_rules = updateBinders rules_for_locals binds
394
395
396         ; Err.dumpIfSet_dyn dflags Opt_D_dump_rules "Transformation rules"
397                 (withPprStyle (mkUserStyle (mkPrintUnqualified dflags rdr_env) AllTheWay) $
398                  vcat [text "Local rules", pprRules simpl_rules,
399                        text "",
400                        text "Imported rules", pprRuleBase imp_rule_base])
401
402         ; return (imp_rule_base, guts { mg_binds = binds_w_rules, 
403                                         mg_rules = rules_for_imps })
404     }
405
406 -- Note [Attach rules to local ids]
407 -- ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
408 -- Find the rules for locally-defined Ids; then we can attach them
409 -- to the binders in the top-level bindings
410 -- 
411 -- Reason
412 --      - It makes the rules easier to look up
413 --      - It means that transformation rules and specialisations for
414 --        locally defined Ids are handled uniformly
415 --      - It keeps alive things that are referred to only from a rule
416 --        (the occurrence analyser knows about rules attached to Ids)
417 --      - It makes sure that, when we apply a rule, the free vars
418 --        of the RHS are more likely to be in scope
419 --      - The imported rules are carried in the in-scope set
420 --        which is extended on each iteration by the new wave of
421 --        local binders; any rules which aren't on the binding will
422 --        thereby get dropped
423
424 updateBinders :: [CoreRule] -> [CoreBind] -> [CoreBind]
425 updateBinders rules_for_locals binds
426   = map update_bind binds
427   where
428     local_rules = extendRuleBaseList emptyRuleBase rules_for_locals
429
430     update_bind (NonRec b r) = NonRec (add_rules b) r
431     update_bind (Rec prs)    = Rec (mapFst add_rules prs)
432
433         -- See Note [Attach rules to local ids]
434         -- NB: the binder might have some existing rules,
435         -- arising from specialisation pragmas
436     add_rules bndr
437         | Just rules <- lookupNameEnv local_rules (idName bndr)
438         = bndr `addIdSpecialisations` rules
439         | otherwise
440         = bndr
441 \end{code}
442
443 Note [Simplifying the left-hand side of a RULE]
444 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
445 We must do some gentle simplification on the lhs (template) of each
446 rule.  The case that forced me to add this was the fold/build rule,
447 which without simplification looked like:
448         fold k z (build (/\a. g a))  ==>  ...
449 This doesn't match unless you do eta reduction on the build argument.
450 Similarly for a LHS like
451         augment g (build h) 
452 we do not want to get
453         augment (\a. g a) (build h)
454 otherwise we don't match when given an argument like
455         augment (\a. h a a) (build h)
456
457 The simplifier does indeed do eta reduction (it's in
458 Simplify.completeLam) but only if -O is on.
459
460 \begin{code}
461 simplRule env rule@(BuiltinRule {})
462   = return rule
463 simplRule env rule@(Rule { ru_bndrs = bndrs, ru_args = args, ru_rhs = rhs })
464   = do (env, bndrs') <- simplBinders env bndrs
465        args' <- mapM (simplExprGently env) args
466        rhs' <- simplExprGently env rhs
467        return (rule { ru_bndrs = bndrs', ru_args = args', ru_rhs = rhs' })
468 \end{code}
469
470 \begin{code}
471 simplExprGently :: SimplEnv -> CoreExpr -> SimplM CoreExpr
472 -- Simplifies an expression 
473 --      does occurrence analysis, then simplification
474 --      and repeats (twice currently) because one pass
475 --      alone leaves tons of crud.
476 -- Used (a) for user expressions typed in at the interactive prompt
477 --      (b) the LHS and RHS of a RULE
478 --      (c) Template Haskell splices
479 --
480 -- The name 'Gently' suggests that the SimplifierMode is SimplGently,
481 -- and in fact that is so.... but the 'Gently' in simplExprGently doesn't
482 -- enforce that; it just simplifies the expression twice
483
484 -- It's important that simplExprGently does eta reduction; see
485 -- Note [Simplifying the left-hand side of a RULE] above.  The
486 -- simplifier does indeed do eta reduction (it's in Simplify.completeLam)
487 -- but only if -O is on.
488
489 simplExprGently env expr = do
490     expr1 <- simplExpr env (occurAnalyseExpr expr)
491     simplExpr env (occurAnalyseExpr expr1)
492 \end{code}
493
494
495 %************************************************************************
496 %*                                                                      *
497 \subsection{Glomming}
498 %*                                                                      *
499 %************************************************************************
500
501 \begin{code}
502 glomBinds :: DynFlags -> [CoreBind] -> IO [CoreBind]
503 -- Glom all binds together in one Rec, in case any
504 -- transformations have introduced any new dependencies
505 --
506 -- NB: the global invariant is this:
507 --      *** the top level bindings are never cloned, and are always unique ***
508 --
509 -- We sort them into dependency order, but applying transformation rules may
510 -- make something at the top refer to something at the bottom:
511 --      f = \x -> p (q x)
512 --      h = \y -> 3
513 --      
514 --      RULE:  p (q x) = h x
515 --
516 -- Applying this rule makes f refer to h, 
517 -- although it doesn't appear to in the source program.  
518 -- This pass lets us control where it happens.
519 --
520 -- NOTICE that this cannot happen for rules whose head is a locally-defined
521 -- function.  It only happens for rules whose head is an imported function
522 -- (p in the example above).  So, for example, the rule had been
523 --      RULE: f (p x) = h x
524 -- then the rule for f would be attached to f itself (in its IdInfo) 
525 -- by prepareLocalRuleBase and h would be regarded by the occurrency 
526 -- analyser as free in f.
527
528 glomBinds dflags binds
529   = do { Err.showPass dflags "GlomBinds" ;
530          let { recd_binds = [Rec (flattenBinds binds)] } ;
531          return recd_binds }
532         -- Not much point in printing the result... 
533         -- just consumes output bandwidth
534 \end{code}
535
536
537 %************************************************************************
538 %*                                                                      *
539 \subsection{The driver for the simplifier}
540 %*                                                                      *
541 %************************************************************************
542
543 \begin{code}
544 simplifyPgm :: SimplifierMode -> [SimplifierSwitch] -> ModGuts -> CoreM ModGuts
545 simplifyPgm mode switches
546   = describePassD doc Opt_D_dump_simpl_phases $ \guts -> 
547     do { hsc_env <- getHscEnv
548        ; us <- getUniqueSupplyM
549        ; rb <- getRuleBase
550        ; let fam_inst_env = mg_fam_inst_env guts
551              dump_phase = shouldDumpSimplPhase (hsc_dflags hsc_env) mode
552              simplify_pgm = simplifyPgmIO dump_phase mode switches 
553                                           hsc_env us rb fam_inst_env
554
555        ; doPassM (liftIOWithCount . simplify_pgm) guts }
556   where
557     doc = ptext (sLit "Simplifier Phase") <+> text (showPpr mode) 
558
559 simplifyPgmIO :: Bool
560             -> SimplifierMode
561             -> [SimplifierSwitch]
562             -> HscEnv
563             -> UniqSupply
564             -> RuleBase
565             -> FamInstEnv
566             -> [CoreBind]
567             -> IO (SimplCount, [CoreBind])  -- New bindings
568
569 simplifyPgmIO dump_phase mode switches hsc_env us imp_rule_base fam_inst_env binds
570   = do {
571         (termination_msg, it_count, counts_out, binds') 
572            <- do_iteration us 1 (zeroSimplCount dflags) binds ;
573
574         Err.dumpIfSet (dump_phase && dopt Opt_D_dump_simpl_stats dflags)
575                   "Simplifier statistics for following pass"
576                   (vcat [text termination_msg <+> text "after" <+> ppr it_count <+> text "iterations",
577                          text "",
578                          pprSimplCount counts_out]);
579
580         return (counts_out, binds')
581     }
582   where
583     dflags         = hsc_dflags hsc_env
584                    
585     sw_chkr        = isAmongSimpl switches
586     max_iterations = intSwitchSet sw_chkr MaxSimplifierIterations `orElse` 2
587  
588     do_iteration us iteration_no counts binds
589         -- iteration_no is the number of the iteration we are
590         -- about to begin, with '1' for the first
591       | iteration_no > max_iterations   -- Stop if we've run out of iterations
592       =  WARN(debugIsOn && (max_iterations > 2),
593                 text ("Simplifier still going after " ++
594                                 show max_iterations ++
595                                 " iterations; bailing out.  Size = " ++ show (coreBindsSize binds) ++ "\n" ))
596                 -- Subtract 1 from iteration_no to get the
597                 -- number of iterations we actually completed
598             return ("Simplifier bailed out", iteration_no - 1, counts, binds)
599
600       -- Try and force thunks off the binds; significantly reduces
601       -- space usage, especially with -O.  JRS, 000620.
602       | let sz = coreBindsSize binds in sz == sz
603       = do {
604                 -- Occurrence analysis
605            let { tagged_binds = {-# SCC "OccAnal" #-} occurAnalysePgm binds } ;
606            Err.dumpIfSet_dyn dflags Opt_D_dump_occur_anal "Occurrence analysis"
607                      (pprCoreBindings tagged_binds);
608
609                 -- Get any new rules, and extend the rule base
610                 -- We need to do this regularly, because simplification can
611                 -- poke on IdInfo thunks, which in turn brings in new rules
612                 -- behind the scenes.  Otherwise there's a danger we'll simply
613                 -- miss the rules for Ids hidden inside imported inlinings
614            eps <- hscEPS hsc_env ;
615            let  { rule_base' = unionRuleBase imp_rule_base (eps_rule_base eps)
616                 ; simpl_env  = mkSimplEnv mode sw_chkr 
617                 ; simpl_binds = {-# SCC "SimplTopBinds" #-} 
618                                 simplTopBinds simpl_env tagged_binds
619                 ; fam_envs = (eps_fam_inst_env eps, fam_inst_env) } ;
620            
621                 -- Simplify the program
622                 -- We do this with a *case* not a *let* because lazy pattern
623                 -- matching bit us with bad space leak!
624                 -- With a let, we ended up with
625                 --   let
626                 --      t = initSmpl ...
627                 --      counts' = snd t
628                 --   in
629                 --      case t of {(_,counts') -> if counts'=0 then ... }
630                 -- So the conditional didn't force counts', because the
631                 -- selection got duplicated.  Sigh!
632            case initSmpl dflags rule_base' fam_envs us1 simpl_binds of {
633                 (binds', counts') -> do {
634
635            let  { all_counts = counts `plusSimplCount` counts'
636                 ; herald     = "Simplifier mode " ++ showPpr mode ++ 
637                               ", iteration " ++ show iteration_no ++
638                               " out of " ++ show max_iterations
639                 } ;
640
641                 -- Stop if nothing happened; don't dump output
642            if isZeroSimplCount counts' then
643                 return ("Simplifier reached fixed point", iteration_no, 
644                         all_counts, binds')
645            else do {
646                 -- Short out indirections
647                 -- We do this *after* at least one run of the simplifier 
648                 -- because indirection-shorting uses the export flag on *occurrences*
649                 -- and that isn't guaranteed to be ok until after the first run propagates
650                 -- stuff from the binding site to its occurrences
651                 --
652                 -- ToDo: alas, this means that indirection-shorting does not happen at all
653                 --       if the simplifier does nothing (not common, I know, but unsavoury)
654            let { binds'' = {-# SCC "ZapInd" #-} shortOutIndirections binds' } ;
655
656                 -- Dump the result of this iteration
657            Err.dumpIfSet_dyn dflags Opt_D_dump_simpl_iterations herald
658                          (pprSimplCount counts') ;
659            endIteration dflags herald Opt_D_dump_simpl_iterations binds'' ;
660
661                 -- Loop
662            do_iteration us2 (iteration_no + 1) all_counts binds''
663         }  } } }
664       where
665           (us1, us2) = splitUniqSupply us
666 \end{code}
667
668
669 %************************************************************************
670 %*                                                                      *
671                 Shorting out indirections
672 %*                                                                      *
673 %************************************************************************
674
675 If we have this:
676
677         x_local = <expression>
678         ...bindings...
679         x_exported = x_local
680
681 where x_exported is exported, and x_local is not, then we replace it with this:
682
683         x_exported = <expression>
684         x_local = x_exported
685         ...bindings...
686
687 Without this we never get rid of the x_exported = x_local thing.  This
688 save a gratuitous jump (from \tr{x_exported} to \tr{x_local}), and
689 makes strictness information propagate better.  This used to happen in
690 the final phase, but it's tidier to do it here.
691
692 STRICTNESS: if we have done strictness analysis, we want the strictness info on
693 x_local to transfer to x_exported.  Hence the copyIdInfo call.
694
695 RULES: we want to *add* any RULES for x_local to x_exported.
696
697 Note [Rules and indirection-zapping]
698 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
699 Problem: what if x_exported has a RULE that mentions something in ...bindings...?
700 Then the things mentioned can be out of scope!  Solution
701  a) Make sure that in this pass the usage-info from x_exported is 
702         available for ...bindings...
703  b) If there are any such RULES, rec-ify the entire top-level. 
704     It'll get sorted out next time round
705
706 Messing up the rules
707 ~~~~~~~~~~~~~~~~~~~~
708 The example that went bad on me at one stage was this one:
709         
710     iterate :: (a -> a) -> a -> [a]
711         [Exported]
712     iterate = iterateList       
713     
714     iterateFB c f x = x `c` iterateFB c f (f x)
715     iterateList f x =  x : iterateList f (f x)
716         [Not exported]
717     
718     {-# RULES
719     "iterate"   forall f x.     iterate f x = build (\c _n -> iterateFB c f x)
720     "iterateFB"                 iterateFB (:) = iterateList
721      #-}
722
723 This got shorted out to:
724
725     iterateList :: (a -> a) -> a -> [a]
726     iterateList = iterate
727     
728     iterateFB c f x = x `c` iterateFB c f (f x)
729     iterate f x =  x : iterate f (f x)
730     
731     {-# RULES
732     "iterate"   forall f x.     iterate f x = build (\c _n -> iterateFB c f x)
733     "iterateFB"                 iterateFB (:) = iterate
734      #-}
735
736 And now we get an infinite loop in the rule system 
737         iterate f x -> build (\cn -> iterateFB c f x)
738                     -> iterateFB (:) f x
739                     -> iterate f x
740
741 Tiresome old solution: 
742         don't do shorting out if f has rewrite rules (see shortableIdInfo)
743
744 New solution (I think): 
745         use rule switching-off pragmas to get rid 
746         of iterateList in the first place
747
748
749 Other remarks
750 ~~~~~~~~~~~~~
751 If more than one exported thing is equal to a local thing (i.e., the
752 local thing really is shared), then we do one only:
753 \begin{verbatim}
754         x_local = ....
755         x_exported1 = x_local
756         x_exported2 = x_local
757 ==>
758         x_exported1 = ....
759
760         x_exported2 = x_exported1
761 \end{verbatim}
762
763 We rely on prior eta reduction to simplify things like
764 \begin{verbatim}
765         x_exported = /\ tyvars -> x_local tyvars
766 ==>
767         x_exported = x_local
768 \end{verbatim}
769 Hence,there's a possibility of leaving unchanged something like this:
770 \begin{verbatim}
771         x_local = ....
772         x_exported1 = x_local Int
773 \end{verbatim}
774 By the time we've thrown away the types in STG land this 
775 could be eliminated.  But I don't think it's very common
776 and it's dangerous to do this fiddling in STG land 
777 because we might elminate a binding that's mentioned in the
778 unfolding for something.
779
780 \begin{code}
781 type IndEnv = IdEnv Id          -- Maps local_id -> exported_id
782
783 shortOutIndirections :: [CoreBind] -> [CoreBind]
784 shortOutIndirections binds
785   | isEmptyVarEnv ind_env = binds
786   | no_need_to_flatten    = binds'                      -- See Note [Rules and indirect-zapping]
787   | otherwise             = [Rec (flattenBinds binds')] -- for this no_need_to_flatten stuff
788   where
789     ind_env            = makeIndEnv binds
790     exp_ids            = varSetElems ind_env    -- These exported Ids are the subjects
791     exp_id_set         = mkVarSet exp_ids       -- of the indirection-elimination
792     no_need_to_flatten = all (null . specInfoRules . idSpecialisation) exp_ids
793     binds'             = concatMap zap binds
794
795     zap (NonRec bndr rhs) = [NonRec b r | (b,r) <- zapPair (bndr,rhs)]
796     zap (Rec pairs)       = [Rec (concatMap zapPair pairs)]
797
798     zapPair (bndr, rhs)
799         | bndr `elemVarSet` exp_id_set             = []
800         | Just exp_id <- lookupVarEnv ind_env bndr = [(transferIdInfo exp_id bndr, rhs),
801                                                       (bndr, Var exp_id)]
802         | otherwise                                = [(bndr,rhs)]
803                              
804 makeIndEnv :: [CoreBind] -> IndEnv
805 makeIndEnv binds
806   = foldr add_bind emptyVarEnv binds
807   where
808     add_bind :: CoreBind -> IndEnv -> IndEnv
809     add_bind (NonRec exported_id rhs) env = add_pair (exported_id, rhs) env
810     add_bind (Rec pairs)              env = foldr add_pair env pairs
811
812     add_pair :: (Id,CoreExpr) -> IndEnv -> IndEnv
813     add_pair (exported_id, Var local_id) env
814         | shortMeOut env exported_id local_id = extendVarEnv env local_id exported_id
815     add_pair (exported_id, rhs) env
816         = env
817                         
818 shortMeOut ind_env exported_id local_id
819 -- The if-then-else stuff is just so I can get a pprTrace to see
820 -- how often I don't get shorting out becuase of IdInfo stuff
821   = if isExportedId exported_id &&              -- Only if this is exported
822
823        isLocalId local_id &&                    -- Only if this one is defined in this
824                                                 --      module, so that we *can* change its
825                                                 --      binding to be the exported thing!
826
827        not (isExportedId local_id) &&           -- Only if this one is not itself exported,
828                                                 --      since the transformation will nuke it
829    
830        not (local_id `elemVarEnv` ind_env)      -- Only if not already substituted for
831     then
832         True
833
834 {- No longer needed
835         if isEmptySpecInfo (specInfo (idInfo exported_id))      -- Only if no rules
836         then True       -- See note on "Messing up rules"
837         else 
838 #ifdef DEBUG 
839           pprTrace "shortMeOut:" (ppr exported_id)
840 #endif
841                                                 False
842 -}
843     else
844         False
845
846
847 -----------------
848 transferIdInfo :: Id -> Id -> Id
849 -- If we have
850 --      lcl_id = e; exp_id = lcl_id
851 -- and lcl_id has useful IdInfo, we don't want to discard it by going
852 --      gbl_id = e; lcl_id = gbl_id
853 -- Instead, transfer IdInfo from lcl_id to exp_id
854 -- Overwriting, rather than merging, seems to work ok.
855 transferIdInfo exported_id local_id
856   = modifyIdInfo transfer exported_id
857   where
858     local_info = idInfo local_id
859     transfer exp_info = exp_info `setNewStrictnessInfo` newStrictnessInfo local_info
860                                  `setUnfoldingInfo`     unfoldingInfo local_info
861                                  `setInlinePragInfo`    inlinePragInfo local_info
862                                  `setSpecInfo`          addSpecInfo (specInfo exp_info) new_info
863     new_info = setSpecInfoHead (idName exported_id) 
864                                (specInfo local_info)
865         -- Remember to set the function-name field of the
866         -- rules as we transfer them from one function to another
867 \end{code}