Turn "NOTE: Simplifier still going..." message into a WARN()
[ghc-hetmet.git] / compiler / simplCore / SimplCore.lhs
1 %
2 % (c) The GRASP/AQUA Project, Glasgow University, 1992-1998
3 %
4 \section[SimplCore]{Driver for simplifying @Core@ programs}
5
6 \begin{code}
7 {-# OPTIONS -w #-}
8 -- The above warning supression flag is a temporary kludge.
9 -- While working on this module you are encouraged to remove it and fix
10 -- any warnings in the module. See
11 --     http://hackage.haskell.org/trac/ghc/wiki/Commentary/CodingStyle#Warnings
12 -- for details
13
14 module SimplCore ( core2core, simplifyExpr ) where
15
16 #include "HsVersions.h"
17
18 import DynFlags         ( CoreToDo(..), SimplifierSwitch(..),
19                           SimplifierMode(..), DynFlags, DynFlag(..), dopt,
20                           getCoreToDo, shouldDumpSimplPhase )
21 import CoreSyn
22 import HscTypes
23 import CSE              ( cseProgram )
24 import Rules            ( RuleBase, emptyRuleBase, mkRuleBase, unionRuleBase,
25                           extendRuleBaseList, pprRuleBase, ruleCheckProgram,
26                           addSpecInfo, addIdSpecialisations )
27 import PprCore          ( pprCoreBindings, pprCoreExpr, pprRules )
28 import OccurAnal        ( occurAnalysePgm, occurAnalyseExpr )
29 import IdInfo           ( setNewStrictnessInfo, newStrictnessInfo, 
30                           setWorkerInfo, workerInfo, setSpecInfoHead,
31                           setInlinePragInfo, inlinePragInfo,
32                           setSpecInfo, specInfo, specInfoRules )
33 import CoreUtils        ( coreBindsSize )
34 import Simplify         ( simplTopBinds, simplExpr )
35 import SimplEnv         ( SimplEnv, simplBinders, mkSimplEnv, setInScopeSet )
36 import SimplMonad
37 import ErrUtils         ( dumpIfSet, dumpIfSet_dyn, showPass )
38 import CoreLint         ( endPassIf, endIteration )
39 import FloatIn          ( floatInwards )
40 import FloatOut         ( floatOutwards )
41 import FamInstEnv
42 import Id
43 import DataCon
44 import TyCon            ( tyConSelIds, tyConDataCons )
45 import Class            ( classSelIds )
46 import VarSet
47 import VarEnv
48 import NameEnv          ( lookupNameEnv )
49 import LiberateCase     ( liberateCase )
50 import SAT              ( doStaticArgs )
51 import Specialise       ( specProgram)
52 import SpecConstr       ( specConstrProgram)
53 import DmdAnal          ( dmdAnalPgm )
54 import WorkWrap         ( wwTopBinds )
55 #ifdef OLD_STRICTNESS
56 import StrictAnal       ( saBinds )
57 import CprAnalyse       ( cprAnalyse )
58 #endif
59 import Vectorise        ( vectorise )
60 import Util
61
62 import UniqSupply       ( UniqSupply, mkSplitUniqSupply, splitUniqSupply )
63 import IO               ( hPutStr, stderr )
64 import Outputable
65 import Control.Monad
66 import List             ( partition, intersperse )
67 import Maybes
68 \end{code}
69
70 %************************************************************************
71 %*                                                                      *
72 \subsection{The driver for the simplifier}
73 %*                                                                      *
74 %************************************************************************
75
76 \begin{code}
77 core2core :: HscEnv
78           -> ModGuts
79           -> IO ModGuts
80
81 core2core hsc_env guts
82   = do  {
83         ; let dflags = hsc_dflags hsc_env
84               core_todos = getCoreToDo dflags
85
86         ; us <- mkSplitUniqSupply 's'
87         ; let (cp_us, ru_us) = splitUniqSupply us
88
89                 -- COMPUTE THE RULE BASE TO USE
90         ; (imp_rule_base, guts1) <- prepareRules hsc_env guts ru_us
91
92                 -- Note [Injecting implicit bindings]
93         ; let implicit_binds = getImplicitBinds (mg_types guts1)
94               guts2 = guts1 { mg_binds = implicit_binds ++ mg_binds guts1 }
95
96                 -- DO THE BUSINESS
97         ; (stats, guts3) <- doCorePasses hsc_env imp_rule_base cp_us
98                                          (zeroSimplCount dflags) 
99                                          guts2 core_todos
100
101         ; dumpIfSet_dyn dflags Opt_D_dump_simpl_stats
102                   "Grand total simplifier statistics"
103                   (pprSimplCount stats)
104
105         ; return guts3 }
106
107
108 simplifyExpr :: DynFlags -- includes spec of what core-to-core passes to do
109              -> CoreExpr
110              -> IO CoreExpr
111 -- simplifyExpr is called by the driver to simplify an
112 -- expression typed in at the interactive prompt
113 simplifyExpr dflags expr
114   = do  {
115         ; showPass dflags "Simplify"
116
117         ; us <-  mkSplitUniqSupply 's'
118
119         ; let (expr', _counts) = initSmpl dflags emptyRuleBase emptyFamInstEnvs us $
120                                  simplExprGently gentleSimplEnv expr
121
122         ; dumpIfSet_dyn dflags Opt_D_dump_simpl "Simplified expression"
123                         (pprCoreExpr expr')
124
125         ; return expr'
126         }
127
128 gentleSimplEnv :: SimplEnv
129 gentleSimplEnv = mkSimplEnv SimplGently  (isAmongSimpl [])
130
131 doCorePasses :: HscEnv
132              -> RuleBase        -- the imported main rule base
133              -> UniqSupply      -- uniques
134              -> SimplCount      -- simplifier stats
135              -> ModGuts         -- local binds in (with rules attached)
136              -> [CoreToDo]      -- which passes to do
137              -> IO (SimplCount, ModGuts)
138
139 doCorePasses hsc_env rb us stats guts []
140   = return (stats, guts)
141
142 doCorePasses hsc_env rb us stats guts (CoreDoPasses to_dos1 : to_dos2) 
143   = doCorePasses hsc_env rb us stats guts (to_dos1 ++ to_dos2) 
144
145 doCorePasses hsc_env rb us stats guts (to_do : to_dos) 
146   = do
147         let (us1, us2) = splitUniqSupply us
148         (stats1, guts1) <- doCorePass to_do hsc_env us1 rb guts
149         doCorePasses hsc_env rb us2 (stats `plusSimplCount` stats1) guts1 to_dos
150
151 doCorePass :: CoreToDo -> HscEnv -> UniqSupply -> RuleBase
152            -> ModGuts -> IO (SimplCount, ModGuts)
153 doCorePass (CoreDoSimplify mode sws)   = {-# SCC "Simplify" #-}      simplifyPgm mode sws
154 doCorePass CoreCSE                     = {-# SCC "CommonSubExpr" #-} trBinds  cseProgram
155 doCorePass CoreLiberateCase            = {-# SCC "LiberateCase" #-}  liberateCase
156 doCorePass CoreDoFloatInwards          = {-# SCC "FloatInwards" #-}  trBinds  floatInwards
157 doCorePass (CoreDoFloatOutwards f)     = {-# SCC "FloatOutwards" #-} trBindsU (floatOutwards f)
158 doCorePass CoreDoStaticArgs            = {-# SCC "StaticArgs" #-}    trBindsU  doStaticArgs
159 doCorePass CoreDoStrictness            = {-# SCC "Stranal" #-}       trBinds  dmdAnalPgm
160 doCorePass CoreDoWorkerWrapper         = {-# SCC "WorkWrap" #-}      trBindsU wwTopBinds
161 doCorePass CoreDoSpecialising          = {-# SCC "Specialise" #-}    trBindsU specProgram
162 doCorePass CoreDoSpecConstr            = {-# SCC "SpecConstr" #-}    trBindsU specConstrProgram
163 doCorePass CoreDoGlomBinds             = trBinds glomBinds
164 doCorePass CoreDoVectorisation         = {-# SCC "Vectorise" #-}     vectorise
165 doCorePass CoreDoPrintCore             = observe printCore
166 doCorePass (CoreDoRuleCheck phase pat) = ruleCheck phase pat
167 doCorePass CoreDoNothing               = observe (\ _ _ -> return ())
168 #ifdef OLD_STRICTNESS                  
169 doCorePass CoreDoOldStrictness         = {-# SCC "OldStrictness" #-} trBinds doOldStrictness
170 #else
171 doCorePass CoreDoOldStrictness         = panic "CoreDoOldStrictness"
172 #endif
173 doCorePass (CoreDoPasses _) = panic "CoreDoPasses"
174
175 #ifdef OLD_STRICTNESS
176 doOldStrictness dfs binds
177   = do binds1 <- saBinds dfs binds
178        binds2 <- cprAnalyse dfs binds1
179        return binds2
180 #endif
181
182 printCore _ binds = dumpIfSet True "Print Core" (pprCoreBindings binds)
183
184 ruleCheck phase pat hsc_env us rb guts 
185   =  do let dflags = hsc_dflags hsc_env
186         showPass dflags "RuleCheck"
187         printDump (ruleCheckProgram phase pat rb (mg_binds guts))
188         return (zeroSimplCount dflags, guts)
189
190 -- Most passes return no stats and don't change rules
191 trBinds :: (DynFlags -> [CoreBind] -> IO [CoreBind])
192         -> HscEnv -> UniqSupply -> RuleBase -> ModGuts
193         -> IO (SimplCount, ModGuts)
194 trBinds do_pass hsc_env us rb guts
195   = do  { binds' <- do_pass dflags (mg_binds guts)
196         ; return (zeroSimplCount dflags, guts { mg_binds = binds' }) }
197   where
198     dflags = hsc_dflags hsc_env
199
200 trBindsU :: (DynFlags -> UniqSupply -> [CoreBind] -> IO [CoreBind])
201         -> HscEnv -> UniqSupply -> RuleBase -> ModGuts
202         -> IO (SimplCount, ModGuts)
203 trBindsU do_pass hsc_env us rb guts
204   = do  { binds' <- do_pass dflags us (mg_binds guts)
205         ; return (zeroSimplCount dflags, guts { mg_binds = binds' }) }
206   where
207     dflags = hsc_dflags hsc_env
208
209 -- Observer passes just peek; don't modify the bindings at all
210 observe :: (DynFlags -> [CoreBind] -> IO a)
211         -> HscEnv -> UniqSupply -> RuleBase -> ModGuts
212         -> IO (SimplCount, ModGuts)
213 observe do_pass hsc_env us rb guts 
214   = do  { binds <- do_pass dflags (mg_binds guts)
215         ; return (zeroSimplCount dflags, guts) }
216   where
217     dflags = hsc_dflags hsc_env
218 \end{code}
219
220
221 %************************************************************************
222 %*                                                                      *
223         Implicit bindings
224 %*                                                                      *
225 %************************************************************************
226
227 Note [Injecting implicit bindings]
228 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
229 We used to inject the implict bindings right at the end, in CoreTidy.
230 But some of these bindings, notably record selectors, are not
231 constructed in an optimised form.  E.g. record selector for
232         data T = MkT { x :: {-# UNPACK #-} !Int }
233 Then the unfolding looks like
234         x = \t. case t of MkT x1 -> let x = I# x1 in x
235 This generates bad code unless it's first simplified a bit.
236 (Only matters when the selector is used curried; eg map x ys.)
237 See Trac #2070.
238
239 \begin{code}
240 getImplicitBinds :: TypeEnv -> [CoreBind]
241 getImplicitBinds type_env
242   = map get_defn (concatMap implicit_con_ids (typeEnvTyCons type_env)
243                   ++ concatMap other_implicit_ids (typeEnvElts type_env))
244         -- Put the constructor wrappers first, because
245         -- other implicit bindings (notably the fromT functions arising 
246         -- from generics) use the constructor wrappers.  At least that's
247         -- what External Core likes
248   where
249     implicit_con_ids tc = mapCatMaybes dataConWrapId_maybe (tyConDataCons tc)
250     
251     other_implicit_ids (ATyCon tc) = filter (not . isNaughtyRecordSelector) (tyConSelIds tc)
252         -- The "naughty" ones are not real functions at all
253         -- They are there just so we can get decent error messages
254         -- See Note  [Naughty record selectors] in MkId.lhs
255     other_implicit_ids (AClass cl) = classSelIds cl
256     other_implicit_ids _other      = []
257     
258     get_defn :: Id -> CoreBind
259     get_defn id = NonRec id (unfoldingTemplate (idUnfolding id))
260 \end{code}
261
262
263 %************************************************************************
264 %*                                                                      *
265         Dealing with rules
266 %*                                                                      *
267 %************************************************************************
268
269 -- prepareLocalRuleBase takes the CoreBinds and rules defined in this module.
270 -- It attaches those rules that are for local Ids to their binders, and
271 -- returns the remainder attached to Ids in an IdSet.  
272
273 \begin{code}
274 prepareRules :: HscEnv 
275              -> ModGuts
276              -> UniqSupply
277              -> IO (RuleBase,           -- Rule base for imported things, incl
278                                         -- (a) rules defined in this module (orphans)
279                                         -- (b) rules from other modules in home package
280                                         -- but not things from other packages
281
282                     ModGuts)            -- Modified fields are 
283                                         --      (a) Bindings have rules attached,
284                                         --      (b) Rules are now just orphan rules
285
286 prepareRules hsc_env@(HscEnv { hsc_dflags = dflags, hsc_HPT = hpt })
287              guts@(ModGuts { mg_binds = binds, mg_deps = deps, mg_rules = local_rules })
288              us 
289   = do  { let   -- Simplify the local rules; boringly, we need to make an in-scope set
290                 -- from the local binders, to avoid warnings from Simplify.simplVar
291               local_ids        = mkInScopeSet (mkVarSet (bindersOfBinds binds))
292               env              = setInScopeSet gentleSimplEnv local_ids 
293               (better_rules,_) = initSmpl dflags emptyRuleBase emptyFamInstEnvs us $
294                                  (mapM (simplRule env) local_rules)
295               home_pkg_rules   = hptRules hsc_env (dep_mods deps)
296
297                 -- Find the rules for locally-defined Ids; then we can attach them
298                 -- to the binders in the top-level bindings
299                 -- 
300                 -- Reason
301                 --      - It makes the rules easier to look up
302                 --      - It means that transformation rules and specialisations for
303                 --        locally defined Ids are handled uniformly
304                 --      - It keeps alive things that are referred to only from a rule
305                 --        (the occurrence analyser knows about rules attached to Ids)
306                 --      - It makes sure that, when we apply a rule, the free vars
307                 --        of the RHS are more likely to be in scope
308                 --      - The imported rules are carried in the in-scope set
309                 --        which is extended on each iteration by the new wave of
310                 --        local binders; any rules which aren't on the binding will
311                 --        thereby get dropped
312               (rules_for_locals, rules_for_imps) = partition isLocalRule better_rules
313               local_rule_base = extendRuleBaseList emptyRuleBase rules_for_locals
314               binds_w_rules   = updateBinders local_rule_base binds
315
316               hpt_rule_base = mkRuleBase home_pkg_rules
317               imp_rule_base = extendRuleBaseList hpt_rule_base rules_for_imps
318
319         ; dumpIfSet_dyn dflags Opt_D_dump_rules "Transformation rules"
320                 (vcat [text "Local rules", pprRules better_rules,
321                        text "",
322                        text "Imported rules", pprRuleBase imp_rule_base])
323
324         ; return (imp_rule_base, guts { mg_binds = binds_w_rules, 
325                                         mg_rules = rules_for_imps })
326     }
327
328 updateBinders :: RuleBase -> [CoreBind] -> [CoreBind]
329 updateBinders local_rules binds
330   = map update_bndrs binds
331   where
332     update_bndrs (NonRec b r) = NonRec (update_bndr b) r
333     update_bndrs (Rec prs)    = Rec [(update_bndr b, r) | (b,r) <- prs]
334
335     update_bndr bndr = case lookupNameEnv local_rules (idName bndr) of
336                           Nothing    -> bndr
337                           Just rules -> bndr `addIdSpecialisations` rules
338                                 -- The binder might have some existing rules,
339                                 -- arising from specialisation pragmas
340 \end{code}
341
342 Note [Simplifying the left-hand side of a RULE]
343 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
344 We must do some gentle simplification on the lhs (template) of each
345 rule.  The case that forced me to add this was the fold/build rule,
346 which without simplification looked like:
347         fold k z (build (/\a. g a))  ==>  ...
348 This doesn't match unless you do eta reduction on the build argument.
349 Similarly for a LHS like
350         augment g (build h) 
351 we do not want to get
352         augment (\a. g a) (build h)
353 otherwise we don't match when given an argument like
354         augment (\a. h a a) (build h)
355
356 \begin{code}
357 simplRule env rule@(BuiltinRule {})
358   = return rule
359 simplRule env rule@(Rule { ru_bndrs = bndrs, ru_args = args, ru_rhs = rhs })
360   = do (env, bndrs') <- simplBinders env bndrs
361        args' <- mapM (simplExprGently env) args
362        rhs' <- simplExprGently env rhs
363        return (rule { ru_bndrs = bndrs', ru_args = args', ru_rhs = rhs' })
364
365 -- It's important that simplExprGently does eta reduction.
366 -- For example, in a rule like:
367 --      augment g (build h) 
368 -- we do not want to get
369 --      augment (\a. g a) (build h)
370 -- otherwise we don't match when given an argument like
371 --      (\a. h a a)
372 --
373 -- The simplifier does indeed do eta reduction (it's in
374 -- Simplify.completeLam) but only if -O is on.
375 \end{code}
376
377 \begin{code}
378 simplExprGently :: SimplEnv -> CoreExpr -> SimplM CoreExpr
379 -- Simplifies an expression 
380 --      does occurrence analysis, then simplification
381 --      and repeats (twice currently) because one pass
382 --      alone leaves tons of crud.
383 -- Used (a) for user expressions typed in at the interactive prompt
384 --      (b) the LHS and RHS of a RULE
385 --      (c) Template Haskell splices
386 --
387 -- The name 'Gently' suggests that the SimplifierMode is SimplGently,
388 -- and in fact that is so.... but the 'Gently' in simplExprGently doesn't
389 -- enforce that; it just simplifies the expression twice
390
391 -- It's important that simplExprGently does eta reduction; see
392 -- Note [Simplifying the left-hand side of a RULE] above.  The
393 -- simplifier does indeed do eta reduction (it's in Simplify.completeLam)
394 -- but only if -O is on.
395
396 simplExprGently env expr = do
397     expr1 <- simplExpr env (occurAnalyseExpr expr)
398     simplExpr env (occurAnalyseExpr expr1)
399 \end{code}
400
401
402 %************************************************************************
403 %*                                                                      *
404 \subsection{Glomming}
405 %*                                                                      *
406 %************************************************************************
407
408 \begin{code}
409 glomBinds :: DynFlags -> [CoreBind] -> IO [CoreBind]
410 -- Glom all binds together in one Rec, in case any
411 -- transformations have introduced any new dependencies
412 --
413 -- NB: the global invariant is this:
414 --      *** the top level bindings are never cloned, and are always unique ***
415 --
416 -- We sort them into dependency order, but applying transformation rules may
417 -- make something at the top refer to something at the bottom:
418 --      f = \x -> p (q x)
419 --      h = \y -> 3
420 --      
421 --      RULE:  p (q x) = h x
422 --
423 -- Applying this rule makes f refer to h, 
424 -- although it doesn't appear to in the source program.  
425 -- This pass lets us control where it happens.
426 --
427 -- NOTICE that this cannot happen for rules whose head is a locally-defined
428 -- function.  It only happens for rules whose head is an imported function
429 -- (p in the example above).  So, for example, the rule had been
430 --      RULE: f (p x) = h x
431 -- then the rule for f would be attached to f itself (in its IdInfo) 
432 -- by prepareLocalRuleBase and h would be regarded by the occurrency 
433 -- analyser as free in f.
434
435 glomBinds dflags binds
436   = do { showPass dflags "GlomBinds" ;
437          let { recd_binds = [Rec (flattenBinds binds)] } ;
438          return recd_binds }
439         -- Not much point in printing the result... 
440         -- just consumes output bandwidth
441 \end{code}
442
443
444 %************************************************************************
445 %*                                                                      *
446 \subsection{The driver for the simplifier}
447 %*                                                                      *
448 %************************************************************************
449
450 \begin{code}
451 simplifyPgm :: SimplifierMode
452             -> [SimplifierSwitch]
453             -> HscEnv
454             -> UniqSupply
455             -> RuleBase
456             -> ModGuts
457             -> IO (SimplCount, ModGuts)  -- New bindings
458
459 simplifyPgm mode switches hsc_env us imp_rule_base guts
460   = do {
461         showPass dflags "Simplify";
462
463         (termination_msg, it_count, counts_out, binds') 
464            <- do_iteration us 1 (zeroSimplCount dflags) (mg_binds guts) ;
465
466         dumpIfSet (dump_phase && dopt Opt_D_dump_simpl_stats dflags)
467                   "Simplifier statistics"
468                   (vcat [text termination_msg <+> text "after" <+> ppr it_count <+> text "iterations",
469                          text "",
470                          pprSimplCount counts_out]);
471
472         endPassIf dump_phase dflags
473                   ("Simplify phase " ++ phase_info ++ " done")
474                   Opt_D_dump_simpl_phases binds';
475
476         return (counts_out, guts { mg_binds = binds' })
477     }
478   where
479     dflags         = hsc_dflags hsc_env
480     phase_info     = case mode of
481                           SimplGently     -> "gentle"
482                           SimplPhase n ss -> shows n
483                                            . showString " ["
484                                            . showString (concat $ intersperse "," ss)
485                                            $ "]"
486
487     dump_phase     = shouldDumpSimplPhase dflags mode
488                    
489     sw_chkr        = isAmongSimpl switches
490     max_iterations = intSwitchSet sw_chkr MaxSimplifierIterations `orElse` 2
491  
492     do_iteration us iteration_no counts binds
493         -- iteration_no is the number of the iteration we are
494         -- about to begin, with '1' for the first
495       | iteration_no > max_iterations   -- Stop if we've run out of iterations
496       =  WARN(debugIsOn && (max_iterations > 2),
497                 text ("Simplifier still going after " ++
498                                 show max_iterations ++
499                                 " iterations; bailing out.  Size = " ++ show (coreBindsSize binds) ++ "\n" ))
500                 -- Subtract 1 from iteration_no to get the
501                 -- number of iterations we actually completed
502             return ("Simplifier bailed out", iteration_no - 1, counts, binds)
503
504       -- Try and force thunks off the binds; significantly reduces
505       -- space usage, especially with -O.  JRS, 000620.
506       | let sz = coreBindsSize binds in sz == sz
507       = do {
508                 -- Occurrence analysis
509            let { tagged_binds = {-# SCC "OccAnal" #-} occurAnalysePgm binds } ;
510            dumpIfSet_dyn dflags Opt_D_dump_occur_anal "Occurrence analysis"
511                      (pprCoreBindings tagged_binds);
512
513                 -- Get any new rules, and extend the rule base
514                 -- We need to do this regularly, because simplification can
515                 -- poke on IdInfo thunks, which in turn brings in new rules
516                 -- behind the scenes.  Otherwise there's a danger we'll simply
517                 -- miss the rules for Ids hidden inside imported inlinings
518            eps <- hscEPS hsc_env ;
519            let  { rule_base' = unionRuleBase imp_rule_base (eps_rule_base eps)
520                 ; simpl_env  = mkSimplEnv mode sw_chkr 
521                 ; simpl_binds = {-# SCC "SimplTopBinds" #-} 
522                                 simplTopBinds simpl_env tagged_binds
523                 ; fam_envs = (eps_fam_inst_env eps, mg_fam_inst_env guts) } ;
524            
525                 -- Simplify the program
526                 -- We do this with a *case* not a *let* because lazy pattern
527                 -- matching bit us with bad space leak!
528                 -- With a let, we ended up with
529                 --   let
530                 --      t = initSmpl ...
531                 --      counts' = snd t
532                 --   in
533                 --      case t of {(_,counts') -> if counts'=0 then ... }
534                 -- So the conditional didn't force counts', because the
535                 -- selection got duplicated.  Sigh!
536            case initSmpl dflags rule_base' fam_envs us1 simpl_binds of {
537                 (binds', counts') -> do {
538
539            let  { all_counts = counts `plusSimplCount` counts'
540                 ; herald     = "Simplifier phase " ++ phase_info ++ 
541                               ", iteration " ++ show iteration_no ++
542                               " out of " ++ show max_iterations
543                 } ;
544
545                 -- Stop if nothing happened; don't dump output
546            if isZeroSimplCount counts' then
547                 return ("Simplifier reached fixed point", iteration_no, 
548                         all_counts, binds')
549            else do {
550                 -- Short out indirections
551                 -- We do this *after* at least one run of the simplifier 
552                 -- because indirection-shorting uses the export flag on *occurrences*
553                 -- and that isn't guaranteed to be ok until after the first run propagates
554                 -- stuff from the binding site to its occurrences
555                 --
556                 -- ToDo: alas, this means that indirection-shorting does not happen at all
557                 --       if the simplifier does nothing (not common, I know, but unsavoury)
558            let { binds'' = {-# SCC "ZapInd" #-} shortOutIndirections binds' } ;
559
560                 -- Dump the result of this iteration
561            dumpIfSet_dyn dflags Opt_D_dump_simpl_iterations herald
562                          (pprSimplCount counts') ;
563            endIteration dflags herald Opt_D_dump_simpl_iterations binds'' ;
564
565                 -- Loop
566            do_iteration us2 (iteration_no + 1) all_counts binds''
567         }  } } }
568       where
569           (us1, us2) = splitUniqSupply us
570 \end{code}
571
572
573 %************************************************************************
574 %*                                                                      *
575                 Shorting out indirections
576 %*                                                                      *
577 %************************************************************************
578
579 If we have this:
580
581         x_local = <expression>
582         ...bindings...
583         x_exported = x_local
584
585 where x_exported is exported, and x_local is not, then we replace it with this:
586
587         x_exported = <expression>
588         x_local = x_exported
589         ...bindings...
590
591 Without this we never get rid of the x_exported = x_local thing.  This
592 save a gratuitous jump (from \tr{x_exported} to \tr{x_local}), and
593 makes strictness information propagate better.  This used to happen in
594 the final phase, but it's tidier to do it here.
595
596 STRICTNESS: if we have done strictness analysis, we want the strictness info on
597 x_local to transfer to x_exported.  Hence the copyIdInfo call.
598
599 RULES: we want to *add* any RULES for x_local to x_exported.
600
601 Note [Rules and indirection-zapping]
602 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
603 Problem: what if x_exported has a RULE that mentions something in ...bindings...?
604 Then the things mentioned can be out of scope!  Solution
605  a) Make sure that in this pass the usage-info from x_exported is 
606         available for ...bindings...
607  b) If there are any such RULES, rec-ify the entire top-level. 
608     It'll get sorted out next time round
609
610 Messing up the rules
611 ~~~~~~~~~~~~~~~~~~~~
612 The example that went bad on me at one stage was this one:
613         
614     iterate :: (a -> a) -> a -> [a]
615         [Exported]
616     iterate = iterateList       
617     
618     iterateFB c f x = x `c` iterateFB c f (f x)
619     iterateList f x =  x : iterateList f (f x)
620         [Not exported]
621     
622     {-# RULES
623     "iterate"   forall f x.     iterate f x = build (\c _n -> iterateFB c f x)
624     "iterateFB"                 iterateFB (:) = iterateList
625      #-}
626
627 This got shorted out to:
628
629     iterateList :: (a -> a) -> a -> [a]
630     iterateList = iterate
631     
632     iterateFB c f x = x `c` iterateFB c f (f x)
633     iterate f x =  x : iterate f (f x)
634     
635     {-# RULES
636     "iterate"   forall f x.     iterate f x = build (\c _n -> iterateFB c f x)
637     "iterateFB"                 iterateFB (:) = iterate
638      #-}
639
640 And now we get an infinite loop in the rule system 
641         iterate f x -> build (\cn -> iterateFB c f x)
642                     -> iterateFB (:) f x
643                     -> iterate f x
644
645 Tiresome old solution: 
646         don't do shorting out if f has rewrite rules (see shortableIdInfo)
647
648 New solution (I think): 
649         use rule switching-off pragmas to get rid 
650         of iterateList in the first place
651
652
653 Other remarks
654 ~~~~~~~~~~~~~
655 If more than one exported thing is equal to a local thing (i.e., the
656 local thing really is shared), then we do one only:
657 \begin{verbatim}
658         x_local = ....
659         x_exported1 = x_local
660         x_exported2 = x_local
661 ==>
662         x_exported1 = ....
663
664         x_exported2 = x_exported1
665 \end{verbatim}
666
667 We rely on prior eta reduction to simplify things like
668 \begin{verbatim}
669         x_exported = /\ tyvars -> x_local tyvars
670 ==>
671         x_exported = x_local
672 \end{verbatim}
673 Hence,there's a possibility of leaving unchanged something like this:
674 \begin{verbatim}
675         x_local = ....
676         x_exported1 = x_local Int
677 \end{verbatim}
678 By the time we've thrown away the types in STG land this 
679 could be eliminated.  But I don't think it's very common
680 and it's dangerous to do this fiddling in STG land 
681 because we might elminate a binding that's mentioned in the
682 unfolding for something.
683
684 \begin{code}
685 type IndEnv = IdEnv Id          -- Maps local_id -> exported_id
686
687 shortOutIndirections :: [CoreBind] -> [CoreBind]
688 shortOutIndirections binds
689   | isEmptyVarEnv ind_env = binds
690   | no_need_to_flatten    = binds'                      -- See Note [Rules and indirect-zapping]
691   | otherwise             = [Rec (flattenBinds binds')] -- for this no_need_to_flatten stuff
692   where
693     ind_env            = makeIndEnv binds
694     exp_ids            = varSetElems ind_env    -- These exported Ids are the subjects
695     exp_id_set         = mkVarSet exp_ids       -- of the indirection-elimination
696     no_need_to_flatten = all (null . specInfoRules . idSpecialisation) exp_ids
697     binds'             = concatMap zap binds
698
699     zap (NonRec bndr rhs) = [NonRec b r | (b,r) <- zapPair (bndr,rhs)]
700     zap (Rec pairs)       = [Rec (concatMap zapPair pairs)]
701
702     zapPair (bndr, rhs)
703         | bndr `elemVarSet` exp_id_set             = []
704         | Just exp_id <- lookupVarEnv ind_env bndr = [(transferIdInfo exp_id bndr, rhs),
705                                                       (bndr, Var exp_id)]
706         | otherwise                                = [(bndr,rhs)]
707                              
708 makeIndEnv :: [CoreBind] -> IndEnv
709 makeIndEnv binds
710   = foldr add_bind emptyVarEnv binds
711   where
712     add_bind :: CoreBind -> IndEnv -> IndEnv
713     add_bind (NonRec exported_id rhs) env = add_pair (exported_id, rhs) env
714     add_bind (Rec pairs)              env = foldr add_pair env pairs
715
716     add_pair :: (Id,CoreExpr) -> IndEnv -> IndEnv
717     add_pair (exported_id, Var local_id) env
718         | shortMeOut env exported_id local_id = extendVarEnv env local_id exported_id
719     add_pair (exported_id, rhs) env
720         = env
721                         
722 shortMeOut ind_env exported_id local_id
723 -- The if-then-else stuff is just so I can get a pprTrace to see
724 -- how often I don't get shorting out becuase of IdInfo stuff
725   = if isExportedId exported_id &&              -- Only if this is exported
726
727        isLocalId local_id &&                    -- Only if this one is defined in this
728                                                 --      module, so that we *can* change its
729                                                 --      binding to be the exported thing!
730
731        not (isExportedId local_id) &&           -- Only if this one is not itself exported,
732                                                 --      since the transformation will nuke it
733    
734        not (local_id `elemVarEnv` ind_env)      -- Only if not already substituted for
735     then
736         True
737
738 {- No longer needed
739         if isEmptySpecInfo (specInfo (idInfo exported_id))      -- Only if no rules
740         then True       -- See note on "Messing up rules"
741         else 
742 #ifdef DEBUG 
743           pprTrace "shortMeOut:" (ppr exported_id)
744 #endif
745                                                 False
746 -}
747     else
748         False
749
750
751 -----------------
752 transferIdInfo :: Id -> Id -> Id
753 -- If we have
754 --      lcl_id = e; exp_id = lcl_id
755 -- and lcl_id has useful IdInfo, we don't want to discard it by going
756 --      gbl_id = e; lcl_id = gbl_id
757 -- Instead, transfer IdInfo from lcl_id to exp_id
758 -- Overwriting, rather than merging, seems to work ok.
759 transferIdInfo exported_id local_id
760   = modifyIdInfo transfer exported_id
761   where
762     local_info = idInfo local_id
763     transfer exp_info = exp_info `setNewStrictnessInfo` newStrictnessInfo local_info
764                                  `setWorkerInfo`        workerInfo local_info
765                                  `setInlinePragInfo`    inlinePragInfo local_info
766                                  `setSpecInfo`          addSpecInfo (specInfo exp_info) new_info
767     new_info = setSpecInfoHead (idName exported_id) 
768                                (specInfo local_info)
769         -- Remember to set the function-name field of the
770         -- rules as we transfer them from one function to another
771 \end{code}