61e67df57c1e923a30e7bf7e70df79572ae4a031
[ghc-hetmet.git] / ghc / compiler / stgSyn / CoreToStg.lhs
1 %
2 % (c) The GRASP/AQUA Project, Glasgow University, 1993-1998
3 %
4 \section[CoreToStg]{Converts Core to STG Syntax}
5
6 And, as we have the info in hand, we may convert some lets to
7 let-no-escapes.
8
9 \begin{code}
10 module CoreToStg ( coreToStg, coreExprToStg ) where
11
12 #include "HsVersions.h"
13
14 import CoreSyn
15 import CoreUtils        ( rhsIsStatic, manifestArity, exprType )
16 import StgSyn
17
18 import Type
19 import TyCon            ( isAlgTyCon )
20 import Id
21 import Var              ( Var, globalIdDetails, idType )
22 import TyCon            ( isUnboxedTupleTyCon, isPrimTyCon, isFunTyCon, isHiBootTyCon )
23 #ifdef ILX
24 import MkId             ( unsafeCoerceId )
25 #endif
26 import IdInfo
27 import DataCon
28 import CostCentre       ( noCCS )
29 import VarSet
30 import VarEnv
31 import Maybes           ( maybeToBool )
32 import Name             ( getOccName, isExternalName, nameOccName )
33 import OccName          ( occNameUserString, occNameFS )
34 import BasicTypes       ( Arity )
35 import CmdLineOpts      ( DynFlags, opt_RuntimeTypes )
36 import Outputable
37
38 infixr 9 `thenLne`
39 \end{code}
40
41 %************************************************************************
42 %*                                                                      *
43 \subsection[live-vs-free-doc]{Documentation}
44 %*                                                                      *
45 %************************************************************************
46
47 (There is other relevant documentation in codeGen/CgLetNoEscape.)
48
49 The actual Stg datatype is decorated with {\em live variable}
50 information, as well as {\em free variable} information.  The two are
51 {\em not} the same.  Liveness is an operational property rather than a
52 semantic one.  A variable is live at a particular execution point if
53 it can be referred to {\em directly} again.  In particular, a dead
54 variable's stack slot (if it has one):
55 \begin{enumerate}
56 \item
57 should be stubbed to avoid space leaks, and
58 \item
59 may be reused for something else.
60 \end{enumerate}
61
62 There ought to be a better way to say this.  Here are some examples:
63 \begin{verbatim}
64         let v = [q] \[x] -> e
65         in
66         ...v...  (but no q's)
67 \end{verbatim}
68
69 Just after the `in', v is live, but q is dead.  If the whole of that
70 let expression was enclosed in a case expression, thus:
71 \begin{verbatim}
72         case (let v = [q] \[x] -> e in ...v...) of
73                 alts[...q...]
74 \end{verbatim}
75 (ie @alts@ mention @q@), then @q@ is live even after the `in'; because
76 we'll return later to the @alts@ and need it.
77
78 Let-no-escapes make this a bit more interesting:
79 \begin{verbatim}
80         let-no-escape v = [q] \ [x] -> e
81         in
82         ...v...
83 \end{verbatim}
84 Here, @q@ is still live at the `in', because @v@ is represented not by
85 a closure but by the current stack state.  In other words, if @v@ is
86 live then so is @q@.  Furthermore, if @e@ mentions an enclosing
87 let-no-escaped variable, then {\em its} free variables are also live
88 if @v@ is.
89
90 %************************************************************************
91 %*                                                                      *
92 \subsection[caf-info]{Collecting live CAF info}
93 %*                                                                      *
94 %************************************************************************
95
96 In this pass we also collect information on which CAFs are live for 
97 constructing SRTs (see SRT.lhs).  
98
99 A top-level Id has CafInfo, which is
100
101         - MayHaveCafRefs, if it may refer indirectly to
102           one or more CAFs, or
103         - NoCafRefs if it definitely doesn't
104
105 The CafInfo has already been calculated during the CoreTidy pass.
106
107 During CoreToStg, we then pin onto each binding and case expression, a
108 list of Ids which represents the "live" CAFs at that point.  The meaning
109 of "live" here is the same as for live variables, see above (which is
110 why it's convenient to collect CAF information here rather than elsewhere).
111
112 The later SRT pass takes these lists of Ids and uses them to construct
113 the actual nested SRTs, and replaces the lists of Ids with (offset,length)
114 pairs.
115
116
117 Interaction of let-no-escape with SRTs   [Sept 01]
118 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
119 Consider
120
121         let-no-escape x = ...caf1...caf2...
122         in
123         ...x...x...x...
124
125 where caf1,caf2 are CAFs.  Since x doesn't have a closure, we 
126 build SRTs just as if x's defn was inlined at each call site, and
127 that means that x's CAF refs get duplicated in the overall SRT.
128
129 This is unlike ordinary lets, in which the CAF refs are not duplicated.
130
131 We could fix this loss of (static) sharing by making a sort of pseudo-closure
132 for x, solely to put in the SRTs lower down.
133
134
135 %************************************************************************
136 %*                                                                      *
137 \subsection[binds-StgVarInfo]{Setting variable info: top-level, binds, RHSs}
138 %*                                                                      *
139 %************************************************************************
140
141 \begin{code}
142 coreToStg :: DynFlags -> [CoreBind] -> IO [StgBinding]
143 coreToStg dflags pgm
144   = return pgm'
145   where (_, _, pgm') = coreTopBindsToStg emptyVarEnv pgm
146
147 coreExprToStg :: CoreExpr -> StgExpr
148 coreExprToStg expr 
149   = new_expr where (new_expr,_,_) = initLne emptyVarEnv (coreToStgExpr expr)
150
151
152 coreTopBindsToStg
153     :: IdEnv HowBound           -- environment for the bindings
154     -> [CoreBind]
155     -> (IdEnv HowBound, FreeVarsInfo, [StgBinding])
156
157 coreTopBindsToStg env [] = (env, emptyFVInfo, [])
158 coreTopBindsToStg env (b:bs)
159   = (env2, fvs2, b':bs')
160   where
161         -- env accumulates down the list of binds, fvs accumulates upwards
162         (env1, fvs2, b' ) = coreTopBindToStg env fvs1 b
163         (env2, fvs1, bs') = coreTopBindsToStg env1 bs
164
165
166 coreTopBindToStg
167         :: IdEnv HowBound
168         -> FreeVarsInfo         -- Info about the body
169         -> CoreBind
170         -> (IdEnv HowBound, FreeVarsInfo, StgBinding)
171
172 coreTopBindToStg env body_fvs (NonRec id rhs)
173   = let 
174         env'      = extendVarEnv env id how_bound
175         how_bound = LetBound TopLet (manifestArity rhs)
176
177         (stg_rhs, fvs') = 
178             initLne env (
179               coreToTopStgRhs body_fvs (id,rhs) `thenLne` \ (stg_rhs, fvs') ->
180               returnLne (stg_rhs, fvs')
181            )
182         
183         bind = StgNonRec id stg_rhs
184     in
185     ASSERT2(manifestArity rhs == stgRhsArity stg_rhs, ppr id)
186     ASSERT2(consistentCafInfo id bind, ppr id)
187 --    WARN(not (consistent caf_info bind), ppr id <+> ppr cafs <+> ppCafInfo caf_info)
188     (env', fvs' `unionFVInfo` body_fvs, bind)
189
190 coreTopBindToStg env body_fvs (Rec pairs)
191   = let 
192         (binders, rhss) = unzip pairs
193
194         extra_env' = [ (b, LetBound TopLet (manifestArity rhs))
195                      | (b, rhs) <- pairs ]
196         env' = extendVarEnvList env extra_env'
197
198         (stg_rhss, fvs')
199           = initLne env' (
200                mapAndUnzipLne (coreToTopStgRhs body_fvs) pairs
201                                                 `thenLne` \ (stg_rhss, fvss') ->
202                let fvs' = unionFVInfos fvss' in
203                returnLne (stg_rhss, fvs')
204            )
205
206         bind = StgRec (zip binders stg_rhss)
207     in
208     ASSERT2(and [manifestArity rhs == stgRhsArity stg_rhs | (rhs,stg_rhs) <- rhss `zip` stg_rhss], ppr binders)
209     ASSERT2(consistentCafInfo (head binders) bind, ppr binders)
210     (env', fvs' `unionFVInfo` body_fvs, bind)
211
212 #ifdef DEBUG
213 -- Assertion helper: this checks that the CafInfo on the Id matches
214 -- what CoreToStg has figured out about the binding's SRT.  The
215 -- CafInfo will be exact in all cases except when CorePrep has
216 -- floated out a binding, in which case it will be approximate.
217 consistentCafInfo id bind
218   | occNameFS (nameOccName (idName id)) == FSLIT("sat")
219   = safe
220   | otherwise
221   = WARN (not exact, ppr id) safe
222   where
223         safe  = id_marked_caffy || not binding_is_caffy
224         exact = id_marked_caffy == binding_is_caffy
225         id_marked_caffy  = mayHaveCafRefs (idCafInfo id)
226         binding_is_caffy = stgBindHasCafRefs bind
227 #endif
228 \end{code}
229
230 \begin{code}
231 coreToTopStgRhs
232         :: FreeVarsInfo         -- Free var info for the scope of the binding
233         -> (Id,CoreExpr)
234         -> LneM (StgRhs, FreeVarsInfo)
235
236 coreToTopStgRhs scope_fv_info (bndr, rhs)
237   = coreToStgExpr rhs           `thenLne` \ (new_rhs, rhs_fvs, _) ->
238     freeVarsToLiveVars rhs_fvs  `thenLne` \ lv_info ->
239     returnLne (mkTopStgRhs is_static rhs_fvs (mkSRT lv_info) bndr_info new_rhs, rhs_fvs)
240   where
241     bndr_info = lookupFVInfo scope_fv_info bndr
242     is_static = rhsIsStatic rhs
243
244 mkTopStgRhs :: Bool -> FreeVarsInfo -> SRT -> StgBinderInfo -> StgExpr
245         -> StgRhs
246
247 mkTopStgRhs is_static rhs_fvs srt binder_info (StgLam _ bndrs body)
248   = ASSERT( is_static )
249     StgRhsClosure noCCS binder_info
250                   (getFVs rhs_fvs)               
251                   ReEntrant
252                   srt
253                   bndrs body
254         
255 mkTopStgRhs is_static rhs_fvs srt binder_info (StgConApp con args)
256   | is_static    -- StgConApps can be updatable (see isCrossDllConApp)
257   = StgRhsCon noCCS con args
258
259 mkTopStgRhs is_static rhs_fvs srt binder_info rhs
260   = ASSERT2( not is_static, ppr rhs )
261     StgRhsClosure noCCS binder_info
262                   (getFVs rhs_fvs)               
263                   Updatable
264                   srt
265                   [] rhs
266 \end{code}
267
268
269 -- ---------------------------------------------------------------------------
270 -- Expressions
271 -- ---------------------------------------------------------------------------
272
273 \begin{code}
274 coreToStgExpr
275         :: CoreExpr
276         -> LneM (StgExpr,       -- Decorated STG expr
277                  FreeVarsInfo,  -- Its free vars (NB free, not live)
278                  EscVarsSet)    -- Its escapees, a subset of its free vars;
279                                 -- also a subset of the domain of the envt
280                                 -- because we are only interested in the escapees
281                                 -- for vars which might be turned into
282                                 -- let-no-escaped ones.
283 \end{code}
284
285 The second and third components can be derived in a simple bottom up pass, not
286 dependent on any decisions about which variables will be let-no-escaped or
287 not.  The first component, that is, the decorated expression, may then depend
288 on these components, but it in turn is not scrutinised as the basis for any
289 decisions.  Hence no black holes.
290
291 \begin{code}
292 coreToStgExpr (Lit l) = returnLne (StgLit l, emptyFVInfo, emptyVarSet)
293 coreToStgExpr (Var v) = coreToStgApp Nothing v []
294
295 coreToStgExpr expr@(App _ _)
296   = coreToStgApp Nothing f args
297   where
298     (f, args) = myCollectArgs expr
299
300 coreToStgExpr expr@(Lam _ _)
301   = let
302         (args, body) = myCollectBinders expr 
303         args'        = filterStgBinders args
304     in
305     extendVarEnvLne [ (a, LambdaBound) | a <- args' ] $
306     coreToStgExpr body  `thenLne` \ (body, body_fvs, body_escs) ->
307     let
308         fvs             = args' `minusFVBinders` body_fvs
309         escs            = body_escs `delVarSetList` args'
310         result_expr | null args' = body
311                     | otherwise  = StgLam (exprType expr) args' body
312     in
313     returnLne (result_expr, fvs, escs)
314
315 coreToStgExpr (Note (SCC cc) expr)
316   = coreToStgExpr expr          `thenLne` ( \ (expr2, fvs, escs) ->
317     returnLne (StgSCC cc expr2, fvs, escs) )
318
319 #ifdef ILX
320 -- For ILX, convert (__coerce__ to_ty from_ty e) 
321 --          into    (coerce to_ty from_ty e)
322 -- where coerce is real function
323 coreToStgExpr (Note (Coerce to_ty from_ty) expr)
324   = coreToStgExpr (mkApps (Var unsafeCoerceId) 
325                           [Type from_ty, Type to_ty, expr])
326 #endif
327
328 coreToStgExpr (Note other_note expr)
329   = coreToStgExpr expr
330
331 -- Cases require a little more real work.
332
333 -- gaw 2004
334 coreToStgExpr (Case scrut bndr _ alts)
335   = extendVarEnvLne [(bndr, LambdaBound)]       (
336          mapAndUnzip3Lne vars_alt alts  `thenLne` \ (alts2, fvs_s, escs_s) ->
337          returnLne ( alts2,
338                      unionFVInfos fvs_s,
339                      unionVarSets escs_s )
340     )                                   `thenLne` \ (alts2, alts_fvs, alts_escs) ->
341     let
342         -- Determine whether the default binder is dead or not
343         -- This helps the code generator to avoid generating an assignment
344         -- for the case binder (is extremely rare cases) ToDo: remove.
345         bndr' | bndr `elementOfFVInfo` alts_fvs = bndr
346               | otherwise                       = bndr `setIdOccInfo` IAmDead
347
348         -- Don't consider the default binder as being 'live in alts',
349         -- since this is from the point of view of the case expr, where
350         -- the default binder is not free.
351         alts_fvs_wo_bndr  = bndr `minusFVBinder` alts_fvs
352         alts_escs_wo_bndr = alts_escs `delVarSet` bndr
353     in
354
355     freeVarsToLiveVars alts_fvs_wo_bndr         `thenLne` \ alts_lv_info ->
356
357         -- We tell the scrutinee that everything 
358         -- live in the alts is live in it, too.
359     setVarsLiveInCont alts_lv_info (
360         coreToStgExpr scrut       `thenLne` \ (scrut2, scrut_fvs, scrut_escs) ->
361         freeVarsToLiveVars scrut_fvs `thenLne` \ scrut_lv_info ->
362         returnLne (scrut2, scrut_fvs, scrut_escs, scrut_lv_info)
363       )    
364                 `thenLne` \ (scrut2, scrut_fvs, scrut_escs, scrut_lv_info) ->
365
366     returnLne (
367       StgCase scrut2 (getLiveVars scrut_lv_info)
368                      (getLiveVars alts_lv_info)
369                      bndr'
370                      (mkSRT alts_lv_info)
371                      (mkStgAltType (idType bndr)) 
372                      alts2,
373       scrut_fvs `unionFVInfo` alts_fvs_wo_bndr,
374       alts_escs_wo_bndr `unionVarSet` getFVSet scrut_fvs
375                 -- You might think we should have scrut_escs, not 
376                 -- (getFVSet scrut_fvs), but actually we can't call, and 
377                 -- then return from, a let-no-escape thing.
378       )
379   where
380     vars_alt (con, binders, rhs)
381       = let     -- Remove type variables
382             binders' = filterStgBinders binders
383         in      
384         extendVarEnvLne [(b, LambdaBound) | b <- binders']      $
385         coreToStgExpr rhs       `thenLne` \ (rhs2, rhs_fvs, rhs_escs) ->
386         let
387                 -- Records whether each param is used in the RHS
388             good_use_mask = [ b `elementOfFVInfo` rhs_fvs | b <- binders' ]
389         in
390         returnLne ( (con, binders', good_use_mask, rhs2),
391                     binders' `minusFVBinders` rhs_fvs,
392                     rhs_escs `delVarSetList` binders' )
393                 -- ToDo: remove the delVarSet;
394                 -- since escs won't include any of these binders
395 \end{code}
396
397 Lets not only take quite a bit of work, but this is where we convert
398 then to let-no-escapes, if we wish.
399
400 (Meanwhile, we don't expect to see let-no-escapes...)
401 \begin{code}
402 coreToStgExpr (Let bind body)
403   = fixLne (\ ~(_, _, _, no_binder_escapes) ->
404         coreToStgLet no_binder_escapes bind body
405     )                           `thenLne` \ (new_let, fvs, escs, _) ->
406
407     returnLne (new_let, fvs, escs)
408 \end{code}
409
410 \begin{code}
411 mkStgAltType scrut_ty
412   = case splitTyConApp_maybe (repType scrut_ty) of
413         Just (tc,_) | isUnboxedTupleTyCon tc -> UbxTupAlt tc
414                     | isPrimTyCon tc         -> PrimAlt tc
415                     | isHiBootTyCon tc       -> PolyAlt -- Algebraic, but no constructors visible
416                     | isAlgTyCon tc          -> AlgAlt tc
417                     | isFunTyCon tc          -> PolyAlt
418                     | otherwise              -> pprPanic "mkStgAlts" (ppr tc)
419         Nothing                              -> PolyAlt
420 \end{code}
421
422
423 -- ---------------------------------------------------------------------------
424 -- Applications
425 -- ---------------------------------------------------------------------------
426
427 \begin{code}
428 coreToStgApp
429          :: Maybe UpdateFlag            -- Just upd <=> this application is
430                                         -- the rhs of a thunk binding
431                                         --      x = [...] \upd [] -> the_app
432                                         -- with specified update flag
433         -> Id                           -- Function
434         -> [CoreArg]                    -- Arguments
435         -> LneM (StgExpr, FreeVarsInfo, EscVarsSet)
436
437 coreToStgApp maybe_thunk_body f args
438   = coreToStgArgs args          `thenLne` \ (args', args_fvs) ->
439     lookupVarLne f              `thenLne` \ how_bound ->
440
441     let
442         n_val_args       = valArgCount args
443         not_letrec_bound = not (isLetBound how_bound)
444         fun_fvs          
445           = let fvs = singletonFVInfo f how_bound fun_occ in
446             -- e.g. (f :: a -> int) (x :: a) 
447             -- Here the free variables are "f", "x" AND the type variable "a"
448             -- coreToStgArgs will deal with the arguments recursively
449             if opt_RuntimeTypes then
450               fvs `unionFVInfo` tyvarFVInfo (tyVarsOfType (idType f))
451             else fvs
452
453         -- Mostly, the arity info of a function is in the fn's IdInfo
454         -- But new bindings introduced by CoreSat may not have no
455         -- arity info; it would do us no good anyway.  For example:
456         --      let f = \ab -> e in f
457         -- No point in having correct arity info for f!
458         -- Hence the hasArity stuff below.
459         -- NB: f_arity is only consulted for LetBound things
460         f_arity   = stgArity f how_bound
461         saturated = f_arity <= n_val_args
462
463         fun_occ 
464          | not_letrec_bound         = noBinderInfo      -- Uninteresting variable
465          | f_arity > 0 && saturated = stgSatOcc -- Saturated or over-saturated function call
466          | otherwise                = stgUnsatOcc       -- Unsaturated function or thunk
467
468         fun_escs
469          | not_letrec_bound      = emptyVarSet  -- Only letrec-bound escapees are interesting
470          | f_arity == n_val_args = emptyVarSet  -- A function *or thunk* with an exactly
471                                                 -- saturated call doesn't escape
472                                                 -- (let-no-escape applies to 'thunks' too)
473
474          | otherwise         = unitVarSet f     -- Inexact application; it does escape
475
476         -- At the moment of the call:
477
478         --  either the function is *not* let-no-escaped, in which case
479         --         nothing is live except live_in_cont
480         --      or the function *is* let-no-escaped in which case the
481         --         variables it uses are live, but still the function
482         --         itself is not.  PS.  In this case, the function's
483         --         live vars should already include those of the
484         --         continuation, but it does no harm to just union the
485         --         two regardless.
486
487         res_ty = exprType (mkApps (Var f) args)
488         app = case globalIdDetails f of
489                 DataConWorkId dc | saturated -> StgConApp dc args'
490                 PrimOpId op                  -> ASSERT( saturated )
491                                                 StgOpApp (StgPrimOp op) args' res_ty
492                 FCallId call     -> ASSERT( saturated )
493                                     StgOpApp (StgFCallOp call (idUnique f)) args' res_ty
494                 _other           -> StgApp f args'
495
496     in
497     returnLne (
498         app,
499         fun_fvs  `unionFVInfo` args_fvs,
500         fun_escs `unionVarSet` (getFVSet args_fvs)
501                                 -- All the free vars of the args are disqualified
502                                 -- from being let-no-escaped.
503     )
504
505
506
507 -- ---------------------------------------------------------------------------
508 -- Argument lists
509 -- This is the guy that turns applications into A-normal form
510 -- ---------------------------------------------------------------------------
511
512 coreToStgArgs :: [CoreArg] -> LneM ([StgArg], FreeVarsInfo)
513 coreToStgArgs []
514   = returnLne ([], emptyFVInfo)
515
516 coreToStgArgs (Type ty : args)  -- Type argument
517   = coreToStgArgs args  `thenLne` \ (args', fvs) ->
518     if opt_RuntimeTypes then
519         returnLne (StgTypeArg ty : args', fvs `unionFVInfo` tyvarFVInfo (tyVarsOfType ty))
520     else
521     returnLne (args', fvs)
522
523 coreToStgArgs (arg : args)      -- Non-type argument
524   = coreToStgArgs args  `thenLne` \ (stg_args, args_fvs) ->
525     coreToStgExpr arg   `thenLne` \ (arg', arg_fvs, escs) ->
526     let
527         fvs = args_fvs `unionFVInfo` arg_fvs
528         stg_arg = case arg' of
529                        StgApp v []      -> StgVarArg v
530                        StgConApp con [] -> StgVarArg (dataConWorkId con)
531                        StgLit lit       -> StgLitArg lit
532                        _                -> pprPanic "coreToStgArgs" (ppr arg)
533     in
534     returnLne (stg_arg : stg_args, fvs)
535
536
537 -- ---------------------------------------------------------------------------
538 -- The magic for lets:
539 -- ---------------------------------------------------------------------------
540
541 coreToStgLet
542          :: Bool        -- True <=> yes, we are let-no-escaping this let
543          -> CoreBind    -- bindings
544          -> CoreExpr    -- body
545          -> LneM (StgExpr,      -- new let
546                   FreeVarsInfo, -- variables free in the whole let
547                   EscVarsSet,   -- variables that escape from the whole let
548                   Bool)         -- True <=> none of the binders in the bindings
549                                 -- is among the escaping vars
550
551 coreToStgLet let_no_escape bind body
552   = fixLne (\ ~(_, _, _, _, _, rec_body_fvs, _, _) ->
553
554         -- Do the bindings, setting live_in_cont to empty if
555         -- we ain't in a let-no-escape world
556         getVarsLiveInCont               `thenLne` \ live_in_cont ->
557         setVarsLiveInCont (if let_no_escape 
558                                 then live_in_cont 
559                                 else emptyLiveInfo)
560                           (vars_bind rec_body_fvs bind)
561             `thenLne` \ ( bind2, bind_fvs, bind_escs, bind_lv_info, env_ext) ->
562
563         -- Do the body
564         extendVarEnvLne env_ext (
565           coreToStgExpr body          `thenLne` \(body2, body_fvs, body_escs) ->
566           freeVarsToLiveVars body_fvs `thenLne` \ body_lv_info ->
567
568           returnLne (bind2, bind_fvs, bind_escs, getLiveVars bind_lv_info,
569                      body2, body_fvs, body_escs, getLiveVars body_lv_info)
570         )
571
572     ) `thenLne` (\ (bind2, bind_fvs, bind_escs, bind_lvs, 
573                     body2, body_fvs, body_escs, body_lvs) ->
574
575
576         -- Compute the new let-expression
577     let
578         new_let | let_no_escape = StgLetNoEscape live_in_whole_let bind_lvs bind2 body2
579                 | otherwise     = StgLet bind2 body2
580
581         free_in_whole_let
582           = binders `minusFVBinders` (bind_fvs `unionFVInfo` body_fvs)
583
584         live_in_whole_let
585           = bind_lvs `unionVarSet` (body_lvs `delVarSetList` binders)
586
587         real_bind_escs = if let_no_escape then
588                             bind_escs
589                          else
590                             getFVSet bind_fvs
591                             -- Everything escapes which is free in the bindings
592
593         let_escs = (real_bind_escs `unionVarSet` body_escs) `delVarSetList` binders
594
595         all_escs = bind_escs `unionVarSet` body_escs    -- Still includes binders of
596                                                         -- this let(rec)
597
598         no_binder_escapes = isEmptyVarSet (set_of_binders `intersectVarSet` all_escs)
599
600 #ifdef DEBUG
601         -- Debugging code as requested by Andrew Kennedy
602         checked_no_binder_escapes
603                 | not no_binder_escapes && any is_join_var binders
604                 = pprTrace "Interesting!  A join var that isn't let-no-escaped" (ppr binders)
605                   False
606                 | otherwise = no_binder_escapes
607 #else
608         checked_no_binder_escapes = no_binder_escapes
609 #endif
610                             
611                 -- Mustn't depend on the passed-in let_no_escape flag, since
612                 -- no_binder_escapes is used by the caller to derive the flag!
613     in
614     returnLne (
615         new_let,
616         free_in_whole_let,
617         let_escs,
618         checked_no_binder_escapes
619     ))
620   where
621     set_of_binders = mkVarSet binders
622     binders        = bindersOf bind
623
624     mk_binding bind_lv_info binder rhs
625         = (binder, LetBound (NestedLet live_vars) (manifestArity rhs))
626         where
627            live_vars | let_no_escape = addLiveVar bind_lv_info binder
628                      | otherwise     = unitLiveVar binder
629                 -- c.f. the invariant on NestedLet
630
631     vars_bind :: FreeVarsInfo           -- Free var info for body of binding
632               -> CoreBind
633               -> LneM (StgBinding,
634                        FreeVarsInfo, 
635                        EscVarsSet,        -- free vars; escapee vars
636                        LiveInfo,          -- Vars and CAFs live in binding
637                        [(Id, HowBound)])  -- extension to environment
638                                          
639
640     vars_bind body_fvs (NonRec binder rhs)
641       = coreToStgRhs body_fvs [] (binder,rhs)
642                                 `thenLne` \ (rhs2, bind_fvs, bind_lv_info, escs) ->
643         let
644             env_ext_item = mk_binding bind_lv_info binder rhs
645         in
646         returnLne (StgNonRec binder rhs2, 
647                    bind_fvs, escs, bind_lv_info, [env_ext_item])
648
649
650     vars_bind body_fvs (Rec pairs)
651       = fixLne (\ ~(_, rec_rhs_fvs, _, bind_lv_info, _) ->
652            let
653                 rec_scope_fvs = unionFVInfo body_fvs rec_rhs_fvs
654                 binders = map fst pairs
655                 env_ext = [ mk_binding bind_lv_info b rhs 
656                           | (b,rhs) <- pairs ]
657            in
658            extendVarEnvLne env_ext (
659               mapAndUnzip4Lne (coreToStgRhs rec_scope_fvs binders) pairs 
660                                         `thenLne` \ (rhss2, fvss, lv_infos, escss) ->
661               let
662                         bind_fvs = unionFVInfos fvss
663                         bind_lv_info = foldr unionLiveInfo emptyLiveInfo lv_infos
664                         escs     = unionVarSets escss
665               in
666               returnLne (StgRec (binders `zip` rhss2),
667                          bind_fvs, escs, bind_lv_info, env_ext)
668            )
669         )
670
671 is_join_var :: Id -> Bool
672 -- A hack (used only for compiler debuggging) to tell if
673 -- a variable started life as a join point ($j)
674 is_join_var j = occNameUserString (getOccName j) == "$j"
675 \end{code}
676
677 \begin{code}
678 coreToStgRhs :: FreeVarsInfo            -- Free var info for the scope of the binding
679              -> [Id]
680              -> (Id,CoreExpr)
681              -> LneM (StgRhs, FreeVarsInfo, LiveInfo, EscVarsSet)
682
683 coreToStgRhs scope_fv_info binders (bndr, rhs)
684   = coreToStgExpr rhs           `thenLne` \ (new_rhs, rhs_fvs, rhs_escs) ->
685     getEnvLne                   `thenLne` \ env ->    
686     freeVarsToLiveVars (binders `minusFVBinders` rhs_fvs) `thenLne` \ lv_info ->
687     returnLne (mkStgRhs rhs_fvs (mkSRT lv_info) bndr_info new_rhs,
688                rhs_fvs, lv_info, rhs_escs)
689   where
690     bndr_info = lookupFVInfo scope_fv_info bndr
691
692 mkStgRhs :: FreeVarsInfo -> SRT -> StgBinderInfo -> StgExpr -> StgRhs
693
694 mkStgRhs rhs_fvs srt binder_info (StgConApp con args)
695   = StgRhsCon noCCS con args
696
697 mkStgRhs rhs_fvs srt binder_info (StgLam _ bndrs body)
698   = StgRhsClosure noCCS binder_info
699                   (getFVs rhs_fvs)               
700                   ReEntrant
701                   srt bndrs body
702         
703 mkStgRhs rhs_fvs srt binder_info rhs
704   = StgRhsClosure noCCS binder_info
705                   (getFVs rhs_fvs)               
706                   upd_flag srt [] rhs
707   where
708    upd_flag = Updatable
709   {-
710     SDM: disabled.  Eval/Apply can't handle functions with arity zero very
711     well; and making these into simple non-updatable thunks breaks other
712     assumptions (namely that they will be entered only once).
713
714     upd_flag | isPAP env rhs  = ReEntrant
715              | otherwise      = Updatable
716   -}
717
718 {- ToDo:
719           upd = if isOnceDem dem
720                     then (if isNotTop toplev 
721                             then SingleEntry    -- HA!  Paydirt for "dem"
722                             else 
723 #ifdef DEBUG
724                      trace "WARNING: SE CAFs unsupported, forcing UPD instead" $
725 #endif
726                      Updatable)
727                 else Updatable
728         -- For now we forbid SingleEntry CAFs; they tickle the
729         -- ASSERT in rts/Storage.c line 215 at newCAF() re mut_link,
730         -- and I don't understand why.  There's only one SE_CAF (well,
731         -- only one that tickled a great gaping bug in an earlier attempt
732         -- at ClosureInfo.getEntryConvention) in the whole of nofib, 
733         -- specifically Main.lvl6 in spectral/cryptarithm2.
734         -- So no great loss.  KSW 2000-07.
735 -}
736 \end{code}
737
738 Detect thunks which will reduce immediately to PAPs, and make them
739 non-updatable.  This has several advantages:
740
741         - the non-updatable thunk behaves exactly like the PAP,
742
743         - the thunk is more efficient to enter, because it is
744           specialised to the task.
745
746         - we save one update frame, one stg_update_PAP, one update
747           and lots of PAP_enters.
748
749         - in the case where the thunk is top-level, we save building
750           a black hole and futhermore the thunk isn't considered to
751           be a CAF any more, so it doesn't appear in any SRTs.
752
753 We do it here, because the arity information is accurate, and we need
754 to do it before the SRT pass to save the SRT entries associated with
755 any top-level PAPs.
756
757 isPAP env (StgApp f args) = listLengthCmp args arity == LT -- idArity f > length args
758                           where
759                             arity = stgArity f (lookupBinding env f)
760 isPAP env _               = False
761
762
763 %************************************************************************
764 %*                                                                      *
765 \subsection[LNE-monad]{A little monad for this let-no-escaping pass}
766 %*                                                                      *
767 %************************************************************************
768
769 There's a lot of stuff to pass around, so we use this @LneM@ monad to
770 help.  All the stuff here is only passed *down*.
771
772 \begin{code}
773 type LneM a =  IdEnv HowBound
774             -> LiveInfo         -- Vars and CAFs live in continuation
775             -> a
776
777 type LiveInfo = (StgLiveVars,   -- Dynamic live variables; 
778                                 -- i.e. ones with a nested (non-top-level) binding
779                  CafSet)        -- Static live variables;
780                                 -- i.e. top-level variables that are CAFs or refer to them
781
782 type EscVarsSet = IdSet
783 type CafSet     = IdSet
784
785 data HowBound
786   = ImportBound         -- Used only as a response to lookupBinding; never
787                         -- exists in the range of the (IdEnv HowBound)
788
789   | LetBound            -- A let(rec) in this module
790         LetInfo         -- Whether top level or nested
791         Arity           -- Its arity (local Ids don't have arity info at this point)
792
793   | LambdaBound         -- Used for both lambda and case
794
795 data LetInfo
796   = TopLet              -- top level things
797   | NestedLet LiveInfo  -- For nested things, what is live if this
798                         -- thing is live?  Invariant: the binder
799                         -- itself is always a member of
800                         -- the dynamic set of its own LiveInfo
801
802 isLetBound (LetBound _ _) = True
803 isLetBound other          = False
804
805 topLevelBound ImportBound         = True
806 topLevelBound (LetBound TopLet _) = True
807 topLevelBound other               = False
808 \end{code}
809
810 For a let(rec)-bound variable, x, we record LiveInfo, the set of
811 variables that are live if x is live.  This LiveInfo comprises
812         (a) dynamic live variables (ones with a non-top-level binding)
813         (b) static live variabes (CAFs or things that refer to CAFs)
814
815 For "normal" variables (a) is just x alone.  If x is a let-no-escaped
816 variable then x is represented by a code pointer and a stack pointer
817 (well, one for each stack).  So all of the variables needed in the
818 execution of x are live if x is, and are therefore recorded in the
819 LetBound constructor; x itself *is* included.
820
821 The set of dynamic live variables is guaranteed ot have no further let-no-escaped
822 variables in it.
823
824 \begin{code}
825 emptyLiveInfo :: LiveInfo
826 emptyLiveInfo = (emptyVarSet,emptyVarSet)
827
828 unitLiveVar :: Id -> LiveInfo
829 unitLiveVar lv = (unitVarSet lv, emptyVarSet)
830
831 unitLiveCaf :: Id -> LiveInfo
832 unitLiveCaf caf = (emptyVarSet, unitVarSet caf)
833
834 addLiveVar :: LiveInfo -> Id -> LiveInfo
835 addLiveVar (lvs, cafs) id = (lvs `extendVarSet` id, cafs)
836
837 unionLiveInfo :: LiveInfo -> LiveInfo -> LiveInfo
838 unionLiveInfo (lv1,caf1) (lv2,caf2) = (lv1 `unionVarSet` lv2, caf1 `unionVarSet` caf2)
839
840 mkSRT :: LiveInfo -> SRT
841 mkSRT (_, cafs) = SRTEntries cafs
842
843 getLiveVars :: LiveInfo -> StgLiveVars
844 getLiveVars (lvs, _) = lvs
845 \end{code}
846
847
848 The std monad functions:
849 \begin{code}
850 initLne :: IdEnv HowBound -> LneM a -> a
851 initLne env m = m env emptyLiveInfo
852
853
854
855 {-# INLINE thenLne #-}
856 {-# INLINE returnLne #-}
857
858 returnLne :: a -> LneM a
859 returnLne e env lvs_cont = e
860
861 thenLne :: LneM a -> (a -> LneM b) -> LneM b
862 thenLne m k env lvs_cont 
863   = k (m env lvs_cont) env lvs_cont
864
865 mapAndUnzipLne  :: (a -> LneM (b,c))   -> [a] -> LneM ([b],[c])
866 mapAndUnzipLne f [] = returnLne ([],[])
867 mapAndUnzipLne f (x:xs)
868   = f x                 `thenLne` \ (r1,  r2)  ->
869     mapAndUnzipLne f xs `thenLne` \ (rs1, rs2) ->
870     returnLne (r1:rs1, r2:rs2)
871
872 mapAndUnzip3Lne :: (a -> LneM (b,c,d)) -> [a] -> LneM ([b],[c],[d])
873 mapAndUnzip3Lne f []    = returnLne ([],[],[])
874 mapAndUnzip3Lne f (x:xs)
875   = f x                  `thenLne` \ (r1,  r2,  r3)  ->
876     mapAndUnzip3Lne f xs `thenLne` \ (rs1, rs2, rs3) ->
877     returnLne (r1:rs1, r2:rs2, r3:rs3)
878
879 mapAndUnzip4Lne :: (a -> LneM (b,c,d,e)) -> [a] -> LneM ([b],[c],[d],[e])
880 mapAndUnzip4Lne f []    = returnLne ([],[],[],[])
881 mapAndUnzip4Lne f (x:xs)
882   = f x                  `thenLne` \ (r1,  r2,  r3, r4)  ->
883     mapAndUnzip4Lne f xs `thenLne` \ (rs1, rs2, rs3, rs4) ->
884     returnLne (r1:rs1, r2:rs2, r3:rs3, r4:rs4)
885
886 fixLne :: (a -> LneM a) -> LneM a
887 fixLne expr env lvs_cont
888   = result
889   where
890     result = expr result env lvs_cont
891 \end{code}
892
893 Functions specific to this monad:
894
895 \begin{code}
896 getVarsLiveInCont :: LneM LiveInfo
897 getVarsLiveInCont env lvs_cont = lvs_cont
898
899 setVarsLiveInCont :: LiveInfo -> LneM a -> LneM a
900 setVarsLiveInCont new_lvs_cont expr env lvs_cont
901   = expr env new_lvs_cont
902
903 extendVarEnvLne :: [(Id, HowBound)] -> LneM a -> LneM a
904 extendVarEnvLne ids_w_howbound expr env lvs_cont
905   = expr (extendVarEnvList env ids_w_howbound) lvs_cont
906
907 lookupVarLne :: Id -> LneM HowBound
908 lookupVarLne v env lvs_cont = returnLne (lookupBinding env v) env lvs_cont
909
910 getEnvLne :: LneM (IdEnv HowBound)
911 getEnvLne env lvs_cont = returnLne env env lvs_cont
912
913 lookupBinding :: IdEnv HowBound -> Id -> HowBound
914 lookupBinding env v = case lookupVarEnv env v of
915                         Just xx -> xx
916                         Nothing -> ASSERT2( isGlobalId v, ppr v ) ImportBound
917
918
919 -- The result of lookupLiveVarsForSet, a set of live variables, is
920 -- only ever tacked onto a decorated expression. It is never used as
921 -- the basis of a control decision, which might give a black hole.
922
923 freeVarsToLiveVars :: FreeVarsInfo -> LneM LiveInfo
924 freeVarsToLiveVars fvs env live_in_cont
925   = returnLne live_info env live_in_cont
926   where
927     live_info    = foldr unionLiveInfo live_in_cont lvs_from_fvs
928     lvs_from_fvs = map do_one (allFreeIds fvs)
929
930     do_one (v, how_bound)
931       = case how_bound of
932           ImportBound                     -> unitLiveCaf v      -- Only CAF imports are 
933                                                                 -- recorded in fvs
934           LetBound TopLet _              
935                 | mayHaveCafRefs (idCafInfo v) -> unitLiveCaf v
936                 | otherwise                    -> emptyLiveInfo
937
938           LetBound (NestedLet lvs) _      -> lvs        -- lvs already contains v
939                                                         -- (see the invariant on NestedLet)
940
941           _lambda_or_case_binding         -> unitLiveVar v      -- Bound by lambda or case
942 \end{code}
943
944 %************************************************************************
945 %*                                                                      *
946 \subsection[Free-var info]{Free variable information}
947 %*                                                                      *
948 %************************************************************************
949
950 \begin{code}
951 type FreeVarsInfo = VarEnv (Var, HowBound, StgBinderInfo)
952         -- The Var is so we can gather up the free variables
953         -- as a set.
954         --
955         -- The HowBound info just saves repeated lookups;
956         -- we look up just once when we encounter the occurrence.
957         -- INVARIANT: Any ImportBound Ids are HaveCafRef Ids
958         --            Imported Ids without CAF refs are simply
959         --            not put in the FreeVarsInfo for an expression.
960         --            See singletonFVInfo and freeVarsToLiveVars
961         --
962         -- StgBinderInfo records how it occurs; notably, we
963         -- are interested in whether it only occurs in saturated 
964         -- applications, because then we don't need to build a
965         -- curried version.
966         -- If f is mapped to noBinderInfo, that means
967         -- that f *is* mentioned (else it wouldn't be in the
968         -- IdEnv at all), but perhaps in an unsaturated applications.
969         --
970         -- All case/lambda-bound things are also mapped to
971         -- noBinderInfo, since we aren't interested in their
972         -- occurence info.
973         --
974         -- For ILX we track free var info for type variables too;
975         -- hence VarEnv not IdEnv
976 \end{code}
977
978 \begin{code}
979 emptyFVInfo :: FreeVarsInfo
980 emptyFVInfo = emptyVarEnv
981
982 singletonFVInfo :: Id -> HowBound -> StgBinderInfo -> FreeVarsInfo
983 -- Don't record non-CAF imports at all, to keep free-var sets small
984 singletonFVInfo id ImportBound info
985    | mayHaveCafRefs (idCafInfo id) = unitVarEnv id (id, ImportBound, info)
986    | otherwise                     = emptyVarEnv
987 singletonFVInfo id how_bound info  = unitVarEnv id (id, how_bound, info)
988
989 tyvarFVInfo :: TyVarSet -> FreeVarsInfo
990 tyvarFVInfo tvs = foldVarSet add emptyFVInfo tvs
991         where
992           add tv fvs = extendVarEnv fvs tv (tv, LambdaBound, noBinderInfo)
993                 -- Type variables must be lambda-bound
994
995 unionFVInfo :: FreeVarsInfo -> FreeVarsInfo -> FreeVarsInfo
996 unionFVInfo fv1 fv2 = plusVarEnv_C plusFVInfo fv1 fv2
997
998 unionFVInfos :: [FreeVarsInfo] -> FreeVarsInfo
999 unionFVInfos fvs = foldr unionFVInfo emptyFVInfo fvs
1000
1001 minusFVBinders :: [Id] -> FreeVarsInfo -> FreeVarsInfo
1002 minusFVBinders vs fv = foldr minusFVBinder fv vs
1003
1004 minusFVBinder :: Id -> FreeVarsInfo -> FreeVarsInfo
1005 minusFVBinder v fv | isId v && opt_RuntimeTypes
1006                    = (fv `delVarEnv` v) `unionFVInfo` 
1007                      tyvarFVInfo (tyVarsOfType (idType v))
1008                    | otherwise = fv `delVarEnv` v
1009         -- When removing a binder, remember to add its type variables
1010         -- c.f. CoreFVs.delBinderFV
1011
1012 elementOfFVInfo :: Id -> FreeVarsInfo -> Bool
1013 elementOfFVInfo id fvs = maybeToBool (lookupVarEnv fvs id)
1014
1015 lookupFVInfo :: FreeVarsInfo -> Id -> StgBinderInfo
1016 -- Find how the given Id is used.
1017 -- Externally visible things may be used any old how
1018 lookupFVInfo fvs id 
1019   | isExternalName (idName id) = noBinderInfo
1020   | otherwise = case lookupVarEnv fvs id of
1021                         Nothing         -> noBinderInfo
1022                         Just (_,_,info) -> info
1023
1024 allFreeIds :: FreeVarsInfo -> [(Id,HowBound)]   -- Both top level and non-top-level Ids
1025 allFreeIds fvs = [(id,how_bound) | (id,how_bound,_) <- varEnvElts fvs, isId id]
1026
1027 -- Non-top-level things only, both type variables and ids
1028 -- (type variables only if opt_RuntimeTypes)
1029 getFVs :: FreeVarsInfo -> [Var] 
1030 getFVs fvs = [id | (id, how_bound, _) <- varEnvElts fvs, 
1031                     not (topLevelBound how_bound) ]
1032
1033 getFVSet :: FreeVarsInfo -> VarSet
1034 getFVSet fvs = mkVarSet (getFVs fvs)
1035
1036 plusFVInfo (id1,hb1,info1) (id2,hb2,info2)
1037   = ASSERT (id1 == id2 && hb1 `check_eq_how_bound` hb2)
1038     (id1, hb1, combineStgBinderInfo info1 info2)
1039
1040 #ifdef DEBUG
1041 -- The HowBound info for a variable in the FVInfo should be consistent
1042 check_eq_how_bound ImportBound        ImportBound        = True
1043 check_eq_how_bound LambdaBound        LambdaBound        = True
1044 check_eq_how_bound (LetBound li1 ar1) (LetBound li2 ar2) = ar1 == ar2 && check_eq_li li1 li2
1045 check_eq_how_bound hb1                hb2                = False
1046
1047 check_eq_li (NestedLet _) (NestedLet _) = True
1048 check_eq_li TopLet        TopLet        = True
1049 check_eq_li li1           li2           = False
1050 #endif
1051 \end{code}
1052
1053 Misc.
1054 \begin{code}
1055 filterStgBinders :: [Var] -> [Var]
1056 filterStgBinders bndrs
1057   | opt_RuntimeTypes = bndrs
1058   | otherwise        = filter isId bndrs
1059 \end{code}
1060
1061
1062 \begin{code}
1063         -- Ignore all notes except SCC
1064 myCollectBinders expr
1065   = go [] expr
1066   where
1067     go bs (Lam b e)          = go (b:bs) e
1068     go bs e@(Note (SCC _) _) = (reverse bs, e) 
1069     go bs (Note _ e)         = go bs e
1070     go bs e                  = (reverse bs, e)
1071
1072 myCollectArgs :: CoreExpr -> (Id, [CoreArg])
1073         -- We assume that we only have variables
1074         -- in the function position by now
1075 myCollectArgs expr
1076   = go expr []
1077   where
1078     go (Var v)          as = (v, as)
1079     go (App f a) as        = go f (a:as)
1080     go (Note (SCC _) e) as = pprPanic "CoreToStg.myCollectArgs" (ppr expr)
1081     go (Note n e)       as = go e as
1082     go _                as = pprPanic "CoreToStg.myCollectArgs" (ppr expr)
1083 \end{code}
1084
1085 \begin{code}
1086 stgArity :: Id -> HowBound -> Arity
1087 stgArity f (LetBound _ arity) = arity
1088 stgArity f ImportBound        = idArity f
1089 stgArity f LambdaBound        = 0
1090 \end{code}