Evaluate the results in coreToStgApp
[ghc-hetmet.git] / compiler / stgSyn / CoreToStg.lhs
1 %
2 % (c) The GRASP/AQUA Project, Glasgow University, 1993-1998
3 %
4 \section[CoreToStg]{Converts Core to STG Syntax}
5
6 And, as we have the info in hand, we may convert some lets to
7 let-no-escapes.
8
9 \begin{code}
10 module CoreToStg ( coreToStg, coreExprToStg ) where
11
12 #include "HsVersions.h"
13
14 import CoreSyn
15 import CoreUtils        ( exprType, findDefault )
16 import CoreArity        ( manifestArity )
17 import StgSyn
18
19 import Type
20 import TyCon
21 import Id
22 import Var              ( Var )
23 import IdInfo
24 import DataCon
25 import CostCentre       ( noCCS )
26 import VarSet
27 import VarEnv
28 import Maybes           ( maybeToBool )
29 import Name             ( getOccName, isExternalName, nameOccName )
30 import OccName          ( occNameString, occNameFS )
31 import BasicTypes       ( Arity )
32 import Module
33 import Outputable
34 import MonadUtils
35 import FastString
36 import Util
37 import ForeignCall
38 import PrimOp           ( PrimCall(..) )
39 \end{code}
40
41 %************************************************************************
42 %*                                                                      *
43 \subsection[live-vs-free-doc]{Documentation}
44 %*                                                                      *
45 %************************************************************************
46
47 (There is other relevant documentation in codeGen/CgLetNoEscape.)
48
49 The actual Stg datatype is decorated with {\em live variable}
50 information, as well as {\em free variable} information.  The two are
51 {\em not} the same.  Liveness is an operational property rather than a
52 semantic one.  A variable is live at a particular execution point if
53 it can be referred to {\em directly} again.  In particular, a dead
54 variable's stack slot (if it has one):
55 \begin{enumerate}
56 \item
57 should be stubbed to avoid space leaks, and
58 \item
59 may be reused for something else.
60 \end{enumerate}
61
62 There ought to be a better way to say this.  Here are some examples:
63 \begin{verbatim}
64         let v = [q] \[x] -> e
65         in
66         ...v...  (but no q's)
67 \end{verbatim}
68
69 Just after the `in', v is live, but q is dead.  If the whole of that
70 let expression was enclosed in a case expression, thus:
71 \begin{verbatim}
72         case (let v = [q] \[x] -> e in ...v...) of
73                 alts[...q...]
74 \end{verbatim}
75 (ie @alts@ mention @q@), then @q@ is live even after the `in'; because
76 we'll return later to the @alts@ and need it.
77
78 Let-no-escapes make this a bit more interesting:
79 \begin{verbatim}
80         let-no-escape v = [q] \ [x] -> e
81         in
82         ...v...
83 \end{verbatim}
84 Here, @q@ is still live at the `in', because @v@ is represented not by
85 a closure but by the current stack state.  In other words, if @v@ is
86 live then so is @q@.  Furthermore, if @e@ mentions an enclosing
87 let-no-escaped variable, then {\em its} free variables are also live
88 if @v@ is.
89
90 %************************************************************************
91 %*                                                                      *
92 \subsection[caf-info]{Collecting live CAF info}
93 %*                                                                      *
94 %************************************************************************
95
96 In this pass we also collect information on which CAFs are live for
97 constructing SRTs (see SRT.lhs).
98
99 A top-level Id has CafInfo, which is
100
101         - MayHaveCafRefs, if it may refer indirectly to
102           one or more CAFs, or
103         - NoCafRefs if it definitely doesn't
104
105 The CafInfo has already been calculated during the CoreTidy pass.
106
107 During CoreToStg, we then pin onto each binding and case expression, a
108 list of Ids which represents the "live" CAFs at that point.  The meaning
109 of "live" here is the same as for live variables, see above (which is
110 why it's convenient to collect CAF information here rather than elsewhere).
111
112 The later SRT pass takes these lists of Ids and uses them to construct
113 the actual nested SRTs, and replaces the lists of Ids with (offset,length)
114 pairs.
115
116
117 Interaction of let-no-escape with SRTs   [Sept 01]
118 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
119 Consider
120
121         let-no-escape x = ...caf1...caf2...
122         in
123         ...x...x...x...
124
125 where caf1,caf2 are CAFs.  Since x doesn't have a closure, we
126 build SRTs just as if x's defn was inlined at each call site, and
127 that means that x's CAF refs get duplicated in the overall SRT.
128
129 This is unlike ordinary lets, in which the CAF refs are not duplicated.
130
131 We could fix this loss of (static) sharing by making a sort of pseudo-closure
132 for x, solely to put in the SRTs lower down.
133
134
135 %************************************************************************
136 %*                                                                      *
137 \subsection[binds-StgVarInfo]{Setting variable info: top-level, binds, RHSs}
138 %*                                                                      *
139 %************************************************************************
140
141 \begin{code}
142 coreToStg :: PackageId -> [CoreBind] -> IO [StgBinding]
143 coreToStg this_pkg pgm
144   = return pgm'
145   where (_, _, pgm') = coreTopBindsToStg this_pkg emptyVarEnv pgm
146
147 coreExprToStg :: CoreExpr -> StgExpr
148 coreExprToStg expr
149   = new_expr where (new_expr,_,_) = initLne emptyVarEnv (coreToStgExpr expr)
150
151
152 coreTopBindsToStg
153     :: PackageId
154     -> IdEnv HowBound           -- environment for the bindings
155     -> [CoreBind]
156     -> (IdEnv HowBound, FreeVarsInfo, [StgBinding])
157
158 coreTopBindsToStg _        env [] = (env, emptyFVInfo, [])
159 coreTopBindsToStg this_pkg env (b:bs)
160   = (env2, fvs2, b':bs')
161   where
162         -- Notice the mutually-recursive "knot" here:
163         --   env accumulates down the list of binds,
164         --   fvs accumulates upwards
165         (env1, fvs2, b' ) = coreTopBindToStg this_pkg env fvs1 b
166         (env2, fvs1, bs') = coreTopBindsToStg this_pkg env1 bs
167
168 coreTopBindToStg
169         :: PackageId
170         -> IdEnv HowBound
171         -> FreeVarsInfo         -- Info about the body
172         -> CoreBind
173         -> (IdEnv HowBound, FreeVarsInfo, StgBinding)
174
175 coreTopBindToStg this_pkg env body_fvs (NonRec id rhs)
176   = let
177         env'      = extendVarEnv env id how_bound
178         how_bound = LetBound TopLet $! manifestArity rhs
179
180         (stg_rhs, fvs') =
181             initLne env $ do
182               (stg_rhs, fvs') <- coreToTopStgRhs this_pkg body_fvs (id,rhs)
183               return (stg_rhs, fvs')
184
185         bind = StgNonRec id stg_rhs
186     in
187     ASSERT2(consistentCafInfo id bind, ppr id )
188       -- NB: previously the assertion printed 'rhs' and 'bind'
189       --     as well as 'id', but that led to a black hole
190       --     where printing the assertion error tripped the
191       --     assertion again!
192     (env', fvs' `unionFVInfo` body_fvs, bind)
193
194 coreTopBindToStg this_pkg env body_fvs (Rec pairs)
195   = ASSERT( not (null pairs) )
196     let
197         binders = map fst pairs
198
199         extra_env' = [ (b, LetBound TopLet $! manifestArity rhs)
200                      | (b, rhs) <- pairs ]
201         env' = extendVarEnvList env extra_env'
202
203         (stg_rhss, fvs')
204           = initLne env' $ do
205                (stg_rhss, fvss') <- mapAndUnzipM (coreToTopStgRhs this_pkg body_fvs) pairs
206                let fvs' = unionFVInfos fvss'
207                return (stg_rhss, fvs')
208
209         bind = StgRec (zip binders stg_rhss)
210     in
211     ASSERT2(consistentCafInfo (head binders) bind, ppr binders)
212     (env', fvs' `unionFVInfo` body_fvs, bind)
213
214
215 -- Assertion helper: this checks that the CafInfo on the Id matches
216 -- what CoreToStg has figured out about the binding's SRT.  The
217 -- CafInfo will be exact in all cases except when CorePrep has
218 -- floated out a binding, in which case it will be approximate.
219 consistentCafInfo :: Id -> GenStgBinding Var Id -> Bool
220 consistentCafInfo id bind
221   = WARN( not (exact || is_sat_thing) , ppr id )
222     safe
223   where
224     safe  = id_marked_caffy || not binding_is_caffy
225     exact = id_marked_caffy == binding_is_caffy
226     id_marked_caffy  = mayHaveCafRefs (idCafInfo id)
227     binding_is_caffy = stgBindHasCafRefs bind
228     is_sat_thing = occNameFS (nameOccName (idName id)) == fsLit "sat"
229 \end{code}
230
231 \begin{code}
232 coreToTopStgRhs
233         :: PackageId
234         -> FreeVarsInfo         -- Free var info for the scope of the binding
235         -> (Id,CoreExpr)
236         -> LneM (StgRhs, FreeVarsInfo)
237
238 coreToTopStgRhs this_pkg scope_fv_info (bndr, rhs)
239   = do { (new_rhs, rhs_fvs, _) <- coreToStgExpr rhs
240        ; lv_info <- freeVarsToLiveVars rhs_fvs
241
242        ; let stg_rhs   = mkTopStgRhs this_pkg rhs_fvs (mkSRT lv_info) bndr_info new_rhs
243              stg_arity = stgRhsArity stg_rhs
244        ; return (ASSERT2( arity_ok stg_arity, mk_arity_msg stg_arity) stg_rhs,
245                  rhs_fvs) }
246   where
247     bndr_info = lookupFVInfo scope_fv_info bndr
248
249         -- It's vital that the arity on a top-level Id matches
250         -- the arity of the generated STG binding, else an importing
251         -- module will use the wrong calling convention
252         --      (Trac #2844 was an example where this happened)
253         -- NB1: we can't move the assertion further out without
254         --      blocking the "knot" tied in coreTopBindsToStg
255         -- NB2: the arity check is only needed for Ids with External
256         --      Names, because they are externally visible.  The CorePrep
257         --      pass introduces "sat" things with Local Names and does
258         --      not bother to set their Arity info, so don't fail for those
259     arity_ok stg_arity
260        | isExternalName (idName bndr) = id_arity == stg_arity
261        | otherwise                    = True
262     id_arity  = idArity bndr
263     mk_arity_msg stg_arity
264         = vcat [ppr bndr,
265                 ptext (sLit "Id arity:") <+> ppr id_arity,
266                 ptext (sLit "STG arity:") <+> ppr stg_arity]
267
268 mkTopStgRhs :: PackageId -> FreeVarsInfo
269             -> SRT -> StgBinderInfo -> StgExpr
270             -> StgRhs
271
272 mkTopStgRhs _ rhs_fvs srt binder_info (StgLam _ bndrs body)
273   = StgRhsClosure noCCS binder_info
274                   (getFVs rhs_fvs)
275                   ReEntrant
276                   srt
277                   bndrs body
278
279 mkTopStgRhs this_pkg _ _ _ (StgConApp con args)
280   | not (isDllConApp this_pkg con args)  -- Dynamic StgConApps are updatable
281   = StgRhsCon noCCS con args
282
283 mkTopStgRhs _ rhs_fvs srt binder_info rhs
284   = StgRhsClosure noCCS binder_info
285                   (getFVs rhs_fvs)
286                   Updatable
287                   srt
288                   [] rhs
289 \end{code}
290
291
292 -- ---------------------------------------------------------------------------
293 -- Expressions
294 -- ---------------------------------------------------------------------------
295
296 \begin{code}
297 coreToStgExpr
298         :: CoreExpr
299         -> LneM (StgExpr,       -- Decorated STG expr
300                  FreeVarsInfo,  -- Its free vars (NB free, not live)
301                  EscVarsSet)    -- Its escapees, a subset of its free vars;
302                                 -- also a subset of the domain of the envt
303                                 -- because we are only interested in the escapees
304                                 -- for vars which might be turned into
305                                 -- let-no-escaped ones.
306 \end{code}
307
308 The second and third components can be derived in a simple bottom up pass, not
309 dependent on any decisions about which variables will be let-no-escaped or
310 not.  The first component, that is, the decorated expression, may then depend
311 on these components, but it in turn is not scrutinised as the basis for any
312 decisions.  Hence no black holes.
313
314 \begin{code}
315 coreToStgExpr (Lit l) = return (StgLit l, emptyFVInfo, emptyVarSet)
316 coreToStgExpr (Var v) = coreToStgApp Nothing v []
317
318 coreToStgExpr expr@(App _ _)
319   = coreToStgApp Nothing f args
320   where
321     (f, args) = myCollectArgs expr
322
323 coreToStgExpr expr@(Lam _ _)
324   = let
325         (args, body) = myCollectBinders expr
326         args'        = filterStgBinders args
327     in
328     extendVarEnvLne [ (a, LambdaBound) | a <- args' ] $ do
329     (body, body_fvs, body_escs) <- coreToStgExpr body
330     let
331         fvs             = args' `minusFVBinders` body_fvs
332         escs            = body_escs `delVarSetList` args'
333         result_expr | null args' = body
334                     | otherwise  = StgLam (exprType expr) args' body
335
336     return (result_expr, fvs, escs)
337
338 coreToStgExpr (Note (SCC cc) expr) = do
339     (expr2, fvs, escs) <- coreToStgExpr expr
340     return (StgSCC cc expr2, fvs, escs)
341
342 coreToStgExpr (Case (Var id) _bndr _ty [(DEFAULT,[],expr)])
343   | Just (TickBox m n) <- isTickBoxOp_maybe id = do
344     (expr2, fvs, escs) <- coreToStgExpr expr
345     return (StgTick m n expr2, fvs, escs)
346
347 coreToStgExpr (Note _ expr)
348   = coreToStgExpr expr
349
350 coreToStgExpr (Cast expr _)
351   = coreToStgExpr expr
352
353 -- Cases require a little more real work.
354
355 coreToStgExpr (Case scrut bndr _ alts) = do
356     (alts2, alts_fvs, alts_escs)
357        <- extendVarEnvLne [(bndr, LambdaBound)] $ do
358             (alts2, fvs_s, escs_s) <- mapAndUnzip3M vars_alt alts
359             return ( alts2,
360                      unionFVInfos fvs_s,
361                      unionVarSets escs_s )
362     let
363         -- Determine whether the default binder is dead or not
364         -- This helps the code generator to avoid generating an assignment
365         -- for the case binder (is extremely rare cases) ToDo: remove.
366         bndr' | bndr `elementOfFVInfo` alts_fvs = bndr
367               | otherwise                       = bndr `setIdOccInfo` IAmDead
368
369         -- Don't consider the default binder as being 'live in alts',
370         -- since this is from the point of view of the case expr, where
371         -- the default binder is not free.
372         alts_fvs_wo_bndr  = bndr `minusFVBinder` alts_fvs
373         alts_escs_wo_bndr = alts_escs `delVarSet` bndr
374
375     alts_lv_info <- freeVarsToLiveVars alts_fvs_wo_bndr
376
377         -- We tell the scrutinee that everything
378         -- live in the alts is live in it, too.
379     (scrut2, scrut_fvs, _scrut_escs, scrut_lv_info)
380        <- setVarsLiveInCont alts_lv_info $ do
381             (scrut2, scrut_fvs, scrut_escs) <- coreToStgExpr scrut
382             scrut_lv_info <- freeVarsToLiveVars scrut_fvs
383             return (scrut2, scrut_fvs, scrut_escs, scrut_lv_info)
384
385     return (
386       StgCase scrut2 (getLiveVars scrut_lv_info)
387                      (getLiveVars alts_lv_info)
388                      bndr'
389                      (mkSRT alts_lv_info)
390                      (mkStgAltType bndr alts)
391                      alts2,
392       scrut_fvs `unionFVInfo` alts_fvs_wo_bndr,
393       alts_escs_wo_bndr `unionVarSet` getFVSet scrut_fvs
394                 -- You might think we should have scrut_escs, not
395                 -- (getFVSet scrut_fvs), but actually we can't call, and
396                 -- then return from, a let-no-escape thing.
397       )
398   where
399     vars_alt (con, binders, rhs)
400       = let     -- Remove type variables
401             binders' = filterStgBinders binders
402         in
403         extendVarEnvLne [(b, LambdaBound) | b <- binders'] $ do
404         (rhs2, rhs_fvs, rhs_escs) <- coreToStgExpr rhs
405         let
406                 -- Records whether each param is used in the RHS
407             good_use_mask = [ b `elementOfFVInfo` rhs_fvs | b <- binders' ]
408
409         return ( (con, binders', good_use_mask, rhs2),
410                  binders' `minusFVBinders` rhs_fvs,
411                  rhs_escs `delVarSetList` binders' )
412                 -- ToDo: remove the delVarSet;
413                 -- since escs won't include any of these binders
414 \end{code}
415
416 Lets not only take quite a bit of work, but this is where we convert
417 then to let-no-escapes, if we wish.
418
419 (Meanwhile, we don't expect to see let-no-escapes...)
420 \begin{code}
421 coreToStgExpr (Let bind body) = do
422     (new_let, fvs, escs, _)
423        <- mfix (\ ~(_, _, _, no_binder_escapes) ->
424              coreToStgLet no_binder_escapes bind body
425           )
426
427     return (new_let, fvs, escs)
428
429 coreToStgExpr e = pprPanic "coreToStgExpr" (ppr e)
430 \end{code}
431
432 \begin{code}
433 mkStgAltType :: Id -> [CoreAlt] -> AltType
434 mkStgAltType bndr alts
435   = case splitTyConApp_maybe (repType (idType bndr)) of
436         Just (tc,_) | isUnboxedTupleTyCon tc -> UbxTupAlt tc
437                     | isUnLiftedTyCon tc     -> PrimAlt tc
438                     | isHiBootTyCon tc       -> look_for_better_tycon
439                     | isAlgTyCon tc          -> AlgAlt tc
440                     | otherwise              -> ASSERT2( _is_poly_alt_tycon tc, ppr tc )
441                                                 PolyAlt
442         Nothing                              -> PolyAlt
443
444   where
445    _is_poly_alt_tycon tc
446         =  isFunTyCon tc
447         || isPrimTyCon tc   -- "Any" is lifted but primitive
448         || isFamilyTyCon tc   -- Type family; e.g. arising from strict
449                             -- function application where argument has a
450                             -- type-family type
451
452    -- Sometimes, the TyCon is a HiBootTyCon which may not have any
453    -- constructors inside it.  Then we can get a better TyCon by
454    -- grabbing the one from a constructor alternative
455    -- if one exists.
456    look_for_better_tycon
457         | ((DataAlt con, _, _) : _) <- data_alts =
458                 AlgAlt (dataConTyCon con)
459         | otherwise =
460                 ASSERT(null data_alts)
461                 PolyAlt
462         where
463                 (data_alts, _deflt) = findDefault alts
464 \end{code}
465
466
467 -- ---------------------------------------------------------------------------
468 -- Applications
469 -- ---------------------------------------------------------------------------
470
471 \begin{code}
472 coreToStgApp
473          :: Maybe UpdateFlag            -- Just upd <=> this application is
474                                         -- the rhs of a thunk binding
475                                         --      x = [...] \upd [] -> the_app
476                                         -- with specified update flag
477         -> Id                           -- Function
478         -> [CoreArg]                    -- Arguments
479         -> LneM (StgExpr, FreeVarsInfo, EscVarsSet)
480
481
482 coreToStgApp _ f args = do
483     (args', args_fvs) <- coreToStgArgs args
484     how_bound <- lookupVarLne f
485
486     let
487         n_val_args       = valArgCount args
488         not_letrec_bound = not (isLetBound how_bound)
489         fun_fvs = singletonFVInfo f how_bound fun_occ
490             -- e.g. (f :: a -> int) (x :: a)
491             -- Here the free variables are "f", "x" AND the type variable "a"
492             -- coreToStgArgs will deal with the arguments recursively
493
494         -- Mostly, the arity info of a function is in the fn's IdInfo
495         -- But new bindings introduced by CoreSat may not have no
496         -- arity info; it would do us no good anyway.  For example:
497         --      let f = \ab -> e in f
498         -- No point in having correct arity info for f!
499         -- Hence the hasArity stuff below.
500         -- NB: f_arity is only consulted for LetBound things
501         f_arity   = stgArity f how_bound
502         saturated = f_arity <= n_val_args
503
504         fun_occ
505          | not_letrec_bound         = noBinderInfo      -- Uninteresting variable
506          | f_arity > 0 && saturated = stgSatOcc -- Saturated or over-saturated function call
507          | otherwise                = stgUnsatOcc       -- Unsaturated function or thunk
508
509         fun_escs
510          | not_letrec_bound      = emptyVarSet  -- Only letrec-bound escapees are interesting
511          | f_arity == n_val_args = emptyVarSet  -- A function *or thunk* with an exactly
512                                                 -- saturated call doesn't escape
513                                                 -- (let-no-escape applies to 'thunks' too)
514
515          | otherwise         = unitVarSet f     -- Inexact application; it does escape
516
517         -- At the moment of the call:
518
519         --  either the function is *not* let-no-escaped, in which case
520         --         nothing is live except live_in_cont
521         --      or the function *is* let-no-escaped in which case the
522         --         variables it uses are live, but still the function
523         --         itself is not.  PS.  In this case, the function's
524         --         live vars should already include those of the
525         --         continuation, but it does no harm to just union the
526         --         two regardless.
527
528         res_ty = exprType (mkApps (Var f) args)
529         app = case idDetails f of
530                 DataConWorkId dc | saturated -> StgConApp dc args'
531
532                 -- Some primitive operator that might be implemented as a library call.
533                 PrimOpId op      -> ASSERT( saturated )
534                                     StgOpApp (StgPrimOp op) args' res_ty
535
536                 -- A call to some primitive Cmm function.
537                 FCallId (CCall (CCallSpec (StaticTarget lbl (Just pkgId)) PrimCallConv _))
538                                  -> ASSERT( saturated )
539                                     StgOpApp (StgPrimCallOp (PrimCall lbl pkgId)) args' res_ty
540
541                 -- A regular foreign call.
542                 FCallId call     -> ASSERT( saturated )
543                                     StgOpApp (StgFCallOp call (idUnique f)) args' res_ty
544
545                 TickBoxOpId {}   -> pprPanic "coreToStg TickBox" $ ppr (f,args')
546                 _other           -> StgApp f args'
547         fvs = fun_fvs  `unionFVInfo` args_fvs
548         vars = fun_escs `unionVarSet` (getFVSet args_fvs)
549                                 -- All the free vars of the args are disqualified
550                                 -- from being let-no-escaped.
551
552     app `seq` fvs `seq` seqVarSet vars `seq` return (
553         app,
554         fvs,
555         vars
556      )
557
558
559
560 -- ---------------------------------------------------------------------------
561 -- Argument lists
562 -- This is the guy that turns applications into A-normal form
563 -- ---------------------------------------------------------------------------
564
565 coreToStgArgs :: [CoreArg] -> LneM ([StgArg], FreeVarsInfo)
566 coreToStgArgs []
567   = return ([], emptyFVInfo)
568
569 coreToStgArgs (Type _ : args) = do     -- Type argument
570     (args', fvs) <- coreToStgArgs args
571     return (args', fvs)
572
573 coreToStgArgs (arg : args) = do         -- Non-type argument
574     (stg_args, args_fvs) <- coreToStgArgs args
575     (arg', arg_fvs, _escs) <- coreToStgExpr arg
576     let
577         fvs = args_fvs `unionFVInfo` arg_fvs
578         stg_arg = case arg' of
579                        StgApp v []      -> StgVarArg v
580                        StgConApp con [] -> StgVarArg (dataConWorkId con)
581                        StgLit lit       -> StgLitArg lit
582                        _                -> pprPanic "coreToStgArgs" (ppr arg)
583
584         -- WARNING: what if we have an argument like (v `cast` co)
585         --          where 'co' changes the representation type?
586         --          (This really only happens if co is unsafe.)
587         -- Then all the getArgAmode stuff in CgBindery will set the
588         -- cg_rep of the CgIdInfo based on the type of v, rather
589         -- than the type of 'co'.
590         -- This matters particularly when the function is a primop
591         -- or foreign call.
592         -- Wanted: a better solution than this hacky warning
593     let
594         arg_ty = exprType arg
595         stg_arg_ty = stgArgType stg_arg
596         bad_args = (isUnLiftedType arg_ty && not (isUnLiftedType stg_arg_ty))
597                 || (typePrimRep arg_ty /= typePrimRep stg_arg_ty)
598         -- In GHCi we coerce an argument of type BCO# (unlifted) to HValue (lifted),
599         -- and pass it to a function expecting an HValue (arg_ty).  This is ok because
600         -- we can treat an unlifted value as lifted.  But the other way round
601         -- we complain.
602         -- We also want to check if a pointer is cast to a non-ptr etc
603
604     WARN( bad_args, ptext (sLit "Dangerous-looking argument. Probable cause: bad unsafeCoerce#") $$ ppr arg )
605      return (stg_arg : stg_args, fvs)
606
607
608 -- ---------------------------------------------------------------------------
609 -- The magic for lets:
610 -- ---------------------------------------------------------------------------
611
612 coreToStgLet
613          :: Bool        -- True <=> yes, we are let-no-escaping this let
614          -> CoreBind    -- bindings
615          -> CoreExpr    -- body
616          -> LneM (StgExpr,      -- new let
617                   FreeVarsInfo, -- variables free in the whole let
618                   EscVarsSet,   -- variables that escape from the whole let
619                   Bool)         -- True <=> none of the binders in the bindings
620                                 -- is among the escaping vars
621
622 coreToStgLet let_no_escape bind body = do
623     (bind2, bind_fvs, bind_escs, bind_lvs,
624      body2, body_fvs, body_escs, body_lvs)
625        <- mfix $ \ ~(_, _, _, _, _, rec_body_fvs, _, _) -> do
626
627           -- Do the bindings, setting live_in_cont to empty if
628           -- we ain't in a let-no-escape world
629           live_in_cont <- getVarsLiveInCont
630           ( bind2, bind_fvs, bind_escs, bind_lv_info, env_ext)
631                 <- setVarsLiveInCont (if let_no_escape
632                                           then live_in_cont
633                                           else emptyLiveInfo)
634                                      (vars_bind rec_body_fvs bind)
635
636           -- Do the body
637           extendVarEnvLne env_ext $ do
638              (body2, body_fvs, body_escs) <- coreToStgExpr body
639              body_lv_info <- freeVarsToLiveVars body_fvs
640
641              return (bind2, bind_fvs, bind_escs, getLiveVars bind_lv_info,
642                      body2, body_fvs, body_escs, getLiveVars body_lv_info)
643
644
645         -- Compute the new let-expression
646     let
647         new_let | let_no_escape = StgLetNoEscape live_in_whole_let bind_lvs bind2 body2
648                 | otherwise     = StgLet bind2 body2
649
650         free_in_whole_let
651           = binders `minusFVBinders` (bind_fvs `unionFVInfo` body_fvs)
652
653         live_in_whole_let
654           = bind_lvs `unionVarSet` (body_lvs `delVarSetList` binders)
655
656         real_bind_escs = if let_no_escape then
657                             bind_escs
658                          else
659                             getFVSet bind_fvs
660                             -- Everything escapes which is free in the bindings
661
662         let_escs = (real_bind_escs `unionVarSet` body_escs) `delVarSetList` binders
663
664         all_escs = bind_escs `unionVarSet` body_escs    -- Still includes binders of
665                                                         -- this let(rec)
666
667         no_binder_escapes = isEmptyVarSet (set_of_binders `intersectVarSet` all_escs)
668
669         -- Debugging code as requested by Andrew Kennedy
670         checked_no_binder_escapes
671                 | debugIsOn && not no_binder_escapes && any is_join_var binders
672                 = pprTrace "Interesting!  A join var that isn't let-no-escaped" (ppr binders)
673                   False
674                 | otherwise = no_binder_escapes
675
676                 -- Mustn't depend on the passed-in let_no_escape flag, since
677                 -- no_binder_escapes is used by the caller to derive the flag!
678     return (
679         new_let,
680         free_in_whole_let,
681         let_escs,
682         checked_no_binder_escapes
683       )
684   where
685     set_of_binders = mkVarSet binders
686     binders        = bindersOf bind
687
688     mk_binding bind_lv_info binder rhs
689         = (binder, LetBound (NestedLet live_vars) (manifestArity rhs))
690         where
691            live_vars | let_no_escape = addLiveVar bind_lv_info binder
692                      | otherwise     = unitLiveVar binder
693                 -- c.f. the invariant on NestedLet
694
695     vars_bind :: FreeVarsInfo           -- Free var info for body of binding
696               -> CoreBind
697               -> LneM (StgBinding,
698                        FreeVarsInfo,
699                        EscVarsSet,        -- free vars; escapee vars
700                        LiveInfo,          -- Vars and CAFs live in binding
701                        [(Id, HowBound)])  -- extension to environment
702
703
704     vars_bind body_fvs (NonRec binder rhs) = do
705         (rhs2, bind_fvs, bind_lv_info, escs) <- coreToStgRhs body_fvs [] (binder,rhs)
706         let
707             env_ext_item = mk_binding bind_lv_info binder rhs
708
709         return (StgNonRec binder rhs2,
710                 bind_fvs, escs, bind_lv_info, [env_ext_item])
711
712
713     vars_bind body_fvs (Rec pairs)
714       = mfix $ \ ~(_, rec_rhs_fvs, _, bind_lv_info, _) ->
715            let
716                 rec_scope_fvs = unionFVInfo body_fvs rec_rhs_fvs
717                 binders = map fst pairs
718                 env_ext = [ mk_binding bind_lv_info b rhs
719                           | (b,rhs) <- pairs ]
720            in
721            extendVarEnvLne env_ext $ do
722               (rhss2, fvss, lv_infos, escss)
723                      <- mapAndUnzip4M (coreToStgRhs rec_scope_fvs binders) pairs
724               let
725                         bind_fvs = unionFVInfos fvss
726                         bind_lv_info = foldr unionLiveInfo emptyLiveInfo lv_infos
727                         escs     = unionVarSets escss
728
729               return (StgRec (binders `zip` rhss2),
730                       bind_fvs, escs, bind_lv_info, env_ext)
731
732
733 is_join_var :: Id -> Bool
734 -- A hack (used only for compiler debuggging) to tell if
735 -- a variable started life as a join point ($j)
736 is_join_var j = occNameString (getOccName j) == "$j"
737 \end{code}
738
739 \begin{code}
740 coreToStgRhs :: FreeVarsInfo            -- Free var info for the scope of the binding
741              -> [Id]
742              -> (Id,CoreExpr)
743              -> LneM (StgRhs, FreeVarsInfo, LiveInfo, EscVarsSet)
744
745 coreToStgRhs scope_fv_info binders (bndr, rhs) = do
746     (new_rhs, rhs_fvs, rhs_escs) <- coreToStgExpr rhs
747     lv_info <- freeVarsToLiveVars (binders `minusFVBinders` rhs_fvs)
748     return (mkStgRhs rhs_fvs (mkSRT lv_info) bndr_info new_rhs,
749             rhs_fvs, lv_info, rhs_escs)
750   where
751     bndr_info = lookupFVInfo scope_fv_info bndr
752
753 mkStgRhs :: FreeVarsInfo -> SRT -> StgBinderInfo -> StgExpr -> StgRhs
754
755 mkStgRhs _ _ _ (StgConApp con args) = StgRhsCon noCCS con args
756
757 mkStgRhs rhs_fvs srt binder_info (StgLam _ bndrs body)
758   = StgRhsClosure noCCS binder_info
759                   (getFVs rhs_fvs)
760                   ReEntrant
761                   srt bndrs body
762
763 mkStgRhs rhs_fvs srt binder_info rhs
764   = StgRhsClosure noCCS binder_info
765                   (getFVs rhs_fvs)
766                   upd_flag srt [] rhs
767   where
768    upd_flag = Updatable
769   {-
770     SDM: disabled.  Eval/Apply can't handle functions with arity zero very
771     well; and making these into simple non-updatable thunks breaks other
772     assumptions (namely that they will be entered only once).
773
774     upd_flag | isPAP env rhs  = ReEntrant
775              | otherwise      = Updatable
776   -}
777
778 {- ToDo:
779           upd = if isOnceDem dem
780                     then (if isNotTop toplev
781                             then SingleEntry    -- HA!  Paydirt for "dem"
782                             else
783 #ifdef DEBUG
784                      trace "WARNING: SE CAFs unsupported, forcing UPD instead" $
785 #endif
786                      Updatable)
787                 else Updatable
788         -- For now we forbid SingleEntry CAFs; they tickle the
789         -- ASSERT in rts/Storage.c line 215 at newCAF() re mut_link,
790         -- and I don't understand why.  There's only one SE_CAF (well,
791         -- only one that tickled a great gaping bug in an earlier attempt
792         -- at ClosureInfo.getEntryConvention) in the whole of nofib,
793         -- specifically Main.lvl6 in spectral/cryptarithm2.
794         -- So no great loss.  KSW 2000-07.
795 -}
796 \end{code}
797
798 Detect thunks which will reduce immediately to PAPs, and make them
799 non-updatable.  This has several advantages:
800
801         - the non-updatable thunk behaves exactly like the PAP,
802
803         - the thunk is more efficient to enter, because it is
804           specialised to the task.
805
806         - we save one update frame, one stg_update_PAP, one update
807           and lots of PAP_enters.
808
809         - in the case where the thunk is top-level, we save building
810           a black hole and futhermore the thunk isn't considered to
811           be a CAF any more, so it doesn't appear in any SRTs.
812
813 We do it here, because the arity information is accurate, and we need
814 to do it before the SRT pass to save the SRT entries associated with
815 any top-level PAPs.
816
817 isPAP env (StgApp f args) = listLengthCmp args arity == LT -- idArity f > length args
818                           where
819                             arity = stgArity f (lookupBinding env f)
820 isPAP env _               = False
821
822
823 %************************************************************************
824 %*                                                                      *
825 \subsection[LNE-monad]{A little monad for this let-no-escaping pass}
826 %*                                                                      *
827 %************************************************************************
828
829 There's a lot of stuff to pass around, so we use this @LneM@ monad to
830 help.  All the stuff here is only passed *down*.
831
832 \begin{code}
833 newtype LneM a = LneM
834     { unLneM :: IdEnv HowBound
835              -> LiveInfo                -- Vars and CAFs live in continuation
836              -> a
837     }
838
839 type LiveInfo = (StgLiveVars,   -- Dynamic live variables;
840                                 -- i.e. ones with a nested (non-top-level) binding
841                  CafSet)        -- Static live variables;
842                                 -- i.e. top-level variables that are CAFs or refer to them
843
844 type EscVarsSet = IdSet
845 type CafSet     = IdSet
846
847 data HowBound
848   = ImportBound         -- Used only as a response to lookupBinding; never
849                         -- exists in the range of the (IdEnv HowBound)
850
851   | LetBound            -- A let(rec) in this module
852         LetInfo         -- Whether top level or nested
853         Arity           -- Its arity (local Ids don't have arity info at this point)
854
855   | LambdaBound         -- Used for both lambda and case
856
857 data LetInfo
858   = TopLet              -- top level things
859   | NestedLet LiveInfo  -- For nested things, what is live if this
860                         -- thing is live?  Invariant: the binder
861                         -- itself is always a member of
862                         -- the dynamic set of its own LiveInfo
863
864 isLetBound :: HowBound -> Bool
865 isLetBound (LetBound _ _) = True
866 isLetBound _              = False
867
868 topLevelBound :: HowBound -> Bool
869 topLevelBound ImportBound         = True
870 topLevelBound (LetBound TopLet _) = True
871 topLevelBound _                   = False
872 \end{code}
873
874 For a let(rec)-bound variable, x, we record LiveInfo, the set of
875 variables that are live if x is live.  This LiveInfo comprises
876         (a) dynamic live variables (ones with a non-top-level binding)
877         (b) static live variabes (CAFs or things that refer to CAFs)
878
879 For "normal" variables (a) is just x alone.  If x is a let-no-escaped
880 variable then x is represented by a code pointer and a stack pointer
881 (well, one for each stack).  So all of the variables needed in the
882 execution of x are live if x is, and are therefore recorded in the
883 LetBound constructor; x itself *is* included.
884
885 The set of dynamic live variables is guaranteed ot have no further let-no-escaped
886 variables in it.
887
888 \begin{code}
889 emptyLiveInfo :: LiveInfo
890 emptyLiveInfo = (emptyVarSet,emptyVarSet)
891
892 unitLiveVar :: Id -> LiveInfo
893 unitLiveVar lv = (unitVarSet lv, emptyVarSet)
894
895 unitLiveCaf :: Id -> LiveInfo
896 unitLiveCaf caf = (emptyVarSet, unitVarSet caf)
897
898 addLiveVar :: LiveInfo -> Id -> LiveInfo
899 addLiveVar (lvs, cafs) id = (lvs `extendVarSet` id, cafs)
900
901 unionLiveInfo :: LiveInfo -> LiveInfo -> LiveInfo
902 unionLiveInfo (lv1,caf1) (lv2,caf2) = (lv1 `unionVarSet` lv2, caf1 `unionVarSet` caf2)
903
904 mkSRT :: LiveInfo -> SRT
905 mkSRT (_, cafs) = SRTEntries cafs
906
907 getLiveVars :: LiveInfo -> StgLiveVars
908 getLiveVars (lvs, _) = lvs
909 \end{code}
910
911
912 The std monad functions:
913 \begin{code}
914 initLne :: IdEnv HowBound -> LneM a -> a
915 initLne env m = unLneM m env emptyLiveInfo
916
917
918
919 {-# INLINE thenLne #-}
920 {-# INLINE returnLne #-}
921
922 returnLne :: a -> LneM a
923 returnLne e = LneM $ \_ _ -> e
924
925 thenLne :: LneM a -> (a -> LneM b) -> LneM b
926 thenLne m k = LneM $ \env lvs_cont
927   -> unLneM (k (unLneM m env lvs_cont)) env lvs_cont
928
929 instance Monad LneM where
930     return = returnLne
931     (>>=)  = thenLne
932
933 instance MonadFix LneM where
934     mfix expr = LneM $ \env lvs_cont ->
935                        let result = unLneM (expr result) env lvs_cont
936                        in  result
937 \end{code}
938
939 Functions specific to this monad:
940
941 \begin{code}
942 getVarsLiveInCont :: LneM LiveInfo
943 getVarsLiveInCont = LneM $ \_env lvs_cont -> lvs_cont
944
945 setVarsLiveInCont :: LiveInfo -> LneM a -> LneM a
946 setVarsLiveInCont new_lvs_cont expr
947    =    LneM $   \env _lvs_cont
948    -> unLneM expr env new_lvs_cont
949
950 extendVarEnvLne :: [(Id, HowBound)] -> LneM a -> LneM a
951 extendVarEnvLne ids_w_howbound expr
952    =    LneM $   \env lvs_cont
953    -> unLneM expr (extendVarEnvList env ids_w_howbound) lvs_cont
954
955 lookupVarLne :: Id -> LneM HowBound
956 lookupVarLne v = LneM $ \env _lvs_cont -> lookupBinding env v
957
958 lookupBinding :: IdEnv HowBound -> Id -> HowBound
959 lookupBinding env v = case lookupVarEnv env v of
960                         Just xx -> xx
961                         Nothing -> ASSERT2( isGlobalId v, ppr v ) ImportBound
962
963
964 -- The result of lookupLiveVarsForSet, a set of live variables, is
965 -- only ever tacked onto a decorated expression. It is never used as
966 -- the basis of a control decision, which might give a black hole.
967
968 freeVarsToLiveVars :: FreeVarsInfo -> LneM LiveInfo
969 freeVarsToLiveVars fvs = LneM freeVarsToLiveVars'
970  where
971   freeVarsToLiveVars' _env live_in_cont = live_info
972    where
973     live_info    = foldr unionLiveInfo live_in_cont lvs_from_fvs
974     lvs_from_fvs = map do_one (allFreeIds fvs)
975
976     do_one (v, how_bound)
977       = case how_bound of
978           ImportBound                     -> unitLiveCaf v      -- Only CAF imports are
979                                                                 -- recorded in fvs
980           LetBound TopLet _
981                 | mayHaveCafRefs (idCafInfo v) -> unitLiveCaf v
982                 | otherwise                    -> emptyLiveInfo
983
984           LetBound (NestedLet lvs) _      -> lvs        -- lvs already contains v
985                                                         -- (see the invariant on NestedLet)
986
987           _lambda_or_case_binding         -> unitLiveVar v      -- Bound by lambda or case
988 \end{code}
989
990 %************************************************************************
991 %*                                                                      *
992 \subsection[Free-var info]{Free variable information}
993 %*                                                                      *
994 %************************************************************************
995
996 \begin{code}
997 type FreeVarsInfo = VarEnv (Var, HowBound, StgBinderInfo)
998         -- The Var is so we can gather up the free variables
999         -- as a set.
1000         --
1001         -- The HowBound info just saves repeated lookups;
1002         -- we look up just once when we encounter the occurrence.
1003         -- INVARIANT: Any ImportBound Ids are HaveCafRef Ids
1004         --            Imported Ids without CAF refs are simply
1005         --            not put in the FreeVarsInfo for an expression.
1006         --            See singletonFVInfo and freeVarsToLiveVars
1007         --
1008         -- StgBinderInfo records how it occurs; notably, we
1009         -- are interested in whether it only occurs in saturated
1010         -- applications, because then we don't need to build a
1011         -- curried version.
1012         -- If f is mapped to noBinderInfo, that means
1013         -- that f *is* mentioned (else it wouldn't be in the
1014         -- IdEnv at all), but perhaps in an unsaturated applications.
1015         --
1016         -- All case/lambda-bound things are also mapped to
1017         -- noBinderInfo, since we aren't interested in their
1018         -- occurence info.
1019         --
1020         -- For ILX we track free var info for type variables too;
1021         -- hence VarEnv not IdEnv
1022 \end{code}
1023
1024 \begin{code}
1025 emptyFVInfo :: FreeVarsInfo
1026 emptyFVInfo = emptyVarEnv
1027
1028 singletonFVInfo :: Id -> HowBound -> StgBinderInfo -> FreeVarsInfo
1029 -- Don't record non-CAF imports at all, to keep free-var sets small
1030 singletonFVInfo id ImportBound info
1031    | mayHaveCafRefs (idCafInfo id) = unitVarEnv id (id, ImportBound, info)
1032    | otherwise                     = emptyVarEnv
1033 singletonFVInfo id how_bound info  = unitVarEnv id (id, how_bound, info)
1034
1035 unionFVInfo :: FreeVarsInfo -> FreeVarsInfo -> FreeVarsInfo
1036 unionFVInfo fv1 fv2 = plusVarEnv_C plusFVInfo fv1 fv2
1037
1038 unionFVInfos :: [FreeVarsInfo] -> FreeVarsInfo
1039 unionFVInfos fvs = foldr unionFVInfo emptyFVInfo fvs
1040
1041 minusFVBinders :: [Id] -> FreeVarsInfo -> FreeVarsInfo
1042 minusFVBinders vs fv = foldr minusFVBinder fv vs
1043
1044 minusFVBinder :: Id -> FreeVarsInfo -> FreeVarsInfo
1045 minusFVBinder v fv = fv `delVarEnv` v
1046         -- When removing a binder, remember to add its type variables
1047         -- c.f. CoreFVs.delBinderFV
1048
1049 elementOfFVInfo :: Id -> FreeVarsInfo -> Bool
1050 elementOfFVInfo id fvs = maybeToBool (lookupVarEnv fvs id)
1051
1052 lookupFVInfo :: FreeVarsInfo -> Id -> StgBinderInfo
1053 -- Find how the given Id is used.
1054 -- Externally visible things may be used any old how
1055 lookupFVInfo fvs id
1056   | isExternalName (idName id) = noBinderInfo
1057   | otherwise = case lookupVarEnv fvs id of
1058                         Nothing         -> noBinderInfo
1059                         Just (_,_,info) -> info
1060
1061 allFreeIds :: FreeVarsInfo -> [(Id,HowBound)]   -- Both top level and non-top-level Ids
1062 allFreeIds fvs = ASSERT( all (isId . fst) ids ) ids
1063       where
1064         ids = [(id,how_bound) | (id,how_bound,_) <- varEnvElts fvs]
1065
1066 -- Non-top-level things only, both type variables and ids
1067 getFVs :: FreeVarsInfo -> [Var]
1068 getFVs fvs = [id | (id, how_bound, _) <- varEnvElts fvs,
1069                     not (topLevelBound how_bound) ]
1070
1071 getFVSet :: FreeVarsInfo -> VarSet
1072 getFVSet fvs = mkVarSet (getFVs fvs)
1073
1074 plusFVInfo :: (Var, HowBound, StgBinderInfo)
1075            -> (Var, HowBound, StgBinderInfo)
1076            -> (Var, HowBound, StgBinderInfo)
1077 plusFVInfo (id1,hb1,info1) (id2,hb2,info2)
1078   = ASSERT (id1 == id2 && hb1 `check_eq_how_bound` hb2)
1079     (id1, hb1, combineStgBinderInfo info1 info2)
1080
1081 -- The HowBound info for a variable in the FVInfo should be consistent
1082 check_eq_how_bound :: HowBound -> HowBound -> Bool
1083 check_eq_how_bound ImportBound        ImportBound        = True
1084 check_eq_how_bound LambdaBound        LambdaBound        = True
1085 check_eq_how_bound (LetBound li1 ar1) (LetBound li2 ar2) = ar1 == ar2 && check_eq_li li1 li2
1086 check_eq_how_bound _                  _                  = False
1087
1088 check_eq_li :: LetInfo -> LetInfo -> Bool
1089 check_eq_li (NestedLet _) (NestedLet _) = True
1090 check_eq_li TopLet        TopLet        = True
1091 check_eq_li _             _             = False
1092 \end{code}
1093
1094 Misc.
1095 \begin{code}
1096 filterStgBinders :: [Var] -> [Var]
1097 filterStgBinders bndrs = filter isId bndrs
1098 \end{code}
1099
1100
1101 \begin{code}
1102         -- Ignore all notes except SCC
1103 myCollectBinders :: Expr Var -> ([Var], Expr Var)
1104 myCollectBinders expr
1105   = go [] expr
1106   where
1107     go bs (Lam b e)          = go (b:bs) e
1108     go bs e@(Note (SCC _) _) = (reverse bs, e)
1109     go bs (Cast e _)         = go bs e
1110     go bs (Note _ e)         = go bs e
1111     go bs e                  = (reverse bs, e)
1112
1113 myCollectArgs :: CoreExpr -> (Id, [CoreArg])
1114         -- We assume that we only have variables
1115         -- in the function position by now
1116 myCollectArgs expr
1117   = go expr []
1118   where
1119     go (Var v)          as = (v, as)
1120     go (App f a) as        = go f (a:as)
1121     go (Note (SCC _) _) _  = pprPanic "CoreToStg.myCollectArgs" (ppr expr)
1122     go (Cast e _)       as = go e as
1123     go (Note _ e)       as = go e as
1124     go (Lam b e)        as
1125        | isTyCoVar b         = go e as  -- Note [Collect args]
1126     go _                _  = pprPanic "CoreToStg.myCollectArgs" (ppr expr)
1127 \end{code}
1128
1129 Note [Collect args]
1130 ~~~~~~~~~~~~~~~~~~~
1131 This big-lambda case occurred following a rather obscure eta expansion.
1132 It all seems a bit yukky to me.
1133
1134 \begin{code}
1135 stgArity :: Id -> HowBound -> Arity
1136 stgArity _ (LetBound _ arity) = arity
1137 stgArity f ImportBound        = idArity f
1138 stgArity _ LambdaBound        = 0
1139 \end{code}