fc7550fe01aba68bd316dbb72f3694197f04fd34
[ghc-hetmet.git] / compiler / stgSyn / CoreToStg.lhs
1 %
2 % (c) The GRASP/AQUA Project, Glasgow University, 1993-1998
3 %
4 \section[CoreToStg]{Converts Core to STG Syntax}
5
6 And, as we have the info in hand, we may convert some lets to
7 let-no-escapes.
8
9 \begin{code}
10 module CoreToStg ( coreToStg, coreExprToStg ) where
11
12 #include "HsVersions.h"
13
14 import CoreSyn
15 import CoreUtils        ( exprType, findDefault )
16 import CoreArity        ( manifestArity )
17 import StgSyn
18
19 import Type
20 import TyCon
21 import MkId             ( coercionTokenId )
22 import Id
23 import IdInfo
24 import DataCon
25 import CostCentre       ( noCCS )
26 import VarSet
27 import VarEnv
28 import Maybes           ( maybeToBool )
29 import Name             ( getOccName, isExternalName, nameOccName )
30 import OccName          ( occNameString, occNameFS )
31 import BasicTypes       ( Arity )
32 import Module
33 import Outputable
34 import MonadUtils
35 import FastString
36 import Util
37 import ForeignCall
38 import PrimOp           ( PrimCall(..) )
39 \end{code}
40
41 %************************************************************************
42 %*                                                                      *
43 \subsection[live-vs-free-doc]{Documentation}
44 %*                                                                      *
45 %************************************************************************
46
47 (There is other relevant documentation in codeGen/CgLetNoEscape.)
48
49 The actual Stg datatype is decorated with {\em live variable}
50 information, as well as {\em free variable} information.  The two are
51 {\em not} the same.  Liveness is an operational property rather than a
52 semantic one.  A variable is live at a particular execution point if
53 it can be referred to {\em directly} again.  In particular, a dead
54 variable's stack slot (if it has one):
55 \begin{enumerate}
56 \item
57 should be stubbed to avoid space leaks, and
58 \item
59 may be reused for something else.
60 \end{enumerate}
61
62 There ought to be a better way to say this.  Here are some examples:
63 \begin{verbatim}
64         let v = [q] \[x] -> e
65         in
66         ...v...  (but no q's)
67 \end{verbatim}
68
69 Just after the `in', v is live, but q is dead.  If the whole of that
70 let expression was enclosed in a case expression, thus:
71 \begin{verbatim}
72         case (let v = [q] \[x] -> e in ...v...) of
73                 alts[...q...]
74 \end{verbatim}
75 (ie @alts@ mention @q@), then @q@ is live even after the `in'; because
76 we'll return later to the @alts@ and need it.
77
78 Let-no-escapes make this a bit more interesting:
79 \begin{verbatim}
80         let-no-escape v = [q] \ [x] -> e
81         in
82         ...v...
83 \end{verbatim}
84 Here, @q@ is still live at the `in', because @v@ is represented not by
85 a closure but by the current stack state.  In other words, if @v@ is
86 live then so is @q@.  Furthermore, if @e@ mentions an enclosing
87 let-no-escaped variable, then {\em its} free variables are also live
88 if @v@ is.
89
90 %************************************************************************
91 %*                                                                      *
92 \subsection[caf-info]{Collecting live CAF info}
93 %*                                                                      *
94 %************************************************************************
95
96 In this pass we also collect information on which CAFs are live for
97 constructing SRTs (see SRT.lhs).
98
99 A top-level Id has CafInfo, which is
100
101         - MayHaveCafRefs, if it may refer indirectly to
102           one or more CAFs, or
103         - NoCafRefs if it definitely doesn't
104
105 The CafInfo has already been calculated during the CoreTidy pass.
106
107 During CoreToStg, we then pin onto each binding and case expression, a
108 list of Ids which represents the "live" CAFs at that point.  The meaning
109 of "live" here is the same as for live variables, see above (which is
110 why it's convenient to collect CAF information here rather than elsewhere).
111
112 The later SRT pass takes these lists of Ids and uses them to construct
113 the actual nested SRTs, and replaces the lists of Ids with (offset,length)
114 pairs.
115
116
117 Interaction of let-no-escape with SRTs   [Sept 01]
118 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
119 Consider
120
121         let-no-escape x = ...caf1...caf2...
122         in
123         ...x...x...x...
124
125 where caf1,caf2 are CAFs.  Since x doesn't have a closure, we
126 build SRTs just as if x's defn was inlined at each call site, and
127 that means that x's CAF refs get duplicated in the overall SRT.
128
129 This is unlike ordinary lets, in which the CAF refs are not duplicated.
130
131 We could fix this loss of (static) sharing by making a sort of pseudo-closure
132 for x, solely to put in the SRTs lower down.
133
134
135 %************************************************************************
136 %*                                                                      *
137 \subsection[binds-StgVarInfo]{Setting variable info: top-level, binds, RHSs}
138 %*                                                                      *
139 %************************************************************************
140
141 \begin{code}
142 coreToStg :: PackageId -> [CoreBind] -> IO [StgBinding]
143 coreToStg this_pkg pgm
144   = return pgm'
145   where (_, _, pgm') = coreTopBindsToStg this_pkg emptyVarEnv pgm
146
147 coreExprToStg :: CoreExpr -> StgExpr
148 coreExprToStg expr
149   = new_expr where (new_expr,_,_) = initLne emptyVarEnv (coreToStgExpr expr)
150
151
152 coreTopBindsToStg
153     :: PackageId
154     -> IdEnv HowBound           -- environment for the bindings
155     -> [CoreBind]
156     -> (IdEnv HowBound, FreeVarsInfo, [StgBinding])
157
158 coreTopBindsToStg _        env [] = (env, emptyFVInfo, [])
159 coreTopBindsToStg this_pkg env (b:bs)
160   = (env2, fvs2, b':bs')
161   where
162         -- Notice the mutually-recursive "knot" here:
163         --   env accumulates down the list of binds,
164         --   fvs accumulates upwards
165         (env1, fvs2, b' ) = coreTopBindToStg this_pkg env fvs1 b
166         (env2, fvs1, bs') = coreTopBindsToStg this_pkg env1 bs
167
168 coreTopBindToStg
169         :: PackageId
170         -> IdEnv HowBound
171         -> FreeVarsInfo         -- Info about the body
172         -> CoreBind
173         -> (IdEnv HowBound, FreeVarsInfo, StgBinding)
174
175 coreTopBindToStg this_pkg env body_fvs (NonRec id rhs)
176   = let
177         env'      = extendVarEnv env id how_bound
178         how_bound = LetBound TopLet $! manifestArity rhs
179
180         (stg_rhs, fvs') =
181             initLne env $ do
182               (stg_rhs, fvs') <- coreToTopStgRhs this_pkg body_fvs (id,rhs)
183               return (stg_rhs, fvs')
184
185         bind = StgNonRec id stg_rhs
186     in
187     ASSERT2(consistentCafInfo id bind, ppr id )
188       -- NB: previously the assertion printed 'rhs' and 'bind'
189       --     as well as 'id', but that led to a black hole
190       --     where printing the assertion error tripped the
191       --     assertion again!
192     (env', fvs' `unionFVInfo` body_fvs, bind)
193
194 coreTopBindToStg this_pkg env body_fvs (Rec pairs)
195   = ASSERT( not (null pairs) )
196     let
197         binders = map fst pairs
198
199         extra_env' = [ (b, LetBound TopLet $! manifestArity rhs)
200                      | (b, rhs) <- pairs ]
201         env' = extendVarEnvList env extra_env'
202
203         (stg_rhss, fvs')
204           = initLne env' $ do
205                (stg_rhss, fvss') <- mapAndUnzipM (coreToTopStgRhs this_pkg body_fvs) pairs
206                let fvs' = unionFVInfos fvss'
207                return (stg_rhss, fvs')
208
209         bind = StgRec (zip binders stg_rhss)
210     in
211     ASSERT2(consistentCafInfo (head binders) bind, ppr binders)
212     (env', fvs' `unionFVInfo` body_fvs, bind)
213
214
215 -- Assertion helper: this checks that the CafInfo on the Id matches
216 -- what CoreToStg has figured out about the binding's SRT.  The
217 -- CafInfo will be exact in all cases except when CorePrep has
218 -- floated out a binding, in which case it will be approximate.
219 consistentCafInfo :: Id -> GenStgBinding Var Id -> Bool
220 consistentCafInfo id bind
221   = WARN( not (exact || is_sat_thing) , ppr id <+> ppr id_marked_caffy <+> ppr binding_is_caffy )
222     safe
223   where
224     safe  = id_marked_caffy || not binding_is_caffy
225     exact = id_marked_caffy == binding_is_caffy
226     id_marked_caffy  = mayHaveCafRefs (idCafInfo id)
227     binding_is_caffy = stgBindHasCafRefs bind
228     is_sat_thing = occNameFS (nameOccName (idName id)) == fsLit "sat"
229 \end{code}
230
231 \begin{code}
232 coreToTopStgRhs
233         :: PackageId
234         -> FreeVarsInfo         -- Free var info for the scope of the binding
235         -> (Id,CoreExpr)
236         -> LneM (StgRhs, FreeVarsInfo)
237
238 coreToTopStgRhs this_pkg scope_fv_info (bndr, rhs)
239   = do { (new_rhs, rhs_fvs, _) <- coreToStgExpr rhs
240        ; lv_info <- freeVarsToLiveVars rhs_fvs
241
242        ; let stg_rhs   = mkTopStgRhs this_pkg rhs_fvs (mkSRT lv_info) bndr_info new_rhs
243              stg_arity = stgRhsArity stg_rhs
244        ; return (ASSERT2( arity_ok stg_arity, mk_arity_msg stg_arity) stg_rhs,
245                  rhs_fvs) }
246   where
247     bndr_info = lookupFVInfo scope_fv_info bndr
248
249         -- It's vital that the arity on a top-level Id matches
250         -- the arity of the generated STG binding, else an importing
251         -- module will use the wrong calling convention
252         --      (Trac #2844 was an example where this happened)
253         -- NB1: we can't move the assertion further out without
254         --      blocking the "knot" tied in coreTopBindsToStg
255         -- NB2: the arity check is only needed for Ids with External
256         --      Names, because they are externally visible.  The CorePrep
257         --      pass introduces "sat" things with Local Names and does
258         --      not bother to set their Arity info, so don't fail for those
259     arity_ok stg_arity
260        | isExternalName (idName bndr) = id_arity == stg_arity
261        | otherwise                    = True
262     id_arity  = idArity bndr
263     mk_arity_msg stg_arity
264         = vcat [ppr bndr,
265                 ptext (sLit "Id arity:") <+> ppr id_arity,
266                 ptext (sLit "STG arity:") <+> ppr stg_arity]
267
268 mkTopStgRhs :: PackageId -> FreeVarsInfo
269             -> SRT -> StgBinderInfo -> StgExpr
270             -> StgRhs
271
272 mkTopStgRhs _ rhs_fvs srt binder_info (StgLam _ bndrs body)
273   = StgRhsClosure noCCS binder_info
274                   (getFVs rhs_fvs)
275                   ReEntrant
276                   srt
277                   bndrs body
278
279 mkTopStgRhs this_pkg _ _ _ (StgConApp con args)
280   | not (isDllConApp this_pkg con args)  -- Dynamic StgConApps are updatable
281   = StgRhsCon noCCS con args
282
283 mkTopStgRhs _ rhs_fvs srt binder_info rhs
284   = StgRhsClosure noCCS binder_info
285                   (getFVs rhs_fvs)
286                   Updatable
287                   srt
288                   [] rhs
289 \end{code}
290
291
292 -- ---------------------------------------------------------------------------
293 -- Expressions
294 -- ---------------------------------------------------------------------------
295
296 \begin{code}
297 coreToStgExpr
298         :: CoreExpr
299         -> LneM (StgExpr,       -- Decorated STG expr
300                  FreeVarsInfo,  -- Its free vars (NB free, not live)
301                  EscVarsSet)    -- Its escapees, a subset of its free vars;
302                                 -- also a subset of the domain of the envt
303                                 -- because we are only interested in the escapees
304                                 -- for vars which might be turned into
305                                 -- let-no-escaped ones.
306 \end{code}
307
308 The second and third components can be derived in a simple bottom up pass, not
309 dependent on any decisions about which variables will be let-no-escaped or
310 not.  The first component, that is, the decorated expression, may then depend
311 on these components, but it in turn is not scrutinised as the basis for any
312 decisions.  Hence no black holes.
313
314 \begin{code}
315 coreToStgExpr (Lit l) = return (StgLit l, emptyFVInfo, emptyVarSet)
316 coreToStgExpr (Var v) = coreToStgApp Nothing v []
317
318 coreToStgExpr expr@(App _ _)
319   = coreToStgApp Nothing f args
320   where
321     (f, args) = myCollectArgs expr
322
323 coreToStgExpr expr@(Lam _ _)
324   = let
325         (args, body) = myCollectBinders expr
326         args'        = filterStgBinders args
327     in
328     extendVarEnvLne [ (a, LambdaBound) | a <- args' ] $ do
329     (body, body_fvs, body_escs) <- coreToStgExpr body
330     let
331         fvs             = args' `minusFVBinders` body_fvs
332         escs            = body_escs `delVarSetList` args'
333         result_expr | null args' = body
334                     | otherwise  = StgLam (exprType expr) args' body
335
336     return (result_expr, fvs, escs)
337
338 coreToStgExpr (Note (SCC cc) expr) = do
339     (expr2, fvs, escs) <- coreToStgExpr expr
340     return (StgSCC cc expr2, fvs, escs)
341
342 coreToStgExpr (Case (Var id) _bndr _ty [(DEFAULT,[],expr)])
343   | Just (TickBox m n) <- isTickBoxOp_maybe id = do
344     (expr2, fvs, escs) <- coreToStgExpr expr
345     return (StgTick m n expr2, fvs, escs)
346
347 coreToStgExpr (Note _ expr)
348   = coreToStgExpr expr
349
350 coreToStgExpr (Cast expr _)
351   = coreToStgExpr expr
352
353 -- Cases require a little more real work.
354
355 coreToStgExpr (Case scrut bndr _ alts) = do
356     (alts2, alts_fvs, alts_escs)
357        <- extendVarEnvLne [(bndr, LambdaBound)] $ do
358             (alts2, fvs_s, escs_s) <- mapAndUnzip3M vars_alt alts
359             return ( alts2,
360                      unionFVInfos fvs_s,
361                      unionVarSets escs_s )
362     let
363         -- Determine whether the default binder is dead or not
364         -- This helps the code generator to avoid generating an assignment
365         -- for the case binder (is extremely rare cases) ToDo: remove.
366         bndr' | bndr `elementOfFVInfo` alts_fvs = bndr
367               | otherwise                       = bndr `setIdOccInfo` IAmDead
368
369         -- Don't consider the default binder as being 'live in alts',
370         -- since this is from the point of view of the case expr, where
371         -- the default binder is not free.
372         alts_fvs_wo_bndr  = bndr `minusFVBinder` alts_fvs
373         alts_escs_wo_bndr = alts_escs `delVarSet` bndr
374
375     alts_lv_info <- freeVarsToLiveVars alts_fvs_wo_bndr
376
377         -- We tell the scrutinee that everything
378         -- live in the alts is live in it, too.
379     (scrut2, scrut_fvs, _scrut_escs, scrut_lv_info)
380        <- setVarsLiveInCont alts_lv_info $ do
381             (scrut2, scrut_fvs, scrut_escs) <- coreToStgExpr scrut
382             scrut_lv_info <- freeVarsToLiveVars scrut_fvs
383             return (scrut2, scrut_fvs, scrut_escs, scrut_lv_info)
384
385     return (
386       StgCase scrut2 (getLiveVars scrut_lv_info)
387                      (getLiveVars alts_lv_info)
388                      bndr'
389                      (mkSRT alts_lv_info)
390                      (mkStgAltType bndr alts)
391                      alts2,
392       scrut_fvs `unionFVInfo` alts_fvs_wo_bndr,
393       alts_escs_wo_bndr `unionVarSet` getFVSet scrut_fvs
394                 -- You might think we should have scrut_escs, not
395                 -- (getFVSet scrut_fvs), but actually we can't call, and
396                 -- then return from, a let-no-escape thing.
397       )
398   where
399     vars_alt (con, binders, rhs)
400       = let     -- Remove type variables
401             binders' = filterStgBinders binders
402         in
403         extendVarEnvLne [(b, LambdaBound) | b <- binders'] $ do
404         (rhs2, rhs_fvs, rhs_escs) <- coreToStgExpr rhs
405         let
406                 -- Records whether each param is used in the RHS
407             good_use_mask = [ b `elementOfFVInfo` rhs_fvs | b <- binders' ]
408
409         return ( (con, binders', good_use_mask, rhs2),
410                  binders' `minusFVBinders` rhs_fvs,
411                  rhs_escs `delVarSetList` binders' )
412                 -- ToDo: remove the delVarSet;
413                 -- since escs won't include any of these binders
414 \end{code}
415
416 Lets not only take quite a bit of work, but this is where we convert
417 then to let-no-escapes, if we wish.
418
419 (Meanwhile, we don't expect to see let-no-escapes...)
420 \begin{code}
421 coreToStgExpr (Let bind body) = do
422     (new_let, fvs, escs, _)
423        <- mfix (\ ~(_, _, _, no_binder_escapes) ->
424              coreToStgLet no_binder_escapes bind body
425           )
426
427     return (new_let, fvs, escs)
428
429 coreToStgExpr e = pprPanic "coreToStgExpr" (ppr e)
430 \end{code}
431
432 \begin{code}
433 mkStgAltType :: Id -> [CoreAlt] -> AltType
434 mkStgAltType bndr alts
435   = case splitTyConApp_maybe (repType (idType bndr)) of
436         Just (tc,_) | isUnboxedTupleTyCon tc -> UbxTupAlt tc
437                     | isUnLiftedTyCon tc     -> PrimAlt tc
438                     | isHiBootTyCon tc       -> look_for_better_tycon
439                     | isAlgTyCon tc          -> AlgAlt tc
440                     | otherwise              -> ASSERT2( _is_poly_alt_tycon tc, ppr tc )
441                                                 PolyAlt
442         Nothing                              -> PolyAlt
443
444   where
445    _is_poly_alt_tycon tc
446         =  isFunTyCon tc
447         || isPrimTyCon tc   -- "Any" is lifted but primitive
448         || isFamilyTyCon tc   -- Type family; e.g. arising from strict
449                             -- function application where argument has a
450                             -- type-family type
451
452    -- Sometimes, the TyCon is a HiBootTyCon which may not have any
453    -- constructors inside it.  Then we can get a better TyCon by
454    -- grabbing the one from a constructor alternative
455    -- if one exists.
456    look_for_better_tycon
457         | ((DataAlt con, _, _) : _) <- data_alts =
458                 AlgAlt (dataConTyCon con)
459         | otherwise =
460                 ASSERT(null data_alts)
461                 PolyAlt
462         where
463                 (data_alts, _deflt) = findDefault alts
464 \end{code}
465
466
467 -- ---------------------------------------------------------------------------
468 -- Applications
469 -- ---------------------------------------------------------------------------
470
471 \begin{code}
472 coreToStgApp
473          :: Maybe UpdateFlag            -- Just upd <=> this application is
474                                         -- the rhs of a thunk binding
475                                         --      x = [...] \upd [] -> the_app
476                                         -- with specified update flag
477         -> Id                           -- Function
478         -> [CoreArg]                    -- Arguments
479         -> LneM (StgExpr, FreeVarsInfo, EscVarsSet)
480
481
482 coreToStgApp _ f args = do
483     (args', args_fvs) <- coreToStgArgs args
484     how_bound <- lookupVarLne f
485
486     let
487         n_val_args       = valArgCount args
488         not_letrec_bound = not (isLetBound how_bound)
489         fun_fvs = singletonFVInfo f how_bound fun_occ
490             -- e.g. (f :: a -> int) (x :: a)
491             -- Here the free variables are "f", "x" AND the type variable "a"
492             -- coreToStgArgs will deal with the arguments recursively
493
494         -- Mostly, the arity info of a function is in the fn's IdInfo
495         -- But new bindings introduced by CoreSat may not have no
496         -- arity info; it would do us no good anyway.  For example:
497         --      let f = \ab -> e in f
498         -- No point in having correct arity info for f!
499         -- Hence the hasArity stuff below.
500         -- NB: f_arity is only consulted for LetBound things
501         f_arity   = stgArity f how_bound
502         saturated = f_arity <= n_val_args
503
504         fun_occ
505          | not_letrec_bound         = noBinderInfo      -- Uninteresting variable
506          | f_arity > 0 && saturated = stgSatOcc -- Saturated or over-saturated function call
507          | otherwise                = stgUnsatOcc       -- Unsaturated function or thunk
508
509         fun_escs
510          | not_letrec_bound      = emptyVarSet  -- Only letrec-bound escapees are interesting
511          | f_arity == n_val_args = emptyVarSet  -- A function *or thunk* with an exactly
512                                                 -- saturated call doesn't escape
513                                                 -- (let-no-escape applies to 'thunks' too)
514
515          | otherwise         = unitVarSet f     -- Inexact application; it does escape
516
517         -- At the moment of the call:
518
519         --  either the function is *not* let-no-escaped, in which case
520         --         nothing is live except live_in_cont
521         --      or the function *is* let-no-escaped in which case the
522         --         variables it uses are live, but still the function
523         --         itself is not.  PS.  In this case, the function's
524         --         live vars should already include those of the
525         --         continuation, but it does no harm to just union the
526         --         two regardless.
527
528         res_ty = exprType (mkApps (Var f) args)
529         app = case idDetails f of
530                 DataConWorkId dc | saturated -> StgConApp dc args'
531
532                 -- Some primitive operator that might be implemented as a library call.
533                 PrimOpId op      -> ASSERT( saturated )
534                                     StgOpApp (StgPrimOp op) args' res_ty
535
536                 -- A call to some primitive Cmm function.
537                 FCallId (CCall (CCallSpec (StaticTarget lbl (Just pkgId)) PrimCallConv _))
538                                  -> ASSERT( saturated )
539                                     StgOpApp (StgPrimCallOp (PrimCall lbl pkgId)) args' res_ty
540
541                 -- A regular foreign call.
542                 FCallId call     -> ASSERT( saturated )
543                                     StgOpApp (StgFCallOp call (idUnique f)) args' res_ty
544
545                 TickBoxOpId {}   -> pprPanic "coreToStg TickBox" $ ppr (f,args')
546                 _other           -> StgApp f args'
547         fvs = fun_fvs  `unionFVInfo` args_fvs
548         vars = fun_escs `unionVarSet` (getFVSet args_fvs)
549                                 -- All the free vars of the args are disqualified
550                                 -- from being let-no-escaped.
551
552     -- Forcing these fixes a leak in the code generator, noticed while
553     -- profiling for trac #4367
554     app `seq` fvs `seq` seqVarSet vars `seq` return (
555         app,
556         fvs,
557         vars
558      )
559
560
561
562 -- ---------------------------------------------------------------------------
563 -- Argument lists
564 -- This is the guy that turns applications into A-normal form
565 -- ---------------------------------------------------------------------------
566
567 coreToStgArgs :: [CoreArg] -> LneM ([StgArg], FreeVarsInfo)
568 coreToStgArgs []
569   = return ([], emptyFVInfo)
570
571 coreToStgArgs (Type _ : args) = do     -- Type argument
572     (args', fvs) <- coreToStgArgs args
573     return (args', fvs)
574
575 coreToStgArgs (Coercion _ : args)  -- Coercion argument; replace with place holder
576   = do { (args', fvs) <- coreToStgArgs args
577        ; return (StgVarArg coercionTokenId : args', fvs) }
578
579 coreToStgArgs (arg : args) = do         -- Non-type argument
580     (stg_args, args_fvs) <- coreToStgArgs args
581     (arg', arg_fvs, _escs) <- coreToStgExpr arg
582     let
583         fvs = args_fvs `unionFVInfo` arg_fvs
584         stg_arg = case arg' of
585                        StgApp v []      -> StgVarArg v
586                        StgConApp con [] -> StgVarArg (dataConWorkId con)
587                        StgLit lit       -> StgLitArg lit
588                        _                -> pprPanic "coreToStgArgs" (ppr arg)
589
590         -- WARNING: what if we have an argument like (v `cast` co)
591         --          where 'co' changes the representation type?
592         --          (This really only happens if co is unsafe.)
593         -- Then all the getArgAmode stuff in CgBindery will set the
594         -- cg_rep of the CgIdInfo based on the type of v, rather
595         -- than the type of 'co'.
596         -- This matters particularly when the function is a primop
597         -- or foreign call.
598         -- Wanted: a better solution than this hacky warning
599     let
600         arg_ty = exprType arg
601         stg_arg_ty = stgArgType stg_arg
602         bad_args = (isUnLiftedType arg_ty && not (isUnLiftedType stg_arg_ty))
603                 || (typePrimRep arg_ty /= typePrimRep stg_arg_ty)
604         -- In GHCi we coerce an argument of type BCO# (unlifted) to HValue (lifted),
605         -- and pass it to a function expecting an HValue (arg_ty).  This is ok because
606         -- we can treat an unlifted value as lifted.  But the other way round
607         -- we complain.
608         -- We also want to check if a pointer is cast to a non-ptr etc
609
610     WARN( bad_args, ptext (sLit "Dangerous-looking argument. Probable cause: bad unsafeCoerce#") $$ ppr arg )
611      return (stg_arg : stg_args, fvs)
612
613
614 -- ---------------------------------------------------------------------------
615 -- The magic for lets:
616 -- ---------------------------------------------------------------------------
617
618 coreToStgLet
619          :: Bool        -- True <=> yes, we are let-no-escaping this let
620          -> CoreBind    -- bindings
621          -> CoreExpr    -- body
622          -> LneM (StgExpr,      -- new let
623                   FreeVarsInfo, -- variables free in the whole let
624                   EscVarsSet,   -- variables that escape from the whole let
625                   Bool)         -- True <=> none of the binders in the bindings
626                                 -- is among the escaping vars
627
628 coreToStgLet let_no_escape bind body = do
629     (bind2, bind_fvs, bind_escs, bind_lvs,
630      body2, body_fvs, body_escs, body_lvs)
631        <- mfix $ \ ~(_, _, _, _, _, rec_body_fvs, _, _) -> do
632
633           -- Do the bindings, setting live_in_cont to empty if
634           -- we ain't in a let-no-escape world
635           live_in_cont <- getVarsLiveInCont
636           ( bind2, bind_fvs, bind_escs, bind_lv_info, env_ext)
637                 <- setVarsLiveInCont (if let_no_escape
638                                           then live_in_cont
639                                           else emptyLiveInfo)
640                                      (vars_bind rec_body_fvs bind)
641
642           -- Do the body
643           extendVarEnvLne env_ext $ do
644              (body2, body_fvs, body_escs) <- coreToStgExpr body
645              body_lv_info <- freeVarsToLiveVars body_fvs
646
647              return (bind2, bind_fvs, bind_escs, getLiveVars bind_lv_info,
648                      body2, body_fvs, body_escs, getLiveVars body_lv_info)
649
650
651         -- Compute the new let-expression
652     let
653         new_let | let_no_escape = StgLetNoEscape live_in_whole_let bind_lvs bind2 body2
654                 | otherwise     = StgLet bind2 body2
655
656         free_in_whole_let
657           = binders `minusFVBinders` (bind_fvs `unionFVInfo` body_fvs)
658
659         live_in_whole_let
660           = bind_lvs `unionVarSet` (body_lvs `delVarSetList` binders)
661
662         real_bind_escs = if let_no_escape then
663                             bind_escs
664                          else
665                             getFVSet bind_fvs
666                             -- Everything escapes which is free in the bindings
667
668         let_escs = (real_bind_escs `unionVarSet` body_escs) `delVarSetList` binders
669
670         all_escs = bind_escs `unionVarSet` body_escs    -- Still includes binders of
671                                                         -- this let(rec)
672
673         no_binder_escapes = isEmptyVarSet (set_of_binders `intersectVarSet` all_escs)
674
675         -- Debugging code as requested by Andrew Kennedy
676         checked_no_binder_escapes
677                 | debugIsOn && not no_binder_escapes && any is_join_var binders
678                 = pprTrace "Interesting!  A join var that isn't let-no-escaped" (ppr binders)
679                   False
680                 | otherwise = no_binder_escapes
681
682                 -- Mustn't depend on the passed-in let_no_escape flag, since
683                 -- no_binder_escapes is used by the caller to derive the flag!
684     return (
685         new_let,
686         free_in_whole_let,
687         let_escs,
688         checked_no_binder_escapes
689       )
690   where
691     set_of_binders = mkVarSet binders
692     binders        = bindersOf bind
693
694     mk_binding bind_lv_info binder rhs
695         = (binder, LetBound (NestedLet live_vars) (manifestArity rhs))
696         where
697            live_vars | let_no_escape = addLiveVar bind_lv_info binder
698                      | otherwise     = unitLiveVar binder
699                 -- c.f. the invariant on NestedLet
700
701     vars_bind :: FreeVarsInfo           -- Free var info for body of binding
702               -> CoreBind
703               -> LneM (StgBinding,
704                        FreeVarsInfo,
705                        EscVarsSet,        -- free vars; escapee vars
706                        LiveInfo,          -- Vars and CAFs live in binding
707                        [(Id, HowBound)])  -- extension to environment
708
709
710     vars_bind body_fvs (NonRec binder rhs) = do
711         (rhs2, bind_fvs, bind_lv_info, escs) <- coreToStgRhs body_fvs [] (binder,rhs)
712         let
713             env_ext_item = mk_binding bind_lv_info binder rhs
714
715         return (StgNonRec binder rhs2,
716                 bind_fvs, escs, bind_lv_info, [env_ext_item])
717
718
719     vars_bind body_fvs (Rec pairs)
720       = mfix $ \ ~(_, rec_rhs_fvs, _, bind_lv_info, _) ->
721            let
722                 rec_scope_fvs = unionFVInfo body_fvs rec_rhs_fvs
723                 binders = map fst pairs
724                 env_ext = [ mk_binding bind_lv_info b rhs
725                           | (b,rhs) <- pairs ]
726            in
727            extendVarEnvLne env_ext $ do
728               (rhss2, fvss, lv_infos, escss)
729                      <- mapAndUnzip4M (coreToStgRhs rec_scope_fvs binders) pairs
730               let
731                         bind_fvs = unionFVInfos fvss
732                         bind_lv_info = foldr unionLiveInfo emptyLiveInfo lv_infos
733                         escs     = unionVarSets escss
734
735               return (StgRec (binders `zip` rhss2),
736                       bind_fvs, escs, bind_lv_info, env_ext)
737
738
739 is_join_var :: Id -> Bool
740 -- A hack (used only for compiler debuggging) to tell if
741 -- a variable started life as a join point ($j)
742 is_join_var j = occNameString (getOccName j) == "$j"
743 \end{code}
744
745 \begin{code}
746 coreToStgRhs :: FreeVarsInfo            -- Free var info for the scope of the binding
747              -> [Id]
748              -> (Id,CoreExpr)
749              -> LneM (StgRhs, FreeVarsInfo, LiveInfo, EscVarsSet)
750
751 coreToStgRhs scope_fv_info binders (bndr, rhs) = do
752     (new_rhs, rhs_fvs, rhs_escs) <- coreToStgExpr rhs
753     lv_info <- freeVarsToLiveVars (binders `minusFVBinders` rhs_fvs)
754     return (mkStgRhs rhs_fvs (mkSRT lv_info) bndr_info new_rhs,
755             rhs_fvs, lv_info, rhs_escs)
756   where
757     bndr_info = lookupFVInfo scope_fv_info bndr
758
759 mkStgRhs :: FreeVarsInfo -> SRT -> StgBinderInfo -> StgExpr -> StgRhs
760
761 mkStgRhs _ _ _ (StgConApp con args) = StgRhsCon noCCS con args
762
763 mkStgRhs rhs_fvs srt binder_info (StgLam _ bndrs body)
764   = StgRhsClosure noCCS binder_info
765                   (getFVs rhs_fvs)
766                   ReEntrant
767                   srt bndrs body
768
769 mkStgRhs rhs_fvs srt binder_info rhs
770   = StgRhsClosure noCCS binder_info
771                   (getFVs rhs_fvs)
772                   upd_flag srt [] rhs
773   where
774    upd_flag = Updatable
775   {-
776     SDM: disabled.  Eval/Apply can't handle functions with arity zero very
777     well; and making these into simple non-updatable thunks breaks other
778     assumptions (namely that they will be entered only once).
779
780     upd_flag | isPAP env rhs  = ReEntrant
781              | otherwise      = Updatable
782   -}
783
784 {- ToDo:
785           upd = if isOnceDem dem
786                     then (if isNotTop toplev
787                             then SingleEntry    -- HA!  Paydirt for "dem"
788                             else
789 #ifdef DEBUG
790                      trace "WARNING: SE CAFs unsupported, forcing UPD instead" $
791 #endif
792                      Updatable)
793                 else Updatable
794         -- For now we forbid SingleEntry CAFs; they tickle the
795         -- ASSERT in rts/Storage.c line 215 at newCAF() re mut_link,
796         -- and I don't understand why.  There's only one SE_CAF (well,
797         -- only one that tickled a great gaping bug in an earlier attempt
798         -- at ClosureInfo.getEntryConvention) in the whole of nofib,
799         -- specifically Main.lvl6 in spectral/cryptarithm2.
800         -- So no great loss.  KSW 2000-07.
801 -}
802 \end{code}
803
804 Detect thunks which will reduce immediately to PAPs, and make them
805 non-updatable.  This has several advantages:
806
807         - the non-updatable thunk behaves exactly like the PAP,
808
809         - the thunk is more efficient to enter, because it is
810           specialised to the task.
811
812         - we save one update frame, one stg_update_PAP, one update
813           and lots of PAP_enters.
814
815         - in the case where the thunk is top-level, we save building
816           a black hole and futhermore the thunk isn't considered to
817           be a CAF any more, so it doesn't appear in any SRTs.
818
819 We do it here, because the arity information is accurate, and we need
820 to do it before the SRT pass to save the SRT entries associated with
821 any top-level PAPs.
822
823 isPAP env (StgApp f args) = listLengthCmp args arity == LT -- idArity f > length args
824                           where
825                             arity = stgArity f (lookupBinding env f)
826 isPAP env _               = False
827
828
829 %************************************************************************
830 %*                                                                      *
831 \subsection[LNE-monad]{A little monad for this let-no-escaping pass}
832 %*                                                                      *
833 %************************************************************************
834
835 There's a lot of stuff to pass around, so we use this @LneM@ monad to
836 help.  All the stuff here is only passed *down*.
837
838 \begin{code}
839 newtype LneM a = LneM
840     { unLneM :: IdEnv HowBound
841              -> LiveInfo                -- Vars and CAFs live in continuation
842              -> a
843     }
844
845 type LiveInfo = (StgLiveVars,   -- Dynamic live variables;
846                                 -- i.e. ones with a nested (non-top-level) binding
847                  CafSet)        -- Static live variables;
848                                 -- i.e. top-level variables that are CAFs or refer to them
849
850 type EscVarsSet = IdSet
851 type CafSet     = IdSet
852
853 data HowBound
854   = ImportBound         -- Used only as a response to lookupBinding; never
855                         -- exists in the range of the (IdEnv HowBound)
856
857   | LetBound            -- A let(rec) in this module
858         LetInfo         -- Whether top level or nested
859         Arity           -- Its arity (local Ids don't have arity info at this point)
860
861   | LambdaBound         -- Used for both lambda and case
862
863 data LetInfo
864   = TopLet              -- top level things
865   | NestedLet LiveInfo  -- For nested things, what is live if this
866                         -- thing is live?  Invariant: the binder
867                         -- itself is always a member of
868                         -- the dynamic set of its own LiveInfo
869
870 isLetBound :: HowBound -> Bool
871 isLetBound (LetBound _ _) = True
872 isLetBound _              = False
873
874 topLevelBound :: HowBound -> Bool
875 topLevelBound ImportBound         = True
876 topLevelBound (LetBound TopLet _) = True
877 topLevelBound _                   = False
878 \end{code}
879
880 For a let(rec)-bound variable, x, we record LiveInfo, the set of
881 variables that are live if x is live.  This LiveInfo comprises
882         (a) dynamic live variables (ones with a non-top-level binding)
883         (b) static live variabes (CAFs or things that refer to CAFs)
884
885 For "normal" variables (a) is just x alone.  If x is a let-no-escaped
886 variable then x is represented by a code pointer and a stack pointer
887 (well, one for each stack).  So all of the variables needed in the
888 execution of x are live if x is, and are therefore recorded in the
889 LetBound constructor; x itself *is* included.
890
891 The set of dynamic live variables is guaranteed ot have no further let-no-escaped
892 variables in it.
893
894 \begin{code}
895 emptyLiveInfo :: LiveInfo
896 emptyLiveInfo = (emptyVarSet,emptyVarSet)
897
898 unitLiveVar :: Id -> LiveInfo
899 unitLiveVar lv = (unitVarSet lv, emptyVarSet)
900
901 unitLiveCaf :: Id -> LiveInfo
902 unitLiveCaf caf = (emptyVarSet, unitVarSet caf)
903
904 addLiveVar :: LiveInfo -> Id -> LiveInfo
905 addLiveVar (lvs, cafs) id = (lvs `extendVarSet` id, cafs)
906
907 unionLiveInfo :: LiveInfo -> LiveInfo -> LiveInfo
908 unionLiveInfo (lv1,caf1) (lv2,caf2) = (lv1 `unionVarSet` lv2, caf1 `unionVarSet` caf2)
909
910 mkSRT :: LiveInfo -> SRT
911 mkSRT (_, cafs) = SRTEntries cafs
912
913 getLiveVars :: LiveInfo -> StgLiveVars
914 getLiveVars (lvs, _) = lvs
915 \end{code}
916
917
918 The std monad functions:
919 \begin{code}
920 initLne :: IdEnv HowBound -> LneM a -> a
921 initLne env m = unLneM m env emptyLiveInfo
922
923
924
925 {-# INLINE thenLne #-}
926 {-# INLINE returnLne #-}
927
928 returnLne :: a -> LneM a
929 returnLne e = LneM $ \_ _ -> e
930
931 thenLne :: LneM a -> (a -> LneM b) -> LneM b
932 thenLne m k = LneM $ \env lvs_cont
933   -> unLneM (k (unLneM m env lvs_cont)) env lvs_cont
934
935 instance Monad LneM where
936     return = returnLne
937     (>>=)  = thenLne
938
939 instance MonadFix LneM where
940     mfix expr = LneM $ \env lvs_cont ->
941                        let result = unLneM (expr result) env lvs_cont
942                        in  result
943 \end{code}
944
945 Functions specific to this monad:
946
947 \begin{code}
948 getVarsLiveInCont :: LneM LiveInfo
949 getVarsLiveInCont = LneM $ \_env lvs_cont -> lvs_cont
950
951 setVarsLiveInCont :: LiveInfo -> LneM a -> LneM a
952 setVarsLiveInCont new_lvs_cont expr
953    =    LneM $   \env _lvs_cont
954    -> unLneM expr env new_lvs_cont
955
956 extendVarEnvLne :: [(Id, HowBound)] -> LneM a -> LneM a
957 extendVarEnvLne ids_w_howbound expr
958    =    LneM $   \env lvs_cont
959    -> unLneM expr (extendVarEnvList env ids_w_howbound) lvs_cont
960
961 lookupVarLne :: Id -> LneM HowBound
962 lookupVarLne v = LneM $ \env _lvs_cont -> lookupBinding env v
963
964 lookupBinding :: IdEnv HowBound -> Id -> HowBound
965 lookupBinding env v = case lookupVarEnv env v of
966                         Just xx -> xx
967                         Nothing -> ASSERT2( isGlobalId v, ppr v ) ImportBound
968
969
970 -- The result of lookupLiveVarsForSet, a set of live variables, is
971 -- only ever tacked onto a decorated expression. It is never used as
972 -- the basis of a control decision, which might give a black hole.
973
974 freeVarsToLiveVars :: FreeVarsInfo -> LneM LiveInfo
975 freeVarsToLiveVars fvs = LneM freeVarsToLiveVars'
976  where
977   freeVarsToLiveVars' _env live_in_cont = live_info
978    where
979     live_info    = foldr unionLiveInfo live_in_cont lvs_from_fvs
980     lvs_from_fvs = map do_one (allFreeIds fvs)
981
982     do_one (v, how_bound)
983       = case how_bound of
984           ImportBound                     -> unitLiveCaf v      -- Only CAF imports are
985                                                                 -- recorded in fvs
986           LetBound TopLet _
987                 | mayHaveCafRefs (idCafInfo v) -> unitLiveCaf v
988                 | otherwise                    -> emptyLiveInfo
989
990           LetBound (NestedLet lvs) _      -> lvs        -- lvs already contains v
991                                                         -- (see the invariant on NestedLet)
992
993           _lambda_or_case_binding         -> unitLiveVar v      -- Bound by lambda or case
994 \end{code}
995
996 %************************************************************************
997 %*                                                                      *
998 \subsection[Free-var info]{Free variable information}
999 %*                                                                      *
1000 %************************************************************************
1001
1002 \begin{code}
1003 type FreeVarsInfo = VarEnv (Var, HowBound, StgBinderInfo)
1004         -- The Var is so we can gather up the free variables
1005         -- as a set.
1006         --
1007         -- The HowBound info just saves repeated lookups;
1008         -- we look up just once when we encounter the occurrence.
1009         -- INVARIANT: Any ImportBound Ids are HaveCafRef Ids
1010         --            Imported Ids without CAF refs are simply
1011         --            not put in the FreeVarsInfo for an expression.
1012         --            See singletonFVInfo and freeVarsToLiveVars
1013         --
1014         -- StgBinderInfo records how it occurs; notably, we
1015         -- are interested in whether it only occurs in saturated
1016         -- applications, because then we don't need to build a
1017         -- curried version.
1018         -- If f is mapped to noBinderInfo, that means
1019         -- that f *is* mentioned (else it wouldn't be in the
1020         -- IdEnv at all), but perhaps in an unsaturated applications.
1021         --
1022         -- All case/lambda-bound things are also mapped to
1023         -- noBinderInfo, since we aren't interested in their
1024         -- occurence info.
1025         --
1026         -- For ILX we track free var info for type variables too;
1027         -- hence VarEnv not IdEnv
1028 \end{code}
1029
1030 \begin{code}
1031 emptyFVInfo :: FreeVarsInfo
1032 emptyFVInfo = emptyVarEnv
1033
1034 singletonFVInfo :: Id -> HowBound -> StgBinderInfo -> FreeVarsInfo
1035 -- Don't record non-CAF imports at all, to keep free-var sets small
1036 singletonFVInfo id ImportBound info
1037    | mayHaveCafRefs (idCafInfo id) = unitVarEnv id (id, ImportBound, info)
1038    | otherwise                     = emptyVarEnv
1039 singletonFVInfo id how_bound info  = unitVarEnv id (id, how_bound, info)
1040
1041 unionFVInfo :: FreeVarsInfo -> FreeVarsInfo -> FreeVarsInfo
1042 unionFVInfo fv1 fv2 = plusVarEnv_C plusFVInfo fv1 fv2
1043
1044 unionFVInfos :: [FreeVarsInfo] -> FreeVarsInfo
1045 unionFVInfos fvs = foldr unionFVInfo emptyFVInfo fvs
1046
1047 minusFVBinders :: [Id] -> FreeVarsInfo -> FreeVarsInfo
1048 minusFVBinders vs fv = foldr minusFVBinder fv vs
1049
1050 minusFVBinder :: Id -> FreeVarsInfo -> FreeVarsInfo
1051 minusFVBinder v fv = fv `delVarEnv` v
1052         -- When removing a binder, remember to add its type variables
1053         -- c.f. CoreFVs.delBinderFV
1054
1055 elementOfFVInfo :: Id -> FreeVarsInfo -> Bool
1056 elementOfFVInfo id fvs = maybeToBool (lookupVarEnv fvs id)
1057
1058 lookupFVInfo :: FreeVarsInfo -> Id -> StgBinderInfo
1059 -- Find how the given Id is used.
1060 -- Externally visible things may be used any old how
1061 lookupFVInfo fvs id
1062   | isExternalName (idName id) = noBinderInfo
1063   | otherwise = case lookupVarEnv fvs id of
1064                         Nothing         -> noBinderInfo
1065                         Just (_,_,info) -> info
1066
1067 allFreeIds :: FreeVarsInfo -> [(Id,HowBound)]   -- Both top level and non-top-level Ids
1068 allFreeIds fvs = ASSERT( all (isId . fst) ids ) ids
1069       where
1070         ids = [(id,how_bound) | (id,how_bound,_) <- varEnvElts fvs]
1071
1072 -- Non-top-level things only, both type variables and ids
1073 getFVs :: FreeVarsInfo -> [Var]
1074 getFVs fvs = [id | (id, how_bound, _) <- varEnvElts fvs,
1075                     not (topLevelBound how_bound) ]
1076
1077 getFVSet :: FreeVarsInfo -> VarSet
1078 getFVSet fvs = mkVarSet (getFVs fvs)
1079
1080 plusFVInfo :: (Var, HowBound, StgBinderInfo)
1081            -> (Var, HowBound, StgBinderInfo)
1082            -> (Var, HowBound, StgBinderInfo)
1083 plusFVInfo (id1,hb1,info1) (id2,hb2,info2)
1084   = ASSERT (id1 == id2 && hb1 `check_eq_how_bound` hb2)
1085     (id1, hb1, combineStgBinderInfo info1 info2)
1086
1087 -- The HowBound info for a variable in the FVInfo should be consistent
1088 check_eq_how_bound :: HowBound -> HowBound -> Bool
1089 check_eq_how_bound ImportBound        ImportBound        = True
1090 check_eq_how_bound LambdaBound        LambdaBound        = True
1091 check_eq_how_bound (LetBound li1 ar1) (LetBound li2 ar2) = ar1 == ar2 && check_eq_li li1 li2
1092 check_eq_how_bound _                  _                  = False
1093
1094 check_eq_li :: LetInfo -> LetInfo -> Bool
1095 check_eq_li (NestedLet _) (NestedLet _) = True
1096 check_eq_li TopLet        TopLet        = True
1097 check_eq_li _             _             = False
1098 \end{code}
1099
1100 Misc.
1101 \begin{code}
1102 filterStgBinders :: [Var] -> [Var]
1103 filterStgBinders bndrs = filter isId bndrs
1104 \end{code}
1105
1106
1107 \begin{code}
1108         -- Ignore all notes except SCC
1109 myCollectBinders :: Expr Var -> ([Var], Expr Var)
1110 myCollectBinders expr
1111   = go [] expr
1112   where
1113     go bs (Lam b e)          = go (b:bs) e
1114     go bs e@(Note (SCC _) _) = (reverse bs, e)
1115     go bs (Cast e _)         = go bs e
1116     go bs (Note _ e)         = go bs e
1117     go bs e                  = (reverse bs, e)
1118
1119 myCollectArgs :: CoreExpr -> (Id, [CoreArg])
1120         -- We assume that we only have variables
1121         -- in the function position by now
1122 myCollectArgs expr
1123   = go expr []
1124   where
1125     go (Var v)          as = (v, as)
1126     go (App f a) as        = go f (a:as)
1127     go (Note (SCC _) _) _  = pprPanic "CoreToStg.myCollectArgs" (ppr expr)
1128     go (Cast e _)       as = go e as
1129     go (Note _ e)       as = go e as
1130     go (Lam b e)        as
1131        | isTyVar b         = go e as  -- Note [Collect args]
1132     go _                _  = pprPanic "CoreToStg.myCollectArgs" (ppr expr)
1133 \end{code}
1134
1135 Note [Collect args]
1136 ~~~~~~~~~~~~~~~~~~~
1137 This big-lambda case occurred following a rather obscure eta expansion.
1138 It all seems a bit yukky to me.
1139
1140 \begin{code}
1141 stgArity :: Id -> HowBound -> Arity
1142 stgArity _ (LetBound _ arity) = arity
1143 stgArity f ImportBound        = idArity f
1144 stgArity _ LambdaBound        = 0
1145 \end{code}