[project @ 2003-07-02 13:18:24 by simonpj]
[ghc-hetmet.git] / ghc / compiler / codeGen / CgExpr.lhs
1 %
2 % (c) The GRASP/AQUA Project, Glasgow University, 1992-1998
3 %
4 % $Id: CgExpr.lhs,v 1.56 2003/07/02 13:19:28 simonpj Exp $
5 %
6 %********************************************************
7 %*                                                      *
8 \section[CgExpr]{Converting @StgExpr@s}
9 %*                                                      *
10 %********************************************************
11
12 \begin{code}
13 module CgExpr ( cgExpr ) where
14
15 #include "HsVersions.h"
16
17 import Constants        ( mAX_SPEC_SELECTEE_SIZE, mAX_SPEC_AP_SIZE )
18 import StgSyn
19 import CgMonad
20 import AbsCSyn
21 import AbsCUtils        ( mkAbstractCs, getAmodeRep )
22 import CLabel           ( mkClosureTblLabel )
23
24 import SMRep            ( fixedHdrSize )
25 import CoreSyn          ( AltCon(..) )
26 import CgBindery        ( getArgAmodes, getArgAmode, CgIdInfo, 
27                           nukeDeadBindings, addBindC, addBindsC )
28 import CgCase           ( cgCase, saveVolatileVarsAndRegs )
29 import CgClosure        ( cgRhsClosure, cgStdRhsClosure )
30 import CgCon            ( buildDynCon, cgReturnDataCon )
31 import CgLetNoEscape    ( cgLetNoEscapeClosure )
32 import CgRetConv        ( dataReturnConvPrim )
33 import CgTailCall       ( cgTailCall, performReturn, performPrimReturn,
34                           mkDynamicAlgReturnCode, mkPrimReturnCode,
35                           tailCallPrimOp, ccallReturnUnboxedTuple
36                         )
37 import ClosureInfo      ( mkClosureLFInfo, mkSelectorLFInfo,
38                           mkApLFInfo, layOutDynConstr )
39 import CostCentre       ( sccAbleCostCentre, isSccCountCostCentre )
40 import Id               ( idPrimRep, Id )
41 import VarSet
42 import PrimOp           ( primOpOutOfLine, getPrimOpResultInfo, 
43                           PrimOp(..), PrimOpResultInfo(..) )
44 import TysPrim          ( foreignObjPrimTyCon, arrayPrimTyCon, 
45                           byteArrayPrimTyCon, mutableByteArrayPrimTyCon,
46                           mutableArrayPrimTyCon )
47 import PrimRep          ( PrimRep(..), isFollowableRep )
48 import TyCon            ( isUnboxedTupleTyCon, isEnumerationTyCon )
49 import Type             ( Type, typePrimRep, tyConAppArgs, tyConAppTyCon, repType )
50 import Maybes           ( maybeToBool )
51 import ListSetOps       ( assocMaybe )
52 import Unique           ( mkBuiltinUnique )
53 import BasicTypes       ( TopLevelFlag(..), RecFlag(..) )
54 import Util             ( lengthIs )
55 import Outputable
56 \end{code}
57
58 This module provides the support code for @StgToAbstractC@ to deal
59 with STG {\em expressions}.  See also @CgClosure@, which deals
60 with closures, and @CgCon@, which deals with constructors.
61
62 \begin{code}
63 cgExpr  :: StgExpr              -- input
64         -> Code                 -- output
65 \end{code}
66
67 %********************************************************
68 %*                                                      *
69 %*              Tail calls                              *
70 %*                                                      *
71 %********************************************************
72
73 ``Applications'' mean {\em tail calls}, a service provided by module
74 @CgTailCall@.  This includes literals, which show up as
75 @(STGApp (StgLitArg 42) [])@.
76
77 \begin{code}
78 cgExpr (StgApp fun args) = cgTailCall fun args
79 \end{code}
80
81 %********************************************************
82 %*                                                      *
83 %*              STG ConApps  (for inline versions)      *
84 %*                                                      *
85 %********************************************************
86
87 \begin{code}
88 cgExpr (StgConApp con args)
89   = getArgAmodes args `thenFC` \ amodes ->
90     cgReturnDataCon con amodes
91 \end{code}
92
93 Literals are similar to constructors; they return by putting
94 themselves in an appropriate register and returning to the address on
95 top of the stack.
96
97 \begin{code}
98 cgExpr (StgLit lit)
99   = performPrimReturn (text "literal" <+> ppr lit) (CLit lit)
100 \end{code}
101
102
103 %********************************************************
104 %*                                                      *
105 %*              STG PrimApps  (unboxed primitive ops)   *
106 %*                                                      *
107 %********************************************************
108
109 Here is where we insert real live machine instructions.
110
111 NOTE about _ccall_GC_:
112
113 A _ccall_GC_ is treated as an out-of-line primop (returns True
114 for primOpOutOfLine) so that when we see the call in case context
115         case (ccall ...) of { ... }
116 we get a proper stack frame on the stack when we perform it.  When we
117 get in a tail-call position, however, we need to actually perform the
118 call, so we treat it as an inline primop.
119
120 \begin{code}
121 cgExpr (StgOpApp op@(StgFCallOp _ _) args res_ty)
122   = primRetUnboxedTuple op args res_ty
123
124 -- tagToEnum# is special: we need to pull the constructor out of the table,
125 -- and perform an appropriate return.
126
127 cgExpr (StgOpApp (StgPrimOp TagToEnumOp) [arg] res_ty) 
128   = ASSERT(isEnumerationTyCon tycon)
129     getArgAmode arg `thenFC` \amode ->
130         -- save the tag in a temporary in case amode overlaps
131         -- with node.
132     absC (CAssign dyn_tag amode)        `thenC`
133     performReturn (
134                 CAssign (CReg node) 
135                         (CVal (CIndex
136                           (CLbl (mkClosureTblLabel tycon) PtrRep)
137                           dyn_tag PtrRep) PtrRep))
138             (\ sequel -> mkDynamicAlgReturnCode tycon dyn_tag sequel)
139    where
140         dyn_tag = CTemp (mkBuiltinUnique 0) IntRep
141                 -- The '0' is just to get a random spare temp
142           --
143           -- if you're reading this code in the attempt to figure
144           -- out why the compiler panic'ed here, it is probably because
145           -- you used tagToEnum# in a non-monomorphic setting, e.g., 
146           --         intToTg :: Enum a => Int -> a ; intToTg (I# x#) = tagToEnum# x#
147           --
148           -- That won't work.
149           --
150         tycon = tyConAppTyCon res_ty
151
152
153 cgExpr x@(StgOpApp op@(StgPrimOp primop) args res_ty)
154   | primOpOutOfLine primop 
155   = tailCallPrimOp primop args
156
157   | otherwise
158   = getArgAmodes args   `thenFC` \ arg_amodes ->
159
160     case (getPrimOpResultInfo primop) of
161
162         ReturnsPrim kind ->
163             let result_amode = CReg (dataReturnConvPrim kind) in
164             performReturn 
165               (COpStmt [result_amode] op arg_amodes [{-no vol_regs-}])
166               (mkPrimReturnCode (text "primapp)" <+> ppr x))
167                           
168         -- otherwise, must be returning an enumerated type (eg. Bool).
169         -- we've only got the tag in R2, so we have to load the constructor
170         -- itself into R1.
171
172         ReturnsAlg tycon
173             | isUnboxedTupleTyCon tycon -> primRetUnboxedTuple op args res_ty
174
175             | isEnumerationTyCon  tycon ->
176                 performReturn
177                      (COpStmt [dyn_tag] op arg_amodes [{-no vol_regs-}])
178                           (\ sequel -> 
179                           absC (CAssign (CReg node) closure_lbl) `thenC`
180                           mkDynamicAlgReturnCode tycon dyn_tag sequel)
181
182             where
183                -- Pull a unique out of thin air to put the tag in.  
184                -- It shouldn't matter if this overlaps with anything - we're
185                -- about to return anyway.
186                dyn_tag = CTemp (mkBuiltinUnique 0) IntRep
187
188                closure_lbl = CVal (CIndex
189                                (CLbl (mkClosureTblLabel tycon) PtrRep)
190                                dyn_tag PtrRep) PtrRep
191
192 \end{code}
193
194 %********************************************************
195 %*                                                      *
196 %*              Case expressions                        *
197 %*                                                      *
198 %********************************************************
199 Case-expression conversion is complicated enough to have its own
200 module, @CgCase@.
201 \begin{code}
202
203 cgExpr (StgCase expr live_vars save_vars bndr srt alt_type alts)
204   = cgCase expr live_vars save_vars bndr srt alt_type alts
205 \end{code}
206
207
208 %********************************************************
209 %*                                                      *
210 %*              Let and letrec                          *
211 %*                                                      *
212 %********************************************************
213 \subsection[let-and-letrec-codegen]{Converting @StgLet@ and @StgLetrec@}
214
215 \begin{code}
216 cgExpr (StgLet (StgNonRec name rhs) expr)
217   = cgRhs name rhs      `thenFC` \ (name, info) ->
218     addBindC name info  `thenC`
219     cgExpr expr
220
221 cgExpr (StgLet (StgRec pairs) expr)
222   = fixC (\ new_bindings -> addBindsC new_bindings `thenC`
223                             listFCs [ cgRhs b e | (b,e) <- pairs ]
224     ) `thenFC` \ new_bindings ->
225
226     addBindsC new_bindings `thenC`
227     cgExpr expr
228 \end{code}
229
230 \begin{code}
231 cgExpr (StgLetNoEscape live_in_whole_let live_in_rhss bindings body)
232   =     -- Figure out what volatile variables to save
233     nukeDeadBindings live_in_whole_let  `thenC`
234     saveVolatileVarsAndRegs live_in_rhss
235             `thenFC` \ (save_assts, rhs_eob_info, maybe_cc_slot) ->
236
237         -- Save those variables right now!
238     absC save_assts                             `thenC`
239
240         -- Produce code for the rhss
241         -- and add suitable bindings to the environment
242     cgLetNoEscapeBindings live_in_rhss rhs_eob_info maybe_cc_slot bindings `thenC`
243
244         -- Do the body
245     setEndOfBlockInfo rhs_eob_info (cgExpr body)
246 \end{code}
247
248
249 %********************************************************
250 %*                                                      *
251 %*              SCC Expressions                         *
252 %*                                                      *
253 %********************************************************
254
255 SCC expressions are treated specially. They set the current cost
256 centre.
257 \begin{code}
258 cgExpr (StgSCC cc expr)
259   = ASSERT(sccAbleCostCentre cc)
260     costCentresC
261         FSLIT("SET_CCC")
262         [mkCCostCentre cc, mkIntCLit (if isSccCountCostCentre cc then 1 else 0)]
263     `thenC`
264     cgExpr expr
265 \end{code}
266
267 ToDo: counting of dict sccs ...
268
269 %********************************************************
270 %*                                                      *
271 %*              Non-top-level bindings                  *
272 %*                                                      *
273 %********************************************************
274 \subsection[non-top-level-bindings]{Converting non-top-level bindings}
275
276 We rely on the support code in @CgCon@ (to do constructors) and
277 in @CgClosure@ (to do closures).
278
279 \begin{code}
280 cgRhs :: Id -> StgRhs -> FCode (Id, CgIdInfo)
281         -- the Id is passed along so a binding can be set up
282
283 cgRhs name (StgRhsCon maybe_cc con args)
284   = getArgAmodes args                           `thenFC` \ amodes ->
285     buildDynCon name maybe_cc con amodes        `thenFC` \ idinfo ->
286     returnFC (name, idinfo)
287
288 cgRhs name (StgRhsClosure cc bi fvs upd_flag srt args body)
289   = mkRhsClosure name cc bi srt fvs upd_flag args body
290 \end{code}
291
292 mkRhsClosure looks for two special forms of the right-hand side:
293         a) selector thunks.
294         b) AP thunks
295
296 If neither happens, it just calls mkClosureLFInfo.  You might think
297 that mkClosureLFInfo should do all this, but it seems wrong for the
298 latter to look at the structure of an expression
299
300 Selectors
301 ~~~~~~~~~
302 We look at the body of the closure to see if it's a selector---turgid,
303 but nothing deep.  We are looking for a closure of {\em exactly} the
304 form:
305
306 ...  = [the_fv] \ u [] ->
307          case the_fv of
308            con a_1 ... a_n -> a_i
309
310
311 \begin{code}
312 mkRhsClosure    bndr cc bi srt
313                 [the_fv]                -- Just one free var
314                 upd_flag                -- Updatable thunk
315                 []                      -- A thunk
316                 body@(StgCase (StgApp scrutinee [{-no args-}])
317                       _ _ _ _   -- ignore uniq, etc.
318                       (AlgAlt tycon)
319                       [(DataAlt con, params, use_mask,
320                             (StgApp selectee [{-no args-}]))])
321   |  the_fv == scrutinee                -- Scrutinee is the only free variable
322   && maybeToBool maybe_offset           -- Selectee is a component of the tuple
323   && offset_into_int <= mAX_SPEC_SELECTEE_SIZE  -- Offset is small enough
324   = -- NOT TRUE: ASSERT(is_single_constructor)
325     -- The simplifier may have statically determined that the single alternative
326     -- is the only possible case and eliminated the others, even if there are
327     -- other constructors in the datatype.  It's still ok to make a selector
328     -- thunk in this case, because we *know* which constructor the scrutinee
329     -- will evaluate to.
330     cgStdRhsClosure bndr cc bi [the_fv] [] body lf_info [StgVarArg the_fv]
331   where
332     lf_info               = mkSelectorLFInfo bndr offset_into_int (isUpdatable upd_flag)
333     (_, params_w_offsets) = layOutDynConstr con idPrimRep params
334                                 -- Just want the layout
335     maybe_offset          = assocMaybe params_w_offsets selectee
336     Just the_offset       = maybe_offset
337     offset_into_int       = the_offset - fixedHdrSize
338 \end{code}
339
340 Ap thunks
341 ~~~~~~~~~
342
343 A more generic AP thunk of the form
344
345         x = [ x_1...x_n ] \.. [] -> x_1 ... x_n
346
347 A set of these is compiled statically into the RTS, so we just use
348 those.  We could extend the idea to thunks where some of the x_i are
349 global ids (and hence not free variables), but this would entail
350 generating a larger thunk.  It might be an option for non-optimising
351 compilation, though.
352
353 We only generate an Ap thunk if all the free variables are pointers,
354 for semi-obvious reasons.
355
356 \begin{code}
357 mkRhsClosure    bndr cc bi srt
358                 fvs
359                 upd_flag
360                 []                      -- No args; a thunk
361                 body@(StgApp fun_id args)
362
363   | args `lengthIs` (arity-1)
364         && all isFollowableRep (map idPrimRep fvs) 
365         && isUpdatable upd_flag
366         && arity <= mAX_SPEC_AP_SIZE 
367
368                    -- Ha! an Ap thunk
369         = cgStdRhsClosure bndr cc bi fvs [] body lf_info payload
370
371    where
372         lf_info = mkApLFInfo bndr upd_flag arity
373         -- the payload has to be in the correct order, hence we can't
374         -- just use the fvs.
375         payload    = StgVarArg fun_id : args
376         arity      = length fvs
377 \end{code}
378
379 The default case
380 ~~~~~~~~~~~~~~~~
381 \begin{code}
382 mkRhsClosure bndr cc bi srt fvs upd_flag args body
383   = cgRhsClosure bndr cc bi srt fvs args body lf_info
384   where
385     lf_info = mkClosureLFInfo bndr NotTopLevel fvs upd_flag args
386 \end{code}
387
388
389 %********************************************************
390 %*                                                      *
391 %*              Let-no-escape bindings
392 %*                                                      *
393 %********************************************************
394 \begin{code}
395 cgLetNoEscapeBindings live_in_rhss rhs_eob_info maybe_cc_slot 
396         (StgNonRec binder rhs)
397   = cgLetNoEscapeRhs live_in_rhss rhs_eob_info maybe_cc_slot    
398                      NonRecursive binder rhs 
399                                 `thenFC` \ (binder, info) ->
400     addBindC binder info
401
402 cgLetNoEscapeBindings live_in_rhss rhs_eob_info maybe_cc_slot (StgRec pairs)
403   = fixC (\ new_bindings ->
404                 addBindsC new_bindings  `thenC`
405                 listFCs [ cgLetNoEscapeRhs full_live_in_rhss 
406                                 rhs_eob_info maybe_cc_slot Recursive b e 
407                         | (b,e) <- pairs ]
408     ) `thenFC` \ new_bindings ->
409
410     addBindsC new_bindings
411   where
412     -- We add the binders to the live-in-rhss set so that we don't
413     -- delete the bindings for the binder from the environment!
414     full_live_in_rhss = live_in_rhss `unionVarSet` (mkVarSet [b | (b,r) <- pairs])
415
416 cgLetNoEscapeRhs
417     :: StgLiveVars      -- Live in rhss
418     -> EndOfBlockInfo
419     -> Maybe VirtualSpOffset
420     -> RecFlag
421     -> Id
422     -> StgRhs
423     -> FCode (Id, CgIdInfo)
424
425 cgLetNoEscapeRhs full_live_in_rhss rhs_eob_info maybe_cc_slot rec binder
426                  (StgRhsClosure cc bi _ upd_flag srt args body)
427   = -- We could check the update flag, but currently we don't switch it off
428     -- for let-no-escaped things, so we omit the check too!
429     -- case upd_flag of
430     --     Updatable -> panic "cgLetNoEscapeRhs"        -- Nothing to update!
431     --     other     -> cgLetNoEscapeClosure binder cc bi live_in_whole_let live_in_rhss args body
432     cgLetNoEscapeClosure binder cc bi srt full_live_in_rhss rhs_eob_info
433         maybe_cc_slot rec args body
434
435 -- For a constructor RHS we want to generate a single chunk of code which
436 -- can be jumped to from many places, which will return the constructor.
437 -- It's easy; just behave as if it was an StgRhsClosure with a ConApp inside!
438 cgLetNoEscapeRhs full_live_in_rhss rhs_eob_info maybe_cc_slot rec binder
439                  (StgRhsCon cc con args)
440   = cgLetNoEscapeClosure binder cc noBinderInfo{-safe-} NoSRT
441                          full_live_in_rhss rhs_eob_info maybe_cc_slot rec
442         []      --No args; the binder is data structure, not a function
443         (StgConApp con args)
444 \end{code}
445
446 Little helper for primitives that return unboxed tuples.
447
448
449 \begin{code}
450 primRetUnboxedTuple :: StgOp -> [StgArg] -> Type -> Code
451 primRetUnboxedTuple op args res_ty
452   = getArgAmodes args       `thenFC` \ arg_amodes1 ->
453     {-
454       For a foreign call, we might need to fiddle with some of the args:
455       for example, when passing a ByteArray#, we pass a ptr to the goods
456       rather than the heap object.
457     -}
458     let 
459         arg_amodes
460           | StgFCallOp{} <- op = zipWith shimFCallArg args arg_amodes1
461           | otherwise          = arg_amodes1
462     in
463     {-
464       put all the arguments in temporaries so they don't get stomped when
465       we push the return address.
466     -}
467     let
468       n_args              = length args
469       arg_uniqs           = map mkBuiltinUnique [0 .. n_args-1]
470       arg_reps            = map getAmodeRep arg_amodes
471       arg_temps           = zipWith CTemp arg_uniqs arg_reps
472     in
473     absC (mkAbstractCs (zipWith CAssign arg_temps arg_amodes)) `thenC`
474     {-
475       allocate some temporaries for the return values.
476     -}
477     let
478       ty_args     = tyConAppArgs (repType res_ty)
479       prim_reps   = map typePrimRep ty_args
480       temp_uniqs  = map mkBuiltinUnique [ n_args .. n_args + length ty_args - 1]
481       temp_amodes = zipWith CTemp temp_uniqs prim_reps
482     in
483     ccallReturnUnboxedTuple temp_amodes         
484         (absC (COpStmt temp_amodes op arg_temps []))
485
486
487 shimFCallArg arg amode
488   | tycon == foreignObjPrimTyCon
489         = CMacroExpr AddrRep ForeignObj_CLOSURE_DATA [amode]
490   | tycon == arrayPrimTyCon || tycon == mutableArrayPrimTyCon
491         = CMacroExpr PtrRep PTRS_ARR_CTS [amode]
492   | tycon == byteArrayPrimTyCon || tycon == mutableByteArrayPrimTyCon
493         = CMacroExpr AddrRep BYTE_ARR_CTS [amode]
494   | otherwise = amode
495   where 
496         -- should be a tycon app, since this is a foreign call
497         tycon = tyConAppTyCon (repType (stgArgType arg))
498 \end{code}