71f9ef831756df690335096bcec0ad9a648b3272
[ghc-hetmet.git] / compiler / stranal / WorkWrap.lhs
1 %
2 % (c) The GRASP/AQUA Project, Glasgow University, 1993-1998
3 %
4 \section[WorkWrap]{Worker/wrapper-generating back-end of strictness analyser}
5
6 \begin{code}
7 module WorkWrap ( wwTopBinds, mkWrapper ) where
8
9 #include "HsVersions.h"
10
11 import CoreSyn
12 import CoreUnfold       ( certainlyWillInline )
13 import CoreUtils        ( exprType, exprIsHNF )
14 import CoreArity        ( exprArity )
15 import Var
16 import Id               ( Id, idType, isOneShotLambda, 
17                           setIdNewStrictness, mkWorkerId,
18                           setIdWorkerInfo, setInlinePragma,
19                           setIdArity, idInfo )
20 import MkId             ( lazyIdKey, lazyIdUnfolding )
21 import Type             ( Type )
22 import IdInfo
23 import NewDemand        ( Demand(..), StrictSig(..), DmdType(..), DmdResult(..), 
24                           Demands(..), mkTopDmdType, isBotRes, returnsCPR, topSig, isAbsent
25                         )
26 import UniqSupply
27 import Unique           ( hasKey )
28 import BasicTypes       ( RecFlag(..), isNonRec, isNeverActive )
29 import VarEnv           ( isEmptyVarEnv )
30 import Maybes           ( orElse )
31 import WwLib
32 import Util             ( lengthIs, notNull )
33 import Outputable
34 import MonadUtils
35 \end{code}
36
37 We take Core bindings whose binders have:
38
39 \begin{enumerate}
40
41 \item Strictness attached (by the front-end of the strictness
42 analyser), and / or
43
44 \item Constructed Product Result information attached by the CPR
45 analysis pass.
46
47 \end{enumerate}
48
49 and we return some ``plain'' bindings which have been
50 worker/wrapper-ified, meaning: 
51
52 \begin{enumerate} 
53
54 \item Functions have been split into workers and wrappers where
55 appropriate.  If a function has both strictness and CPR properties
56 then only one worker/wrapper doing both transformations is produced;
57
58 \item Binders' @IdInfos@ have been updated to reflect the existence of
59 these workers/wrappers (this is where we get STRICTNESS and CPR pragma
60 info for exported values).
61 \end{enumerate}
62
63 \begin{code}
64 wwTopBinds :: UniqSupply -> [CoreBind] -> [CoreBind]
65
66 wwTopBinds us top_binds
67   = initUs_ us $ do
68     top_binds' <- mapM wwBind top_binds
69     return (concat top_binds')
70 \end{code}
71
72 %************************************************************************
73 %*                                                                      *
74 \subsection[wwBind-wwExpr]{@wwBind@ and @wwExpr@}
75 %*                                                                      *
76 %************************************************************************
77
78 @wwBind@ works on a binding, trying each \tr{(binder, expr)} pair in
79 turn.  Non-recursive case first, then recursive...
80
81 \begin{code}
82 wwBind  :: CoreBind
83         -> UniqSM [CoreBind]    -- returns a WwBinding intermediate form;
84                                 -- the caller will convert to Expr/Binding,
85                                 -- as appropriate.
86
87 wwBind (NonRec binder rhs) = do
88     new_rhs <- wwExpr rhs
89     new_pairs <- tryWW NonRecursive binder new_rhs
90     return [NonRec b e | (b,e) <- new_pairs]
91       -- Generated bindings must be non-recursive
92       -- because the original binding was.
93
94 wwBind (Rec pairs)
95   = return . Rec <$> concatMapM do_one pairs
96   where
97     do_one (binder, rhs) = do new_rhs <- wwExpr rhs
98                               tryWW Recursive binder new_rhs
99 \end{code}
100
101 @wwExpr@ basically just walks the tree, looking for appropriate
102 annotations that can be used. Remember it is @wwBind@ that does the
103 matching by looking for strict arguments of the correct type.
104 @wwExpr@ is a version that just returns the ``Plain'' Tree.
105
106 \begin{code}
107 wwExpr :: CoreExpr -> UniqSM CoreExpr
108
109 wwExpr e@(Type _)          = return e
110 wwExpr e@(Lit _)           = return e
111 wwExpr e@(Note InlineMe _) = return e
112         -- Don't w/w inside InlineMe's
113
114 wwExpr e@(Var v)
115   | v `hasKey` lazyIdKey = return lazyIdUnfolding
116   | otherwise            = return e
117         -- HACK alert: Inline 'lazy' after strictness analysis
118         -- (but not inside InlineMe's)
119
120 wwExpr (Lam binder expr)
121   = Lam binder <$> wwExpr expr
122
123 wwExpr (App f a)
124   = App <$> wwExpr f <*> wwExpr a
125
126 wwExpr (Note note expr)
127   = Note note <$> wwExpr expr
128
129 wwExpr (Cast expr co) = do
130     new_expr <- wwExpr expr
131     return (Cast new_expr co)
132
133 wwExpr (Let bind expr)
134   = mkLets <$> wwBind bind <*> wwExpr expr
135
136 wwExpr (Case expr binder ty alts) = do
137     new_expr <- wwExpr expr
138     new_alts <- mapM ww_alt alts
139     return (Case new_expr binder ty new_alts)
140   where
141     ww_alt (con, binders, rhs) = do
142         new_rhs <- wwExpr rhs
143         return (con, binders, new_rhs)
144 \end{code}
145
146 %************************************************************************
147 %*                                                                      *
148 \subsection[tryWW]{@tryWW@: attempt a worker/wrapper pair}
149 %*                                                                      *
150 %************************************************************************
151
152 @tryWW@ just accumulates arguments, converts strictness info from the
153 front-end into the proper form, then calls @mkWwBodies@ to do
154 the business.
155
156 We have to BE CAREFUL that we don't worker-wrapperize an Id that has
157 already been w-w'd!  (You can end up with several liked-named Ids
158 bouncing around at the same time---absolute mischief.)  So the
159 criterion we use is: if an Id already has an unfolding (for whatever
160 reason), then we don't w-w it.
161
162 The only reason this is monadised is for the unique supply.
163
164 Note [Don't w/w inline things]
165 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
166 It's very important to refrain from w/w-ing an INLINE function
167 If we do so by mistake we transform
168         f = __inline (\x -> E)
169 into
170         f = __inline (\x -> case x of (a,b) -> fw E)
171         fw = \ab -> (__inline (\x -> E)) (a,b)
172 and the original __inline now vanishes, so E is no longer
173 inside its __inline wrapper.  Death!  Disaster!
174
175 Furthermore, if the programmer has marked something as INLINE, 
176 we may lose by w/w'ing it.
177
178 If the strictness analyser is run twice, this test also prevents
179 wrappers (which are INLINEd) from being re-done.
180
181 Notice that we refrain from w/w'ing an INLINE function even if it is
182 in a recursive group.  It might not be the loop breaker.  (We could
183 test for loop-breaker-hood, but I'm not sure that ever matters.)
184
185 \begin{code}
186 tryWW   :: RecFlag
187         -> Id                           -- The fn binder
188         -> CoreExpr                     -- The bound rhs; its innards
189                                         --   are already ww'd
190         -> UniqSM [(Id, CoreExpr)]      -- either *one* or *two* pairs;
191                                         -- if one, then no worker (only
192                                         -- the orig "wrapper" lives on);
193                                         -- if two, then a worker and a
194                                         -- wrapper.
195 tryWW is_rec fn_id rhs
196   |  -- isNonRec is_rec &&      -- Now omitted: see Note [Don't w/w inline things]
197      certainlyWillInline unfolding
198
199   || isNeverActive inline_prag
200         -- No point in worker/wrappering if the thing is never inlined!
201         -- Because the no-inline prag will prevent the wrapper ever
202         -- being inlined at a call site. 
203   = return [ (new_fn_id, rhs) ]
204
205   | is_thunk && worthSplittingThunk maybe_fn_dmd res_info
206   = ASSERT2( isNonRec is_rec, ppr new_fn_id )   -- The thunk must be non-recursive
207     splitThunk new_fn_id rhs
208
209   | is_fun && worthSplittingFun wrap_dmds res_info
210   = splitFun new_fn_id fn_info wrap_dmds res_info inline_prag rhs
211
212   | otherwise
213   = return [ (new_fn_id, rhs) ]
214
215   where
216     fn_info      = idInfo fn_id
217     maybe_fn_dmd = newDemandInfo fn_info
218     unfolding    = unfoldingInfo fn_info
219     inline_prag  = inlinePragInfo fn_info
220
221         -- In practice it always will have a strictness 
222         -- signature, even if it's a uninformative one
223     strict_sig  = newStrictnessInfo fn_info `orElse` topSig
224     StrictSig (DmdType env wrap_dmds res_info) = strict_sig
225
226         -- new_fn_id has the DmdEnv zapped.  
227         --      (a) it is never used again
228         --      (b) it wastes space
229         --      (c) it becomes incorrect as things are cloned, because
230         --          we don't push the substitution into it
231     new_fn_id | isEmptyVarEnv env = fn_id
232               | otherwise         = fn_id `setIdNewStrictness` 
233                                      StrictSig (mkTopDmdType wrap_dmds res_info)
234
235     is_fun    = notNull wrap_dmds
236     is_thunk  = not is_fun && not (exprIsHNF rhs)
237
238 ---------------------
239 splitFun :: Id -> IdInfo -> [Demand] -> DmdResult -> InlinePragInfo -> Expr Var
240          -> UniqSM [(Id, CoreExpr)]
241 splitFun fn_id fn_info wrap_dmds res_info inline_prag rhs
242   = WARN( not (wrap_dmds `lengthIs` arity), ppr fn_id <+> (ppr arity $$ ppr wrap_dmds $$ ppr res_info) ) 
243     (do {
244         -- The arity should match the signature
245       (work_demands, wrap_fn, work_fn) <- mkWwBodies fun_ty wrap_dmds res_info one_shots
246     ; work_uniq <- getUniqueM
247     ; let
248         work_rhs = work_fn rhs
249         work_id  = mkWorkerId work_uniq fn_id (exprType work_rhs) 
250                         `setInlinePragma` inline_prag
251                                 -- Any inline pragma (which sets when inlining is active) 
252                                 -- on the original function is duplicated on the worker and wrapper
253                                 -- It *matters* that the pragma stays on the wrapper
254                                 -- It seems sensible to have it on the worker too, although we
255                                 -- can't think of a compelling reason. (In ptic, INLINE things are 
256                                 -- not w/wd)
257                         `setIdNewStrictness` StrictSig (mkTopDmdType work_demands work_res_info)
258                                 -- Even though we may not be at top level, 
259                                 -- it's ok to give it an empty DmdEnv
260                         `setIdArity` (exprArity work_rhs)
261                                 -- Set the arity so that the Core Lint check that the 
262                                 -- arity is consistent with the demand type goes through
263
264         wrap_rhs = wrap_fn work_id
265         wrap_id  = fn_id `setIdWorkerInfo` HasWorker work_id arity
266
267     ; return ([(work_id, work_rhs), (wrap_id, wrap_rhs)]) })
268         -- Worker first, because wrapper mentions it
269         -- mkWwBodies has already built a wrap_rhs with an INLINE pragma wrapped around it
270   where
271     fun_ty = idType fn_id
272
273     arity  = arityInfo fn_info  -- The arity is set by the simplifier using exprEtaExpandArity
274                                 -- So it may be more than the number of top-level-visible lambdas
275
276     work_res_info | isBotRes res_info = BotRes  -- Cpr stuff done by wrapper
277                   | otherwise         = TopRes
278
279     one_shots = get_one_shots rhs
280
281 -- If the original function has one-shot arguments, it is important to
282 -- make the wrapper and worker have corresponding one-shot arguments too.
283 -- Otherwise we spuriously float stuff out of case-expression join points,
284 -- which is very annoying.
285 get_one_shots :: Expr Var -> [Bool]
286 get_one_shots (Lam b e)
287   | isId b    = isOneShotLambda b : get_one_shots e
288   | otherwise = get_one_shots e
289 get_one_shots (Note _ e) = get_one_shots e
290 get_one_shots _          = noOneShotInfo
291 \end{code}
292
293 Thunk splitting
294 ~~~~~~~~~~~~~~~
295 Suppose x is used strictly (never mind whether it has the CPR
296 property).  
297
298       let
299         x* = x-rhs
300       in body
301
302 splitThunk transforms like this:
303
304       let
305         x* = case x-rhs of { I# a -> I# a }
306       in body
307
308 Now simplifier will transform to
309
310       case x-rhs of 
311         I# a -> let x* = I# a 
312                 in body
313
314 which is what we want. Now suppose x-rhs is itself a case:
315
316         x-rhs = case e of { T -> I# a; F -> I# b }
317
318 The join point will abstract over a, rather than over (which is
319 what would have happened before) which is fine.
320
321 Notice that x certainly has the CPR property now!
322
323 In fact, splitThunk uses the function argument w/w splitting 
324 function, so that if x's demand is deeper (say U(U(L,L),L))
325 then the splitting will go deeper too.
326
327 \begin{code}
328 -- splitThunk converts the *non-recursive* binding
329 --      x = e
330 -- into
331 --      x = let x = e
332 --          in case x of 
333 --               I# y -> let x = I# y in x }
334 -- See comments above. Is it not beautifully short?
335
336 splitThunk :: Var -> Expr Var -> UniqSM [(Var, Expr Var)]
337 splitThunk fn_id rhs = do
338     (_, wrap_fn, work_fn) <- mkWWstr [fn_id]
339     return [ (fn_id, Let (NonRec fn_id rhs) (wrap_fn (work_fn (Var fn_id)))) ]
340 \end{code}
341
342
343 %************************************************************************
344 %*                                                                      *
345 \subsection{Functions over Demands}
346 %*                                                                      *
347 %************************************************************************
348
349 \begin{code}
350 worthSplittingFun :: [Demand] -> DmdResult -> Bool
351                 -- True <=> the wrapper would not be an identity function
352 worthSplittingFun ds res
353   = any worth_it ds || returnsCPR res
354         -- worthSplitting returns False for an empty list of demands,
355         -- and hence do_strict_ww is False if arity is zero and there is no CPR
356   -- See Note [Worker-wrapper for bottoming functions]
357   where
358     worth_it Abs              = True    -- Absent arg
359     worth_it (Eval (Prod _)) = True     -- Product arg to evaluate
360     worth_it _                = False
361
362 worthSplittingThunk :: Maybe Demand     -- Demand on the thunk
363                     -> DmdResult        -- CPR info for the thunk
364                     -> Bool
365 worthSplittingThunk maybe_dmd res
366   = worth_it maybe_dmd || returnsCPR res
367   where
368         -- Split if the thing is unpacked
369     worth_it (Just (Eval (Prod ds))) = not (all isAbsent ds)
370     worth_it _                       = False
371 \end{code}
372
373 Note [Worker-wrapper for bottoming functions]
374 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
375 We used not to split if the result is bottom.
376 [Justification:  there's no efficiency to be gained.]
377
378 But it's sometimes bad not to make a wrapper.  Consider
379         fw = \x# -> let x = I# x# in case e of
380                                         p1 -> error_fn x
381                                         p2 -> error_fn x
382                                         p3 -> the real stuff
383 The re-boxing code won't go away unless error_fn gets a wrapper too.
384 [We don't do reboxing now, but in general it's better to pass an
385 unboxed thing to f, and have it reboxed in the error cases....]
386
387
388 %************************************************************************
389 %*                                                                      *
390 \subsection{The worker wrapper core}
391 %*                                                                      *
392 %************************************************************************
393
394 @mkWrapper@ is called when importing a function.  We have the type of 
395 the function and the name of its worker, and we want to make its body (the wrapper).
396
397 \begin{code}
398 mkWrapper :: Type               -- Wrapper type
399           -> StrictSig          -- Wrapper strictness info
400           -> UniqSM (Id -> CoreExpr)    -- Wrapper body, missing worker Id
401
402 mkWrapper fun_ty (StrictSig (DmdType _ demands res_info)) = do
403     (_, wrap_fn, _) <- mkWwBodies fun_ty demands res_info noOneShotInfo
404     return wrap_fn
405
406 noOneShotInfo :: [Bool]
407 noOneShotInfo = repeat False
408 \end{code}