[project @ 1996-04-05 08:26:04 by partain]
[ghc-hetmet.git] / ghc / compiler / simplCore / FloatIn.lhs
1 %
2 % (c) The GRASP/AQUA Project, Glasgow University, 1992-1996
3 %
4 %************************************************************************
5 %*                                                                      *
6 \section[FloatIn]{Floating Inwards pass}
7 %*                                                                      *
8 %************************************************************************
9
10 The main purpose of @floatInwards@ is floating into branches of a
11 case, so that we don't allocate things, save them on the stack, and
12 then discover that they aren't needed in the chosen branch.
13
14 \begin{code}
15 #include "HsVersions.h"
16
17 module FloatIn (
18         floatInwards
19
20         -- and to make the interface self-sufficient...
21     ) where
22
23 import Ubiq{-uitous-}
24
25 import AnnCoreSyn
26 import CoreSyn
27
28 import FreeVars
29 import Id               ( emptyIdSet, unionIdSets, unionManyIdSets,
30                           elementOfIdSet, IdSet(..)
31                         )
32 import Util             ( panic )
33 \end{code}
34
35 Top-level interface function, @floatInwards@.  Note that we do not
36 actually float any bindings downwards from the top-level.
37
38 \begin{code}
39 floatInwards :: [CoreBinding] -> [CoreBinding]
40
41 floatInwards binds
42   = map fi_top_bind binds
43   where
44     fi_top_bind (NonRec binder rhs)
45       = NonRec binder (fiExpr [] (freeVars rhs))
46     fi_top_bind (Rec pairs)
47       = Rec [ (b, fiExpr [] (freeVars rhs)) | (b, rhs) <- pairs ]
48 \end{code}
49
50 %************************************************************************
51 %*                                                                      *
52 \subsection{Mail from Andr\'e [edited]}
53 %*                                                                      *
54 %************************************************************************
55
56 {\em Will wrote: What??? I thought the idea was to float as far
57 inwards as possible, no matter what.  This is dropping all bindings
58 every time it sees a lambda of any kind.  Help! }
59
60 You are assuming we DO DO full laziness AFTER floating inwards!  We
61 have to [not float inside lambdas] if we don't.
62
63 If we indeed do full laziness after the floating inwards (we could
64 check the compilation flags for that) then I agree we could be more
65 aggressive and do float inwards past lambdas.
66
67 Actually we are not doing a proper full laziness (see below), which
68 was another reason for not floating inwards past a lambda.
69
70 This can easily be fixed.
71 The problem is that we float lets outwards,
72 but there are a few expressions which are not
73 let bound, like case scrutinees and case alternatives.
74 After floating inwards the simplifier could decide to inline
75 the let and the laziness would be lost, e.g.
76 \begin{verbatim}
77 let a = expensive             ==> \b -> case expensive of ...
78 in \ b -> case a of ...
79 \end{verbatim}
80 The fix is
81 \begin{enumerate}
82 \item
83 to let bind the algebraic case scrutinees (done, I think) and
84 the case alternatives (except the ones with an
85 unboxed type)(not done, I think). This is best done in the
86 SetLevels.lhs module, which tags things with their level numbers.
87 \item
88 do the full laziness pass (floating lets outwards).
89 \item
90 simplify. The simplifier inlines the (trivial) lets that were
91  created but were not floated outwards.
92 \end{enumerate}
93
94 With the fix I think Will's suggestion that we can gain even more from
95 strictness by floating inwards past lambdas makes sense.
96
97 We still gain even without going past lambdas, as things may be
98 strict in the (new) context of a branch (where it was floated to) or
99 of a let rhs, e.g.
100 \begin{verbatim}
101 let a = something            case x of
102 in case x of                   alt1 -> case something of a -> a + a
103      alt1 -> a + a      ==>    alt2 -> b
104      alt2 -> b
105
106 let a = something           let b = case something of a -> a + a
107 in let b = a + a        ==> in (b,b)
108 in (b,b)
109 \end{verbatim}
110 Also, even if a is not found to be strict in the new context and is
111 still left as a let, if the branch is not taken (or b is not entered)
112 the closure for a is not built.
113
114 %************************************************************************
115 %*                                                                      *
116 \subsection{Main floating-inwards code}
117 %*                                                                      *
118 %************************************************************************
119
120 \begin{code}
121 type FreeVarsSet   = IdSet
122
123 type FloatingBinds = [(CoreBinding, FreeVarsSet)]
124         -- In dependency order (outermost first)
125
126         -- The FreeVarsSet is the free variables of the binding.  In the case
127         -- of recursive bindings, the set doesn't include the bound
128         -- variables.
129
130 fiExpr :: FloatingBinds         -- binds we're trying to drop
131                                 -- as far "inwards" as possible
132        -> CoreExprWithFVs       -- input expr
133        -> CoreExpr              -- result
134
135 fiExpr to_drop (_,AnnVar v) = mkCoLets' to_drop (Var v)
136
137 fiExpr to_drop (_,AnnLit k) = mkCoLets' to_drop (Lit k)
138
139 fiExpr to_drop (_,AnnCon c atoms)
140   = mkCoLets' to_drop (Con c atoms)
141
142 fiExpr to_drop (_,AnnPrim c atoms)
143   = mkCoLets' to_drop (Prim c atoms)
144 \end{code}
145
146 Here we are not floating inside lambda (type lambdas are OK):
147 \begin{code}
148 fiExpr to_drop (_,AnnLam (UsageBinder binder) body)
149   = panic "FloatIn.fiExpr:AnnLam UsageBinder"
150
151 fiExpr to_drop (_,AnnLam b@(ValBinder binder) body)
152   = mkCoLets' to_drop (Lam b (fiExpr [] body))
153
154 fiExpr to_drop (_,AnnLam b@(TyBinder tyvar) body)
155   | whnf body
156   -- we do not float into type lambdas if they are followed by
157   -- a whnf (actually we check for lambdas and constructors).
158   -- The reason is that a let binding will get stuck
159   -- in between the type lambda and the whnf and the simplifier
160   -- does not know how to pull it back out from a type lambda.
161   -- Ex:
162   --    let v = ...
163   --    in let f = /\t -> \a -> ...
164   --       ==>
165   --    let f = /\t -> let v = ... in \a -> ...
166   -- which is bad as now f is an updatable closure (update PAP)
167   -- and has arity 0. This example comes from cichelli.
168
169   = mkCoLets' to_drop (Lam b (fiExpr [] body))
170   | otherwise
171   = Lam b (fiExpr to_drop body)
172   where
173     whnf :: CoreExprWithFVs -> Bool
174
175     whnf (_,AnnLit _)   = True
176     whnf (_,AnnCon _ _) = True
177     whnf (_,AnnLam x e) = if isValBinder x then True else whnf e
178     whnf (_,AnnSCC _ e) = whnf e
179     whnf _              = False
180 \end{code}
181
182 Applications: we could float inside applications, but it's probably
183 not worth it (a purely practical choice, hunch- [not experience-]
184 based).
185 \begin{code}
186 fiExpr to_drop (_,AnnApp fun arg)
187   | isValArg arg
188   = mkCoLets' to_drop (App (fiExpr [] fun) arg)
189   | otherwise
190   = App (fiExpr to_drop fun) arg
191 \end{code}
192
193 We don't float lets inwards past an SCC.
194
195 ToDo: SCC: {\em should} keep info on current cc, and when passing
196 one, if it is not the same, annotate all lets in binds with current
197 cc, change current cc to the new one and float binds into expr.
198 \begin{code}
199 fiExpr to_drop (_, AnnSCC cc expr)
200   = mkCoLets' to_drop (SCC cc (fiExpr [] expr))
201 \end{code}
202
203 For @Lets@, the possible ``drop points'' for the \tr{to_drop}
204 bindings are: (a)~in the body, (b1)~in the RHS of a NonRec binding,
205 or~(b2), in each of the RHSs of the pairs of a @Rec@.
206
207 Note that we do {\em weird things} with this let's binding.  Consider:
208 \begin{verbatim}
209 let
210     w = ...
211 in {
212     let v = ... w ...
213     in ... w ...
214 }
215 \end{verbatim}
216 Look at the inner \tr{let}.  As \tr{w} is used in both the bind and
217 body of the inner let, we could panic and leave \tr{w}'s binding where
218 it is.  But \tr{v} is floatable into the body of the inner let, and
219 {\em then} \tr{w} will also be only in the body of that inner let.
220
221 So: rather than drop \tr{w}'s binding here, we add it onto the list of
222 things to drop in the outer let's body, and let nature take its
223 course.
224
225 \begin{code}
226 fiExpr to_drop (_,AnnLet (AnnNonRec id rhs) body)
227   = fiExpr new_to_drop body
228   where
229     rhs_fvs  = freeVarsOf rhs
230     body_fvs = freeVarsOf body
231
232     ([rhs_binds, body_binds], shared_binds) = sepBindsByDropPoint [rhs_fvs, body_fvs] to_drop
233
234     new_to_drop = body_binds ++                         -- the bindings used only in the body
235                   [(NonRec id rhs', rhs_fvs')] ++       -- the new binding itself
236                   shared_binds                          -- the bindings used both in rhs and body
237
238         -- Push rhs_binds into the right hand side of the binding
239     rhs'     = fiExpr rhs_binds rhs
240     rhs_fvs' = rhs_fvs `unionIdSets` floatedBindsFVs rhs_binds
241
242 fiExpr to_drop (_,AnnLet (AnnRec bindings) body)
243   = fiExpr new_to_drop body
244   where
245     (binders, rhss) = unzip bindings
246
247     rhss_fvs = map freeVarsOf rhss
248     body_fvs = freeVarsOf body
249
250     (body_binds:rhss_binds, shared_binds)
251       = sepBindsByDropPoint (body_fvs:rhss_fvs) to_drop
252
253     new_to_drop = -- the bindings used only in the body
254                   body_binds ++
255                   -- the new binding itself
256                   [(Rec (fi_bind rhss_binds bindings), rhs_fvs')] ++
257                   -- the bindings used both in rhs and body or in more than one rhs
258                   shared_binds
259
260     rhs_fvs' = unionIdSets (unionManyIdSets rhss_fvs)
261                      (unionManyIdSets (map floatedBindsFVs rhss_binds))
262
263     -- Push rhs_binds into the right hand side of the binding
264     fi_bind :: [FloatingBinds]      -- one per "drop pt" conjured w/ fvs_of_rhss
265             -> [(Id, CoreExprWithFVs)]
266             -> [(Id, CoreExpr)]
267
268     fi_bind to_drops pairs
269       = [ (binder, fiExpr to_drop rhs) | ((binder, rhs), to_drop) <- zip pairs to_drops ]
270 \end{code}
271
272 For @Case@, the possible ``drop points'' for the \tr{to_drop}
273 bindings are: (a)~inside the scrutinee, (b)~inside one of the
274 alternatives/default [default FVs always {\em first}!].
275
276 \begin{code}
277 fiExpr to_drop (_, AnnCase scrut alts)
278   = let
279         fvs_scrut    = freeVarsOf scrut
280         drop_pts_fvs = fvs_scrut : (get_fvs_from_deflt_and_alts alts)
281     in
282     case (sepBindsByDropPoint drop_pts_fvs to_drop)
283                 of (scrut_drops : deflt_drops : alts_drops, drop_here) ->
284                      mkCoLets' drop_here (Case (fiExpr scrut_drops scrut)
285                                                 (fi_alts deflt_drops alts_drops alts))
286
287   where
288     ----------------------------
289     -- pin default FVs on first!
290     --
291     get_fvs_from_deflt_and_alts (AnnAlgAlts alts deflt)
292       = get_deflt_fvs deflt : [ freeVarsOf rhs | (_, _, rhs) <- alts ]
293
294     get_fvs_from_deflt_and_alts (AnnPrimAlts alts deflt)
295       = get_deflt_fvs deflt : [ freeVarsOf rhs | (_, rhs) <- alts]
296
297     get_deflt_fvs AnnNoDefault     = emptyIdSet
298     get_deflt_fvs (AnnBindDefault b rhs) = freeVarsOf rhs
299
300     ----------------------------
301     fi_alts to_drop_deflt to_drop_alts (AnnAlgAlts alts deflt)
302       = AlgAlts
303             [ (con, params, fiExpr to_drop rhs)
304             | ((con, params, rhs), to_drop) <- alts `zip` to_drop_alts ]
305             (fi_default to_drop_deflt deflt)
306
307     fi_alts to_drop_deflt to_drop_alts (AnnPrimAlts alts deflt)
308       = PrimAlts
309             [ (lit, fiExpr to_drop rhs)
310             | ((lit, rhs), to_drop) <- alts `zip` to_drop_alts ]
311             (fi_default to_drop_deflt deflt)
312
313     fi_default to_drop AnnNoDefault           = NoDefault
314     fi_default to_drop (AnnBindDefault b e) = BindDefault b (fiExpr to_drop e)
315 \end{code}
316
317 %************************************************************************
318 %*                                                                      *
319 \subsection{@sepBindsByDropPoint@}
320 %*                                                                      *
321 %************************************************************************
322
323 This is the crucial function.  The idea is: We have a wad of bindings
324 that we'd like to distribute inside a collection of {\em drop points};
325 insides the alternatives of a \tr{case} would be one example of some
326 drop points; the RHS and body of a non-recursive \tr{let} binding
327 would be another (2-element) collection.
328
329 So: We're given a list of sets-of-free-variables, one per drop point,
330 and a list of floating-inwards bindings.  If a binding can go into
331 only one drop point (without suddenly making something out-of-scope),
332 in it goes.  If a binding is used inside {\em multiple} drop points,
333 then it has to go in a you-must-drop-it-above-all-these-drop-points
334 point.
335
336 We have to maintain the order on these drop-point-related lists.
337
338 \begin{code}
339 sepBindsByDropPoint
340     :: [FreeVarsSet]        -- one set of FVs per drop point
341     -> FloatingBinds        -- candidate floaters
342     -> ([FloatingBinds],    -- floaters that *can* be floated into
343                             -- the corresponding drop point
344         FloatingBinds)      -- everything else, bindings which must
345                             -- not be floated inside any drop point
346
347 sepBindsByDropPoint drop_pts []
348   = ([[] | p <- drop_pts], []) -- cut to the chase scene; it happens
349
350 sepBindsByDropPoint drop_pts floaters
351   = let
352         (per_drop_pt, must_stay_here, _)
353             --= sep drop_pts emptyIdSet{-fvs of prev drop_pts-} floaters
354             = split' drop_pts floaters [] empty_boxes
355         empty_boxes = take (length drop_pts) (repeat [])
356
357     in
358     (map reverse per_drop_pt, reverse must_stay_here)
359   where
360     split' drop_pts_fvs [] mult_branch drop_boxes
361       = (drop_boxes, mult_branch, drop_pts_fvs)
362
363     -- only in a or unused
364     split' (a:as) (bind:binds) mult_branch (drop_box_a:drop_boxes)
365       | all (\b -> {-b `elementOfIdSet` a &&-}
366                    not (b `elementOfIdSet` (unionManyIdSets as)))
367             (bindersOf (fst bind))
368       = split' (a':as) binds mult_branch ((bind:drop_box_a):drop_boxes)
369       where
370         a' = a `unionIdSets` fvsOfBind bind
371
372     -- not in a
373     split' (a:as) (bind:binds) mult_branch (drop_box_a:drop_boxes)
374       | all (\b -> not (b `elementOfIdSet` a)) (bindersOf (fst bind))
375       = split' (a:as') binds mult_branch' (drop_box_a:drop_boxes')
376       where
377         (drop_boxes',mult_branch',as') = split' as [bind] mult_branch drop_boxes
378
379     -- in a and in as
380     split' aas@(a:as) (bind:binds) mult_branch drop_boxes
381       = split' aas' binds (bind : mult_branch) drop_boxes
382       where
383         aas' = map (unionIdSets (fvsOfBind bind)) aas
384
385     -------------------------
386     fvsOfBind (_,fvs)   = fvs
387
388 --floatedBindsFVs ::
389 floatedBindsFVs binds = unionManyIdSets (map snd binds)
390
391 --mkCoLets' :: [FloatingBinds] -> CoreExpr -> CoreExpr
392 mkCoLets' to_drop e = mkCoLetsNoUnboxed (reverse (map fst to_drop)) e
393 \end{code}