Fix bugs in vectorisation of case expressions
[ghc-hetmet.git] / compiler / vectorise / Vectorise.hs
1 {-# OPTIONS -w #-}
2 -- The above warning supression flag is a temporary kludge.
3 -- While working on this module you are encouraged to remove it and fix
4 -- any warnings in the module. See
5 --     http://hackage.haskell.org/trac/ghc/wiki/Commentary/CodingStyle#Warnings
6 -- for details
7
8 module Vectorise( vectorise )
9 where
10
11 #include "HsVersions.h"
12
13 import VectMonad
14 import VectUtils
15 import VectType
16 import VectCore
17
18 import DynFlags
19 import HscTypes
20
21 import CoreLint             ( showPass, endPass )
22 import CoreSyn
23 import CoreUtils
24 import CoreFVs
25 import SimplMonad           ( SimplCount, zeroSimplCount )
26 import Rules                ( RuleBase )
27 import DataCon
28 import TyCon
29 import Type
30 import FamInstEnv           ( extendFamInstEnvList )
31 import InstEnv              ( extendInstEnvList )
32 import Var
33 import VarEnv
34 import VarSet
35 import Name                 ( Name, mkSysTvName, getName )
36 import NameEnv
37 import Id
38 import MkId                 ( unwrapFamInstScrut )
39 import OccName
40 import Module               ( Module )
41
42 import DsMonad hiding (mapAndUnzipM)
43 import DsUtils              ( mkCoreTup, mkCoreTupTy )
44
45 import Literal              ( Literal )
46 import PrelNames
47 import TysWiredIn
48 import TysPrim              ( intPrimTy )
49 import BasicTypes           ( Boxity(..) )
50
51 import Outputable
52 import FastString
53 import Control.Monad        ( liftM, liftM2, zipWithM, mapAndUnzipM )
54 import Data.List            ( sortBy, unzip4 )
55
56 vectorise :: HscEnv -> UniqSupply -> RuleBase -> ModGuts
57           -> IO (SimplCount, ModGuts)
58 vectorise hsc_env _ _ guts
59   = do
60       showPass dflags "Vectorisation"
61       eps <- hscEPS hsc_env
62       let info = hptVectInfo hsc_env `plusVectInfo` eps_vect_info eps
63       Just (info', guts') <- initV hsc_env guts info (vectModule guts)
64       endPass dflags "Vectorisation" Opt_D_dump_vect (mg_binds guts')
65       return (zeroSimplCount dflags, guts' { mg_vect_info = info' })
66   where
67     dflags = hsc_dflags hsc_env
68
69 vectModule :: ModGuts -> VM ModGuts
70 vectModule guts
71   = do
72       (types', fam_insts, tc_binds) <- vectTypeEnv (mg_types guts)
73       
74       let fam_inst_env' = extendFamInstEnvList (mg_fam_inst_env guts) fam_insts
75       updGEnv (setFamInstEnv fam_inst_env')
76      
77       -- dicts   <- mapM buildPADict pa_insts
78       -- workers <- mapM vectDataConWorkers pa_insts
79       binds'  <- mapM vectTopBind (mg_binds guts)
80       return $ guts { mg_types        = types'
81                     , mg_binds        = Rec tc_binds : binds'
82                     , mg_fam_inst_env = fam_inst_env'
83                     , mg_fam_insts    = mg_fam_insts guts ++ fam_insts
84                     }
85
86 vectTopBind :: CoreBind -> VM CoreBind
87 vectTopBind b@(NonRec var expr)
88   = do
89       var'  <- vectTopBinder var
90       expr' <- vectTopRhs var expr
91       hs    <- takeHoisted
92       cexpr <- tryConvert var var' expr
93       return . Rec $ (var, cexpr) : (var', expr') : hs
94   `orElseV`
95     return b
96
97 vectTopBind b@(Rec bs)
98   = do
99       vars'  <- mapM vectTopBinder vars
100       exprs' <- zipWithM vectTopRhs vars exprs
101       hs     <- takeHoisted
102       cexprs <- sequence $ zipWith3 tryConvert vars vars' exprs
103       return . Rec $ zip vars cexprs ++ zip vars' exprs' ++ hs
104   `orElseV`
105     return b
106   where
107     (vars, exprs) = unzip bs
108
109 vectTopBinder :: Var -> VM Var
110 vectTopBinder var
111   = do
112       vty  <- vectType (idType var)
113       var' <- cloneId mkVectOcc var vty
114       defGlobalVar var var'
115       return var'
116     
117 vectTopRhs :: Var -> CoreExpr -> VM CoreExpr
118 vectTopRhs var expr
119   = do
120       closedV . liftM vectorised
121               . inBind var
122               $ vectPolyExpr (freeVars expr)
123
124 tryConvert :: Var -> Var -> CoreExpr -> VM CoreExpr
125 tryConvert var vect_var rhs
126   = fromVect (idType var) (Var vect_var) `orElseV` return rhs
127
128 -- ----------------------------------------------------------------------------
129 -- Bindings
130
131 vectBndr :: Var -> VM VVar
132 vectBndr v
133   = do
134       vty <- vectType (idType v)
135       lty <- mkPArrayType vty
136       let vv = v `Id.setIdType` vty
137           lv = v `Id.setIdType` lty
138       updLEnv (mapTo vv lv)
139       return (vv, lv)
140   where
141     mapTo vv lv env = env { local_vars = extendVarEnv (local_vars env) v (vv, lv) }
142
143 vectBndrNew :: Var -> FastString -> VM VVar
144 vectBndrNew v fs
145   = do
146       vty <- vectType (idType v)
147       vv  <- newLocalVVar fs vty
148       updLEnv (upd vv)
149       return vv
150   where
151     upd vv env = env { local_vars = extendVarEnv (local_vars env) v vv }
152
153 vectBndrIn :: Var -> VM a -> VM (VVar, a)
154 vectBndrIn v p
155   = localV
156   $ do
157       vv <- vectBndr v
158       x <- p
159       return (vv, x)
160
161 vectBndrNewIn :: Var -> FastString -> VM a -> VM (VVar, a)
162 vectBndrNewIn v fs p
163   = localV
164   $ do
165       vv <- vectBndrNew v fs
166       x  <- p
167       return (vv, x)
168
169 vectBndrIn' :: Var -> (VVar -> VM a) -> VM (VVar, a)
170 vectBndrIn' v p
171   = localV
172   $ do
173       vv <- vectBndr v
174       x  <- p vv
175       return (vv, x)
176
177 vectBndrsIn :: [Var] -> VM a -> VM ([VVar], a)
178 vectBndrsIn vs p
179   = localV
180   $ do
181       vvs <- mapM vectBndr vs
182       x <- p
183       return (vvs, x)
184
185 -- ----------------------------------------------------------------------------
186 -- Expressions
187
188 vectVar :: Var -> VM VExpr
189 vectVar v
190   = do
191       r <- lookupVar v
192       case r of
193         Local (vv,lv) -> return (Var vv, Var lv)
194         Global vv     -> do
195                            let vexpr = Var vv
196                            lexpr <- liftPA vexpr
197                            return (vexpr, lexpr)
198
199 vectPolyVar :: Var -> [Type] -> VM VExpr
200 vectPolyVar v tys
201   = do
202       vtys <- mapM vectType tys
203       r <- lookupVar v
204       case r of
205         Local (vv, lv) -> liftM2 (,) (polyApply (Var vv) vtys)
206                                      (polyApply (Var lv) vtys)
207         Global poly    -> do
208                             vexpr <- polyApply (Var poly) vtys
209                             lexpr <- liftPA vexpr
210                             return (vexpr, lexpr)
211
212 vectLiteral :: Literal -> VM VExpr
213 vectLiteral lit
214   = do
215       lexpr <- liftPA (Lit lit)
216       return (Lit lit, lexpr)
217
218 vectPolyExpr :: CoreExprWithFVs -> VM VExpr
219 vectPolyExpr expr
220   = polyAbstract tvs $ \abstract ->
221     do
222       mono' <- vectExpr mono
223       return $ mapVect abstract mono'
224   where
225     (tvs, mono) = collectAnnTypeBinders expr  
226                 
227 vectExpr :: CoreExprWithFVs -> VM VExpr
228 vectExpr (_, AnnType ty)
229   = liftM vType (vectType ty)
230
231 vectExpr (_, AnnVar v) = vectVar v
232
233 vectExpr (_, AnnLit lit) = vectLiteral lit
234
235 vectExpr (_, AnnNote note expr)
236   = liftM (vNote note) (vectExpr expr)
237
238 vectExpr e@(_, AnnApp _ arg)
239   | isAnnTypeArg arg
240   = vectTyAppExpr fn tys
241   where
242     (fn, tys) = collectAnnTypeArgs e
243
244 vectExpr (_, AnnApp fn arg)
245   = do
246       arg_ty' <- vectType arg_ty
247       res_ty' <- vectType res_ty
248       fn'     <- vectExpr fn
249       arg'    <- vectExpr arg
250       mkClosureApp arg_ty' res_ty' fn' arg'
251   where
252     (arg_ty, res_ty) = splitFunTy . exprType $ deAnnotate fn
253
254 vectExpr (_, AnnCase scrut bndr ty alts)
255   | Just (tycon, ty_args) <- splitTyConApp_maybe scrut_ty
256   , isAlgTyCon tycon
257   = vectAlgCase tycon ty_args scrut bndr ty alts
258   where
259     scrut_ty = exprType (deAnnotate scrut)
260
261 vectExpr (_, AnnCase expr bndr ty alts)
262   = panic "vectExpr: case"
263
264 vectExpr (_, AnnLet (AnnNonRec bndr rhs) body)
265   = do
266       vrhs <- localV . inBind bndr $ vectPolyExpr rhs
267       (vbndr, vbody) <- vectBndrIn bndr (vectExpr body)
268       return $ vLet (vNonRec vbndr vrhs) vbody
269
270 vectExpr (_, AnnLet (AnnRec bs) body)
271   = do
272       (vbndrs, (vrhss, vbody)) <- vectBndrsIn bndrs
273                                 $ liftM2 (,)
274                                   (zipWithM vect_rhs bndrs rhss)
275                                   (vectPolyExpr body)
276       return $ vLet (vRec vbndrs vrhss) vbody
277   where
278     (bndrs, rhss) = unzip bs
279
280     vect_rhs bndr rhs = localV
281                       . inBind bndr
282                       $ vectExpr rhs
283
284 vectExpr e@(fvs, AnnLam bndr _)
285   | not (isId bndr) = pprPanic "vectExpr" (ppr $ deAnnotate e)
286   | otherwise = vectLam fvs bs body
287   where
288     (bs,body) = collectAnnValBinders e
289
290 vectLam :: VarSet -> [Var] -> CoreExprWithFVs -> VM VExpr
291 vectLam fvs bs body
292   = do
293       tyvars <- localTyVars
294       (vs, vvs) <- readLEnv $ \env ->
295                    unzip [(var, vv) | var <- varSetElems fvs
296                                     , Just vv <- [lookupVarEnv (local_vars env) var]]
297
298       arg_tys <- mapM (vectType . idType) bs
299       res_ty  <- vectType (exprType $ deAnnotate body)
300
301       buildClosures tyvars vvs arg_tys res_ty
302         . hoistPolyVExpr tyvars
303         $ do
304             lc <- builtin liftingContext
305             (vbndrs, vbody) <- vectBndrsIn (vs ++ bs)
306                                            (vectExpr body)
307             return $ vLams lc vbndrs vbody
308   
309 vectTyAppExpr :: CoreExprWithFVs -> [Type] -> VM VExpr
310 vectTyAppExpr (_, AnnVar v) tys = vectPolyVar v tys
311 vectTyAppExpr e tys = pprPanic "vectTyAppExpr" (ppr $ deAnnotate e)
312
313 type CoreAltWithFVs = AnnAlt Id VarSet
314
315 -- We convert
316 --
317 --   case e :: t of v { ... }
318 --
319 -- to
320 --
321 --   V:    let v' = e in case v' of _ { ... }
322 --   L:    let v' = e in case v' `cast` ... of _ { ... }
323 --
324 -- When lifting, we have to do it this way because v must have the type
325 -- [:V(T):] but the scrutinee must be cast to the representation type. We also
326 -- have to handle the case where v is a wild var correctly.
327 --   
328
329 -- FIXME: this is too lazy
330 vectAlgCase tycon ty_args scrut bndr ty [(DEFAULT, [], body)]
331   = do
332       vscrut <- vectExpr scrut
333       vty    <- vectType ty
334       lty    <- mkPArrayType vty
335       (vbndr, vbody) <- vectBndrIn bndr (vectExpr body)
336       return $ vCaseDEFAULT vscrut vbndr vty lty vbody
337
338 vectAlgCase tycon ty_args scrut bndr ty [(DataAlt dc, bndrs, body)]
339   = do
340       vect_tc <- maybeV (lookupTyCon tycon)
341       vty <- vectType ty
342       lty <- mkPArrayType vty
343       vexpr <- vectExpr scrut
344       (vbndr, (vbndrs, vbody)) <- vect_scrut_bndr
345                                 . vectBndrsIn bndrs
346                                 $ vectExpr body
347
348       (vscrut, arr_tc, arg_tys) <- mkVScrut (vVar vbndr)
349       vect_dc <- maybeV (lookupDataCon dc)
350       let [arr_dc] = tyConDataCons arr_tc
351       repr <- mkRepr vect_tc
352       shape_bndrs <- arrShapeVars repr
353       return . vLet (vNonRec vbndr vexpr)
354              $ vCaseProd vscrut vty lty vect_dc arr_dc shape_bndrs vbndrs vbody
355   where
356     vect_scrut_bndr | isDeadBinder bndr = vectBndrNewIn bndr FSLIT("scrut")
357                     | otherwise         = vectBndrIn bndr
358
359 vectAlgCase tycon ty_args scrut bndr ty alts
360   = do
361       vect_tc <- maybeV (lookupTyCon tycon)
362       vty               <- vectType ty
363       lty               <- mkPArrayType vty
364
365       repr        <- mkRepr vect_tc
366       shape_bndrs <- arrShapeVars repr
367       (len, sel, indices) <- arrSelector repr (map Var shape_bndrs)
368
369       (vbndr, valts) <- vect_scrut_bndr $ mapM (proc_alt sel lty) alts'
370       let (vect_dcs, vect_bndrss, lift_bndrss, vbodies) = unzip4 valts
371
372       vexpr <- vectExpr scrut
373       (vscrut, arr_tc, arg_tys) <- mkVScrut (vVar vbndr)
374       let [arr_dc] = tyConDataCons arr_tc
375
376       let (vect_scrut,  lift_scrut)  = vscrut
377           (vect_bodies, lift_bodies) = unzip vbodies
378
379       let vect_case = Case vect_scrut (mkWildId (exprType vect_scrut)) vty
380                            (zipWith3 mk_vect_alt vect_dcs vect_bndrss vect_bodies)
381
382       lbody <- combinePA vty len sel indices lift_bodies
383       let lift_case = Case lift_scrut (mkWildId (exprType lift_scrut)) lty
384                            [(DataAlt arr_dc, shape_bndrs ++ concat lift_bndrss,
385                              lbody)]
386
387       return . vLet (vNonRec vbndr vexpr)
388              $ (vect_case, lift_case)
389   where
390     vect_scrut_bndr | isDeadBinder bndr = vectBndrNewIn bndr FSLIT("scrut")
391                     | otherwise         = vectBndrIn bndr
392
393     alts' = sortBy (\(alt1, _, _) (alt2, _, _) -> cmp alt1 alt2) alts
394
395     cmp (DataAlt dc1) (DataAlt dc2) = dataConTag dc1 `compare` dataConTag dc2
396     cmp DEFAULT       DEFAULT       = EQ
397     cmp DEFAULT       _             = LT
398     cmp _             DEFAULT       = GT
399
400     proc_alt sel lty (DataAlt dc, bndrs, body)
401       = do
402           vect_dc <- maybeV (lookupDataCon dc)
403           let tag = mkDataConTag vect_dc
404               fvs = freeVarsOf body `delVarSetList` bndrs
405           (vect_bndrs, lift_bndrs, vbody)
406             <- vect_alt_bndrs bndrs
407              $ \len -> packLiftingContext len sel tag fvs lty
408              $ vectExpr body
409
410           return (vect_dc, vect_bndrs, lift_bndrs, vbody)
411
412     vect_alt_bndrs [] p
413       = do
414           void_tc <- builtin voidTyCon
415           let void_ty = mkTyConApp void_tc []
416           arr_ty <- mkPArrayType void_ty
417           bndr   <- newLocalVar FSLIT("voids") arr_ty
418           len    <- lengthPA void_ty (Var bndr)
419           e      <- p len
420           return ([], [bndr], e)
421
422     vect_alt_bndrs bndrs p
423        = localV
424        $ do
425            vbndrs <- mapM vectBndr bndrs
426            let (vect_bndrs, lift_bndrs) = unzip vbndrs
427                vv : _ = vect_bndrs
428                lv : _ = lift_bndrs
429            len <- lengthPA (idType vv) (Var lv)
430            e   <- p len
431            return (vect_bndrs, lift_bndrs, e)
432
433     mk_vect_alt vect_dc bndrs body = (DataAlt vect_dc, bndrs, body)
434
435 packLiftingContext :: CoreExpr -> CoreExpr -> CoreExpr -> VarSet -> Type -> VM VExpr -> VM VExpr
436 packLiftingContext len shape tag fvs res_ty p
437   = do
438       select <- builtin selectPAIntPrimVar
439       let sel_expr = mkApps (Var select) [shape, tag]
440       sel_var <- newLocalVar FSLIT("sel#") (exprType sel_expr)
441       lc_var <- builtin liftingContext
442       localV $
443         do
444           bnds <- mapM (packFreeVar (Var lc_var) (Var sel_var))
445                 . filter isLocalId
446                 $ varSetElems fvs
447           (vexpr, lexpr) <- p
448           return (vexpr, Let (NonRec sel_var sel_expr)
449                          . mkLets (concat bnds)
450                          $ Case len lc_var res_ty [(DEFAULT, [], lexpr)])
451
452 packFreeVar :: CoreExpr -> CoreExpr -> Var -> VM [CoreBind]
453 packFreeVar len sel v
454   = do
455       r <- lookupVar v
456       case r of
457         Local (vv,lv) ->
458           do
459             lv' <- cloneVar lv
460             expr <- packPA (idType vv) (Var lv) len sel
461             updLEnv (upd vv lv')
462             return [(NonRec lv' expr)]
463
464         _  -> return []
465   where
466     upd vv lv' env = env { local_vars = extendVarEnv (local_vars env) v (vv, lv') }
467