NCG: Do the actual reversing of SCCs
[ghc-hetmet.git] / compiler / nativeGen / RegAlloc / Graph / Main.hs
1 {-# OPTIONS -fno-warn-missing-signatures #-}
2 -- | Graph coloring register allocator.
3 --
4 -- TODO: The colors in graphviz graphs for x86_64 and ppc could be nicer.
5 --
6
7 module RegAlloc.Graph.Main ( 
8         regAlloc
9
10
11 where
12
13 import qualified GraphColor     as Color
14 import RegAlloc.Liveness
15 import RegAlloc.Graph.Spill
16 import RegAlloc.Graph.SpillClean
17 import RegAlloc.Graph.SpillCost
18 import RegAlloc.Graph.Stats
19 import RegAlloc.Graph.TrivColorable
20 import Instruction
21 import TargetReg
22 import RegClass
23 import Reg
24
25
26 import UniqSupply
27 import UniqSet
28 import UniqFM
29 import Bag
30 import Outputable
31 import DynFlags
32
33 import Data.List
34 import Data.Maybe
35 import Control.Monad
36
37 -- | The maximum number of build\/spill cycles we'll allow.
38 --      We should only need 3 or 4 cycles tops.
39 --      If we run for any longer than this we're probably in an infinite loop,
40 --      It's probably better just to bail out and report a bug at this stage.
41 maxSpinCount    :: Int
42 maxSpinCount    = 10
43
44
45 -- | The top level of the graph coloring register allocator.
46 --      
47 regAlloc
48         :: (Outputable instr, Instruction instr)
49         => DynFlags
50         -> UniqFM (UniqSet RealReg)     -- ^ the registers we can use for allocation
51         -> UniqSet Int                  -- ^ the set of available spill slots.
52         -> [LiveCmmTop instr]           -- ^ code annotated with liveness information.
53         -> UniqSM ( [NatCmmTop instr], [RegAllocStats instr] )
54            -- ^ code with registers allocated and stats for each stage of
55            -- allocation
56                 
57 regAlloc dflags regsFree slotsFree code
58  = do
59         -- TODO: the regClass function is currently hard coded to the default target
60         --       architecture. Would prefer to determine this from dflags.
61         --       There are other uses of targetRegClass later in this module.
62         let triv = trivColorable 
63                         targetVirtualRegSqueeze
64                         targetRealRegSqueeze
65
66         (code_final, debug_codeGraphs, _)
67                 <- regAlloc_spin dflags 0 
68                         triv
69                         regsFree slotsFree [] code
70         
71         return  ( code_final
72                 , reverse debug_codeGraphs )
73
74 regAlloc_spin 
75         dflags 
76         spinCount 
77         (triv           :: Color.Triv VirtualReg RegClass RealReg)
78         (regsFree       :: UniqFM (UniqSet RealReg))
79         slotsFree 
80         debug_codeGraphs 
81         code
82  = do
83         -- if any of these dump flags are turned on we want to hang on to
84         --      intermediate structures in the allocator - otherwise tell the
85         --      allocator to ditch them early so we don't end up creating space leaks.
86         let dump = or
87                 [ dopt Opt_D_dump_asm_regalloc_stages dflags
88                 , dopt Opt_D_dump_asm_stats dflags
89                 , dopt Opt_D_dump_asm_conflicts dflags ]
90
91         -- check that we're not running off down the garden path.
92         when (spinCount > maxSpinCount)
93          $ pprPanic "regAlloc_spin: max build/spill cycle count exceeded."
94                 (  text "It looks like the register allocator is stuck in an infinite loop."
95                 $$ text "max cycles  = " <> int maxSpinCount
96                 $$ text "regsFree    = " <> (hcat       $ punctuate space $ map ppr
97                                                 $ uniqSetToList $ unionManyUniqSets $ eltsUFM regsFree)
98                 $$ text "slotsFree   = " <> ppr (sizeUniqSet slotsFree))
99
100         -- build a conflict graph from the code.
101         (graph  :: Color.Graph VirtualReg RegClass RealReg)
102                 <- {-# SCC "BuildGraph" #-} buildGraph code
103
104         -- VERY IMPORTANT:
105         --      We really do want the graph to be fully evaluated _before_ we start coloring.
106         --      If we don't do this now then when the call to Color.colorGraph forces bits of it,
107         --      the heap will be filled with half evaluated pieces of graph and zillions of apply thunks.
108         --
109         seqGraph graph `seq` return ()
110
111
112         -- build a map of the cost of spilling each instruction
113         --      this will only actually be computed if we have to spill something.
114         let spillCosts  = foldl' plusSpillCostInfo zeroSpillCostInfo
115                         $ map slurpSpillCostInfo code
116
117         -- the function to choose regs to leave uncolored
118         let spill       = chooseSpill spillCosts
119
120         -- record startup state
121         let stat1       =
122                 if spinCount == 0
123                  then   Just $ RegAllocStatsStart
124                         { raLiveCmm     = code
125                         , raGraph       = graph
126                         , raSpillCosts  = spillCosts }
127                  else   Nothing
128         
129         -- try and color the graph 
130         let (graph_colored, rsSpill, rmCoalesce)
131                         = {-# SCC "ColorGraph" #-}
132                            Color.colorGraph
133                                 (dopt Opt_RegsIterative dflags)
134                                 spinCount
135                                 regsFree triv spill graph
136
137         -- rewrite regs in the code that have been coalesced
138         let patchF reg  
139                 | RegVirtual vr <- reg
140                 = case lookupUFM rmCoalesce vr of
141                         Just vr'        -> patchF (RegVirtual vr')
142                         Nothing         -> reg
143                         
144                 | otherwise
145                 = reg
146
147         let code_coalesced
148                         = map (patchEraseLive patchF) code
149
150
151         -- see if we've found a coloring
152         if isEmptyUniqSet rsSpill
153          then do
154                 -- if -fasm-lint is turned on then validate the graph
155                 let graph_colored_lint  =
156                         if dopt Opt_DoAsmLinting dflags
157                                 then Color.validateGraph (text "")
158                                         True    -- require all nodes to be colored
159                                         graph_colored
160                                 else graph_colored
161
162                 -- patch the registers using the info in the graph
163                 let code_patched        = map (patchRegsFromGraph graph_colored_lint) code_coalesced
164
165                 -- clean out unneeded SPILL/RELOADs
166                 let code_spillclean     = map cleanSpills code_patched
167
168                 -- strip off liveness information, 
169                 --      and rewrite SPILL/RELOAD pseudos into real instructions along the way
170                 let code_final          = map stripLive code_spillclean
171
172 --              let spillNatTop         = mapGenBlockTop spillNatBlock
173 --              let code_final          = map spillNatTop code_nat
174                 
175                 -- record what happened in this stage for debugging
176                 let stat                =
177                         RegAllocStatsColored
178                         { raCode                = code
179                         , raGraph               = graph
180                         , raGraphColored        = graph_colored_lint
181                         , raCoalesced           = rmCoalesce
182                         , raCodeCoalesced       = code_coalesced
183                         , raPatched             = code_patched
184                         , raSpillClean          = code_spillclean
185                         , raFinal               = code_final
186                         , raSRMs                = foldl' addSRM (0, 0, 0) $ map countSRMs code_spillclean }
187
188
189                 let statList =
190                         if dump then [stat] ++ maybeToList stat1 ++ debug_codeGraphs
191                                 else []
192
193                 -- space leak avoidance
194                 seqList statList `seq` return ()
195
196                 return  ( code_final
197                         , statList
198                         , graph_colored_lint)
199
200          -- we couldn't find a coloring, time to spill something
201          else do
202                 -- if -fasm-lint is turned on then validate the graph
203                 let graph_colored_lint  =
204                         if dopt Opt_DoAsmLinting dflags
205                                 then Color.validateGraph (text "")
206                                         False   -- don't require nodes to be colored
207                                         graph_colored
208                                 else graph_colored
209
210                 -- spill the uncolored regs
211                 (code_spilled, slotsFree', spillStats)
212                         <- regSpill code_coalesced slotsFree rsSpill
213
214                 -- recalculate liveness
215                 -- NOTE: we have to reverse the SCCs here to get them back into the reverse-dependency
216                 --       order required by computeLiveness. If they're not in the correct order
217                 --       that function will panic.
218                 code_relive     <- mapM (regLiveness . reverseBlocksInTops) code_spilled
219
220                 -- record what happened in this stage for debugging
221                 let stat        =
222                         RegAllocStatsSpill
223                         { raCode        = code
224                         , raGraph       = graph_colored_lint
225                         , raCoalesced   = rmCoalesce
226                         , raSpillStats  = spillStats
227                         , raSpillCosts  = spillCosts
228                         , raSpilled     = code_spilled }
229                                 
230                 let statList =
231                         if dump
232                                 then [stat] ++ maybeToList stat1 ++ debug_codeGraphs
233                                 else []
234
235                 -- space leak avoidance
236                 seqList statList `seq` return ()
237
238                 regAlloc_spin dflags (spinCount + 1) triv regsFree slotsFree'
239                         statList
240                         code_relive
241
242
243
244 -- | Build a graph from the liveness and coalesce information in this code.
245
246 buildGraph 
247         :: Instruction instr
248         => [LiveCmmTop instr]
249         -> UniqSM (Color.Graph VirtualReg RegClass RealReg)
250         
251 buildGraph code
252  = do
253         -- Slurp out the conflicts and reg->reg moves from this code
254         let (conflictList, moveList) =
255                 unzip $ map slurpConflicts code
256
257         -- Slurp out the spill/reload coalesces
258         let moveList2           = map slurpReloadCoalesce code
259
260         -- Add the reg-reg conflicts to the graph
261         let conflictBag         = unionManyBags conflictList
262         let graph_conflict      = foldrBag graphAddConflictSet Color.initGraph conflictBag
263
264         -- Add the coalescences edges to the graph.
265         let moveBag             = unionBags (unionManyBags moveList2) (unionManyBags moveList)
266         let graph_coalesce      = foldrBag graphAddCoalesce graph_conflict moveBag
267                         
268         return  graph_coalesce
269
270
271 -- | Add some conflict edges to the graph.
272 --      Conflicts between virtual and real regs are recorded as exclusions.
273 --
274 graphAddConflictSet 
275         :: UniqSet Reg
276         -> Color.Graph VirtualReg RegClass RealReg
277         -> Color.Graph VirtualReg RegClass RealReg
278         
279 graphAddConflictSet set graph
280  = let  virtuals        = mkUniqSet 
281                         [ vr | RegVirtual vr <- uniqSetToList set ]
282  
283         graph1  = Color.addConflicts virtuals classOfVirtualReg graph
284
285         graph2  = foldr (\(r1, r2) -> Color.addExclusion r1 classOfVirtualReg r2)
286                         graph1
287                         [ (vr, rr) 
288                                 | RegVirtual vr <- uniqSetToList set
289                                 , RegReal    rr <- uniqSetToList set]
290
291    in   graph2
292         
293
294 -- | Add some coalesence edges to the graph
295 --      Coalesences between virtual and real regs are recorded as preferences.
296 --
297 graphAddCoalesce 
298         :: (Reg, Reg) 
299         -> Color.Graph VirtualReg RegClass RealReg
300         -> Color.Graph VirtualReg RegClass RealReg
301         
302 graphAddCoalesce (r1, r2) graph
303         | RegReal rr            <- r1
304         , RegVirtual vr         <- r2
305         = Color.addPreference (vr, classOfVirtualReg vr) rr graph
306         
307         | RegReal rr            <- r2
308         , RegVirtual vr         <- r1
309         = Color.addPreference (vr, classOfVirtualReg vr) rr graph
310         
311         | RegVirtual vr1        <- r1
312         , RegVirtual vr2        <- r2
313         = Color.addCoalesce 
314                 (vr1, classOfVirtualReg vr1) 
315                 (vr2, classOfVirtualReg vr2) 
316                 graph
317
318         -- We can't coalesce two real regs, but there could well be existing
319         --      hreg,hreg moves in the input code. We'll just ignore these
320         --      for coalescing purposes.
321         | RegReal _             <- r1
322         , RegReal _             <- r2
323         = graph
324
325 graphAddCoalesce _ _
326         = panic "graphAddCoalesce: bogus"
327         
328
329 -- | Patch registers in code using the reg -> reg mapping in this graph.
330 patchRegsFromGraph 
331         :: (Outputable instr, Instruction instr)
332         => Color.Graph VirtualReg RegClass RealReg
333         -> LiveCmmTop instr -> LiveCmmTop instr
334
335 patchRegsFromGraph graph code
336  = let
337         -- a function to lookup the hardreg for a virtual reg from the graph.
338         patchF reg
339                 -- leave real regs alone.
340                 | RegReal{}     <- reg
341                 = reg
342
343                 -- this virtual has a regular node in the graph.
344                 | RegVirtual vr <- reg
345                 , Just node     <- Color.lookupNode graph vr
346                 = case Color.nodeColor node of
347                         Just color      -> RegReal    color
348                         Nothing         -> RegVirtual vr
349                         
350                 -- no node in the graph for this virtual, bad news.
351                 | otherwise
352                 = pprPanic "patchRegsFromGraph: register mapping failed." 
353                         (  text "There is no node in the graph for register " <> ppr reg
354                         $$ ppr code
355                         $$ Color.dotGraph 
356                                 (\_ -> text "white") 
357                                 (trivColorable 
358                                         targetVirtualRegSqueeze
359                                         targetRealRegSqueeze)
360                                 graph)
361
362    in   patchEraseLive patchF code
363    
364
365 -----
366 -- for when laziness just isn't what you wanted...
367 --
368 seqGraph :: Color.Graph VirtualReg RegClass RealReg -> ()
369 seqGraph graph          = seqNodes (eltsUFM (Color.graphMap graph))
370
371 seqNodes :: [Color.Node VirtualReg RegClass RealReg] -> ()
372 seqNodes ns
373  = case ns of
374         []              -> ()
375         (n : ns)        -> seqNode n `seq` seqNodes ns
376
377 seqNode :: Color.Node VirtualReg RegClass RealReg -> ()
378 seqNode node
379         =     seqVirtualReg     (Color.nodeId node)
380         `seq` seqRegClass       (Color.nodeClass node)
381         `seq` seqMaybeRealReg   (Color.nodeColor node)
382         `seq` (seqVirtualRegList (uniqSetToList (Color.nodeConflicts node)))
383         `seq` (seqRealRegList    (uniqSetToList (Color.nodeExclusions node)))
384         `seq` (seqRealRegList (Color.nodePreference node))
385         `seq` (seqVirtualRegList (uniqSetToList (Color.nodeCoalesce node)))
386
387 seqVirtualReg :: VirtualReg -> ()
388 seqVirtualReg reg = reg `seq` ()
389
390 seqRealReg :: RealReg -> ()
391 seqRealReg reg = reg `seq` ()
392
393 seqRegClass :: RegClass -> ()
394 seqRegClass c = c `seq` ()
395
396 seqMaybeRealReg :: Maybe RealReg -> ()
397 seqMaybeRealReg mr
398  = case mr of
399         Nothing         -> ()
400         Just r          -> seqRealReg r
401
402 seqVirtualRegList :: [VirtualReg] -> ()
403 seqVirtualRegList rs
404  = case rs of
405         []              -> ()
406         (r : rs)        -> seqVirtualReg r `seq` seqVirtualRegList rs
407
408 seqRealRegList :: [RealReg] -> ()
409 seqRealRegList rs
410  = case rs of
411         []              -> ()
412         (r : rs)        -> seqRealReg r `seq` seqRealRegList rs
413
414 seqList :: [a] -> ()
415 seqList ls
416  = case ls of
417         []              -> ()
418         (r : rs)        -> r `seq` seqList rs
419
420