[project @ 2001-11-05 14:08:28 by chak]
[ghc-hetmet.git] / ghc / rts / Stable.c
1 /* -----------------------------------------------------------------------------
2  * $Id: Stable.c,v 1.17 2001/08/14 13:40:09 sewardj Exp $
3  *
4  * (c) The GHC Team, 1998-1999
5  *
6  * Stable names and stable pointers.
7  *
8  * ---------------------------------------------------------------------------*/
9
10 #include "PosixSource.h"
11 #include "Rts.h"
12 #include "Hash.h"
13 #include "StablePriv.h"
14 #include "RtsUtils.h"
15 #include "Storage.h"
16 #include "RtsAPI.h"
17 #include "RtsFlags.h"
18
19 /* Comment from ADR's implementation in old RTS:
20
21   This files (together with @ghc/runtime/storage/PerformIO.lhc@ and a
22   small change in @HpOverflow.lc@) consists of the changes in the
23   runtime system required to implement "Stable Pointers". But we're
24   getting a bit ahead of ourselves --- what is a stable pointer and what
25   is it used for?
26
27   When Haskell calls C, it normally just passes over primitive integers,
28   floats, bools, strings, etc.  This doesn't cause any problems at all
29   for garbage collection because the act of passing them makes a copy
30   from the heap, stack or wherever they are onto the C-world stack.
31   However, if we were to pass a heap object such as a (Haskell) @String@
32   and a garbage collection occured before we finished using it, we'd run
33   into problems since the heap object might have been moved or even
34   deleted.
35
36   So, if a C call is able to cause a garbage collection or we want to
37   store a pointer to a heap object between C calls, we must be careful
38   when passing heap objects. Our solution is to keep a table of all
39   objects we've given to the C-world and to make sure that the garbage
40   collector collects these objects --- updating the table as required to
41   make sure we can still find the object.
42
43
44   Of course, all this rather begs the question: why would we want to
45   pass a boxed value?
46
47   One very good reason is to preserve laziness across the language
48   interface. Rather than evaluating an integer or a string because it
49   {\em might\/} be required by the C function, we can wait until the C
50   function actually wants the value and then force an evaluation.
51
52   Another very good reason (the motivating reason!) is that the C code
53   might want to execute an object of sort $IO ()$ for the side-effects
54   it will produce. For example, this is used when interfacing to an X
55   widgets library to allow a direct implementation of callbacks.
56
57
58   The @makeStablePointer :: a -> IO (StablePtr a)@ function
59   converts a value into a stable pointer.  It is part of the @PrimIO@
60   monad, because we want to be sure we don't allocate one twice by
61   accident, and then only free one of the copies.
62
63   \begin{verbatim}
64   makeStablePtr#  :: a -> State# RealWorld -> (# RealWorld, a #)
65   freeStablePtr#  :: StablePtr# a -> State# RealWorld -> State# RealWorld
66   deRefStablePtr# :: StablePtr# a -> State# RealWorld -> 
67         (# State# RealWorld, a #)
68   \end{verbatim}
69
70   There may be additional functions on the C side to allow evaluation,
71   application, etc of a stable pointer.
72
73   When Haskell calls C, it normally just passes over primitive integers,
74   floats, bools, strings, etc.  This doesn't cause any problems at all
75   for garbage collection because the act of passing them makes a copy
76   from the heap, stack or wherever they are onto the C-world stack.
77   However, if we were to pass a heap object such as a (Haskell) @String@
78   and a garbage collection occured before we finished using it, we'd run
79   into problems since the heap object might have been moved or even
80   deleted.
81
82   So, if a C call is able to cause a garbage collection or we want to
83   store a pointer to a heap object between C calls, we must be careful
84   when passing heap objects. Our solution is to keep a table of all
85   objects we've given to the C-world and to make sure that the garbage
86   collector collects these objects --- updating the table as required to
87   make sure we can still find the object.
88 */
89
90 snEntry *stable_ptr_table;
91 snEntry *stable_ptr_free;
92
93 unsigned int SPT_size;
94
95 /* This hash table maps Haskell objects to stable names, so that every
96  * call to lookupStableName on a given object will return the same
97  * stable name.
98  *
99  * Reference counting
100  * ------------------
101  * A plain stable name entry has a zero reference count, which means
102  * the entry will dissappear when the object it points to is
103  * unreachable.  For stable pointers, we need an entry that sticks
104  * around and keeps the object it points to alive, so each stable name
105  * entry has an associated reference count.
106  *
107  * A stable pointer has a weighted reference count N attached to it
108  * (actually in its upper 5 bits), which represents the weight
109  * 2^(N-1).  The stable name entry keeps a 32-bit reference count, which
110  * represents any weight between 1 and 2^32 (represented as zero).
111  * When the weight is 2^32, the stable name table owns "all" of the
112  * stable pointers to this object, and the entry can be garbage
113  * collected if the object isn't reachable.
114  *
115  * A new stable pointer is given the weight log2(W/2), where W is the
116  * weight stored in the table entry.  The new weight in the table is W
117  * - 2^log2(W/2).
118  *
119  * A stable pointer can be "split" into two stable pointers, by
120  * dividing the weight by 2 and giving each pointer half.
121  * When freeing a stable pointer, the weight of the pointer is added
122  * to the weight stored in the table entry.
123  * */
124
125 HashTable *addrToStableHash;
126
127 #define INIT_SPT_SIZE 64
128
129 static inline void
130 initFreeList(snEntry *table, nat n, snEntry *free)
131 {
132   snEntry *p;
133
134   for (p = table + n - 1; p >= table; p--) {
135     p->addr   = (P_)free;
136     p->old    = NULL;
137     p->weight = 0;
138     p->sn_obj = NULL;
139     free = p;
140   }
141   stable_ptr_free = table;
142 }
143
144 void
145 initStablePtrTable(void)
146 {
147   /* the table will be allocated the first time makeStablePtr is
148    * called */
149   stable_ptr_table = NULL;
150   stable_ptr_free  = NULL;
151   addrToStableHash = NULL;
152   SPT_size = 0;
153 }
154
155 /*
156  * get at the real stuff...remove indirections.
157  *
158  * ToDo: move to a better home.
159  */
160 static
161 StgClosure*
162 removeIndirections(StgClosure* p)
163 {
164   StgClosure* q = p;
165
166   while (get_itbl(q)->type == IND ||
167          get_itbl(q)->type == IND_STATIC ||
168          get_itbl(q)->type == IND_OLDGEN ||
169          get_itbl(q)->type == IND_PERM ||
170          get_itbl(q)->type == IND_OLDGEN_PERM ) {
171       q = ((StgInd *)q)->indirectee;
172   }
173   return q;
174 }
175
176 StgWord
177 lookupStableName(StgPtr p)
178 {
179   StgWord sn;
180
181   if (stable_ptr_free == NULL) {
182     enlargeStablePtrTable();
183   }
184
185   /* removing indirections increases the likelihood
186    * of finding a match in the stable name hash table.
187    */
188   p = (StgPtr)removeIndirections((StgClosure*)p);
189
190   (void *)sn = lookupHashTable(addrToStableHash,(W_)p);
191   
192   if (sn != 0) {
193     ASSERT(stable_ptr_table[sn].addr == p);
194     IF_DEBUG(stable,fprintf(stderr,"cached stable name %d at %p\n",sn,p));
195     return sn;
196   } else {
197     sn = stable_ptr_free - stable_ptr_table;
198     (P_)stable_ptr_free  = stable_ptr_free->addr;
199     stable_ptr_table[sn].weight = 0;
200     stable_ptr_table[sn].addr = p;
201     stable_ptr_table[sn].sn_obj = NULL;
202     /* IF_DEBUG(stable,fprintf(stderr,"new stable name %d at
203        %p\n",sn,p)); */
204     
205     /* add the new stable name to the hash table */
206     insertHashTable(addrToStableHash, (W_)p, (void *)sn);
207
208     return sn;
209   }
210 }
211
212 static inline void
213 freeStableName(snEntry *sn)
214 {
215   ASSERT(sn->sn_obj == NULL);
216   if (sn->addr != NULL) {
217     removeHashTable(addrToStableHash, (W_)sn->addr, NULL);
218   }
219   sn->addr = (P_)stable_ptr_free;
220   stable_ptr_free = sn;
221 }
222
223 StgStablePtr
224 getStablePtr(StgPtr p)
225 {
226   StgWord sn = lookupStableName(p);
227   StgWord weight, n;
228   weight = stable_ptr_table[sn].weight;
229   if (weight == 0) {
230     weight = (StgWord)1 << (BITS_IN(StgWord)-1);
231     stable_ptr_table[sn].weight = weight;
232     return (StgStablePtr)(sn + (BITS_IN(StgWord) << STABLEPTR_WEIGHT_SHIFT));
233   } 
234   else if (weight == 1) {
235     barf("getStablePtr: too light");
236   } 
237   else {
238     weight /= 2;
239     /* find log2(weight) */
240     for (n = 0; weight != 1; n++) {
241       weight >>= 1;
242     }
243     stable_ptr_table[sn].weight -= 1 << n;
244     return (StgStablePtr)(sn + ((n+1) << STABLEPTR_WEIGHT_SHIFT));
245   }
246 }
247
248 void
249 enlargeStablePtrTable(void)
250 {
251   nat old_SPT_size = SPT_size;
252   
253   if (SPT_size == 0) {
254     // 1st time
255     SPT_size = INIT_SPT_SIZE;
256     stable_ptr_table = stgMallocWords(SPT_size * sizeof(snEntry), 
257                                       "initStablePtrTable");
258     
259     /* we don't use index 0 in the stable name table, because that
260      * would conflict with the hash table lookup operations which
261      * return NULL if an entry isn't found in the hash table.
262      */
263     initFreeList(stable_ptr_table+1,INIT_SPT_SIZE-1,NULL);
264     addrToStableHash = allocHashTable();
265   }
266   else {
267     // 2nd and subsequent times
268     SPT_size *= 2;
269     stable_ptr_table = 
270       stgReallocWords(stable_ptr_table, SPT_size * sizeof(snEntry),
271                       "enlargeStablePtrTable");
272     
273     initFreeList(stable_ptr_table + old_SPT_size, old_SPT_size, NULL);
274   }
275 }
276
277 /* -----------------------------------------------------------------------------
278  * Treat stable pointers as roots for the garbage collector.
279  *
280  * A stable pointer is any stable name entry with a weight > 0.  We'll
281  * take the opportunity to zero the "keep" flags at the same time.
282  * -------------------------------------------------------------------------- */
283
284 void
285 markStablePtrTable(evac_fn evac)
286 {
287     snEntry *p, *end_stable_ptr_table;
288     StgPtr q;
289     
290     end_stable_ptr_table = &stable_ptr_table[SPT_size];
291     
292     // Mark all the stable *pointers* (not stable names).
293     // _starting_ at index 1; index 0 is unused.
294     for (p = stable_ptr_table+1; p < end_stable_ptr_table; p++) {
295         q = p->addr;
296
297         // Internal pointers are free slots.  If q == NULL, it's a
298         // stable name where the object has been GC'd, but the
299         // StableName object (sn_obj) is still alive.
300         if (q && (q < (P_)stable_ptr_table || q >= (P_)end_stable_ptr_table)) {
301
302             // save the current addr away: we need to be able to tell
303             // whether the objects moved in order to be able to update
304             // the hash table later.
305             p->old = p->addr;
306
307             // if the weight is non-zero, treat addr as a root
308             if (p->weight != 0) {
309                 evac((StgClosure **)&p->addr);
310             }
311         }
312     }
313 }
314
315 /* -----------------------------------------------------------------------------
316  * Thread the stable pointer table for compacting GC.
317  * 
318  * Here we must call the supplied evac function for each pointer into
319  * the heap from the stable pointer table, because the compacting
320  * collector may move the object it points to.
321  * -------------------------------------------------------------------------- */
322
323 void
324 threadStablePtrTable( evac_fn evac )
325 {
326     snEntry *p, *end_stable_ptr_table;
327     StgPtr q;
328     
329     end_stable_ptr_table = &stable_ptr_table[SPT_size];
330     
331     for (p = stable_ptr_table+1; p < end_stable_ptr_table; p++) {
332         
333         if (p->sn_obj != NULL) {
334             evac((StgClosure **)&p->sn_obj);
335         }
336
337         q = p->addr;
338         if (q && (q < (P_)stable_ptr_table || q >= (P_)end_stable_ptr_table)) {
339             evac((StgClosure **)&p->addr);
340         }
341     }
342 }
343
344 /* -----------------------------------------------------------------------------
345  * Garbage collect any dead entries in the stable pointer table.
346  *
347  * A dead entry has:
348  *
349  *          - a weight of zero (i.e. 2^32)
350  *          - a dead sn_obj
351  *
352  * Both of these conditions must be true in order to re-use the stable
353  * name table entry.  We can re-use stable name table entries for live
354  * heap objects, as long as the program has no StableName objects that
355  * refer to the entry.
356  * -------------------------------------------------------------------------- */
357
358 void
359 gcStablePtrTable( void )
360 {
361     snEntry *p, *end_stable_ptr_table;
362     StgPtr q;
363     
364     end_stable_ptr_table = &stable_ptr_table[SPT_size];
365     
366     // NOTE: _starting_ at index 1; index 0 is unused.
367     for (p = stable_ptr_table + 1; p < end_stable_ptr_table; p++) {
368         
369         // Update the pointer to the StableName object, if there is one
370         if (p->sn_obj != NULL) {
371             p->sn_obj = isAlive(p->sn_obj);
372         }
373         
374         // Internal pointers are free slots.  If q == NULL, it's a
375         // stable name where the object has been GC'd, but the
376         // StableName object (sn_obj) is still alive.
377         q = p->addr;
378         if (q && (q < (P_)stable_ptr_table || q >= (P_)end_stable_ptr_table)) {
379
380             // StableNames only:
381             if (p->weight == 0) {
382                 if (p->sn_obj == NULL) {
383                     // StableName object is dead
384                     freeStableName(p);
385                     IF_DEBUG(stable, fprintf(stderr,"GC'd Stable name %d\n", 
386                                              p - stable_ptr_table));
387                     continue;
388                     
389                 } else {
390                     (StgClosure *)p->addr = isAlive((StgClosure *)p->addr);
391                     IF_DEBUG(stable, fprintf(stderr,"Stable name %d still alive at %p, weight %d\n", p - stable_ptr_table, p->addr, p->weight));
392                 }
393             }
394         }
395     }
396 }
397
398 /* -----------------------------------------------------------------------------
399  * Update the StablePtr/StableName hash table
400  *
401  * The boolean argument 'full' indicates that a major collection is
402  * being done, so we might as well throw away the hash table and build
403  * a new one.  For a minor collection, we just re-hash the elements
404  * that changed.
405  * -------------------------------------------------------------------------- */
406
407 void
408 updateStablePtrTable(rtsBool full)
409 {
410     snEntry *p, *end_stable_ptr_table;
411     
412     if (full && addrToStableHash != NULL) {
413         freeHashTable(addrToStableHash,NULL);
414         addrToStableHash = allocHashTable();
415     }
416     
417     end_stable_ptr_table = &stable_ptr_table[SPT_size];
418     
419     // NOTE: _starting_ at index 1; index 0 is unused.
420     for (p = stable_ptr_table + 1; p < end_stable_ptr_table; p++) {
421         
422         if (p->addr == NULL) {
423             if (p->old != NULL) {
424                 // The target has been garbage collected.  Remove its
425                 // entry from the hash table.
426                 removeHashTable(addrToStableHash, (W_)p->old, NULL);
427                 p->old = NULL;
428             }
429         }
430         else if (p->addr < (P_)stable_ptr_table 
431                  || p->addr >= (P_)end_stable_ptr_table) {
432             // Target still alive, Re-hash this stable name 
433             if (full) {
434                 insertHashTable(addrToStableHash, (W_)p->addr, 
435                                 (void *)(p - stable_ptr_table));
436             } else if (p->addr != p->old) {
437                 removeHashTable(addrToStableHash, (W_)p->old, NULL);
438                 insertHashTable(addrToStableHash, (W_)p->addr, 
439                                 (void *)(p - stable_ptr_table));
440             }
441         }
442     }
443 }