[project @ 2000-06-19 21:28:00 by panne]
[ghc-hetmet.git] / docs / ffi.sgml
1 <Sect1 id="sec-intro">
2 <Title>Introduction
3 </Title>
4
5 <Para>
6 The motivation behind this foreign function interface(FFI)
7 specification is to make it possible to describe in Haskell <Emphasis>source
8 code</Emphasis> the interface to foreign functionality in a Haskell system
9 independent manner. It builds on experiences made with the previous
10 foreign function interfaces provided by GHC and Hugs.
11 </Para>
12
13 <Para>
14 The FFI specified in this document is not in the market of trying to
15 completely bridge the gap between the actual type of an external
16 function, and what is a <Emphasis>convenient</Emphasis> type for that function to the
17 Haskell programmer. That is the domain of tools like HaskellDirect or
18 Green Card, both of which are capable of generating Haskell code that
19 uses this FFI.
20 </Para>
21
22 <Para>
23 The FFI can be split up into two complementary halves; one half that
24 provides Haskell constructs for importing foreign functionality into
25 Haskell, the other which lets you expose Haskell functions to the
26 outside world. We start with the former, how to import external
27 functionality into Haskell.
28 </Para>
29
30 </Sect1>
31
32 <Sect1 id="sec-primitive">
33 <Title>Calling foreign functions
34 </Title>
35
36 <Para>
37 To bind a Haskell variable name and type to an external function, we
38 introduce a new construct: <Literal>foreign import</Literal>. It defines the type of a Haskell function together with the name of an external function that actually implements it. The syntax of <Literal>foreign import</Literal> construct is as follows:
39 </Para>
40
41 <Para>
42
43 <ProgramListing>
44 topdecl 
45   : ...
46   ..
47   | 'foreign' 'import' [callconv] [ext_fun] ['unsafe'] varid '::' prim_type
48 </ProgramListing>
49
50 </Para>
51
52 <Para>
53 A <Literal>foreign import</Literal> declaration is only allowed as a toplevel
54 declaration. It consists of two parts, one giving the Haskell type
55 (<Literal>prim&lowbar;type</Literal>), Haskell name (<Literal>varid</Literal>) and a flag indicating whether the
56 primitive is unsafe, the other giving details of the name of the
57 external function (<Literal>ext&lowbar;fun</Literal>) and its calling interface
58 (<Literal>callconv</Literal>.)
59 </Para>
60
61 <Para>
62 Giving a Haskell name and type to an external entry point is clearly
63 an unsafe thing to do, as the external name will in most cases be
64 untyped. The onus is on the programmer using <Literal>foreign import</Literal> to
65 ensure that the Haskell type given correctly maps on to the
66 type of the external function. Section
67 <XRef LinkEnd="sec-mapping"> specifies the mapping from 
68 Haskell types to external types.
69 </Para>
70
71 <Sect2 id="sec-prim-name">
72 <Title>Giving the external function a Haskell name
73 </Title>
74
75 <Para>
76 The external function has to be given a Haskell name. The name
77 must be a Haskell <Literal>varid</Literal>, so the language rules regarding
78 variable names must be followed, i.e., it must start with a
79 lower case letter followed by a sequence of alphanumeric
80 (`in the Unicode sense') characters or '.
81
82 <Footnote>
83 <Para>
84 Notice that with Haskell 98, underscore ('&lowbar;') is included in
85 the character class <Literal>small</Literal>.
86 </Para>
87 </Footnote>
88
89 </Para>
90
91 <Para>
92 <ProgramListing>
93 varid : small ( small | large | udigit | ' )*
94 </ProgramListing>
95 </Para>
96
97 </Sect2>
98
99 <Sect2 id="sec-prim-ext-name">
100 <Title>Naming the external function
101 </Title>
102
103 <Para>
104 The name of the external function consists of two parts,
105 one specifying its location, the other its name:
106 </Para>
107
108 <Para>
109
110 <ProgramListing>
111 ext_fun  : ext_loc ext_name
112          | ext_name
113
114 ext_name : string
115 ext_loc  : string
116 </ProgramListing>
117
118 </Para>
119
120 <Para>
121 For example,
122 </Para>
123
124 <Para>
125
126 <ProgramListing>
127 foreign import stdcall "Advapi32" "RegCloseKey" regCloseKey :: Addr -&#62; IO ()
128 </ProgramListing>
129
130 </Para>
131
132 <Para>
133 states that the external function named <Function>RegCloseKey</Function> at location
134 <Function>Advapi32</Function> should be bound to the Haskell name <Function>regCloseKey</Function>.
135 For a Win32 Haskell implementation that supports the loading of DLLs
136 on-the-fly, this declaration will most likely cause the run-time
137 system to load the <Filename>Advapi32.dll</Filename> DLL before looking up the 
138 function <Function>RegCloseKey()</Function> therein to get at the function pointer
139 to use when invoking <Function>regCloseKey</Function>. 
140 </Para>
141
142 <Para>
143 Compiled implementations may do something completely different, i.e.,
144 mangle "RegCloseKey" to convert it into an archive/import library
145 symbol, that's assumed to be in scope when linking. The details of
146 which are platform (and compiler command-line) dependent.
147 </Para>
148
149 <Para>
150 If the location part is left out, the name of the external function
151 specifies a symbol that is assumed to be in scope when linking.
152 </Para>
153
154 <Para>
155 The location part can either contain an absolute `address' (i.e.,
156 path) of the archive/DLL, or just its name, leaving it up to the
157 underlying system (system meaning both RTS/compiler and OS) to resolve
158 the name to its real location.
159 </Para>
160
161 <Para>
162 An implementation is <Emphasis>expected</Emphasis> to be able to intelligently
163 transform the <Literal>ext&lowbar;loc</Literal> location to fit platform-specific
164 practices for naming dynamic libraries. For instance, given the
165 declaration
166 </Para>
167
168 <Para>
169
170 <ProgramListing>
171 foreign import "Foo" "foo" foo :: Int -&#62; Int -&#62; IO ()
172 </ProgramListing>
173
174 </Para>
175
176 <Para>
177 an implementation should map <Filename>Foo</Filename> to <Filename>"Foo.dll"</Filename> on a Win32
178 platform, and <Filename>libFoo.so</Filename> on ELF platforms. If the lookup of the
179 dynamic library with this transformed location name should fail, the
180 implementation should then attempt to use the original name before
181 eventually giving up. As part of their documentation, implementations
182 of <Literal>foreign import</Literal> should specify the exact details of how
183 <Literal>ext&lowbar;loc</Literal>s are transformed and resolved, including the list of
184 directories searched (and the order in which they are.)
185 </Para>
186
187 <Para>
188 In the case the Haskell name of the imported function is identical to
189 the external name, the <Literal>ext&lowbar;fun</Literal> can be omitted. i.e.,
190 </Para>
191
192 <Para>
193
194 <ProgramListing>
195 foreign import sin :: Double -&#62; IO Double
196 </ProgramListing>
197
198 </Para>
199
200 <Para>
201 is identical to 
202 </Para>
203
204 <Para>
205
206 <ProgramListing>
207 foreign import "sin" sin :: Double -&#62; IO Double
208 </ProgramListing>
209
210 </Para>
211
212 </Sect2>
213
214 <Sect2 id="sec-cconv">
215 <Title>Calling conventions
216 </Title>
217
218 <Para>
219 The number of calling conventions supported is fixed:
220 </Para>
221
222 <Para>
223
224 <ProgramListing>
225 callconv : ccall | stdcall
226 </ProgramListing>
227
228 </Para>
229
230 <Para>
231 <VariableList>
232
233 <VarListEntry>
234 <Term><Literal>ccall</Literal></Term>
235 <ListItem>
236 <Para>
237 The 'default' calling convention on a platform, i.e., the one
238 used to do (C) function calls.
239 </Para>
240
241 <Para>
242 In the case of x86 platforms, the caller pushes function arguments
243 from right to left on the C stack before calling. The caller is
244 responsible for popping the arguments off of the C stack on return.
245 </Para>
246 </ListItem>
247 </VarListEntry>
248 <VarListEntry>
249 <Term><Literal>stdcall</Literal></Term>
250 <ListItem>
251 <Para>
252 A Win32 specific calling convention. The same as <Literal>ccall</Literal>, except
253 that the callee cleans up the C stack before returning.
254
255 <Footnote>
256 <Para>
257 The <Literal>stdcall</Literal> is a Microsoft Win32 specific wrinkle; it used
258 throughout the Win32 API, for instance. On platforms where
259 <Literal>stdcall</Literal> isn't meaningful, it should be treated as being equal
260 to <Literal>ccall</Literal>.
261 </Para>
262 </Footnote>
263
264 </Para>
265 </ListItem>
266 </VarListEntry>
267 </VariableList>
268 </Para>
269
270 <Para>
271 <Emphasis remap="bf">Some remarks:</Emphasis>
272
273 <ItemizedList>
274 <ListItem>
275
276 <Para>
277 Interoperating well with external code is the name of the game here,
278 so the guiding principle when deciding on what calling conventions
279 to include in <Literal>callconv</Literal> is that there's a demonstrated need for
280 a particular calling convention. Should it emerge that the inclusion
281 of other calling conventions will generally improve the quality of
282 this Haskell FFI, they will be considered for future inclusion in
283 <Literal>callconv</Literal>.
284 </Para>
285 </ListItem>
286 <ListItem>
287
288 <Para>
289 Supporting <Literal>stdcall</Literal> (and perhaps other platform-specific calling
290 conventions) raises the issue of whether a Haskell FFI should allow
291 the user to write platform-specific Haskell code. The calling
292 convention is clearly an integral part of an external function's
293 interface, so if the one used differs from the standard one specified
294 by the platform's ABI <Emphasis>and</Emphasis> that convention is used by a
295 non-trivial amount of external functions, the view of the FFI authors
296 is that a Haskell FFI should support it.
297 </Para>
298 </ListItem>
299 <ListItem>
300
301 <Para>
302 For <Literal>foreign import</Literal> (and other <Literal>foreign</Literal> declarations),
303 supplying the calling convention is optional. If it isn't supplied,
304 it is treated as if <Literal>ccall</Literal> was specified. Users are encouraged
305 to leave out the specification of the calling convention, if possible.
306 </Para>
307 </ListItem>
308
309 </ItemizedList>
310
311 </Para>
312
313 </Sect2>
314
315 <Sect2 id="sec-prim-types">
316 <Title>External function types
317 </Title>
318
319 <Para>
320 The range of types that can be passed as arguments to an external
321 function is restricted (as are the range of results coming back):
322 </Para>
323
324 <Para>
325
326 <ProgramListing>
327 prim_type : IO prim_result
328           | prim_result
329           | prim_arg '-&#62;' prim_type
330 </ProgramListing>
331
332 </Para>
333
334 <Para>
335
336 <ItemizedList>
337 <ListItem>
338
339 <Para>
340 If you associate a non-IO type with an external function, you
341 have the same 'proof obligations' as when you make use of
342 <Function>IOExts.unsafePerformIO</Function> in your Haskell programs.
343 </Para>
344 </ListItem>
345 <ListItem>
346
347 <Para>
348 The external function is strict in all its arguments.
349 </Para>
350 </ListItem>
351 <ListItem>
352
353 <Para>
354 <Emphasis>GHC only:</Emphasis> The GHC FFI implementation provides one extension
355 to <Literal>prim&lowbar;type</Literal>:
356
357
358 <ProgramListing>
359 prim_type : ... 
360           | unsafe_arr_ty '-&#62;' prim_type
361
362 unsafe_arr_ty : ByteArray a
363               | MutableByteArray i s a
364 </ProgramListing>
365
366
367 GHC permits the passing of its byte array primitive types
368 to external functions. There's some restrictions on when
369 they can be used; see Section <XRef LinkEnd="sec-arguments">
370 for more details.
371 </Para>
372 </ListItem>
373
374 </ItemizedList>
375
376 </Para>
377
378 <Para>
379 Section <XRef LinkEnd="sec-results"> defines
380 <Literal>prim&lowbar;result</Literal>; Section <XRef LinkEnd="sec-arguments">
381 defines <Literal>prim&lowbar;arg</Literal>.
382 </Para>
383
384 <Sect3 id="sec-arguments">
385 <Title>Argument types
386 </Title>
387
388 <Para>
389 The external function expects zero or more arguments. The set of legal
390 argument types is restricted to the following set:
391 </Para>
392
393 <Para>
394
395 <ProgramListing>
396 prim_arg : ext_ty | new_ty | ForeignObj
397
398 new_ty : a Haskell newtype of a prim_arg.
399
400 ext_ty : int_ty   | word_ty | float_ty
401        | Addr     | Char    | StablePtr a
402        | Bool
403
404 int_ty       : Int   | Int8   | Int16   | Int32 | Int64
405 word_ty      : Word8 | Word16 | Word32  | Word64
406 float_ty     : Float | Double
407 </ProgramListing>
408
409 </Para>
410
411 <Para>
412
413 <ItemizedList>
414 <ListItem>
415
416 <Para>
417 <Literal>ext&lowbar;ty</Literal> represent the set of basic types supported by
418 C-like languages, although the numeric types are explicitly sized.
419
420 The <Emphasis>stable pointer</Emphasis> <Literal>StablePtr</Literal> type looks out of place in
421 this list of C-like types, but it has a well-defined and simple
422 C mapping, see Section <XRef LinkEnd="sec-mapping">
423 for details.
424
425 </Para>
426 </ListItem>
427 <ListItem>
428
429 <Para>
430 <Literal>prim&lowbar;arg</Literal> represent the set of permissible argument types. In
431 addition to <Literal>ext&lowbar;ty</Literal>, <Literal>ForeignObj</Literal> is also included.
432
433 The <Literal>ForeignObj</Literal> type represent values that are pointers to some
434 external entity/object. It differs from the <Literal>Addr</Literal> type in that
435 <Literal>ForeignObj</Literal>s are <Emphasis>finalized</Emphasis>, i.e., once the garbage collector
436 determines that a <Literal>ForeignObj</Literal> is unreachable, it will invoke a
437 finalising procedure attached to the <Literal>ForeignObj</Literal> to notify the
438 outside world that we're through with using it.
439
440 </Para>
441 </ListItem>
442 <ListItem>
443
444 <Para>
445 Haskell <Literal>newtype</Literal>s that wrap up a <Literal>prim&lowbar;arg</Literal> type can also
446 be passed to external functions. 
447 </Para>
448 </ListItem>
449 <ListItem>
450
451 <Para>
452 Haskell type synonyms for any of the above can also be used
453 in <Literal>foreign import</Literal> declarations. Qualified names likewise,
454 i.e. <Literal>Word.Word32</Literal> is legal.
455
456 </Para>
457 </ListItem>
458 <ListItem>
459
460 <Para>
461 <Literal>foreign import</Literal> does not support the binding to external
462 constants/variables. A <Literal>foreign import</Literal> declaration that takes no
463 arguments represent a binding to a function with no arguments.
464 </Para>
465 </ListItem>
466 <ListItem>
467
468 <Para>
469 <Emphasis>GHC only:</Emphasis> GHC's implementation of the FFI provides
470 two extensions:
471
472 <ItemizedList>
473 <ListItem>
474
475 <Para>
476 Support for passing heap allocated byte arrays to an external
477 function
478
479 <ProgramListing>
480 prim_type : ... 
481           | prim_arg '-&#62;' prim_type
482           | unsafe_arr_ty '-&#62;' prim_type
483
484 unsafe_arr_ty : ByteArray a
485               | MutableByteArray i s a
486 </ProgramListing>
487
488
489 GHC's <Literal>ByteArray</Literal> and <Literal>MutableByteArray</Literal> primitive types are
490 (im)mutable chunks of memory allocated on the Haskell heap, and
491 pointers to these can be passed to <Literal>foreign import</Literal>ed external
492 functions provided they are marked as <Literal>unsafe</Literal>. Since it is
493 inherently unsafe to hand out references to objects in the Haskell
494 heap if the external call may cause a garbage collection to happen,
495 you have to annotate the <Literal>foreign import</Literal> declaration with
496 the attribute <Literal>unsafe</Literal>. By doing so, the user explicitly states
497 that the external function won't provoke a garbage collection,
498 so passing out heap references to the external function is allright.
499
500 </Para>
501 </ListItem>
502 <ListItem>
503
504 <Para>
505 Another GHC extension is the support for unboxed types:
506
507
508 <ProgramListing>
509 prim_arg : ...  | unboxed_h_ty
510 ext_ty   : .... | unboxed_ext_ty
511
512 unboxed_ext_ty : Int#   | Word#    | Char#
513                | Float# | Double#  | Addr# 
514                | StablePtr# a
515 unboxed_h_ty : MutableByteArray# | ForeignObj#
516              | ByteArray#
517 </ProgramListing>
518
519
520 Clearly, if you want to be portable across Haskell systems, using 
521 system-specific extensions such as this is not advisable; avoid
522 using them if you can. (Support for using unboxed types might
523 be withdrawn sometime in the future.)
524 </Para>
525 </ListItem>
526
527 </ItemizedList>
528
529 </Para>
530 </ListItem>
531
532 </ItemizedList>
533
534 </Para>
535
536 </Sect3>
537
538 <Sect3 id="sec-results">
539 <Title>Result type
540 </Title>
541
542 <Para>
543 An external function is permitted to return the following
544 range of types:
545 </Para>
546
547 <Para>
548
549 <ProgramListing>
550 prim_result : ext_ty | new_ext_ty | ()
551
552 new_ext_ty : a Haskell newtype of an ext_ty.
553 </ProgramListing>
554
555 </Para>
556
557 <Para>
558 where <Literal>()</Literal> represents <Literal>void</Literal> / no result. 
559 </Para>
560
561 <Para>
562
563 <ItemizedList>
564 <ListItem>
565
566 <Para>
567 External functions cannot raise exceptions (IO exceptions or non-IO ones.)
568 It is the responsibility of the <Literal>foreign import</Literal> user to layer
569 any error handling on top of an external function.
570 </Para>
571 </ListItem>
572 <ListItem>
573
574 <Para>
575 Only external types (<Literal>ext&lowbar;ty</Literal>) can be passed back, i.e., returning
576 <Literal>ForeignObj</Literal>s is not supported/allowed. 
577 </Para>
578 </ListItem>
579 <ListItem>
580
581 <Para>
582 Haskell newtypes that wrap up <Literal>ext&lowbar;ty</Literal> are also permitted.
583 </Para>
584 </ListItem>
585
586 </ItemizedList>
587
588 </Para>
589
590 </Sect3>
591
592 </Sect2>
593
594 <Sect2 id="sec-mapping">
595 <Title>Type mapping
596 </Title>
597
598 <Para>
599 For the FFI to be of any practical use, the properties and sizes of
600 the various types that can be communicated between the Haskell world
601 and the outside, needs to be precisely defined. We do this by
602 presenting a mapping to C, as it is commonly used and most other
603 languages define a mapping to it. Table
604 <XRef LinkEnd="sec-mapping-table">
605 defines the mapping between Haskell and C types.
606 </Para>
607
608 <Para>
609
610 <Table id="sec-mapping-table">
611 <Title>Mapping of Haskell types to C types</Title>
612
613 <TGroup Cols="4">
614 <ColSpec Align="Left" Colsep="0">
615 <ColSpec Align="Left" Colsep="0">
616 <ColSpec Align="Left" Colsep="0">
617 <ColSpec Align="Left" Colsep="0">
618 <TBody>
619 <Row RowSep="1">
620 <Entry>Haskell type </Entry>
621 <Entry> C type </Entry>
622 <Entry> requirement </Entry>
623 <Entry> range (9) </Entry>
624 <Entry> </Entry>
625 <Entry> </Entry>
626 </Row>
627 <Row>
628 <Entry>
629 <Literal>Char</Literal> </Entry>
630 <Entry> <Literal>HsChar</Literal> </Entry>
631 <Entry> unspec. integral type </Entry>
632 <Entry> <Literal>HS&lowbar;CHAR&lowbar;MIN</Literal> .. <Literal>HS&lowbar;CHAR&lowbar;MAX</Literal></Entry>
633 </Row>
634 <Row>
635 <Entry>
636 <Literal>Int</Literal> </Entry>
637 <Entry> <Literal>HsInt</Literal> </Entry>
638 <Entry> signed integral of unspec. size(4) </Entry>
639 <Entry> <Literal>HS&lowbar;INT&lowbar;MIN</Literal> ..
640 <Literal>HS&lowbar;INT&lowbar;MAX</Literal></Entry>
641 </Row>
642 <Row>
643 <Entry>
644 <Literal>Int8</Literal> (2) </Entry>
645 <Entry> <Literal>HsInt8</Literal> </Entry>
646 <Entry> 8 bit signed integral </Entry>
647 <Entry> <Literal>HS&lowbar;INT8&lowbar;MIN</Literal> 
648 ..
649 <Literal>HS&lowbar;INT8&lowbar;MAX</Literal></Entry>
650 </Row>
651 <Row>
652 <Entry>
653 <Literal>Int16</Literal> (2) </Entry>
654 <Entry> <Literal>HsInt16</Literal> </Entry>
655 <Entry> 16 bit signed integral </Entry>
656 <Entry> <Literal>HS&lowbar;INT16&lowbar;MIN</Literal>
657 .. <Literal>HS&lowbar;INT16&lowbar;MAX</Literal></Entry>
658 </Row>
659 <Row>
660 <Entry>
661 <Literal>Int32</Literal> (2) </Entry>
662 <Entry> <Literal>HsInt32</Literal> </Entry>
663 <Entry> 32 bit signed integral </Entry>
664 <Entry> <Literal>HS&lowbar;INT32&lowbar;MIN</Literal> ..
665 <Literal>HS&lowbar;INT32&lowbar;MAX</Literal></Entry>
666 </Row>
667 <Row>
668 <Entry>
669 <Literal>Int64</Literal> (2,3) </Entry>
670 <Entry> <Literal>HsInt64</Literal> </Entry>
671 <Entry> 64 bit signed integral (3) </Entry>
672 <Entry> <Literal>HS&lowbar;INT64&lowbar;MIN</Literal> ..
673 <Literal>HS&lowbar;INT64&lowbar;MAX</Literal></Entry>
674 </Row>
675 <Row>
676 <Entry>
677 <Literal>Word8</Literal> (2) </Entry>
678 <Entry> <Literal>HsWord8</Literal> </Entry>
679 <Entry> 8 bit unsigned integral </Entry>
680 <Entry> <Literal>0</Literal> ..
681 <Literal>HS&lowbar;WORD8&lowbar;MAX</Literal></Entry>
682 </Row>
683 <Row>
684 <Entry>
685 <Literal>Word16</Literal> (2) </Entry>
686 <Entry> <Literal>HsWord16</Literal> </Entry>
687 <Entry> 16 bit unsigned integral </Entry>
688 <Entry> <Literal>0</Literal> ..
689 <Literal>HS&lowbar;WORD16&lowbar;MAX</Literal></Entry>
690 </Row>
691 <Row>
692 <Entry>
693 <Literal>Word32</Literal> (2) </Entry>
694 <Entry> <Literal>HsWord32</Literal> </Entry>
695 <Entry> 32 bit unsigned integral </Entry>
696 <Entry> <Literal>0</Literal> ..
697 <Literal>HS&lowbar;WORD32&lowbar;MAX</Literal></Entry>
698 </Row>
699 <Row>
700 <Entry>
701 <Literal>Word64</Literal> (2,3) </Entry>
702 <Entry> <Literal>HsWord64</Literal> </Entry>
703 <Entry> 64 bit unsigned integral (3) </Entry>
704 <Entry> <Literal>0</Literal> ..
705 <Literal>HS&lowbar;WORD64&lowbar;MAX</Literal></Entry>
706 </Row>
707 <Row>
708 <Entry>
709 <Literal>Float</Literal> </Entry>
710 <Entry> <Literal>HsFloat</Literal> </Entry>
711 <Entry> floating point of unspec. size (5) </Entry>
712 <Entry> (10) </Entry>
713 </Row>
714 <Row>
715 <Entry>
716 <Literal>Double</Literal> </Entry>
717 <Entry> <Literal>HsDouble</Literal> </Entry>
718 <Entry> floating point of unspec. size (5) </Entry>
719 <Entry> (10) </Entry>
720 </Row>
721 <Row>
722 <Entry>
723 <Literal>Bool</Literal> </Entry>
724 <Entry> <Literal>HsBool</Literal> </Entry>
725 <Entry> unspec. integral type </Entry>
726 <Entry> (11) </Entry>
727 </Row>
728 <Row>
729 <Entry>
730 <Literal>Addr</Literal> </Entry>
731 <Entry> <Literal>HsAddr</Literal> </Entry>
732 <Entry> void* (6) </Entry>
733 <Entry> </Entry>
734 </Row>
735 <Row>
736 <Entry>
737 <Literal>ForeignObj</Literal> </Entry>
738 <Entry> <Literal>HsForeignObj</Literal> </Entry>
739 <Entry> void* (7) </Entry>
740 <Entry> </Entry>
741 </Row>
742 <Row>
743 <Entry>
744 <Literal>StablePtr</Literal> </Entry>
745 <Entry> <Literal>HsStablePtr</Literal> </Entry>
746 <Entry> void* (8) </Entry>
747 <Entry> </Entry>
748 </Row>
749 </TBody>
750
751 </TGroup>
752
753 </Table>
754
755 </Para>
756
757 <Para>
758 <Emphasis remap="bf">Some remarks:</Emphasis>
759
760 <OrderedList>
761 <ListItem>
762
763 <Para>
764 A Haskell system that implements the FFI will supply a header file
765 <Filename>HsFFI.h</Filename> that includes target platform specific definitions
766 for the above types and values.
767 </Para>
768 </ListItem>
769 <ListItem>
770
771 <Para>
772 The sized numeric types <Literal>Hs&lcub;Int,Word&rcub;&lcub;8,16,32,64&rcub;</Literal> have
773 a 1-1 mapping to ISO C 99's <Literal>&lcub;,u&rcub;int&lcub;8,16,32,64&rcub;&lowbar;t</Literal>. For systems
774 that doesn't support this revision of ISO C, a best-fit mapping
775 onto the supported C types is provided.
776 </Para>
777 </ListItem>
778 <ListItem>
779
780 <Para>
781 An implementation which does not support 64 bit integral types
782 on the C side should implement <Literal>Hs&lcub;Int,Word&rcub;64</Literal> as a struct. In
783 this case the bounds <Constant>HS&lowbar;INT64&lowbar;&lcub;MIN,MAX&rcub;</Constant> and <Constant>HS&lowbar;WORD64&lowbar;MAX</Constant>
784 are undefined.
785 </Para>
786 </ListItem>
787 <ListItem>
788
789 <Para>
790 A valid Haskell representation of <Literal>Int</Literal> has to be equal to or
791 wider than 30 bits. The <Literal>HsInt</Literal> synonym is guaranteed to map
792 onto a C type that satisifies Haskell's requirement for <Literal>Int</Literal>.
793 </Para>
794 </ListItem>
795 <ListItem>
796
797 <Para>
798 It is guaranteed that <Literal>Hs&lcub;Float,Double&rcub;</Literal> are one of C's
799 floating-point types <Literal>float</Literal>/<Literal>double</Literal>/<Literal>long double</Literal>.
800 </Para>
801 </ListItem>
802 <ListItem>
803
804 <Para>
805 It is guaranteed that <Literal>HsAddr</Literal> is of the same size as <Literal>void*</Literal>, so
806 any other pointer type can be converted to and from HsAddr without any
807 loss of information (K&amp;R, Appendix A6.8).
808 </Para>
809 </ListItem>
810 <ListItem>
811
812 <Para>
813 Foreign objects are handled like <Literal>Addr</Literal> by the FFI, so there
814 is again the guarantee that <Literal>HsForeignObj</Literal> is the same as
815 <Literal>void*</Literal>. The separate name is meant as a reminder that there is
816 a finalizer attached to the object pointed to.
817 </Para>
818 </ListItem>
819 <ListItem>
820
821 <Para>
822 Stable pointers are passed as addresses by the FFI, but this is
823 only because a <Literal>void*</Literal> is used as a generic container in most
824 APIs, not because they are real addresses. To make this special
825 case clear, a separate C type is used here. 
826 </Para>
827 </ListItem>
828 <ListItem>
829
830 <Para>
831 The bounds are preprocessor macros, so they can be used in
832 <Literal>&num;if</Literal> and for array bounds.
833 </Para>
834 </ListItem>
835 <ListItem>
836
837 <Para>
838 Floating-point limits are a little bit more complicated, so
839 preprocessor macros mirroring ISO C's <Filename>float.h</Filename> are provided:
840
841 <ProgramListing>
842 HS_{FLOAT,DOUBLE}_RADIX
843 HS_{FLOAT,DOUBLE}_ROUNDS
844 HS_{FLOAT,DOUBLE}_EPSILON
845 HS_{FLOAT,DOUBLE}_DIG
846 HS_{FLOAT,DOUBLE}_MANT_DIG
847 HS_{FLOAT,DOUBLE}_MIN
848 HS_{FLOAT,DOUBLE}_MIN_EXP
849 HS_{FLOAT,DOUBLE}_MIN_10_EXP
850 HS_{FLOAT,DOUBLE}_MAX
851 HS_{FLOAT,DOUBLE}_MAX_EXP
852 HS_{FLOAT,DOUBLE}_MAX_10_EXP
853 </ProgramListing>
854
855 </Para>
856 </ListItem>
857 <ListItem>
858
859 <Para>
860 It is guaranteed that Haskell's <Literal>False</Literal>/<Literal>True</Literal> map to
861 C's <Literal>0</Literal>/<Literal>1</Literal>, respectively, and vice versa. The mapping of
862 any other integral value to <Literal>Bool</Literal> is left unspecified.
863 </Para>
864 </ListItem>
865 <ListItem>
866
867 <Para>
868 To avoid name clashes, identifiers starting with <Literal>Hs</Literal> and
869 macros starting with <Literal>HS&lowbar;</Literal> are reserved for the FFI.
870 </Para>
871 </ListItem>
872 <ListItem>
873
874 <Para>
875 <Emphasis>GHC only:</Emphasis> The GHC specific types <Literal>ByteArray</Literal> and
876 <Literal>MutableByteArray</Literal> both map to <Literal>char*</Literal>.
877 </Para>
878 </ListItem>
879
880 </OrderedList>
881
882 </Para>
883
884 </Sect2>
885
886 <Sect2 id="sec-prim-remarks">
887 <Title>Some <Literal>foreign import</Literal> wrinkles
888 </Title>
889
890 <Para>
891
892 <ItemizedList>
893 <ListItem>
894
895 <Para>
896 By default, a <Literal>foreign import</Literal> function is <Emphasis>safe</Emphasis>. A safe
897 external function may cause a Haskell garbage collection as a result
898 of being called. This will typically happen when the imported
899 function end up calling Haskell functions that reside in the same
900 'Haskell world' (i.e., shares the same storage manager heap) -- see
901 Section <XRef LinkEnd="sec-entry"> for
902 details of how the FFI let's you call Haskell functions from the outside.
903
904 If the programmer can guarantee that the imported function won't
905 call back into Haskell, the <Literal>foreign import</Literal> can be marked as
906 'unsafe' (see Section <XRef LinkEnd="sec-primitive"> for details of
907 how to do this.)
908
909 Unsafe calls are cheaper than safe ones, so distinguishing the two
910 classes of external calls may be worth your while if you're extra
911 conscious about performance.
912
913 </Para>
914 </ListItem>
915 <ListItem>
916
917 <Para>
918 A <Literal>foreign import</Literal>ed function should clearly not need to know that
919 it is being called from Haskell. One consequence of this is that the
920 lifetimes of the arguments that are passed from Haskell <Emphasis>must</Emphasis>
921 equal that of a normal C call. For instance, for the following decl,
922
923
924 <ProgramListing>
925 foreign import "mumble" mumble :: ForeignObj -&#62; IO ()
926
927 f :: Addr -&#62; IO ()
928 f ptr = do
929   fo &#60;- newForeignObj ptr myFinalizer
930   mumble fo
931 </ProgramListing>
932
933
934 The <Literal>ForeignObj</Literal> must live across the call to <Function>mumble</Function> even if
935 it is not subsequently used/reachable. Why the insistence on this?
936 Consider what happens if <Function>mumble</Function> calls a function which calls back
937 into the Haskell world to execute a function, behind our back as it
938 were. This evaluation may possibly cause a garbage collection, with
939 the result that <Literal>fo</Literal> may end up being finalised.
940
941 By guaranteeing that <Literal>fo</Literal> will be considered live across the call
942 to <Function>mumble</Function>, the unfortunate situation where <Literal>fo</Literal> is finalised
943 (and hence the reference passed to <Function>mumble</Function> is suddenly no longer
944 valid) is avoided.
945
946
947 </Para>
948 </ListItem>
949
950 </ItemizedList>
951
952 </Para>
953
954 </Sect2>
955
956 </Sect1>
957
958 <Sect1 id="sec-prim-dynamic">
959 <Title>Invoking external functions via a pointer
960 </Title>
961
962 <Para>
963 A <Literal>foreign import</Literal> declaration imports an external 
964 function into Haskell. (The name of the external function
965 is statically known, but the loading/linking of it may very well
966 be delayed until run-time.) A <Literal>foreign import</Literal> declaration is then
967 (approximately) just a type cast of an external function with a
968 <Emphasis>statically known name</Emphasis>. 
969 </Para>
970
971 <Para>
972 An extension of <Literal>foreign import</Literal> is the support for <Emphasis>dynamic</Emphasis> type
973 casts of external names/addresses:
974 </Para>
975
976 <Para>
977
978 <ProgramListing>
979 topdecl 
980    : ...
981    ..
982    | 'foreign' 'import' [callconv] 'dynamic' ['unsafe']
983             varid :: Addr -&#62; (prim_args -&#62; IO prim_result)
984 </ProgramListing>
985
986 </Para>
987
988 <Para>
989 i.e., identical to a <Literal>foreign import</Literal> declaration, but for the
990 specification of <Literal>dynamic</Literal> instead of the name of an external
991 function. The presence of <Literal>dynamic</Literal> indicates that when an
992 application of <Literal>varid</Literal> is evaluated, the function pointed to by its
993 first argument will be invoked, passing it the rest of <Literal>varid</Literal>'s
994 arguments.
995 </Para>
996
997 <Para>
998 What are the uses of this? Native invocation of COM methods,
999 <Footnote>
1000 <Para>
1001 Or the interfacing to any other software component technologies.
1002 </Para>
1003 </Footnote>
1004 Haskell libraries that want to be dressed up as C libs (and hence may have
1005 to support C callbacks), Haskell code that need to dynamically load
1006 and execute code.
1007 </Para>
1008
1009 </Sect1>
1010
1011 <Sect1 id="sec-entry">
1012 <Title>Exposing Haskell functions
1013 </Title>
1014
1015 <Para>
1016 So far we've provided the Haskell programmer with ways of importing
1017 external functions into the Haskell world. The other half of the FFI
1018 coin is how to expose Haskell functionality to the outside world. So,
1019 dual to the <Literal>foreign import</Literal> declaration is <Literal>foreign export</Literal>:
1020 </Para>
1021
1022 <Para>
1023
1024 <ProgramListing>
1025 topdecl 
1026   : ...
1027   ..
1028   | 'foreign' 'export' callconv [ext_name] varid :: prim_type
1029 </ProgramListing>
1030
1031 </Para>
1032
1033 <Para>
1034 A <Literal>foreign export</Literal> declaration tells the compiler to expose a
1035 locally defined Haskell function to the outside world, i.e., wrap
1036 it up behind a calling interface that's useable from C. It is only
1037 permitted at the toplevel, where you have to specify the type at
1038 which you want to export the function, along with the calling
1039 convention to use. For instance, the following export declaration:
1040 </Para>
1041
1042 <Para>
1043
1044 <ProgramListing>
1045 foreign export ccall "foo" bar :: Int -&#62; Addr -&#62; IO Double
1046 </ProgramListing>
1047
1048 </Para>
1049
1050 <Para>
1051 will cause a Haskell system to generate the following C callable
1052 function:
1053 </Para>
1054
1055 <Para>
1056
1057 <ProgramListing>
1058 HsDouble foo(HsInt arg1, HsAddr arg2);
1059 </ProgramListing>
1060
1061 </Para>
1062
1063 <Para>
1064 When invoked, it will call the Haskell function <Function>bar</Function>, passing
1065 it the two arguments that was passed to <Function>foo()</Function>. 
1066 </Para>
1067
1068 <Para>
1069
1070 <ItemizedList>
1071 <ListItem>
1072
1073 <Para>
1074 The range of types that can be passed as arguments and results
1075 is restricted, since <Literal>varid</Literal> has got a <Literal>prim&lowbar;type</Literal>.
1076 </Para>
1077 </ListItem>
1078 <ListItem>
1079
1080 <Para>
1081 It is not possible to directly export operator symbols.
1082 </Para>
1083 </ListItem>
1084 <ListItem>
1085
1086 <Para>
1087 The type checker will verify that the type given for the
1088 <Literal>foreign export</Literal> declaration is compatible with the type given to
1089 function definition itself.  The type in the <Literal>foreign export</Literal> may
1090 be less general than that of the function itself.  For example,
1091 this is legal:
1092
1093
1094 <ProgramListing>
1095    f :: Num a =&#62; a -&#62; a
1096    foreign export ccall "fInt"   f :: Int -&#62; Int
1097    foreign export ccall "fFloat" f :: Float -&#62; Float
1098 </ProgramListing>
1099
1100
1101 These declarations export two C-callable procedures <Literal>fInt</Literal> and
1102 <Literal>fFloat</Literal>, both of which are implemented by the (overloaded)
1103 Haskell function <Function>f</Function>.
1104
1105 </Para>
1106 </ListItem>
1107 <ListItem>
1108
1109 <Para>
1110 The <Literal>foreign export</Literal>ed IO action must catch all exceptions, as
1111 the FFI does not address how to signal Haskell exceptions to the
1112 outside world.
1113 </Para>
1114 </ListItem>
1115
1116 </ItemizedList>
1117
1118 </Para>
1119
1120 <Sect2 id="sec-callback">
1121 <Title>Exposing Haskell function values
1122 </Title>
1123
1124 <Para>
1125 The <Literal>foreign export</Literal> declaration gives the C programmer access to
1126 statically defined Haskell functions. It does not allow you to
1127 conveniently expose dynamically-created Haskell function values as C
1128 function pointers though. To permit this, the FFI supports
1129 <Emphasis>dynamic</Emphasis> <Literal>foreign export</Literal>s:
1130 </Para>
1131
1132 <Para>
1133
1134 <ProgramListing>
1135 topdecl 
1136   : ...
1137   ..
1138   | 'foreign' 'export' [callconv] 'dynamic' varid :: prim_type -&#62; IO Addr
1139 </ProgramListing>
1140
1141 </Para>
1142
1143 <Para>
1144 A <Literal>foreign export dynamic</Literal> declaration declares a C function
1145 pointer <Emphasis>generator</Emphasis>. Given a Haskell function value of some restricted
1146 type, the generator wraps it up behind an externally callable interface,
1147 returning an <Literal>Addr</Literal> to an externally callable (C) function pointer.
1148 </Para>
1149
1150 <Para>
1151 When that function pointer is eventually called, the corresponding
1152 Haskell function value is applied to the function pointer's arguments
1153 and evaluated, returning the result (if any) back to the caller.
1154 </Para>
1155
1156 <Para>
1157 The mapping between the argument to a <Literal>foreign export dynamic</Literal>
1158 declaration and its corresponding C function pointer type, is as
1159 follows:
1160 </Para>
1161
1162 <Para>
1163
1164 <ProgramListing>
1165 typedef cType[[Res]] (*Varid_FunPtr)
1166         (cType[[Ty_1]] ,.., cType[[Ty_n]]);
1167 </ProgramListing>
1168
1169 </Para>
1170
1171 <Para>
1172 where <Literal>cType[[]]</Literal> is the Haskell to C type mapping presented
1173 in Section <XRef LinkEnd="sec-mapping">.
1174 </Para>
1175
1176 <Para>
1177 To make it all a bit more concrete, here's an example:
1178 </Para>
1179
1180 <Para>
1181
1182 <ProgramListing>
1183 foreign export dynamic mkCallback :: (Int -&#62; IO Int) -&#62; IO Addr
1184
1185 foreign import registerCallback :: Addr -&#62; IO ()
1186
1187 exportCallback :: (Int -&#62; IO Int) -&#62; IO ()
1188 exportCallback f = do
1189   fx &#60;- mkCallback f
1190   registerCallback fx
1191 </ProgramListing>
1192
1193 </Para>
1194
1195 <Para>
1196 The <Literal>exportCallback</Literal> lets you register a Haskell function value as
1197 a callback function to some external library. The C type of the
1198 callback that the external library expects in <Literal>registerCallback()</Literal>,
1199 is:
1200 <Footnote>
1201 <Para>
1202 An FFI implementation is encouraged to generate the C typedef corresponding
1203 to a <Literal>foreign export dynamic</Literal> declaration, but isn't required
1204 to do so.
1205 </Para>
1206 </Footnote>
1207
1208 </Para>
1209
1210 <Para>
1211
1212 <ProgramListing>
1213 typedef HsInt (*mkCallback_FunPtr) (HsInt arg1);
1214 </ProgramListing>
1215
1216 </Para>
1217
1218 <Para>
1219 Creating the view of a Haskell closure as a C function pointer entails
1220 registering the Haskell closure as a 'root' with the underlying
1221 Haskell storage system, so that it won't be garbage collected. The FFI
1222 implementation takes care of this, but when the outside world is
1223 through with using a C function pointer generated by a <Literal>foreign
1224 export dynamic</Literal> declaration, it needs to be explicitly freed. This is
1225 done by calling:
1226 </Para>
1227
1228 <Para>
1229
1230 <ProgramListing>
1231 void freeHaskellFunctionPtr(void *ptr);
1232 </ProgramListing>
1233
1234 </Para>
1235
1236 <Para>
1237 In the event you need to free these function pointers from within
1238 Haskell, a standard 'foreign import'ed binding of the above C entry
1239 point is also provided,
1240 </Para>
1241
1242 <Para>
1243
1244 <ProgramListing>
1245 Foreign.freeHaskellFunctionPtr :: Addr -&#62; IO ()
1246 </ProgramListing>
1247
1248 </Para>
1249
1250 </Sect2>
1251
1252 <Sect2 id="sec-foreign-label">
1253 <Title>Code addresses
1254 </Title>
1255
1256 <Para>
1257 The <Literal>foreign import</Literal> declaration allows us to invoke an external
1258 function by name from within the comforts of the Haskell world, while
1259 <Literal>foreign import dynamic</Literal> lets us invoke an external function by
1260 address. However, there's no way of getting at the code address of
1261 some particular external label though, which is at times useful,
1262 e.g. for the construction of method tables for, say, Haskell COM
1263 components. To support this, the FFI has got <Literal>foreign label</Literal>s:
1264 </Para>
1265
1266 <Para>
1267
1268 <ProgramListing>
1269 foreign label "freeAtLast" addrOf_freeAtLast :: Addr
1270 </ProgramListing>
1271
1272 </Para>
1273
1274 <Para>
1275 The meaning of this declaration is that <Literal>addrOf&lowbar;freeAtLast</Literal> will now
1276 contain the address of the label <Literal>freeAtLast</Literal>.
1277 </Para>
1278
1279 </Sect2>
1280
1281 </Sect1>
1282 <!-- This doesn't need to be seen in the docs
1283 <Sect1 id="sec-changelog">
1284 <Title>Change history
1285 </Title>
1286
1287 <Para>
1288
1289 <ItemizedList>
1290 <ListItem>
1291
1292 <Para>
1293 0.95 &gt; 0.96:
1294
1295 <ItemizedList>
1296 <ListItem>
1297
1298 <Para>
1299 changed the C representation of <Literal>Haskell&lowbar;ForeignObj</Literal> from
1300 <Literal>(long*)</Literal> to <Literal>(void*)</Literal>  ANSI C guarantees that <Literal>(void*)</Literal>
1301 is the widest possible data pointer.
1302 </Para>
1303 </ListItem>
1304 <ListItem>
1305
1306 <Para>
1307 Updated defnition of <Literal>varid</Literal> in Section
1308 <XRef LinkEnd="sec-prim-name"> to reflect Haskell98's.
1309 </Para>
1310 </ListItem>
1311 <ListItem>
1312
1313 <Para>
1314 Replaced confusing uses of <Literal>stdcall</Literal> with <Literal>ccall</Literal>.
1315 </Para>
1316 </ListItem>
1317
1318 </ItemizedList>
1319
1320 </Para>
1321 </ListItem>
1322 <ListItem>
1323
1324 <Para>
1325 0.96 &gt; 0.97:
1326
1327 <ItemizedList>
1328 <ListItem>
1329
1330 <Para>
1331 Simplified the calling convention section, support for Pascal (and
1332 fastcall) calling conventions dropped. 
1333 </Para>
1334 </ListItem>
1335 <ListItem>
1336
1337 <Para>
1338 Clarified that the arguments to a safe <Literal>foreign import</Literal> must have
1339 lifetimes that equal that of a C function application.
1340 </Para>
1341 </ListItem>
1342 <ListItem>
1343
1344 <Para>
1345 Outlawed the use of the (GHC specific) types <Literal>ByteArray</Literal>
1346 and <Literal>MutableByteArray</Literal> in safe <Literal>foreign import</Literal>s.
1347 </Para>
1348 </ListItem>
1349 <ListItem>
1350
1351 <Para>
1352 Added a note that support for the use of unboxed types in
1353 <Literal>foreign import</Literal> may be withdrawn/deprecated sometime in the future.
1354 </Para>
1355 </ListItem>
1356 <ListItem>
1357
1358 <Para>
1359 Simplified section which sketches a possible implementation.
1360 </Para>
1361 </ListItem>
1362 <ListItem>
1363
1364 <Para>
1365 Use <Literal>Hs</Literal> as prefix for the typedefs for the primitive Haskell
1366 FFI types rather than the longer <Literal>Haskell&lowbar;</Literal>.
1367 </Para>
1368 </ListItem>
1369
1370 </ItemizedList>
1371
1372 </Para>
1373 </ListItem>
1374 <ListItem>
1375
1376 <Para>
1377 0.97 &gt; 0.98:
1378
1379 <ItemizedList>
1380 <ListItem>
1381
1382 <Para>
1383 Leave out implementation section; of limited interest.
1384 </Para>
1385 </ListItem>
1386 <ListItem>
1387
1388 <Para>
1389 Outlined the criteria used to decide on what calling
1390 conventions to support.
1391 </Para>
1392 </ListItem>
1393 <ListItem>
1394
1395 <Para>
1396 Include <Literal>newtype</Literal>s that wrap primitive types in the list
1397 of types that can be both passed to and returned from external
1398 functions.
1399 </Para>
1400 </ListItem>
1401
1402 </ItemizedList>
1403
1404 </Para>
1405 </ListItem>
1406 <ListItem>
1407
1408 <Para>
1409 0.98 &gt; 0.99:
1410
1411 <ItemizedList>
1412 <ListItem>
1413
1414 <Para>
1415 Updated the section on type mapping to integrate some comments
1416 from people on &lt;ffi@haskell.org&gt; (a fair chunk of the text
1417 in that section was contributed by Sven Panne.)
1418 </Para>
1419 </ListItem>
1420 <ListItem>
1421
1422 <Para>
1423 <Function>freeHaskellFunctionPtr</Function> should belong to module <Literal>Foreign</Literal>, not <Literal>IOExts</Literal>.
1424 </Para>
1425 </ListItem>
1426
1427 </ItemizedList>
1428
1429
1430 </Para>
1431 </ListItem>
1432 <ListItem>
1433
1434 <Para>
1435 0.99 &gt; 0.99.1:
1436
1437 <ItemizedList>
1438 <ListItem>
1439
1440 <Para>
1441 <Literal>Bool</Literal> is now an FFI-supported type (i.e., added it to
1442 <Literal>ext&lowbar;ty</Literal>.)
1443 </Para>
1444 </ListItem>
1445
1446 </ItemizedList>
1447
1448
1449 </Para>
1450 </ListItem>
1451
1452 </ItemizedList>
1453
1454 </Para>
1455
1456 </Sect1>
1457 -->