remove empty dir
[ghc-hetmet.git] / ghc / compiler / deSugar / DsForeign.lhs
index 65d0607..52956a0 100644 (file)
@@ -9,43 +9,50 @@ Expanding out @foreign import@ and @foreign export@ declarations.
 module DsForeign ( dsForeigns ) where
 
 #include "HsVersions.h"
+import TcRnMonad       -- temp
 
 import CoreSyn
 
-import DsCCall         ( dsCCall, mkCCall, boxResult, unboxArg )
+import DsCCall         ( dsCCall, mkFCall, boxResult, unboxArg, resultWrapper )
 import DsMonad
-import DsUtils
 
-import HsSyn           ( ExtName(..), ForeignDecl(..), isDynamicExtName, ForKind(..) )
-import HsDecls         ( extNameStatic )
-import CallConv
-import TcHsSyn         ( TypecheckedForeignDecl )
+import HsSyn           ( ForeignDecl(..), ForeignExport(..), LForeignDecl,
+                         ForeignImport(..), CImportSpec(..) )
+import DataCon         ( splitProductType_maybe )
+#ifdef DEBUG
+import DataCon         ( dataConSourceArity )
+import Type            ( isUnLiftedType )
+#endif
+import MachOp          ( machRepByteWidth, MachRep(..) )
+import SMRep           ( argMachRep, typeCgRep )
 import CoreUtils       ( exprType, mkInlineMe )
-import DataCon         ( DataCon, dataConWrapId )
-import Id              ( Id, idType, idName, mkWildId, mkVanillaId )
-import MkId            ( mkWorkerId )
-import Literal         ( Literal(..) )
-import Module          ( Module, moduleUserString )
-import Name            ( mkGlobalName, nameModule, nameOccName, getOccString, 
-                         mkForeignExportOcc, isLocalName,
-                         NamedThing(..), Provenance(..), ExportFlag(..)
+import Id              ( Id, idType, idName, mkSysLocal, setInlinePragma )
+import Literal         ( Literal(..), mkStringLit )
+import Module          ( moduleFS )
+import Name            ( getOccString, NamedThing(..) )
+import Type            ( repType, coreEqType )
+import TcType          ( Type, mkFunTys, mkForAllTys, mkTyConApp,
+                         mkFunTy, tcSplitTyConApp_maybe, 
+                         tcSplitForAllTys, tcSplitFunTys, tcTyConAppArgs,
                        )
-import PrelInfo                ( deRefStablePtr_NAME, returnIO_NAME, bindIO_NAME, makeStablePtr_NAME )
-import Type            ( unUsgTy,
-                         splitTyConApp_maybe, splitFunTys, splitForAllTys,
-                         Type, mkFunTys, mkForAllTys, mkTyConApp,
-                         mkTyVarTy, mkFunTy, splitAppTy, applyTy, funResultTy
-                       )
-import PprType         ( {- instance Outputable Type -} )
-import PrimOp          ( PrimOp(..), CCall(..), CCallTarget(..) )
-import Var             ( TyVar )
-import TysPrim         ( realWorldStatePrimTy, addrPrimTy )
-import TysWiredIn      ( unitTy, addrTy, stablePtrTyCon,
-                         unboxedTupleCon, addrDataCon
+
+import BasicTypes       ( Boxity(..) )
+import HscTypes                ( ForeignStubs(..) )
+import ForeignCall     ( ForeignCall(..), CCallSpec(..), 
+                         Safety(..), playSafe,
+                         CExportSpec(..), CLabelString,
+                         CCallConv(..), ccallConvToInt,
+                         ccallConvAttribute
                        )
-import Unique
-import Maybes          ( maybeToBool )
+import TysWiredIn      ( unitTy, tupleTyCon )
+import TysPrim         ( addrPrimTy, mkStablePtrPrimTy, alphaTy )
+import PrelNames       ( hasKey, ioTyConKey, stablePtrTyConName, newStablePtrName, bindIOName,
+                         checkDotnetResName )
+import BasicTypes      ( Activation( NeverActive ) )
+import SrcLoc          ( Located(..), unLoc )
 import Outputable
+import Maybe           ( fromJust, isNothing )
+import FastString
 \end{code}
 
 Desugaring of @foreign@ declarations is naturally split up into
@@ -62,46 +69,56 @@ is the same as
 so we reuse the desugaring code in @DsCCall@ to deal with these.
 
 \begin{code}
-dsForeigns :: Module
-           -> [TypecheckedForeignDecl] 
-          -> DsM ( [CoreBind]        -- desugared foreign imports
-                  , [CoreBind]        -- helper functions for foreign exports
-                 , SDoc              -- Header file prototypes for
-                                      -- "foreign exported" functions.
-                 , SDoc              -- C stubs to use when calling
-                                      -- "foreign exported" functions.
-                 )
-dsForeigns mod_name fos = foldlDs combine ([],[],empty,empty) fos
+type Binding = (Id, CoreExpr)  -- No rec/nonrec structure;
+                               -- the occurrence analyser will sort it all out
+
+dsForeigns :: [LForeignDecl Id] 
+          -> DsM (ForeignStubs, [Binding])
+dsForeigns [] 
+  = returnDs (NoStubs, [])
+dsForeigns fos
+  = foldlDs combine (ForeignStubs empty empty [] [], []) fos
  where
-  combine (acc_fi, acc_fe, acc_h, acc_c) fo@(ForeignDecl i imp_exp _ ext_nm cconv _) 
-    | isForeignImport =   -- foreign import (dynamic)?
-        dsFImport i (idType i) uns ext_nm cconv  `thenDs` \ bs -> 
-       returnDs (bs ++ acc_fi, acc_fe, acc_h, acc_c)
-    | isForeignLabel = 
-        dsFLabel i ext_nm `thenDs` \ b -> 
-       returnDs (b:acc_fi, acc_fe, acc_h, acc_c)
-    | isDynamicExtName ext_nm =
-        dsFExportDynamic i (idType i) mod_name ext_nm cconv  `thenDs` \ (fi,fe,h,c) -> 
-       returnDs (fi:acc_fi, fe:acc_fe, h $$ acc_h, c $$ acc_c)
-
-    | otherwise               =  -- foreign export
-        dsFExport i (idType i) mod_name ext_nm cconv False   `thenDs` \ (fe,h,c) ->
-       returnDs (acc_fi, fe:acc_fe, h $$ acc_h, c $$ acc_c)
-   where
-    isForeignImport = 
-       case imp_exp of
-         FoImport _ -> True
-         _          -> False
-
-    isForeignLabel = 
-       case imp_exp of
-         FoLabel -> True
-         _       -> False
-
-    (FoImport uns)   = imp_exp
-
+  combine stubs (L loc decl) = putSrcSpanDs loc (combine1 stubs decl)
+
+  combine1 (ForeignStubs acc_h acc_c acc_hdrs acc_feb, acc_f) 
+          (ForeignImport id _ spec depr)
+    = traceIf (text "fi start" <+> ppr id)     `thenDs` \ _ ->
+      dsFImport (unLoc id) spec                        `thenDs` \ (bs, h, c, mbhd) -> 
+      warnDepr depr                            `thenDs` \ _                ->
+      traceIf (text "fi end" <+> ppr id)       `thenDs` \ _ ->
+      returnDs (ForeignStubs (h $$ acc_h)
+                            (c $$ acc_c)
+                            (addH mbhd acc_hdrs)
+                            acc_feb, 
+               bs ++ acc_f)
+
+  combine1 (ForeignStubs acc_h acc_c acc_hdrs acc_feb, acc_f) 
+          (ForeignExport (L _ id) _ (CExport (CExportStatic ext_nm cconv)) depr)
+    = dsFExport id (idType id) 
+               ext_nm cconv False                 `thenDs` \(h, c, _, _) ->
+      warnDepr depr                               `thenDs` \_              ->
+      returnDs (ForeignStubs (h $$ acc_h) (c $$ acc_c) acc_hdrs (id:acc_feb), 
+               acc_f)
+
+  addH Nothing  ls = ls
+  addH (Just e) ls
+   | e `elem` ls = ls
+   | otherwise   = e:ls
+
+  warnDepr False = returnDs ()
+  warnDepr True  = dsWarn msg
+     where
+       msg = ptext SLIT("foreign declaration uses deprecated non-standard syntax")
 \end{code}
 
+
+%************************************************************************
+%*                                                                     *
+\subsection{Foreign import}
+%*                                                                     *
+%************************************************************************
+
 Desugaring foreign imports is just the matter of creating a binding
 that on its RHS unboxes its arguments, performs the external call
 (using the @CCallOp@ primop), before boxing the result up and returning it.
@@ -119,57 +136,134 @@ However, we create a worker/wrapper pair, thus:
 The strictness/CPR analyser won't do this automatically because it doesn't look
 inside returned tuples; but inlining this wrapper is a Really Good Idea 
 because it exposes the boxing to the call site.
-                       
 
 \begin{code}
 dsFImport :: Id
-         -> Type               -- Type of foreign import.
-         -> Bool               -- True <=> might cause Haskell GC
-         -> ExtName
-         -> CallConv
-         -> DsM [CoreBind]
-dsFImport fn_id ty may_not_gc ext_name cconv 
+         -> ForeignImport
+         -> DsM ([Binding], SDoc, SDoc, Maybe FastString)
+dsFImport id (CImport cconv safety header lib spec)
+  = dsCImport id spec cconv safety no_hdrs       `thenDs` \(ids, h, c) ->
+    returnDs (ids, h, c, if no_hdrs then Nothing else Just header)
+  where
+    no_hdrs = nullFS header
+
+  -- FIXME: the `lib' field is needed for .NET ILX generation when invoking
+  --       routines that are external to the .NET runtime, but GHC doesn't
+  --       support such calls yet; if `nullFastString lib', the value was not given
+dsFImport id (DNImport spec)
+  = dsFCall id (DNCall spec) True {- No headers -} `thenDs` \(ids, h, c) ->
+    returnDs (ids, h, c, Nothing)
+
+dsCImport :: Id
+         -> CImportSpec
+         -> CCallConv
+         -> Safety
+         -> Bool       -- True <=> no headers in the f.i decl
+         -> DsM ([Binding], SDoc, SDoc)
+dsCImport id (CLabel cid) _ _ no_hdrs
+ = resultWrapper (idType id) `thenDs` \ (resTy, foRhs) ->
+   ASSERT(fromJust resTy `coreEqType` addrPrimTy)    -- typechecker ensures this
+    let rhs = foRhs (mkLit (MachLabel cid Nothing)) in
+    returnDs ([(setImpInline no_hdrs id, rhs)], empty, empty)
+dsCImport id (CFunction target) cconv safety no_hdrs
+  = dsFCall id (CCall (CCallSpec target cconv safety)) no_hdrs
+dsCImport id CWrapper cconv _ _
+  = dsFExportDynamic id cconv
+
+setImpInline :: Bool   -- True <=> No #include headers 
+                       -- in the foreign import declaration
+            -> Id -> Id
+-- If there is a #include header in the foreign import
+-- we make the worker non-inlinable, because we currently
+-- don't keep the #include stuff in the CCallId, and hence
+-- it won't be visible in the importing module, which can be
+-- fatal. 
+-- (The #include stuff is just collected from the foreign import
+--  decls in a module.)
+-- If you want to do cross-module inlining of the c-calls themselves,
+-- put the #include stuff in the package spec, not the foreign 
+-- import decl.
+setImpInline True  id = id
+setImpInline False id = id `setInlinePragma` NeverActive
+\end{code}
+
+
+%************************************************************************
+%*                                                                     *
+\subsection{Foreign calls}
+%*                                                                     *
+%************************************************************************
+
+\begin{code}
+dsFCall fn_id fcall no_hdrs
   = let
-       (tvs, fun_ty)        = splitForAllTys ty
-       (arg_tys, io_res_ty) = splitFunTys fun_ty
+       ty                   = idType fn_id
+       (tvs, fun_ty)        = tcSplitForAllTys ty
+       (arg_tys, io_res_ty) = tcSplitFunTys fun_ty
+               -- Must use tcSplit* functions because we want to 
+               -- see that (IO t) in the corner
     in
     newSysLocalsDs arg_tys                     `thenDs` \ args ->
     mapAndUnzipDs unboxArg (map Var args)      `thenDs` \ (val_args, arg_wrappers) ->
-    boxResult io_res_ty                                `thenDs` \ (ccall_result_ty, res_wrapper) ->
 
-    (case ext_name of
-       Dynamic       -> getUniqueDs `thenDs` \ u -> 
-                       returnDs (DynamicTarget u)
-       ExtName fs _  -> returnDs (StaticTarget fs))    `thenDs` \ lbl ->
+    let
+       work_arg_ids  = [v | Var v <- val_args] -- All guaranteed to be vars
+
+       forDotnet = 
+        case fcall of
+          DNCall{} -> True
+          _        -> False
+
+       topConDs
+         | forDotnet = 
+            dsLookupGlobalId checkDotnetResName `thenDs` \ check_id -> 
+            return (Just check_id)
+          | otherwise = return Nothing
+            
+       augmentResultDs
+         | forDotnet = 
+               newSysLocalDs addrPrimTy `thenDs` \ err_res -> 
+               returnDs (\ (mb_res_ty, resWrap) ->
+                             case mb_res_ty of
+                               Nothing -> (Just (mkTyConApp (tupleTyCon Unboxed 1)
+                                                            [ addrPrimTy ]),
+                                                resWrap)
+                               Just x  -> (Just (mkTyConApp (tupleTyCon Unboxed 2)
+                                                            [ x, addrPrimTy ]),
+                                                resWrap))
+         | otherwise = returnDs id
+    in
+    augmentResultDs                                 `thenDs` \ augment -> 
+    topConDs                                        `thenDs` \ topCon -> 
+    boxResult augment topCon io_res_ty `thenDs` \ (ccall_result_ty, res_wrapper) ->
 
-    getUniqueDs                                                `thenDs` \ ccall_uniq ->
-    getUniqueDs                                                `thenDs` \ work_uniq ->
+    newUnique                                  `thenDs` \ ccall_uniq ->
+    newUnique                                  `thenDs` \ work_uniq ->
     let
        -- Build the worker
-       work_arg_ids  = [v | Var v <- val_args]         -- All guaranteed to be vars
        worker_ty     = mkForAllTys tvs (mkFunTys (map idType work_arg_ids) ccall_result_ty)
-       the_ccall     = CCall lbl False (not may_not_gc) cconv
-       the_ccall_app = mkCCall ccall_uniq the_ccall val_args ccall_result_ty
+       the_ccall_app = mkFCall ccall_uniq fcall val_args ccall_result_ty
        work_rhs      = mkLams tvs (mkLams work_arg_ids the_ccall_app)
-       work_id       = mkWorkerId work_uniq fn_id worker_ty
+       work_id       = setImpInline no_hdrs $  -- See comments with setImpInline
+                       mkSysLocal FSLIT("$wccall") work_uniq worker_ty
 
        -- Build the wrapper
        work_app     = mkApps (mkVarApps (Var work_id) tvs) val_args
        wrapper_body = foldr ($) (res_wrapper work_app) arg_wrappers
         wrap_rhs     = mkInlineMe (mkLams (tvs ++ args) wrapper_body)
     in
-    returnDs [NonRec fn_id wrap_rhs, NonRec work_id work_rhs]
+    returnDs ([(work_id, work_rhs), (fn_id, wrap_rhs)], empty, empty)
+
+unsafe_call (CCall (CCallSpec _ _ safety)) = playSafe safety
+unsafe_call (DNCall _)                    = False
 \end{code}
 
-Foreign labels 
 
-\begin{code}
-dsFLabel :: Id -> ExtName -> DsM CoreBind
-dsFLabel nm ext_name = returnDs (NonRec nm fo_rhs)
-  where
-   fo_rhs = mkConApp addrDataCon [mkLit (MachLitLit enm addrPrimTy)]
-   enm    = extNameStatic ext_name
-\end{code}
+%************************************************************************
+%*                                                                     *
+\subsection{Foreign export}
+%*                                                                     *
+%************************************************************************
 
 The function that does most of the work for `@foreign export@' declarations.
 (see below for the boilerplate code a `@foreign export@' declaration expands
@@ -183,113 +277,51 @@ For each `@foreign export foo@' in a module M we generate:
 the user-written Haskell function `@M.foo@'.
 
 \begin{code}
-dsFExport :: Id
-         -> Type               -- Type of foreign export.
-         -> Module
-         -> ExtName
-         -> CallConv
-         -> Bool               -- True => invoke IO action that's hanging off 
-                               -- the first argument's stable pointer
-         -> DsM ( CoreBind
-                , SDoc
-                , SDoc
+dsFExport :: Id                        -- Either the exported Id, 
+                               -- or the foreign-export-dynamic constructor
+         -> Type               -- The type of the thing callable from C
+         -> CLabelString       -- The name to export to C land
+         -> CCallConv
+         -> Bool               -- True => foreign export dynamic
+                               --         so invoke IO action that's hanging off 
+                               --         the first argument's stable pointer
+         -> DsM ( SDoc         -- contents of Module_stub.h
+                , SDoc         -- contents of Module_stub.c
+                , [MachRep]    -- primitive arguments expected by stub function
+                , Int          -- size of args to stub function
                 )
-dsFExport fn_id ty mod_name ext_name cconv isDyn
-  =    -- BUILD THE returnIO WRAPPER, if necessary
-       -- Look at the result type of the exported function, orig_res_ty
-       -- If it's IO t, return         (\x.x,          IO t, t)
-       -- If it's plain t, return      (\x.returnIO x, IO t, t)
-     (case splitTyConApp_maybe orig_res_ty of
-       Just (ioTyCon, [res_ty])
-             -> ASSERT( getUnique ioTyCon == ioTyConKey )
-                       -- The function already returns IO t
-                returnDs (\body -> body, orig_res_ty, res_ty)
-
-       other ->        -- The function returns t, so wrap the call in returnIO
-                dsLookupGlobalValue returnIO_NAME      `thenDs` \ retIOId ->
-                returnDs (\body -> mkApps (Var retIOId) [Type orig_res_ty, body],
-                          funResultTy (applyTy (idType retIOId) orig_res_ty), 
-                               -- We don't have ioTyCon conveniently to hand
-                          orig_res_ty)
-
-     )         `thenDs` \ (return_io_wrapper,  -- Either identity or returnIO
-                           io_res_ty,          -- IO t
-                           res_ty) ->          -- t
-
-
-       -- BUILD THE deRefStablePtr WRAPPER, if necessary
-     (if isDyn then 
-        newSysLocalDs stbl_ptr_ty                      `thenDs` \ stbl_ptr ->
-       newSysLocalDs stbl_ptr_to_ty                    `thenDs` \ stbl_value ->
-       dsLookupGlobalValue deRefStablePtr_NAME         `thenDs` \ deRefStablePtrId ->
-       let
-        the_deref_app = mkApps (Var deRefStablePtrId)
-                               [ Type stbl_ptr_to_ty, Var stbl_ptr ]
-        in
-        dsLookupGlobalValue bindIO_NAME                         `thenDs` \ bindIOId ->
-       let
-        stbl_app cont = mkApps (Var bindIOId)
-                               [ Type stbl_ptr_to_ty
-                               , Type res_ty
-                               , the_deref_app
-                               , mkLams [stbl_value] cont]
-        in
-       returnDs (stbl_value, stbl_app, stbl_ptr)
-      else
-        returnDs (fn_id, 
-                 \ body -> body,
-                 panic "stbl_ptr"  -- should never be touched.
-                 ))                    `thenDs` \ (i, getFun_wrapper, stbl_ptr) ->
-
-
-       -- BUILD THE HELPER
-     getModuleDs                       `thenDs` \ mod -> 
-     getUniqueDs                       `thenDs` \ uniq ->
-     getSrcLocDs                       `thenDs` \ src_loc ->
-     newSysLocalsDs fe_arg_tys         `thenDs` \ fe_args ->
+
+dsFExport fn_id ty ext_name cconv isDyn
+   = 
      let
-        wrapper_args | isDyn      = stbl_ptr:fe_args
-                    | otherwise  = fe_args
-
-        wrapper_arg_tys | isDyn      = stbl_ptr_ty:fe_arg_tys
-                       | otherwise  = fe_arg_tys
-
-       helper_ty =  mkForAllTys tvs $
-                    mkFunTys wrapper_arg_tys io_res_ty
-
-       f_helper_glob = mkVanillaId helper_name helper_ty
-                     where
-                       name                = idName fn_id
-                       mod     
-                        | isLocalName name = mod_name
-                        | otherwise        = nameModule name
-
-                       occ                 = mkForeignExportOcc (nameOccName name)
-                       prov                = LocalDef src_loc Exported
-                       helper_name         = mkGlobalName uniq mod occ prov
-
-       the_app = getFun_wrapper (return_io_wrapper (mkVarApps (Var i) (tvs ++ fe_args)))
-       the_body = mkLams (tvs ++ wrapper_args) the_app
-       c_nm     = extNameStatic ext_name
-  
-       (h_stub, c_stub) = fexportEntry (moduleUserString mod)
-                                     c_nm f_helper_glob
-                                      wrapper_arg_tys res_ty cconv isDyn
+        (_tvs,sans_foralls)            = tcSplitForAllTys ty
+        (fe_arg_tys', orig_res_ty)     = tcSplitFunTys sans_foralls
+       -- We must use tcSplits here, because we want to see 
+       -- the (IO t) in the corner of the type!
+        fe_arg_tys | isDyn     = tail fe_arg_tys'
+                   | otherwise = fe_arg_tys'
      in
-     returnDs (NonRec f_helper_glob the_body, h_stub, c_stub)
-
-  where
-   (tvs,sans_foralls)                  = splitForAllTys ty
-   (fe_arg_tys', orig_res_ty)          = splitFunTys sans_foralls
-
-   (_, stbl_ptr_ty')                   = splitForAllTys stbl_ptr_ty
-   (_, stbl_ptr_to_ty)                 = splitAppTy stbl_ptr_ty'
-
-   fe_arg_tys | isDyn    = tail fe_arg_tys'
-             | otherwise = fe_arg_tys'
+       -- Look at the result type of the exported function, orig_res_ty
+       -- If it's IO t, return         (t, True)
+       -- If it's plain t, return      (t, False)
+     (case tcSplitTyConApp_maybe orig_res_ty of
+       -- We must use tcSplit here so that we see the (IO t) in
+       -- the type.  [IO t is transparent to plain splitTyConApp.]
 
-   stbl_ptr_ty | isDyn     = head fe_arg_tys'
-              | otherwise = error "stbl_ptr_ty"
+       Just (ioTyCon, [res_ty])
+             -> ASSERT( ioTyCon `hasKey` ioTyConKey )
+                -- The function already returns IO t
+                returnDs (res_ty, True)
+
+       other -> -- The function returns t
+                returnDs (orig_res_ty, False)
+     )
+                                       `thenDs` \ (res_ty,             -- t
+                                                   is_IO_res_ty) ->    -- Bool
+     returnDs $
+       mkFExportCBits ext_name 
+                      (if isDyn then Nothing else Just fn_id)
+                      fe_arg_tys res_ty is_IO_res_ty cconv
 \end{code}
 
 @foreign export dynamic@ lets you dress up Haskell IO actions
@@ -297,24 +329,17 @@ of some fixed type behind an externally callable interface (i.e.,
 as a C function pointer). Useful for callbacks and stuff.
 
 \begin{verbatim}
-foreign export stdcall f :: (Addr -> Int -> IO Int) -> IO Addr
+foreign export dynamic f :: (Addr -> Int -> IO Int) -> IO Addr
 
--- Haskell-visible constructor, which is generated from the
--- above:
+-- Haskell-visible constructor, which is generated from the above:
+-- SUP: No check for NULL from createAdjustor anymore???
 
 f :: (Addr -> Int -> IO Int) -> IO Addr
-f cback = IO ( \ s1# ->
-  case makeStablePtr# cback s1# of { StateAndStablePtr# s2# sp# ->
-  case _ccall_ "mkAdjustor" sp# ``f_helper'' s2# of
-    StateAndAddr# s3# a# ->
-    case addr2Int# a# of
-      0# -> IOfail s# err
-      _  -> 
-        let
-         a :: Addr
-         a = A# a#
-        in
-         IOok s3# a)
+f cback =
+   bindIO (newStablePtr cback)
+          (\StablePtr sp# -> IO (\s1# ->
+              case _ccall_ createAdjustor cconv sp# ``f_helper'' s1# of
+                 (# s2#, a# #) -> (# s2#, A# a# #)))
 
 foreign export "f_helper" f_helper :: StablePtr (Addr -> Int -> IO Int) -> Addr -> Int -> IO Int
 -- `special' foreign export that invokes the closure pointed to by the
@@ -323,36 +348,34 @@ foreign export "f_helper" f_helper :: StablePtr (Addr -> Int -> IO Int) -> Addr
 
 \begin{code}
 dsFExportDynamic :: Id
-                -> Type                -- Type of foreign export.
-                -> Module
-                -> ExtName
-                -> CallConv
-                -> DsM (CoreBind, CoreBind, SDoc, SDoc)
-dsFExportDynamic i ty mod_name ext_name cconv =
-     newSysLocalDs ty                                   `thenDs` \ fe_id ->
+                -> CCallConv
+                -> DsM ([Binding], SDoc, SDoc)
+dsFExportDynamic id cconv
+  =  newSysLocalDs ty                           `thenDs` \ fe_id ->
+     getModuleDs                               `thenDs` \ mod_name -> 
      let 
         -- hack: need to get at the name of the C stub we're about to generate.
-       fe_nm      = toCName fe_id
-       fe_ext_name = ExtName (_PK_ fe_nm) Nothing
+       fe_nm      = mkFastString (unpackFS (zEncodeFS (moduleFS mod_name)) ++ "_" ++ toCName fe_id)
      in
-     dsFExport  i export_ty mod_name fe_ext_name cconv True
-     `thenDs` \ (fe@(NonRec fe_helper fe_expr), h_code, c_code) ->
      newSysLocalDs arg_ty                      `thenDs` \ cback ->
-     dsLookupGlobalValue makeStablePtr_NAME    `thenDs` \ makeStablePtrId ->
+     dsLookupGlobalId newStablePtrName         `thenDs` \ newStablePtrId ->
+     dsLookupTyCon stablePtrTyConName          `thenDs` \ stable_ptr_tycon ->
      let
-       mk_stbl_ptr_app    = mkApps (Var makeStablePtrId) [ Type arg_ty, Var cback ]
+       mk_stbl_ptr_app = mkApps (Var newStablePtrId) [ Type arg_ty, Var cback ]
+       stable_ptr_ty   = mkTyConApp stable_ptr_tycon [arg_ty]
+       export_ty       = mkFunTy stable_ptr_ty arg_ty
      in
-     dsLookupGlobalValue bindIO_NAME                   `thenDs` \ bindIOId ->
-     newSysLocalDs (mkTyConApp stablePtrTyCon [arg_ty]) `thenDs` \ stbl_value ->
+     dsLookupGlobalId bindIOName               `thenDs` \ bindIOId ->
+     newSysLocalDs stable_ptr_ty               `thenDs` \ stbl_value ->
+     dsFExport id export_ty fe_nm cconv True   
+               `thenDs` \ (h_code, c_code, arg_reps, args_size) ->
      let
-      stbl_app cont ret_ty 
-       = mkApps (Var bindIOId)
-                [ Type (mkTyConApp stablePtrTyCon [arg_ty])
-                , Type ret_ty
-                , mk_stbl_ptr_app
-                , cont
-                ]
-
+      stbl_app cont ret_ty = mkApps (Var bindIOId)
+                                   [ Type stable_ptr_ty
+                                   , Type ret_ty       
+                                   , mk_stbl_ptr_app
+                                   , cont
+                                   ]
        {-
         The arguments to the external function which will
        create a little bit of (template) code on the fly
@@ -360,36 +383,50 @@ dsFExportDynamic i ty mod_name ext_name cconv =
        to be entered using an external calling convention
        (stdcall, ccall).
        -}
-      adj_args      = [ mkIntLitInt (callConvToInt cconv)
+      adj_args      = [ mkIntLitInt (ccallConvToInt cconv)
                      , Var stbl_value
-                     , mkLit (MachLitLit (_PK_ fe_nm) addrPrimTy)
+                     , mkLit (MachLabel fe_nm mb_sz_args)
+                      , mkLit (mkStringLit arg_type_info)
                      ]
         -- name of external entry point providing these services.
        -- (probably in the RTS.) 
-      adjustor     = SLIT("createAdjustor")
+      adjustor  = FSLIT("createAdjustor")
+      
+      arg_type_info = map repCharCode arg_reps
+      repCharCode F32 = 'f'
+      repCharCode F64 = 'd'
+      repCharCode I64 = 'l'
+      repCharCode _   = 'i'
+
+       -- Determine the number of bytes of arguments to the stub function,
+       -- so that we can attach the '@N' suffix to its label if it is a
+       -- stdcall on Windows.
+      mb_sz_args = case cconv of
+                     StdCallConv -> Just args_size
+                     _           -> Nothing
+
      in
-     dsCCall adjustor adj_args False False ioAddrTy `thenDs` \ ccall_adj ->
+     dsCCall adjustor adj_args PlayRisky io_res_ty     `thenDs` \ ccall_adj ->
+       -- PlayRisky: the adjustor doesn't allocate in the Haskell heap or do a callback
      let ccall_adj_ty = exprType ccall_adj
          ccall_io_adj = mkLams [stbl_value]                 $
-                       Note (Coerce io_res_ty (unUsgTy ccall_adj_ty))
+                       Note (Coerce io_res_ty ccall_adj_ty)
                             ccall_adj
-     in
-     let io_app = mkLams tvs    $
+         io_app = mkLams tvs    $
                  mkLams [cback] $
-                 stbl_app ccall_io_adj addrTy
+                 stbl_app ccall_io_adj res_ty
+        fed = (id `setInlinePragma` NeverActive, io_app)
+               -- Never inline the f.e.d. function, because the litlit
+               -- might not be in scope in other modules.
      in
-     returnDs (NonRec i io_app, fe, h_code, c_code)
+     returnDs ([fed], h_code, c_code)
 
  where
-  (tvs,sans_foralls)              = splitForAllTys ty
-  ([arg_ty], io_res_ty)                   = splitFunTys sans_foralls
-
-  Just (ioTyCon, [res_ty])        = splitTyConApp_maybe io_res_ty
-
-  export_ty                       = mkFunTy (mkTyConApp stablePtrTyCon [arg_ty]) arg_ty
-
-  ioAddrTy :: Type     -- IO Addr
-  ioAddrTy = mkTyConApp ioTyCon [addrTy]
+  ty                   = idType id
+  (tvs,sans_foralls)   = tcSplitForAllTys ty
+  ([arg_ty], io_res_ty)        = tcSplitFunTys sans_foralls
+  [res_ty]             = tcTyConAppArgs io_res_ty
+       -- Must use tcSplit* to see the (IO t), which is a newtype
 
 toCName :: Id -> String
 toCName i = showSDoc (pprCode CStyle (ppr (idName i)))
@@ -406,79 +443,156 @@ The C stub constructs the application of the exported Haskell function
 using the hugs/ghc rts invocation API.
 
 \begin{code}
-fexportEntry :: String
-            -> FAST_STRING
-            -> Id 
-            -> [Type] 
-            -> Type 
-            -> CallConv 
-            -> Bool
-            -> (SDoc, SDoc)
-fexportEntry mod_nm c_nm helper args res_ty cc isDyn = (header_bits, c_bits)
+mkFExportCBits :: FastString
+              -> Maybe Id      -- Just==static, Nothing==dynamic
+              -> [Type] 
+              -> Type 
+               -> Bool         -- True <=> returns an IO type
+              -> CCallConv 
+              -> (SDoc, 
+                  SDoc,
+                  [MachRep],   -- the argument reps
+                  Int          -- total size of arguments
+                 )
+mkFExportCBits c_nm maybe_target arg_htys res_hty is_IO_res_ty cc 
+ = (header_bits, c_bits, 
+    [rep | (_,_,_,rep) <- arg_info],  -- just the real args
+    sum [ machRepByteWidth rep | (_,_,_,rep) <- aug_arg_info] -- all the args
+    )
  where
-   -- name of the (Haskell) helper function generated by the desugarer.
-  h_nm     = ppr helper <> text "_closure"
-   -- prototype for the exported function.
-  header_bits = ptext SLIT("extern") <+> fun_proto <> semi
+  -- list the arguments to the C function
+  arg_info :: [(SDoc,          -- arg name
+               SDoc,           -- C type
+               Type,           -- Haskell type
+               MachRep)]       -- the MachRep
+  arg_info  = [ (text ('a':show n), showStgType ty, ty, 
+                typeMachRep (getPrimTyOf ty))
+             | (ty,n) <- zip arg_htys [1..] ]
+
+  -- add some auxiliary args; the stable ptr in the wrapper case, and
+  -- a slot for the dummy return address in the wrapper + ccall case
+  aug_arg_info
+    | isNothing maybe_target = stable_ptr_arg : insertRetAddr cc arg_info
+    | otherwise              = arg_info
+
+  stable_ptr_arg = 
+       (text "the_stableptr", text "StgStablePtr", undefined,
+        typeMachRep (mkStablePtrPrimTy alphaTy))
+
+  -- stuff to do with the return type of the C function
+  res_hty_is_unit = res_hty `coreEqType` unitTy        -- Look through any newtypes
+
+  cResType | res_hty_is_unit = text "void"
+          | otherwise       = showStgType res_hty
+
+  -- Now we can cook up the prototype for the exported function.
+  pprCconv = case cc of
+               CCallConv   -> empty
+               StdCallConv -> text (ccallConvAttribute cc)
 
-  fun_proto = cResType <+> pprCconv <+> ptext c_nm <>
-             parens (hsep (punctuate comma (zipWith (<+>) cParamTypes proto_args)))
+  header_bits = ptext SLIT("extern") <+> fun_proto <> semi
 
+  fun_proto = cResType <+> pprCconv <+> ftext c_nm <>
+             parens (hsep (punctuate comma (map (\(nm,ty,_,_) -> ty <+> nm) 
+                                                 aug_arg_info)))
+
+  -- the target which will form the root of what we ask rts_evalIO to run
+  the_cfun
+     = case maybe_target of
+          Nothing    -> text "(StgClosure*)deRefStablePtr(the_stableptr)"
+          Just hs_fn -> char '&' <> ppr hs_fn <> text "_closure"
+
+  cap = text "cap" <> comma
+
+  -- the expression we give to rts_evalIO
+  expr_to_run
+     = foldl appArg the_cfun arg_info -- NOT aug_arg_info
+       where
+          appArg acc (arg_cname, _, arg_hty, _) 
+             = text "rts_apply" 
+               <> parens (cap <> acc <> comma <> mkHObj arg_hty <> parens (cap <> arg_cname))
+
+  -- various other bits for inside the fn
+  declareResult = text "HaskellObj ret;"
+  declareCResult | res_hty_is_unit = empty
+                 | otherwise       = cResType <+> text "cret;"
+
+  assignCResult | res_hty_is_unit = empty
+               | otherwise       =
+                       text "cret=" <> unpackHObj res_hty <> parens (text "ret") <> semi
+
+  -- an extern decl for the fn being called
+  extern_decl
+     = case maybe_target of
+          Nothing -> empty
+          Just hs_fn -> text "extern StgClosure " <> ppr hs_fn <> text "_closure" <> semi
+
+   
+   -- Initialise foreign exports by registering a stable pointer from an
+   -- __attribute__((constructor)) function.
+   -- The alternative is to do this from stginit functions generated in
+   -- codeGen/CodeGen.lhs; however, stginit functions have a negative impact
+   -- on binary sizes and link times because the static linker will think that
+   -- all modules that are imported directly or indirectly are actually used by
+   -- the program.
+   -- (this is bad for big umbrella modules like Graphics.Rendering.OpenGL)
+
+  initialiser
+     = case maybe_target of
+          Nothing -> empty
+          Just hs_fn ->
+            vcat
+             [ text "static void stginit_export_" <> ppr hs_fn
+                  <> text "() __attribute__((constructor));"
+             , text "static void stginit_export_" <> ppr hs_fn <> text "()"
+             , braces (text "getStablePtr"
+                <> parens (text "(StgPtr) &" <> ppr hs_fn <> text "_closure")
+                <> semi)
+             ]
+
+  -- finally, the whole darn thing
   c_bits =
-    externDecl $$
+    space $$
+    extern_decl $$
     fun_proto  $$
     vcat 
      [ lbrace
-     ,   text "SchedulerStatus rc;"
+     ,   text "Capability *cap;"
      ,   declareResult
+     ,   declareCResult
+     ,   text "cap = rts_lock();"
          -- create the application + perform it.
-     ,   text "rc=rts_evalIO" <> 
-                  parens (foldl appArg (text "(StgClosure*)&" <> h_nm) (zip args c_args) <> comma <> text "&ret") <> semi
-     ,   text "rts_checkSchedStatus" <> parens (doubleQuotes (text mod_nm <> char '.' <> ptext c_nm) 
-                                               <> comma <> text "rc") <> semi
-     ,   text "return" <> return_what <> semi
+     ,   text "cap=rts_evalIO" <> parens (
+               cap <>
+               text "rts_apply" <> parens (
+                   cap <>
+                   text "(HaskellObj)"
+                <> text (if is_IO_res_ty 
+                               then "runIO_closure" 
+                               else "runNonIO_closure")
+                <> comma
+                <> expr_to_run
+               ) <+> comma
+              <> text "&ret"
+            ) <> semi
+     ,   text "rts_checkSchedStatus" <> parens (doubleQuotes (ftext c_nm)
+                                               <> comma <> text "cap") <> semi
+     ,   assignCResult
+     ,   text "rts_unlock(cap);"
+     ,   if res_hty_is_unit then empty
+            else text "return cret;"
      , rbrace
-     ]
-
-  appArg acc (a,c_a) =
-     text "rts_apply" <> parens (acc <> comma <> mkHObj a <> parens c_a)
-
-  cParamTypes  = map showStgType real_args
-
-  res_ty_is_unit = res_ty == unitTy
-
-  cResType | res_ty_is_unit = text "void"
-          | otherwise      = showStgType res_ty
-
-  pprCconv
-   | cc == cCallConv = empty
-   | otherwise      = pprCallConv cc
-     
-  declareResult  = text "HaskellObj ret;"
-
-  externDecl     = mkExtern (text "HaskellObj") h_nm
-
-  mkExtern ty nm = text "extern" <+> ty <+> nm <> semi
-
-  return_what | res_ty_is_unit = empty
-             | otherwise      = parens (unpackHObj res_ty <> parens (text "ret"))
-
-  c_args = mkCArgNames 0 args
-
-  {-
-   If we're generating an entry point for a 'foreign export ccall dynamic',
-   then we receive the return address of the C function that wants to
-   invoke a Haskell function as any other C function, as second arg.
-   This arg is unused within the body of the generated C stub, but
-   needed by the Adjustor.c code to get the stack cleanup right.
-  -}
-  (proto_args, real_args)
-    | cc == cCallConv && isDyn = ( text "a0" : text "a_" : mkCArgNames 1 (tail args)
-                               , head args : addrTy : tail args)
-    | otherwise = (mkCArgNames 0 args, args)
-
-mkCArgNames :: Int -> [a] -> [SDoc]
-mkCArgNames n as = zipWith (\ _ n -> text ('a':show n)) as [n..] 
+     ] $$
+    initialiser
+
+-- NB. the calculation here isn't strictly speaking correct.
+-- We have a primitive Haskell type (eg. Int#, Double#), and
+-- we want to know the size, when passed on the C stack, of
+-- the associated C type (eg. HsInt, HsDouble).  We don't have
+-- this information to hand, but we know what GHC's conventions
+-- are for passing around the primitive Haskell types, so we
+-- use that instead.  I hope the two coincide --SDM
+typeMachRep ty = argMachRep (typeCgRep ty)
 
 mkHObj :: Type -> SDoc
 mkHObj t = text "rts_mk" <> text (showFFIType t)
@@ -487,12 +601,46 @@ unpackHObj :: Type -> SDoc
 unpackHObj t = text "rts_get" <> text (showFFIType t)
 
 showStgType :: Type -> SDoc
-showStgType t = text "Stg" <> text (showFFIType t)
+showStgType t = text "Hs" <> text (showFFIType t)
 
 showFFIType :: Type -> String
 showFFIType t = getOccString (getName tc)
  where
-  tc = case splitTyConApp_maybe t of
+  tc = case tcSplitTyConApp_maybe (repType t) of
            Just (tc,_) -> tc
            Nothing     -> pprPanic "showFFIType" (ppr t)
+
+#if !defined(x86_64_TARGET_ARCH)
+insertRetAddr CCallConv args = ret_addr_arg : args
+insertRetAddr _ args = args
+#else
+-- On x86_64 we insert the return address after the 6th
+-- integer argument, because this is the point at which we
+-- need to flush a register argument to the stack (See rts/Adjustor.c for
+-- details).
+insertRetAddr CCallConv args = go 0 args
+  where  go 6 args = ret_addr_arg : args
+        go n (arg@(_,_,_,rep):args)
+         | I64 <- rep = arg : go (n+1) args
+         | otherwise  = arg : go n     args
+        go n [] = []
+insertRetAddr _ args = args
+#endif
+
+ret_addr_arg = (text "original_return_addr", text "void*", undefined, 
+               typeMachRep addrPrimTy)
+
+-- This function returns the primitive type associated with the boxed
+-- type argument to a foreign export (eg. Int ==> Int#).  It assumes
+-- that all the types we are interested in have a single constructor
+-- with a single primitive-typed argument, which is true for all of the legal
+-- foreign export argument types (see TcType.legalFEArgTyCon).
+getPrimTyOf :: Type -> Type
+getPrimTyOf ty =
+  case splitProductType_maybe (repType ty) of
+     Just (_, _, data_con, [prim_ty]) ->
+       ASSERT(dataConSourceArity data_con == 1)
+       ASSERT2(isUnLiftedType prim_ty, ppr prim_ty)
+       prim_ty
+     _other -> pprPanic "DsForeign.getPrimTyOf" (ppr ty)
 \end{code}