f750128789e248979878fdc814ca524d1ebc7d23
[ghc-hetmet.git] / ghc / docs / users_guide / separate_compilation.xml
1 <?xml version="1.0" encoding="iso-8859-1"?>
2   <sect1 id="separate-compilation">
3     <title>Filenames and separate compilation</title>
4
5     <indexterm><primary>separate compilation</primary></indexterm>
6     <indexterm><primary>recompilation checker</primary></indexterm>
7     <indexterm><primary>make and recompilation</primary></indexterm>
8
9     <para>This section describes what files GHC expects to find, what
10     files it creates, where these files are stored, and what options
11     affect this behaviour.</para>
12
13     <para>Note that this section is written with
14     <firstterm>hierarchical modules</firstterm> in mind (see <xref
15     linkend="hierarchical-modules"/>); hierarchical modules are an
16     extension to Haskell 98 which extends the lexical syntax of
17     module names to include a dot &lsquo;.&rsquo;.  Non-hierarchical
18     modules are thus a special case in which none of the module names
19     contain dots.</para>
20
21     <para>Pathname conventions vary from system to system.  In
22     particular, the directory separator is
23     &lsquo;<literal>/</literal>&rsquo; on Unix systems and
24     &lsquo;<literal>\</literal>&rsquo; on Windows systems.  In the
25     sections that follow, we shall consistently use
26     &lsquo;<literal>/</literal>&rsquo; as the directory separator;
27     substitute this for the appropriate character for your
28     system.</para>
29
30     <sect2 id="source-files">
31       <title>Haskell source files</title>
32
33       <para>Each Haskell source module should be placed in a file on
34       its own.</para>
35
36       <para>The file should usually be named after the module name, by
37       replacing dots in the module name by directory separators.  For
38       example, on a Unix system, the module <literal>A.B.C</literal>
39       should be placed in the file <literal>A/B/C.hs</literal>,
40       relative to some base directory.  GHC's behaviour if this rule
41       is not followed is fully defined by the following section (<xref
42       linkend="output-files"/>).</para>
43     </sect2>
44
45     <sect2 id="output-files">
46       <title>Output files</title>
47
48       <indexterm><primary>interface files</primary></indexterm>
49       <indexterm><primary><literal>.hi</literal> files</primary></indexterm>
50       <indexterm><primary>object files</primary></indexterm>
51       <indexterm><primary><literal>.o</literal> files</primary></indexterm>
52
53       <para>When asked to compile a source file, GHC normally
54       generates two files: an <firstterm>object file</firstterm>, and
55       an <firstterm>interface file</firstterm>. </para>
56
57       <para>The object file, which normally ends in a
58       <literal>.o</literal> suffix (or <literal>.obj</literal> if
59       you're on Windows), contains the compiled code for the module.</para>
60
61       <para>The interface file,
62       which normally ends in a <literal>.hi</literal> suffix, contains
63       the information that GHC needs in order to compile further
64       modules that depend on this module.  It contains things like the
65       types of exported functions, definitions of data types, and so
66       on.  It is stored in a binary format, so don't try to read one;
67       use the <option>--show-iface</option> option instead (see <xref
68       linkend="hi-options"/>).</para>
69
70       <para>You should think of the object file and the interface file as a
71       pair, since the interface file is in a sense a compiler-readable
72       description of the contents of the object file.  If the
73       interface file and object file get out of sync for any reason,
74       then the compiler may end up making assumptions about the object
75       file that aren't true; trouble will almost certainly follow.
76       For this reason, we recommend keeping object files and interface
77       files in the same place (GHC does this by default, but it is
78       possible to override the defaults as we'll explain
79       shortly).</para>
80
81       <para>Every module has a <emphasis>module name</emphasis>
82       defined in its source code (<literal>module A.B.C where
83       ...</literal>).</para>
84
85       <para>The name of the object file generated by GHC is derived
86       according to the following rules, where
87       <replaceable>osuf</replaceable> is the object-file suffix (this
88       can be changed with the <option>-osuf</option> option).</para>
89
90       <itemizedlist>
91         <listitem>
92           <para>If there is no <option>-odir</option> option (the
93           default), then the object filename is derived from the
94           source filename (ignoring the module name) by replacing the
95           suffix with <replaceable>osuf</replaceable>.</para>
96         </listitem>
97         <listitem>
98           <para>If
99           <option>-odir</option>&nbsp;<replaceable>dir</replaceable>
100           has been specified, then the object filename is
101           <replaceable>dir</replaceable>/<replaceable>mod</replaceable>.<replaceable>osuf</replaceable>,
102           where <replaceable>mod</replaceable> is the module name with
103           dots replaced by slashes.</para>
104         </listitem>
105       </itemizedlist>
106
107       <para>The name of the interface file is derived using the same
108       rules, except that the suffix is
109       <replaceable>hisuf</replaceable> (<literal>.hi</literal> by
110       default) instead of <replaceable>osuf</replaceable>, and the
111       relevant options are <option>-hidir</option> and
112       <option>-hisuf</option> instead of <option>-odir</option> and
113       <option>-osuf</option> respectively.</para>
114
115       <para>For example, if GHC compiles the module
116       <literal>A.B.C</literal> in the file
117       <filename>src/A/B/C.hs</filename>, with no
118       <literal>-odir</literal> or <literal>-hidir</literal> flags, the
119       interface file will be put in <literal>src/A/B/C.hi</literal>
120       and the object file in <literal>src/A/B/C.o</literal>.</para>
121
122       <para>For any module that is imported, GHC requires that the
123       name of the module in the import statement exactly matches the
124       name of the module in the interface file (or source file) found
125       using the strategy specified in <xref linkend="search-path"/>.
126       This means that for most modules, the source file name should
127       match the module name.</para>
128
129       <para>However, note that it is reasonable to have a module
130       <literal>Main</literal> in a file named
131       <filename>foo.hs</filename>, but this only works because GHC
132       never needs to search for the interface for module
133       <literal>Main</literal> (because it is never imported).  It is
134       therefore possible to have several <literal>Main</literal>
135       modules in separate source files in the same directory, and GHC
136       will not get confused.</para>
137
138       <para>In batch compilation mode, the name of the object file can
139       also be overridden using the <option>-o</option> option, and the
140       name of the interface file can be specified directly using the
141       <option>-ohi</option> option.</para>
142     </sect2>
143
144     <sect2 id="search-path">
145       <title>The search path</title>
146
147       <indexterm><primary>search path</primary>
148       </indexterm>
149       <indexterm><primary>interface files, finding them</primary></indexterm>
150       <indexterm><primary>finding interface files</primary></indexterm>
151
152       <para>In your program, you import a module
153       <literal>Foo</literal> by saying <literal>import Foo</literal>.
154       In <option>--make</option> mode or GHCi, GHC will look for a
155       source file for <literal>Foo</literal> and arrange to compile it
156       first.  Without <option>--make</option>, GHC will look for the
157       interface file for <literal>Foo</literal>, which should have
158       been created by an earlier compilation of
159       <literal>Foo</literal>.  GHC uses the same strategy in each of
160       these cases for finding the appropriate file.</para>
161
162       <para>This strategy is as follows: GHC keeps a list of
163       directories called the <firstterm>search path</firstterm>.  For
164       each of these directories, it tries appending
165       <replaceable>basename</replaceable><literal>.</literal><replaceable>extension</replaceable>
166       to the directory, and checks whether the file exists.  The value
167       of <replaceable>basename</replaceable> is the module name with
168       dots replaced by the directory separator ('/' or '\', depending
169       on the system), and <replaceable>extension</replaceable> is a
170       source extension (<literal>hs</literal>, <literal>lhs</literal>)
171       if we are in <option>--make</option> mode and GHCi, or
172       <replaceable>hisuf</replaceable> otherwise.</para>
173
174       <para>For example, suppose the search path contains directories
175       <literal>d1</literal>, <literal>d2</literal>, and
176       <literal>d3</literal>, and we are in <literal>--make</literal>
177       mode looking for the source file for a module
178       <literal>A.B.C</literal>.  GHC will look in
179       <literal>d1/A/B/C.hs</literal>, <literal>d1/A/B/C.lhs</literal>,
180       <literal>d2/A/B/C.hs</literal>, and so on.</para>
181
182       <para>The search path by default contains a single directory:
183       <quote>.</quote> (i.e. the current directory).  The following
184       options can be used to add to or change the contents of the
185       search path:</para>
186
187       <variablelist>
188         <varlistentry>
189           <term><option>-i<replaceable>dirs</replaceable></option></term>
190           <listitem>
191             <para><indexterm><primary><option>-i<replaceable>dirs</replaceable></option>
192             </primary></indexterm>This flag appends a colon-separated
193             list of <filename>dirs</filename> to the search path.</para>
194           </listitem>
195         </varlistentry>
196
197         <varlistentry>
198           <term><option>-i</option></term>
199           <listitem>
200             <para>resets the search path back to nothing.</para>
201           </listitem>
202         </varlistentry>
203       </variablelist>
204
205       <para>This isn't the whole story: GHC also looks for modules in
206       pre-compiled libraries, known as packages.  See the section on
207       packages (<xref linkend="packages"/>), for details.</para>
208     </sect2>
209
210     <sect2 id="options-output">
211       <title>Redirecting the compilation output(s)</title>
212
213       <indexterm><primary>output-directing options</primary></indexterm>
214       <indexterm><primary>redirecting compilation output</primary></indexterm>
215
216       <variablelist>
217         <varlistentry>
218           <term>
219             <option>-o</option> <replaceable>file</replaceable>
220             <indexterm><primary><option>-o</option></primary></indexterm>
221           </term>
222           <listitem>
223             <para>GHC's compiled output normally goes into a
224             <filename>.hc</filename>, <filename>.o</filename>, etc.,
225             file, depending on the last-run compilation phase.  The
226             option <option>-o <replaceable>file</replaceable></option>
227             re-directs the output of that last-run phase to
228             <replaceable>file</replaceable>.</para>
229
230             <para>Note: this &ldquo;feature&rdquo; can be
231             counterintuitive: <command>ghc -C -o foo.o
232             foo.hs</command> will put the intermediate C code in the
233             file <filename>foo.o</filename>, name
234             notwithstanding!</para>
235
236             <para>This option is most often used when creating an
237             executable file, to set the filename of the executable.
238             For example:
239 <screen>   ghc -o prog --make Main</screen>
240
241             will compile the program starting with module
242             <literal>Main</literal>  and put the executable in the
243             file <literal>prog</literal>.</para>
244
245             <para>Note: on Windows, if the result is an executable
246             file, the extension "<filename>.exe</filename>" is added
247             if the specified filename does not already have an
248             extension.  Thus
249 <programlisting>
250    ghc -o foo Main.hs
251 </programlisting>
252           will compile and link the module
253           <filename>Main.hs</filename>, and put the resulting
254           executable in <filename>foo.exe</filename> (not
255           <filename>foo</filename>).</para>
256           </listitem>
257         </varlistentry>
258
259         <varlistentry>
260           <term>
261             <option>-odir</option> <replaceable>dir</replaceable>
262             <indexterm><primary><option>-odir</option></primary></indexterm>
263           </term>
264           <listitem>
265             <para>Redirects object files to directory
266             <replaceable>dir</replaceable>.  For example:</para>
267
268 <screen>
269 $ ghc -c parse/Foo.hs parse/Bar.hs gurgle/Bumble.hs -odir `arch`
270 </screen>
271
272             <para>The object files, <filename>Foo.o</filename>,
273             <filename>Bar.o</filename>, and
274             <filename>Bumble.o</filename> would be put into a
275             subdirectory named after the architecture of the executing
276             machine (<filename>x86</filename>,
277             <filename>mips</filename>, etc).</para>
278
279             <para>Note that the <option>-odir</option> option does
280             <emphasis>not</emphasis> affect where the interface files
281             are put; use the <option>-hidir</option> option for that.
282             In the above example, they would still be put in
283             <filename>parse/Foo.hi</filename>,
284             <filename>parse/Bar.hi</filename>, and
285             <filename>gurgle/Bumble.hi</filename>.</para>
286           </listitem>
287         </varlistentry>
288
289         <varlistentry>
290           <term>
291             <option>-ohi</option>  <replaceable>file</replaceable>
292             <indexterm><primary><option>-ohi</option></primary></indexterm>
293           </term>
294           <listitem>
295             <para>The interface output may be directed to another file
296             <filename>bar2/Wurble.iface</filename> with the option
297             <option>-ohi bar2/Wurble.iface</option> (not
298             recommended).</para>
299
300             <para>WARNING: if you redirect the interface file
301             somewhere that GHC can't find it, then the recompilation
302             checker may get confused (at the least, you won't get any
303             recompilation avoidance).  We recommend using a
304             combination of <option>-hidir</option> and
305             <option>-hisuf</option> options instead, if
306             possible.</para>
307
308             <para>To avoid generating an interface at all, you could
309             use this option to redirect the interface into the bit
310             bucket: <literal>-ohi /dev/null</literal>, for
311             example.</para>
312           </listitem>
313         </varlistentry>
314
315         <varlistentry>
316           <term>
317             <option>-hidir</option>  <replaceable>dir</replaceable>
318             <indexterm><primary><option>-hidir</option></primary></indexterm>
319           </term>
320           <listitem>
321             <para>Redirects all generated interface files into
322             <replaceable>dir</replaceable>, instead of the
323             default.</para>
324           </listitem>
325         </varlistentry>
326
327         <varlistentry>
328           <term>
329             <option>-osuf</option> <replaceable>suffix</replaceable>
330             <indexterm><primary><option>-osuf</option></primary></indexterm>
331           </term>
332           <term>
333             <option>-hisuf</option> <replaceable>suffix</replaceable>
334             <indexterm><primary><option>-hisuf</option></primary></indexterm>
335           </term>
336           <term>
337             <option>-hcsuf</option> <replaceable>suffix</replaceable>
338             <indexterm><primary><option>-hcsuf</option></primary></indexterm>
339           </term>
340           <listitem>
341             <para>The <option>-osuf</option>
342             <replaceable>suffix</replaceable> will change the
343             <literal>.o</literal> file suffix for object files to
344             whatever you specify.  We use this when compiling
345             libraries, so that objects for the profiling versions of
346             the libraries don't clobber the normal ones.</para>
347
348             <para>Similarly, the <option>-hisuf</option>
349             <replaceable>suffix</replaceable> will change the
350             <literal>.hi</literal> file suffix for non-system
351             interface files (see <xref linkend="hi-options"/>).</para>
352
353             <para>Finally, the option <option>-hcsuf</option>
354             <replaceable>suffix</replaceable> will change the
355             <literal>.hc</literal> file suffix for compiler-generated
356             intermediate C files.</para>
357
358             <para>The <option>-hisuf</option>/<option>-osuf</option>
359             game is particularly useful if you want to compile a
360             program both with and without profiling, in the same
361             directory.  You can say:
362             <screen>
363               ghc ...</screen>
364             to get the ordinary version, and
365             <screen>
366               ghc ... -osuf prof.o -hisuf prof.hi -prof -auto-all</screen>
367             to get the profiled version.</para>
368           </listitem>
369         </varlistentry>
370       </variablelist>
371     </sect2>
372   
373     <sect2 id="keeping-intermediates">
374       <title>Keeping Intermediate Files</title>
375       <indexterm><primary>intermediate files, saving</primary>
376       </indexterm>
377       <indexterm><primary><literal>.hc</literal> files, saving</primary>
378       </indexterm>
379       <indexterm><primary><literal>.s</literal> files, saving</primary>
380       </indexterm>
381
382       <para>The following options are useful for keeping certain
383       intermediate files around, when normally GHC would throw these
384       away after compilation:</para>
385
386       <variablelist>
387         <varlistentry>
388           <term>
389             <option>-keep-hc-files</option>
390             <indexterm><primary><option>-keep-hc-files</option></primary></indexterm>
391           </term>
392           <listitem>
393             <para>Keep intermediate <literal>.hc</literal> files when
394             doing <literal>.hs</literal>-to-<literal>.o</literal>
395             compilations via C (NOTE: <literal>.hc</literal> files
396             aren't generated when using the native code generator, you
397             may need to use <option>-fvia-C</option> to force them
398             to be produced).</para>
399           </listitem>
400         </varlistentry>
401
402         <varlistentry>
403           <term>
404             <option>-keep-s-files</option>
405             <indexterm><primary><option>-keep-s-files</option></primary></indexterm>
406           </term>
407           <listitem>
408             <para>Keep intermediate <literal>.s</literal> files.</para>
409           </listitem>
410         </varlistentry>
411
412         <varlistentry>
413           <term>
414             <option>-keep-raw-s-files</option>
415             <indexterm><primary><option>-keep-raw-s-files</option></primary></indexterm>
416           </term>
417           <listitem>
418             <para>Keep intermediate <literal>.raw-s</literal> files.
419             These are the direct output from the C compiler, before
420             GHC does &ldquo;assembly mangling&rdquo; to produce the
421             <literal>.s</literal> file.  Again, these are not produced
422             when using the native code generator.</para>
423           </listitem>
424         </varlistentry>
425
426         <varlistentry>
427           <term>
428             <option>-keep-tmp-files</option>
429             <indexterm><primary><option>-keep-tmp-files</option></primary></indexterm>
430             <indexterm><primary>temporary files</primary><secondary>keeping</secondary></indexterm>
431           </term>
432           <listitem>
433             <para>Instructs the GHC driver not to delete any of its
434             temporary files, which it normally keeps in
435             <literal>/tmp</literal> (or possibly elsewhere; see <xref
436             linkend="temp-files"/>).  Running GHC with
437             <option>-v</option> will show you what temporary files
438             were generated along the way.</para>
439           </listitem>
440         </varlistentry>
441       </variablelist>
442     </sect2>
443
444     <sect2 id="temp-files">
445       <title>Redirecting temporary files</title>
446
447       <indexterm>
448         <primary>temporary files</primary>
449         <secondary>redirecting</secondary>
450       </indexterm>
451
452       <variablelist>
453         <varlistentry>
454           <term>
455             <option>-tmpdir</option>
456             <indexterm><primary><option>-tmpdir</option></primary></indexterm>
457           </term>
458           <listitem>
459             <para>If you have trouble because of running out of space
460             in <filename>/tmp</filename> (or wherever your
461             installation thinks temporary files should go), you may
462             use the <option>-tmpdir
463             &lt;dir&gt;</option><indexterm><primary>-tmpdir
464             &lt;dir&gt; option</primary></indexterm> option to specify
465             an alternate directory.  For example, <option>-tmpdir
466             .</option> says to put temporary files in the current
467             working directory.</para>
468
469             <para>Alternatively, use your <constant>TMPDIR</constant>
470             environment variable.<indexterm><primary>TMPDIR
471             environment variable</primary></indexterm> Set it to the
472             name of the directory where temporary files should be put.
473             GCC and other programs will honour the
474             <constant>TMPDIR</constant> variable as well.</para>
475
476             <para>Even better idea: Set the
477             <constant>DEFAULT_TMPDIR</constant> make variable when
478             building GHC, and never worry about
479             <constant>TMPDIR</constant> again. (see the build
480             documentation).</para>
481           </listitem>
482         </varlistentry>
483       </variablelist>
484     </sect2>
485
486     <sect2 id="hi-options">
487       <title>Other options related to interface files</title>
488       <indexterm><primary>interface files, options</primary></indexterm>
489
490       <variablelist>
491         <varlistentry>
492           <term>
493             <option>-ddump-hi</option>
494             <indexterm><primary><option>-ddump-hi</option></primary></indexterm>
495           </term>
496           <listitem>
497             <para>Dumps the new interface to standard output.</para>
498           </listitem>
499         </varlistentry>
500
501         <varlistentry>
502           <term>
503             <option>-ddump-hi-diffs</option>
504             <indexterm><primary><option>-ddump-hi-diffs</option></primary></indexterm>
505           </term>
506           <listitem>
507             <para>The compiler does not overwrite an existing
508             <filename>.hi</filename> interface file if the new one is
509             the same as the old one; this is friendly to
510             <command>make</command>.  When an interface does change,
511             it is often enlightening to be informed.  The
512             <option>-ddump-hi-diffs</option> option will make GHC run
513             <command>diff</command> on the old and new
514             <filename>.hi</filename> files.</para>
515           </listitem>
516         </varlistentry>
517
518         <varlistentry>
519           <term>
520             <option>-ddump-minimal-imports</option>
521             <indexterm><primary><option>-ddump-minimal-imports</option></primary></indexterm>
522           </term>
523           <listitem>
524             <para>Dump to the file "M.imports" (where M is the module
525             being compiled) a "minimal" set of import declarations.
526             You can safely replace all the import declarations in
527             "M.hs" with those found in "M.imports".  Why would you
528             want to do that?  Because the "minimal" imports (a) import
529             everything explicitly, by name, and (b) import nothing
530             that is not required.  It can be quite painful to maintain
531             this property by hand, so this flag is intended to reduce
532             the labour.</para>
533           </listitem>
534         </varlistentry>
535
536         <varlistentry>
537           <term>
538             <option>--show-iface</option> <replaceable>file</replaceable>
539             <indexterm><primary><option>--show-iface</option></primary></indexterm>
540           </term>
541           <listitem>
542             <para>Where <replaceable>file</replaceable> is the name of
543             an interface file, dumps the contents of that interface in
544             a human-readable (ish) format.</para>
545           </listitem>
546         </varlistentry>
547       </variablelist>
548     </sect2>
549
550     <sect2 id="recomp">
551       <title>The recompilation checker</title>
552
553       <indexterm><primary>recompilation checker</primary></indexterm>
554
555       <variablelist>
556         <varlistentry>
557           <term>
558             <option>-no-recomp</option>
559             <indexterm><primary><option>-recomp</option></primary></indexterm>
560             <indexterm><primary><option>-no-recomp</option></primary></indexterm>
561           </term>
562           <listitem>
563             <para>Turn off recompilation checking (which is on by
564             default).  Recompilation checking normally stops
565             compilation early, leaving an existing
566             <filename>.o</filename> file in place, if it can be
567             determined that the module does not need to be
568             recompiled.</para>
569           </listitem>
570         </varlistentry>
571       </variablelist>
572
573       <para>In the olden days, GHC compared the newly-generated
574       <filename>.hi</filename> file with the previous version; if they
575       were identical, it left the old one alone and didn't change its
576       modification date.  In consequence, importers of a module with
577       an unchanged output <filename>.hi</filename> file were not
578       recompiled.</para>
579
580       <para>This doesn't work any more.  Suppose module
581       <literal>C</literal> imports module <literal>B</literal>, and
582       <literal>B</literal> imports module <literal>A</literal>.  So
583       changes to module <literal>A</literal> might require module
584       <literal>C</literal> to be recompiled, and hence when
585       <filename>A.hi</filename> changes we should check whether
586       <literal>C</literal> should be recompiled.  However, the
587       dependencies of <literal>C</literal> will only list
588       <literal>B.hi</literal>, not <literal>A.hi</literal>, and some
589       changes to <literal>A</literal> (changing the definition of a
590       function that appears in an inlining of a function exported by
591       <literal>B</literal>, say) may conceivably not change
592       <filename>B.hi</filename> one jot.  So now&hellip;</para>
593
594       <para>GHC keeps a version number on each interface file, and on
595       each type signature within the interface file.  It also keeps in
596       every interface file a list of the version numbers of everything
597       it used when it last compiled the file.  If the source file's
598       modification date is earlier than the <filename>.o</filename>
599       file's date (i.e. the source hasn't changed since the file was
600       last compiled), and the recompilation checking is on, GHC will be
601       clever.  It compares the version numbers on the things it needs
602       this time with the version numbers on the things it needed last
603       time (gleaned from the interface file of the module being
604       compiled); if they are all the same it stops compiling rather
605       early in the process saying &ldquo;Compilation IS NOT
606       required&rdquo;.  What a beautiful sight!</para>
607
608       <para>Patrick Sansom had a workshop paper about how all this is
609       done (though the details have changed quite a bit). <ulink
610       url="mailto:sansom@dcs.gla.ac.uk">Ask him</ulink> if you want a
611       copy.</para>
612
613     </sect2>
614
615     <sect2 id="mutual-recursion">
616       <title>How to compile mutually recursive modules</title>
617
618       <indexterm><primary>module system, recursion</primary></indexterm>
619       <indexterm><primary>recursion, between modules</primary></indexterm>
620
621       <para>GHC supports the compilation of mutually recursive modules.
622       This section explains how.</para>
623
624       <para>Every cycle in the module import graph must be broken by a <filename>hs-boot</filename> file.
625       Suppose that modules <filename>A.hs</filename> and <filename>B.hs</filename> are Haskell source files, 
626       thus:
627 <programlisting>
628 module A where
629     import B( TB(..) )
630     
631     newtype TA = MkTA Int
632     
633     f :: TB -&#62; TA
634     f (MkTB x) = MkTA x
635
636 module B where
637     import {-# SOURCE #-} A( TA(..) )
638     
639     data TB = MkTB !Int
640     
641     g :: TA -&#62; TB
642     g (MkTA x) = MkTB x
643 </programlisting>
644 <indexterm><primary><literal>hs-boot</literal>
645       files</primary></indexterm> <indexterm><primary>importing,
646       <literal>hi-boot</literal> files</primary></indexterm>
647 Here <filename>A</filename> imports <filename>B</filename>, but <filename>B</filename> imports
648 <filename>A</filename> with a <literal>{-# SOURCE #-}</literal> pragma, which breaks the
649 circular dependency.  For every module <filename>A.hs</filename> that is <literal>{-# SOURCE #-}</literal>-imported
650 in this way there must exist a souce file <literal>A.hs-boot</literal>.  This file contains an abbreviated
651 version of <filename>A.hs</filename>, thus:
652 <programlisting>
653 module A where
654     newtype TA = MkTA Int
655 </programlisting>
656 </para>
657 <para>To compile these three files, issue the following commands:
658 <programlisting>
659   ghc -c A.hs-boot    -- Poduces A.hi-boot, A.o-boot
660   ghc -c B.hs         -- Consumes A.hi-boot, produces B.hi, B.o
661   ghc -c A.hs         -- Consumes B.hi, produces A.hi, A.o
662   ghc -o foo A.o B.o  -- Linking the program
663 </programlisting>
664 </para>
665 <para>There are several points to note here:
666 <itemizedlist>
667 <listitem>
668   <para>The file <filename>A.hs-boot</filename> is a programmer-written source file.
669   It must live in the same directory as its parent source file <filename>A.hs</filename>.
670   Currently, if you use a literate source file <filename>A.lhs</filename> you must
671   also use a literate boot file, <filename>A.lhs-boot</filename>; and vice versa.
672   </para></listitem>
673
674 <listitem><para>
675   A <filename>hs-boot</filename> file is compiled by GHC, just like a <filename>hs</filename> file:
676 <programlisting>
677   ghc -c A.hs-boot
678 </programlisting>
679 When a hs-boot file <filename>A.hs-boot</filename> 
680    is compiled, it is checked for scope and type errors.
681    When its parent module <filename>A.hs</filename> is compiled, the two are compared, and
682    an error is reported if the two are inconsistent.
683    </para></listitem>
684    
685         <listitem>
686           <para> Just as compiling <filename>A.hs</filename> produces an
687             interface file <filename>A.hi</filename>, and an object file
688             <filename>A.o</filename>, so compiling
689             <filename>A.hs-boot</filename> produces an interface file
690             <filename>A.hi-boot</filename>, and an pseudo-object file
691             <filename>A.o-boot</filename>: </para>
692
693           <itemizedlist>
694             <listitem>
695               <para>The pseudo-object file <filename>A.o-boot</filename> is
696                 empty (don't link it!), but it is very useful when using a
697                 Makefile, to record when the <filename>A.hi-boot</filename> was
698                 last brought up to date (see <xref
699                   linkend="using-make"/>).</para>
700             </listitem>
701
702             <listitem>
703               <para>The <filename>hi-boot</filename> generated by compiling a
704                 <filename>hs-boot</filename> file is in the same
705                 machine-generated binary format as any other GHC-generated
706                 interface file (e.g. <filename>B.hi</filename>). You can
707                 display its contents with <command>ghc
708                   --show-iface</command>. If you specify a directory for
709                 interface files, the <option>-ohidir</option> flag, then that
710                 affects <filename>hi-boot</filename> files
711                 too.</para>
712             </listitem>
713           </itemizedlist>
714         </listitem>
715
716    <listitem><para> If hs-boot files are considered distinct from their parent source
717    files, and if a <literal>{-# SOURCE #-}</literal> import is considered to refer to the
718    hs-boot file, then the module import graph must have no cycles.  The command
719    <command>ghc -M</command> will report an error if a cycle is found.
720    </para></listitem>
721
722    <listitem><para> Every module that is 
723    <literal>{-# SOURCE #-}</literal>-imported in a program must also be ordinarily imported (or
724    else be one of the root modules).  To put it another way, if <literal>M.hs-boot</literal> is
725    reachable in the import graph, then <literal>M.hs</literal> must also be reachable.
726    The command <command>ghc --make</command> will report an error if this
727    condition is not satisfied.
728    </para></listitem>
729 </itemizedlist>
730 </para>
731 <para>
732 A hs-boot file need only contain the bare
733       minimum of information needed to get the bootstrapping process
734       started.  For example, it doesn't need to contain declarations
735       for <emphasis>everything</emphasis> that module
736       <literal>A</literal> exports, only the things required by the
737       module(s) that import <literal>A</literal> recursively.</para>
738 <para>A hs-boot file is written in a subset of Haskell:
739 <itemizedlist>
740 <listitem><para> The module header (including the export list), and import statements, are exactly as in
741 Haskell, and so are the scoping rules.  
742    Hence, to mention a non-Prelude type or class, you must import it.</para></listitem>
743    
744 <listitem><para> There must be no value declarations, but there can be type signatures for
745 values.  For example:
746 <programlisting>
747   double :: Int -&#62; Int
748 </programlisting>
749 </para></listitem>
750 <listitem><para> Fixity declarations are exactly as in Haskell.</para></listitem>
751 <listitem><para> Type synonym declarations are exactly as in Haskell.</para></listitem>
752 <listitem><para> A data type declaration can either be given in full, exactly as in Haskell, or it 
753 can be given abstractly, by omitting the '=' sign and everything that follows.  For example:
754 <programlisting>
755   data T a b
756 </programlisting>
757             In a <emphasis>source</emphasis> program
758           this would declare TA to have no constructors (a GHC extension: see <xref linkend="nullary-types"/>),
759           but in an hi-boot file it means "I don't know or care what the constructors are".
760             This is the most common form of data type declaration, because it's easy to get right.
761           You <emphasis>can</emphasis> also write out the constructors but, if you do so, you must write
762           it out precisely as in its real definition.</para>
763           <para>
764             If you do not write out the constructors, you may need to give a kind 
765             annotation (<xref linkend="sec-kinding"/>), to tell
766             GHC the kind of the type variable, if it is not "*".  (In source files, this is worked out
767             from the way the type variable is used in the constructors.)  For example:
768 <programlisting>
769   data R (x :: * -&#62; *) y
770 </programlisting>
771 </para></listitem>
772 <listitem><para> Class declarations is exactly as in Haskell, except that you may not put
773 default method declarations.  You can also omit all the class methods entirely.
774 </para></listitem>
775 <listitem><para> Do not include instance declarations. There is a complication to do with
776 how the dictionary functions are named.  It may well work, but it's not a well-tested feature.
777  </para></listitem>
778 </itemizedlist>
779 </para>
780     </sect2>
781
782
783     <sect2 id="using-make">
784       <title>Using <command>make</command></title>
785
786       <indexterm><primary><literal>make</literal></primary></indexterm>
787
788       <para>It is reasonably straightforward to set up a
789       <filename>Makefile</filename> to use with GHC, assuming you name
790       your source files the same as your modules.  Thus:</para>
791
792 <programlisting>
793 HC      = ghc
794 HC_OPTS = -cpp $(EXTRA_HC_OPTS)
795
796 SRCS = Main.lhs Foo.lhs Bar.lhs
797 OBJS = Main.o   Foo.o   Bar.o
798
799 .SUFFIXES : .o .hs .hi .lhs .hc .s
800
801 cool_pgm : $(OBJS)
802         rm -f $@
803         $(HC) -o $@ $(HC_OPTS) $(OBJS)
804
805 # Standard suffix rules
806 .o.hi:
807         @:
808
809 .lhs.o:
810         $(HC) -c $&#60; $(HC_OPTS)
811
812 .hs.o:
813         $(HC) -c $&#60; $(HC_OPTS)
814
815 .o-boot.hi-boot:
816         @:
817
818 .lhs-boot.o-boot:
819         $(HC) -c $&#60; $(HC_OPTS)
820
821 .hs-boot.o-boot:
822         $(HC) -c $&#60; $(HC_OPTS)
823
824 # Inter-module dependencies
825 Foo.o Foo.hc Foo.s    : Baz.hi          # Foo imports Baz
826 Main.o Main.hc Main.s : Foo.hi Baz.hi   # Main imports Foo and Baz
827 </programlisting>
828
829       <para>(Sophisticated <command>make</command> variants may
830       achieve some of the above more elegantly.  Notably,
831       <command>gmake</command>'s pattern rules let you write the more
832       comprehensible:</para>
833
834 <programlisting>
835 %.o : %.lhs
836         $(HC) -c $&#60; $(HC_OPTS)
837 </programlisting>
838
839       <para>What we've shown should work with any
840       <command>make</command>.)</para>
841
842       <para>Note the cheesy <literal>.o.hi</literal> rule: It records
843       the dependency of the interface (<filename>.hi</filename>) file
844       on the source.  The rule says a <filename>.hi</filename> file
845       can be made from a <filename>.o</filename> file by
846       doing&hellip;nothing.  Which is true.</para>
847       <para> Note that the suffix rules are all repeated twice, once
848       for normal Haskell source files, and once for <filename>hs-boot</filename>
849       files (see <xref linkend="mutual-recursion"/>).</para>
850
851       <para>Note also the inter-module dependencies at the end of the
852       Makefile, which take the form
853
854 <programlisting>
855 Foo.o Foo.hc Foo.s    : Baz.hi          # Foo imports Baz
856 </programlisting>
857
858       They tell <command>make</command> that if any of
859       <literal>Foo.o</literal>, <literal>Foo.hc</literal> or
860       <literal>Foo.s</literal> have an earlier modification date than
861       <literal>Baz.hi</literal>, then the out-of-date file must be
862       brought up to date.  To bring it up to date,
863       <literal>make</literal> looks for a rule to do so; one of the
864       preceding suffix rules does the job nicely.  These dependencies
865       can be generated automatically by <command>ghc</command>; see 
866       <xref linkend="sec-makefile-dependencies"/></para>
867
868  </sect2>
869
870       <sect2 id="sec-makefile-dependencies">
871         <title>Dependency generation</title>
872         <indexterm><primary>dependencies in Makefiles</primary></indexterm>
873         <indexterm><primary>Makefile dependencies</primary></indexterm>
874
875         <para>Putting inter-dependencies of the form <literal>Foo.o :
876         Bar.hi</literal> into your <filename>Makefile</filename> by
877         hand is rather error-prone.  Don't worry, GHC has support for
878         automatically generating the required dependencies.  Add the
879         following to your <filename>Makefile</filename>:</para>
880
881 <programlisting>
882 depend :
883         ghc -M $(HC_OPTS) $(SRCS)
884 </programlisting>
885
886         <para>Now, before you start compiling, and any time you change
887         the <literal>imports</literal> in your program, do
888         <command>make depend</command> before you do <command>make
889         cool&lowbar;pgm</command>.  The command <command>ghc -M</command> will
890         append the needed dependencies to your
891         <filename>Makefile</filename>.</para>
892
893         <para>In general, <command>ghc -M Foo</command> does the following.
894         For each module <literal>M</literal> in the set 
895         <literal>Foo</literal> plus all its imports (transitively),
896         it adds to the Makefile:
897         <itemizedlist>
898         <listitem><para>A line recording the dependence of the object file on the source file.
899 <programlisting>
900 M.o : M.hs
901 </programlisting>
902 (or <literal>M.lhs</literal> if that is the filename you used).
903        </para></listitem>
904        <listitem><para> For each import declaration <literal>import X</literal> in <literal>M</literal>,
905        a line recording the dependence of <literal>M</literal> on <literal>X</literal>:
906 <programlisting>
907 M.o : X.hi
908 </programlisting></para></listitem>
909        <listitem><para> For each import declaration <literal>import {-# SOURCE #-} X</literal> in <literal>M</literal>,
910        a line recording the dependence of <literal>M</literal> on <literal>X</literal>:
911 <programlisting>
912 M.o : X.hi-boot
913 </programlisting>
914        (See <xref linkend="mutual-recursion"/> for details of
915        <literal>hi-boot</literal> style interface files.)
916       </para></listitem>
917         </itemizedlist> 
918         If <literal>M</literal> imports multiple modules, then there will
919        be multiple lines with <filename>M.o</filename> as the
920        target.</para>
921        <para>There is no need to list all of the source files as arguments to the <command>ghc -M</command> command;
922        <command>ghc</command> traces the dependencies, just like <command>ghc --make</command>
923        (a new feature in GHC 6.4).</para>
924
925         <para>By default, <command>ghc -M</command> generates all the
926         dependencies, and then concatenates them onto the end of
927         <filename>makefile</filename> (or
928         <filename>Makefile</filename> if <filename>makefile</filename>
929         doesn't exist) bracketed by the lines "<literal>&num; DO NOT
930         DELETE: Beginning of Haskell dependencies</literal>" and
931         "<literal>&num; DO NOT DELETE: End of Haskell
932         dependencies</literal>".  If these lines already exist in the
933         <filename>makefile</filename>, then the old dependencies are
934         deleted first.</para>
935
936         <para>Don't forget to use the same <option>-package</option>
937         options on the <literal>ghc -M</literal> command line as you
938         would when compiling; this enables the dependency generator to
939         locate any imported modules that come from packages.  The
940         package modules won't be included in the dependencies
941         generated, though (but see the
942         <option>&ndash;&ndash;include-pkg-deps</option> option below).</para>
943
944         <para>The dependency generation phase of GHC can take some
945         additional options, which you may find useful.  For historical
946         reasons, each option passed to the dependency generator from
947         the GHC command line must be preceded by
948         <literal>-optdep</literal>.  For example, to pass <literal>-f
949         .depend</literal> to the dependency generator, you say
950
951 <screen>
952 ghc -M -optdep-f -optdep.depend ...
953 </screen>
954
955         The options which affect dependency generation are:</para>
956
957         <variablelist>
958           <varlistentry>
959             <term><option>-w</option></term>
960             <listitem>
961               <para>Turn off warnings about interface file shadowing.</para>
962             </listitem>
963           </varlistentry>
964
965           <varlistentry>
966             <term><option>-v2</option></term>
967             <listitem>
968               <para>Print a full list of the module depenencies to stdout.
969                     (This is the standard verbosity flag, so the list will
970               also be displayed with <option>-v3</option> and
971               <option>-v4</option>;
972               <xref linkend ="options-help"/>.)</para>
973             </listitem>
974           </varlistentry>
975
976           <varlistentry>
977             <term><option>-f</option> <replaceable>file</replaceable></term>
978             <listitem>
979               <para>Use <replaceable>file</replaceable> as the makefile,
980               rather than <filename>makefile</filename> or
981               <filename>Makefile</filename>.  If
982               <replaceable>file</replaceable> doesn't exist,
983               <command>mkdependHS</command> creates it.  We often use
984               <option>-f .depend</option> to put the dependencies in
985               <filename>.depend</filename> and then
986               <command>include</command> the file
987               <filename>.depend</filename> into
988               <filename>Makefile</filename>.</para>
989             </listitem>
990           </varlistentry>
991
992 <!-- Retired with the move away from 'mkdependHS'.
993           <varlistentry>
994             <term><option>-o &lt;osuf&gt;</option></term>
995             <listitem>
996               <para>Use <filename>.&lt;osuf&gt;</filename> as the
997               "target file" suffix ( default: <literal>o</literal>).
998               Multiple <option>-o</option> flags are permitted
999               (GHC2.05 onwards).  Thus "<option>-o hc -o o</option>"
1000               will generate dependencies for <filename>.hc</filename>
1001               and <filename>.o</filename> files.</para>
1002             </listitem>
1003           </varlistentry>
1004 -->
1005           <varlistentry>
1006             <term><option>-s &lt;suf&gt;</option></term>
1007             <listitem>
1008               <para>Make extra dependencies that declare that files
1009               with suffix
1010               <filename>.&lt;suf&gt;&lowbar;&lt;osuf&gt;</filename>
1011               depend on interface files with suffix
1012               <filename>.&lt;suf&gt;&lowbar;hi</filename>, or (for
1013               <literal>&lcub;-&num; SOURCE &num;-&rcub;</literal>
1014               imports) on <filename>.hi-boot</filename>.  Multiple
1015               <option>-s</option> flags are permitted.  For example,
1016               <option>-o hc -s a -s b</option> will make dependencies
1017               for <filename>.hc</filename> on
1018               <filename>.hi</filename>,
1019               <filename>.a&lowbar;hc</filename> on
1020               <filename>.a&lowbar;hi</filename>, and
1021               <filename>.b&lowbar;hc</filename> on
1022               <filename>.b&lowbar;hi</filename>.  (Useful in
1023               conjunction with NoFib "ways".)</para>
1024             </listitem>
1025           </varlistentry>
1026
1027           <varlistentry>
1028             <term><option>&ndash;&ndash;exclude-module=&lt;file&gt;</option></term>
1029             <listitem>
1030               <para>Regard <filename>&lt;file&gt;</filename> as
1031               "stable"; i.e., exclude it from having dependencies on
1032               it.</para>
1033             </listitem>
1034           </varlistentry>
1035
1036           <varlistentry>
1037             <term><option>-x</option></term>
1038             <listitem>
1039               <para>same as <option>&ndash;&ndash;exclude-module</option></para>
1040             </listitem>
1041           </varlistentry>
1042
1043           <varlistentry>
1044             <term><option>&ndash;&ndash;exclude-directory=&lt;dirs&gt;</option></term>
1045             <listitem>
1046               <para>Regard the colon-separated list of directories
1047               <filename>&lt;dirs&gt;</filename> as containing stable,
1048               don't generate any dependencies on modules
1049               therein.</para>
1050             </listitem>
1051           </varlistentry>
1052
1053           <varlistentry>
1054             <term><option>&ndash;&ndash;include-module=&lt;file&gt;</option></term>
1055             <listitem>
1056               <para>Regard <filename>&lt;file&gt;</filename> as not
1057               "stable"; i.e., generate dependencies on it (if
1058               any). This option is normally used in conjunction with
1059               the <option>&ndash;&ndash;exclude-directory</option> option.</para>
1060             </listitem>
1061           </varlistentry>
1062
1063           <varlistentry>
1064             <term><option>&ndash;&ndash;include-pkg-deps</option></term>
1065             <listitem>
1066               <para>Regard modules imported from packages as unstable,
1067               i.e., generate dependencies on any imported package modules
1068               (including <literal>Prelude</literal>, and all other
1069               standard Haskell libraries).  Dependencies are not traced
1070               recursively into packages; dependencies are only generated for
1071               home-package modules on external-package modules directly imported
1072               by the home package module.
1073               This option is normally
1074               only used by the various system libraries.</para>
1075             </listitem>
1076           </varlistentry>
1077         </variablelist>
1078
1079     </sect2>
1080
1081     <sect2 id="orphan-modules">
1082       <title>Orphan modules and instance declarations</title>
1083
1084 <para> Haskell specifies that when compiling module M, any instance
1085 declaration in any module "below" M is visible.  (Module A is "below"
1086 M if A is imported directly by M, or if A is below a module that M imports directly.)
1087 In principle, GHC must therefore read the interface files of every module below M,
1088 just in case they contain an instance declaration that matters to M.  This would
1089 be a disaster in practice, so GHC tries to be clever. </para>
1090
1091 <para>In particular, if an instance declaration is in the same module as the definition
1092 of any type or class mentioned in the head of the instance declaration, then
1093 GHC has to visit that interface file anyway.  Example:</para>
1094 <programlisting>
1095   module A where
1096     instance C a =&gt; D (T a) where ...
1097     data T a = ...
1098 </programlisting>
1099 <para> The instance declaration is only relevant if the type T is in use, and if
1100 so, GHC will have visited A's interface file to find T's definition. </para>
1101
1102 <para> The only problem comes when a module contains an instance declaration
1103 and GHC has no other reason for visiting the module.  Example:
1104 <programlisting>
1105   module Orphan where
1106     instance C a =&gt; D (T a) where ...
1107     class C a where ...
1108 </programlisting>
1109 Here, neither D nor T is declared in module Orphan.
1110 We call such modules ``orphan modules'',
1111 defined thus:</para>
1112 <itemizedlist>
1113   <listitem> <para> An <emphasis>orphan module</emphasis>
1114   <indexterm><primary>orphan module</primary></indexterm>
1115   contains at least one <emphasis>orphan instance</emphasis> or at
1116   least one <emphasis>orphan rule</emphasis>.</para> </listitem>
1117
1118   <listitem><para> An instance declaration in a module M is an <emphasis>orphan instance</emphasis> if
1119   <indexterm><primary>orphan instance</primary></indexterm>
1120   none of the type constructors
1121   or classes mentioned in the instance head (the part after the ``<literal>=&gt;</literal>'') are declared
1122   in M.</para>
1123
1124   <para> Only the instance head counts.  In the example above, it is not good enough for C's declaration
1125   to be in module A; it must be the declaration of D or T.</para>
1126   </listitem>
1127
1128   <listitem><para> A rewrite rule in a module M is an <emphasis>orphan rule</emphasis>
1129   <indexterm><primary>orphan rule</primary></indexterm>
1130   if none of the variables, type constructors,
1131   or classes that are free in the left hand side of the rule are declared in M.
1132   </para> </listitem>
1133  </itemizedlist>
1134
1135
1136 <para> GHC identifies orphan modules, and visits the interface file of
1137 every orphan module below the module being compiled.  This is usually
1138 wasted work, but there is no avoiding it.  You should therefore do
1139 your best to have as few orphan modules as possible.
1140
1141 </para>
1142
1143 <para> You can identify an orphan module by looking in its interface
1144 file, <filename>M.hi</filename>, using the
1145 <option>--show-iface</option>.  If there is a ``!'' on the first line,
1146 GHC considers it an orphan module.
1147 </para>
1148 </sect2>
1149
1150   </sect1>
1151
1152 <!-- Emacs stuff:
1153      ;;; Local Variables: ***
1154      ;;; mode: xml ***
1155      ;;; sgml-parent-document: ("users_guide.xml" "book" "chapter" "sect1") ***
1156      ;;; End: ***
1157  -->