24b589e13a902889fd3025e25836352213486d56
[ghc-hetmet.git] / ghc / docs / users_guide / using.vsgml
1 <sect> Using GHC
2 <label id="using-GHC">
3 <p>
4 <nidx>GHC, using</nidx>
5 <nidx>using GHC</nidx>
6
7 GHC is a command-line compiler: in order to compile a Haskell program,
8 GHC must be invoked on the source file(s) by typing a command to the
9 shell.  The steps involved in compiling a program can be automated
10 using the @make@ tool (this is especially useful if the program
11 consists of multiple source files which depend on each other).  This
12 section describes how to use GHC from the command-line.
13
14 %************************************************************************
15 %*                                                                      *
16 <sect1> Overall command-line structure
17 <label id="command-line-structure">
18 <p>
19 <nidx>structure, command-line</nidx>
20 <nidx>command-line structure</nidx>
21 %*                                                                      *
22 %************************************************************************
23
24 An invocation of GHC takes the following form:
25
26 <tscreen> <verb>
27 ghc [argument...]
28 </verb> </tscreen>
29
30 Command-line arguments are either options or file names.
31
32 Command-line options begin with @-@.  They may <em>not</em> be
33 grouped: @-vO@ is different from @-v -O@.  Options need not
34 precede filenames: e.g., @ghc *.o -o foo@.  All options are
35 processed and then applied to all files; you cannot, for example, invoke
36 @ghc -c -O1 Foo.hs -O2 Bar.hs@ to apply different optimisation
37 levels to the files @Foo.hs@ and @Bar.hs@.  For conflicting
38 options, e.g., @-c -S@, we reserve the right to do anything we
39 want.  (Usually, the last one applies.)
40
41 %************************************************************************
42 %*                                                                      *
43 <sect1>Meaningful file suffixes
44 <label id="file-suffixes">
45 <p>
46 <nidx>suffixes, file</nidx>
47 <nidx>file suffixes for GHC</nidx>
48 %*                                                                      *
49 %************************************************************************
50
51 File names with ``meaningful'' suffixes (e.g., @.lhs@ or @.o@)
52 cause the ``right thing'' to happen to those files.
53
54 <descrip>
55 <tag>@.lhs@:</tag>
56 <nidx>lhs suffix</nidx>
57 A ``literate Haskell'' module.
58
59 <tag>@.hs@:</tag> 
60 A not-so-literate Haskell module.
61
62 <tag>@.hi@:</tag>
63 A Haskell interface file, probably compiler-generated.
64
65 <tag>@.hc@:</tag>
66 Intermediate C file produced by the Haskell compiler.
67
68 <tag>@.c@:</tag>
69 A C~file not produced by the Haskell compiler.
70
71 % <tag>@.i@:</tag>
72 % C code after it has be preprocessed by the C compiler (using the
73 % @-E@ flag).
74
75 <tag>@.s@:</tag>
76 An assembly-language source file, usually
77 produced by the compiler.
78
79 <tag>@.o@:</tag>
80 An object file, produced by an assembler.
81 </descrip>
82
83 Files with other suffixes (or without suffixes) are passed straight
84 to the linker.
85
86 %************************************************************************
87 %*                                                                      *
88 <sect1>Help and verbosity options
89 <label id="options-help">
90 <p>
91 <nidx>help options (GHC)</nidx>
92 <nidx>verbose option (GHC)</nidx>
93 %*                                                                      *
94 %************************************************************************
95
96 A good option to start with is the @-help@ (or @-?@) option.
97 <nidx>-help option</nidx>
98 <nidx>-? option</nidx>
99 GHC spews a long message to standard output and then exits.
100
101 The @-v@<nidx>-v option</nidx> option makes GHC <em>verbose</em>: it
102 reports its version number and shows (on stderr) exactly how it invokes each 
103 phase of the compilation system.  Moreover, it passes
104 the @-v@ flag to most phases; each reports
105 its version number (and possibly some other information).
106
107 Please, oh please, use the @-v@ option when reporting bugs!
108 Knowing that you ran the right bits in the right order is always the
109 first thing we want to verify.
110
111 If you're just interested in the compiler version number, the
112 @--version@<nidx>--version option</nidx> option prints out a
113 one-line string containing the requested info.
114
115 %************************************************************************
116 %*                                                                      *
117 <sect1>Running the right phases in the right order
118 <label id="options-order">
119 <p>
120 <nidx>order of passes in GHC</nidx>
121 <nidx>pass ordering in GHC</nidx>
122 %*                                                                      *
123 %************************************************************************
124
125 The basic task of the @ghc@ driver is to run each input file
126 through the right phases (compiling, linking, etc.).
127
128 The first phase to run is determined by the input-file suffix, and the
129 last phase is determined by a flag.  If no relevant flag is present,
130 then go all the way through linking.  This table summarises:
131
132 <tabular ca="llll">
133 Phase of the           | Suffix saying | Flag saying   | (suffix of) @@
134 compilation system     | ``start here''| ``stop after''| output file @@
135 @@
136 literate pre-processor | .lhs          | -             | - @@
137 C pre-processor (opt.) | -             | -             | - @@
138 Haskell compiler       | .hs           | -C, -S        | .hc, .s @@
139 C compiler (opt.)      | .hc or .c     | -S            | .s  @@
140 assembler              | .s            | -c            | .o  @@
141 linker                 | other         | -             | a.out @@
142 </tabular>
143 <nidx>-C option</nidx>
144 <nidx>-S option</nidx>
145 <nidx>-c option</nidx>
146
147 Thus, a common invocation would be: @ghc -c Foo.hs@
148
149 Note: What the Haskell compiler proper produces depends on whether a
150 native-code generator is used (producing assembly language) or not
151 (producing C).
152
153 The option @-cpp@<nidx>-cpp option</nidx> must be given for the C
154 pre-processor phase to be run, that is, the pre-processor will be run
155 over your Haskell source file before continuing.
156
157 The option @-E@<nidx>-E option</nidx> runs just the pre-processing
158 passes of the compiler, outputting the result on stdout before
159 stopping. If used in conjunction with -cpp, the output is the
160 code blocks of the original (literal) source after having put it
161 through the grinder that is the C pre-processor. Sans @-cpp@, the
162 output is the de-litted version of the original source.
163
164 The option @-optcpp-E@<nidx>-optcpp-E option</nidx> runs just the
165 pre-processing stage of the C-compiling phase, sending the result to
166 stdout.  (For debugging or obfuscation contests, usually.)
167
168 %************************************************************************
169 %*                                                                      *
170 <sect1>Re-directing the compilation output(s)
171 <label id="options-output">
172 <p>
173 <nidx>output-directing options</nidx>
174 %*                                                                      *
175 %************************************************************************
176
177 GHC's compiled output normally goes into a @.hc@, @.o@, etc., file,
178 depending on the last-run compilation phase.  The option @-o
179 foo@<nidx>-o option</nidx> re-directs the output of that last-run
180 phase to file @foo@.
181
182 Note: this ``feature'' can be counterintuitive:
183 @ghc -C -o foo.o foo.hs@ will put the intermediate C code in the
184 file @foo.o@, name notwithstanding!
185
186 EXOTICA: But the @-o@ option isn't of much use if you have
187 <em>several</em> input files... Non-interface output files are
188 normally put in the same directory as their corresponding input file
189 came from.  You may specify that they be put in another directory
190 using the @-odir <dir>@<nidx>-odir &lt;dir&gt; option</nidx> (the
191 ``Oh, dear'' option).  For example:
192
193 <tscreen><verb>
194 % ghc -c parse/Foo.hs parse/Bar.hs gurgle/Bumble.hs -odir `arch`
195 </verb></tscreen>
196
197 The output files, @Foo.o@, @Bar.o@, and @Bumble.o@ would be
198 put into a subdirectory named after the architecture of the executing
199 machine (@sun4@, @mips@, etc).  The directory must already
200 exist; it won't be created.
201
202 Note that the @-odir@ option does <em>not</em> affect where the
203 interface files are put.  In the above example, they would still be
204 put in @parse/Foo.hi@, @parse/Bar.hi@, and @gurgle/Bumble.hi@.
205
206 MORE EXOTICA: The @-osuf <suffix>@<nidx>-osuf &lt;suffix&gt;
207 option</nidx> will change the @.o@ file suffix for object files to
208 whatever you specify.  (We use this in compiling the prelude.).
209 Similarly, the @-hisuf <suffix>@<nidx>-hisuf &lt;suffix&gt;
210 option</nidx> will change the @.hi@ file suffix for non-system
211 interface files (see Section <ref name="Other options related to
212 interface files" id="hi-options">).
213
214 The @-hisuf@/@-osuf@ game is useful if you want to compile a program
215 with both GHC and HBC (say) in the same directory.  Let HBC use the
216 standard @.hi@/@.o@ suffixes; add @-hisuf g_hi -osuf g_o@ to your
217 @make@ rule for GHC compiling...
218
219 FURTHER EXOTICA: If you are doing a normal @.hs@-to-@.o@ compilation
220 but would like to hang onto the intermediate @.hc@ C file, just
221 throw in a @-keep-hc-file-too@ option<nidx>-keep-hc-file-too option</nidx>.
222 If you would like to look at the assembler output, toss in a
223 @-keep-s-file-too@,<nidx>-keep-s-file-too option</nidx> too.
224
225 <sect2> Saving GHC's standard error output
226 <label id="saving-ghc-stderr">
227 <p>
228 <nidx>standard error, saving</nidx>
229
230 Sometimes, you may cause GHC to be rather chatty on standard error;
231 with @-v@, for example.  You can instruct GHC to <em>append</em> this
232 output to a particular log file with a @-odump <blah>@<nidx>-odump
233 &lt;blah&gt; option</nidx> option.
234
235 <sect2> Redirecting temporary files
236 <label id="temp-files">
237 <p>
238 <nidx>temporary files, redirecting</nidx>
239
240 If you have trouble because of running out of space in @/tmp@ (or
241 wherever your installation thinks temporary files should go), you may
242 use the @-tmpdir <dir>@<nidx>-tmpdir &lt;dir&gt; option</nidx> option
243 to specify an alternate directory.  For example, @-tmpdir .@ says to
244 put temporary files in the current working directory.
245
246 Alternatively, use your @TMPDIR@ environment variable.<nidx>TMPDIR
247 environment variable</nidx> Set it to the name of the directory where
248 temporary files should be put.  GCC and other programs will honour the
249 @TMPDIR@ variable as well.
250
251 Even better idea: Set the @TMPDIR@ variable when building GHC, and
252 never worry about @TMPDIR@ again. (see the build documentation).
253
254 %************************************************************************
255 %*                                                                      *
256 <sect1>Warnings and sanity-checking
257 <label id="options-sanity">
258 <p>
259 <nidx>sanity-checking options</nidx>
260 <nidx>warnings</nidx>
261 %*                                                                      *
262 %************************************************************************
263
264 GHC has a number of options that select which types of non-fatal error
265 messages, otherwise known as warnings, can be generated during
266 compilation.  By default, you get a standard set of warnings which are
267 generally likely to indicate bugs in your program.  These are:
268 @-fwarn-overlpapping-patterns@, @-fwarn-duplicate-exports@, and
269 @-fwarn-missing-methods@.  The following flags are simple ways to
270 select standard ``packages'' of warnings:
271
272 <descrip>
273
274 <tag>@-Wnot@:</tag>
275 <nidx>-Wnot option</nidx>
276
277 Turns off all warnings, including the standard ones.
278
279 <tag>@-w@:</tag>
280 <nidx>-w option</nidx>
281
282 Synonym for @-Wnot@.
283
284 <tag>@-W@:</tag>
285 <nidx>-W option</nidx>
286
287 Provides the standard warnings plus @-fwarn-incomplete-patterns@,
288 @-fwarn-unused-imports@ and @-fwarn-unused-binds@.
289
290 <tag>@-Wall@:</tag>
291 <nidx>-Wall option</nidx>
292
293 Turns on all warning options.
294
295 </descrip>
296
297 The full set of warning options is described below.  To turn off any
298 warning, simply give the corresponding @-fno-warn-...@ option on
299 the command line.
300
301 <descrip>
302
303 <tag>@-fwarn-name-shadowing@:</tag> 
304 <nidx>-fwarn-name-shadowing option</nidx>
305 <nidx>shadowing, warning</nidx>
306
307 This option causes a warning to be emitted whenever an inner-scope
308 value has the same name as an outer-scope value, i.e. the inner value
309 shadows the outer one.  This can catch typographical errors that turn
310 into hard-to-find bugs, e.g., in the inadvertent cyclic definition
311 @let x = ... x ... in@.
312
313 Consequently, this option does <em>not</em> allow cyclic recursive
314 definitions.
315
316 <tag>@-fwarn-overlapping-patterns@:</tag>
317 <nidx>-fwarn-overlapping-patterns option</nidx>
318 <nidx>overlapping patterns, warning</nidx>
319 <nidx>patterns, overlapping</nidx>
320
321 By default, the compiler will warn you if a set of patterns are
322 overlapping, i.e.,
323
324 <tscreen><verb>
325 f :: String -> Int
326 f []     = 0
327 f (_:xs) = 1
328 f "2"    = 2
329 </verb></tscreen>
330
331 where the last pattern match in @f@ won't ever be reached, as the
332 second pattern overlaps it. More often than not, redundant patterns
333 is a programmer mistake/error, so this option is enabled by default.
334
335 <tag>@-fwarn-incomplete-patterns@:</tag>
336 <nidx>-fwarn-incomplete-patterns option</nidx>
337 <nidx>incomplete patterns, warning</nidx>
338 <nidx>patterns, incomplete</nidx>
339
340 Similarly for incomplete patterns, the function @g@ below will fail
341 when applied to non-empty lists, so the compiler will emit a warning
342 about this when @-fwarn-incomplete-patterns@ is enabled.
343
344 <tscreen><verb>
345 g [] = 2
346 </verb></tscreen>
347
348 This option isn't enabled be default because it can be a bit noisy,
349 and it doesn't always indicate a bug in the program.  However, it's
350 generally considered good practice to cover all the cases in your
351 functions.
352
353 <tag>@-fwarn-missing-methods@:</tag>
354 <nidx>-fwarn-missing-methods option</nidx>
355 <nidx>missing methods, warning</nidx>
356 <nidx>methods, missing</nidx>
357
358 This option is on by default, and warns you whenever an instance
359 declaration is missing one or more methods, and the corresponding
360 class declaration has no default declaration for them.
361
362 <tag>@-fwarn-missing-fields@:</tag>
363 <nidx>-fwarn-missing-fields option</nidx>
364 <nidx>missing fields, warning</nidx>
365 <nidx>fields, missing</nidx>
366
367 This option is on by default, and warns you whenever the construction
368 of a labelled field constructor isn't complete, missing initializers
369 for one or more fields. While not an error (the missing fields are
370 initialised with bottoms), it is often an indication of a programmer
371 error.
372
373 <tag>@-fwarn-unused-imports@:</tag>
374 <nidx>-fwarn-unused-imports option</nidx>
375 <nidx>unused imports, warning</nidx>
376 <nidx>imports, unused</nidx>
377
378 Report any objects that are explicitly imported but never used.
379
380 <tag>@-fwarn-unused-binds@:</tag>
381 <nidx>-fwarn-unused-binds option</nidx>
382 <nidx>unused binds, warning</nidx>
383 <nidx>binds, unused</nidx>
384
385 Report any function definitions (and local bindings) which are unused.
386 For top-level functions, the warning is only given if the binding is
387 not exported.
388
389 <tag>@-fwarn-unused-matches@:</tag>
390 <nidx>-fwarn-unused-matches option</nidx>
391 <nidx>unused matches, warning</nidx>
392 <nidx>matches, unused</nidx>
393
394 Report all unused variables which arise from pattern matches,
395 including patterns consisting of a single variable.  For instance @f x
396 y = []@ would report @x@ and @y@ as unused.  To eliminate the warning,
397 all unused variables can be replaced with wildcards.
398
399 <tag>@-fwarn-duplicate-exports@:</tag>
400 <nidx>-fwarn-duplicate-exports option</nidx>
401 <nidx>duplicate exports, warning</nidx>
402 <nidx>export lists, duplicates</nidx>
403
404 Have the compiler warn about duplicate entries in export lists. This
405 is useful information if you maintain large export lists, and want to
406 avoid the continued export of a definition after you've deleted (one)
407 mention of it in the export list.
408
409 This option is on by default.
410
411 <tag><tt>-fwarn-type-defaults</tt>:</tag>
412 <nidx>-fwarn-type-defaults option</nidx>
413 <nidx>defaulting mechanism, warning</nidx>
414
415 Have the compiler warn/inform you where in your source the Haskell
416 defaulting mechanism for numeric types kicks in. This is useful
417 information when converting code from a context that assumed one
418 default into one with another, e.g., the 'default default' for Haskell
419 1.4 caused the otherwise unconstrained value <tt>1</tt> to be given
420 the type <tt>Int</tt>, whereas Haskell 98 defaults it to
421 <tt>Integer</tt>.  This may lead to differences in performance and
422 behaviour, hence the usefulness of being non-silent about this.
423
424 This warning is off by default.
425
426 <tag>@-fwarn-missing-signatures@:</tag>
427 <nidx>-fwarn-missing-signatures option</nidx>
428 <nidx>type signatures, missing</nidx>
429
430 If you would like GHC to check that every top-level function/value has
431 a type signature, use the @-fwarn-missing-signatures@ option.  This
432 option is off by default.
433
434 </descrip>
435
436 If you're feeling really paranoid, the @-dcore-lint@
437 option<nidx>-dcore-lint option</nidx> is a good choice.  It turns on
438 heavyweight intra-pass sanity-checking within GHC.  (It checks GHC's
439 sanity, not yours.)
440
441 %************************************************************************
442 %*                                                                      *
443 <sect1>Separate compilation
444 <label id="separate-compilation">
445 <p>
446 <nidx>separate compilation</nidx>
447 <nidx>recompilation checker</nidx>
448 <nidx>make and recompilation</nidx>
449 %*                                                                      *
450 %************************************************************************
451
452 This section describes how GHC supports separate compilation.
453
454 <sect2>Interface files
455 <label id="hi-files">
456 <p>
457 <nidx>interface files</nidx>
458 <nidx>.hi files</nidx>
459
460 When GHC compiles a source file @F@ which contains a module @A@, say,
461 it generates an object @F.o@, <em>and</em> a companion <em>interface
462 file</em> @A.hi@.  The interface file is not intended for human
463 consumption, as you'll see if you take a look at one.  It's merely
464 there to help the compiler compile other modules in the same program.
465
466 NOTE: Having the name of the interface file follow the module name and
467 not the file name, means that working with tools such as @make(1)@
468 become harder. @make@ implicitly assumes that any output files
469 produced by processing a translation unit will have file names that
470 can be derived from the file name of the translation unit.  For
471 instance, pattern rules becomes unusable.  For this reason, we
472 recommend you stick to using the same file name as the module name.
473
474 The interface file for @A@ contains information needed by the compiler
475 when it compiles any module @B@ that imports @A@, whether directly or
476 indirectly.  When compiling @B@, GHC will read @A.hi@ to find the
477 details that it needs to know about things defined in @A@.
478
479 Furthermore, when compiling module @C@ which imports @B@, GHC may
480 decide that it needs to know something about @A@ --- for example, @B@
481 might export a function that involves a type defined in @A@.  In this
482 case, GHC will go and read @A.hi@ even though @C@ does not explicitly
483 import @A@ at all.
484
485 The interface file may contain all sorts of things that aren't
486 explicitly exported from @A@ by the programmer.  For example, even
487 though a data type is exported abstractly, @A.hi@ will contain the
488 full data type definition.  For small function definitions, @A.hi@
489 will contain the complete definition of the function.  For bigger
490 functions, @A.hi@ will contain strictness information about the
491 function.  And so on.  GHC puts much more information into @.hi@ files
492 when optimisation is turned on with the @-O@ flag.  Without @-O@ it
493 puts in just the minimum; with @-O@ it lobs in a whole pile of stuff.
494 <nidx>optimsation, effect on .hi files</nidx>
495
496 @A.hi@ should really be thought of as a compiler-readable version of
497 @A.o@.  If you use a @.hi@ file that wasn't generated by the same
498 compilation run that generates the @.o@ file the compiler may assume
499 all sorts of incorrect things about @A@, resulting in core dumps and
500 other unpleasant happenings.
501
502 %************************************************************************
503 %*                                                                      *
504 <sect2>Finding interface files
505 <label id="options-finding-imports">
506 <p>
507 <nidx>interface files, finding them</nidx>
508 <nidx>finding interface files</nidx>
509 %*                                                                      *
510 %************************************************************************
511
512 In your program, you import a module @Foo@ by saying
513 @import Foo@.  GHC goes looking for an interface file, @Foo.hi@.
514 It has a builtin list of directories (notably including @.@) where
515 it looks.
516
517 <descrip>
518
519 <tag>@-i<dirs>@</tag><nidx>-i&lt;dirs&gt; option</nidx> This flag
520 prepends a colon-separated list of @dirs@ to the ``import
521 directories'' list.
522 See also Section <ref id="recomp"> for the significance of using
523 relative and absolute pathnames in the @-i@ list.
524
525 <tag>@-i@</tag> resets the ``import directories'' list back to nothing.
526
527 <tag>@-fno-implicit-prelude@</tag>
528 <nidx>-fno-implicit-prelude option</nidx>
529 GHC normally imports @Prelude.hi@ files for you.  If you'd rather it
530 didn't, then give it a @-fno-implicit-prelude@ option.  You are
531 unlikely to get very far without a Prelude, but, hey, it's a free
532 country.
533
534 <tag>@-syslib <lib>@</tag>
535 <nidx>-syslib &lt;lib&gt; option</nidx>
536
537 If you are using a system-supplied non-Prelude library (e.g., the
538 POSIX library), just use a @-syslib posix@ option (for example).  The
539 right interface files should then be available.  Section <ref
540 name="The GHC Prelude and Libraries" id="ghc-prelude"> lists the
541 libraries available by this mechanism.
542
543 <tag>@-I<dir>@</tag>
544 <nidx>-I&lt;dir&gt; option</nidx>
545
546 Once a Haskell module has been compiled to C (@.hc@ file), you may
547 wish to specify where GHC tells the C compiler to look for @.h@ files.
548 (Or, if you are using the @-cpp@ option<nidx>-cpp option</nidx>, where
549 it tells the C pre-processor to look...)  For this purpose, use a @-I@
550 option in the usual C-ish way.
551
552 </descrip>
553
554 %************************************************************************
555 %*                                                                      *
556 <sect2>Other options related to interface files
557 <label id="hi-options">
558 <p>
559 <nidx>interface files, options</nidx>
560 %*                                                                      *
561 %************************************************************************
562
563 The interface output may be directed to another file
564 @bar2/Wurble.iface@ with the option @-ohi bar2/Wurble.iface@<nidx>-ohi
565 &lt;file&gt; option</nidx> (not recommended).
566
567 To avoid generating an interface file at all, use a @-nohi@
568 option.<nidx>-nohi option</nidx>
569
570 The compiler does not overwrite an existing @.hi@ interface file if
571 the new one is byte-for-byte the same as the old one; this is friendly
572 to @make@.  When an interface does change, it is often enlightening to
573 be informed.  The @-hi-diffs@<nidx>-hi-diffs option</nidx> option will
574 make @ghc@ run @diff@ on the old and new @.hi@ files. You can also
575 record the difference in the interface file itself, the
576 @-keep-hi-diffs@<nidx>-keep-hi-diffs</nidx> option takes care of that.
577
578 The @.hi@ files from GHC contain ``usage'' information which changes
579 often and uninterestingly.  If you really want to see these changes
580 reported, you need to use the
581 @-hi-diffs-with-usages@<nidx>-hi-diffs-with-usages option</nidx>
582 option.
583
584 Interface files are normally jammed full of compiler-produced
585 <em>pragmas</em>, which record arities, strictness info, etc.  If you
586 think these pragmas are messing you up (or you are doing some kind of
587 weird experiment), you can tell GHC to ignore them with the
588 @-fignore-interface-pragmas@<nidx>-fignore-interface-pragmas
589 option</nidx> option.
590
591 When compiling without optimisations on, the compiler is extra-careful
592 about not slurping in data constructors and instance declarations that
593 it will not need. If you believe it is getting it wrong and not
594 importing stuff which you think it should, this optimisation can be
595 turned off with @-fno-prune-tydecls@ and @-fno-prune-instdecls@.
596 <nidx>-fno-prune-tydecls option</nidx><nidx>-fno-prune-instdecls
597 option</nidx>
598
599 See also Section <ref name="Linking and consistency-checking"
600 id="options-linker">, which describes how the linker finds standard
601 Haskell libraries.
602
603 %************************************************************************
604 %*                                                                      *
605 <sect2>The recompilation checker
606 <label id="recomp">
607 <p>
608 <nidx>recompilation checker</nidx>
609 %*                                                                      *
610 %************************************************************************
611
612 In the olden days, GHC compared the newly-generated @.hi@ file with
613 the previous version; if they were identical, it left the old one
614 alone and didn't change its modification date.  In consequence,
615 importers of a module with an unchanged output @.hi@ file were not
616 recompiled.
617
618 This doesn't work any more.  In our earlier example, module @C@ does
619 not import module @A@ directly, yet changes to @A.hi@ should force a
620 recompilation of @C@.  And some changes to @A@ (changing the
621 definition of a function that appears in an inlining of a function
622 exported by @B@, say) may conceivably not change @B.hi@ one jot.  So
623 now...
624
625 GHC keeps a version number on each interface file, and on each type
626 signature within the interface file.  It also keeps in every interface
627 file a list of the version numbers of everything it used when it last
628 compiled the file.  If the source file's modification date is earlier
629 than the @.o@ file's date (i.e. the source hasn't changed since the
630 file was last compiled), GHC will be clever.  It compares the version
631 numbers on the things it needs this time with the version numbers on
632 the things it needed last time (gleaned from the interface file of the
633 module being compiled); if they are all the same it stops compiling
634 rather early in the process saying ``Compilation IS NOT required''.
635 What a beautiful sight!
636
637 GHC <em>only</em> keeps detailed dependency information for ``user'' modules,
638 not for ``library'' modules.  It distinguishes the two by a hack: a module
639 whose @.hi@ file has an absolute path name is considered a library module,
640 while a relative path name indicates a user module.  So if you have a 
641 multi-directory application, use <em>relative</em> path names in your
642 @-i@ path, to force GHC to record detailed dependency information.
643 Use absolute path names only for directories containing slowly-changing
644 library modules.
645
646 A path is considered ``absolute'' if it starts with ``@/@'', or
647 ``@A:/@'', or ``@A:\@'' (or ``@B:/@'', ``@B:\@'' etc).
648
649 Patrick Sansom had a workshop paper about how all this is done (though
650 the details have changed quite a bit).  Ask
651 him (email: <htmlurl name="sansom@@dcs.gla.ac.uk"
652 url="mailto:sansom@@dcs.gla.ac.uk">) if you want a copy.
653
654 %************************************************************************
655 %*                                                                      *
656 <sect2>Using @make@
657 <label id="using-make">
658 <p>
659 <ncdx>make</ncdx>
660 %*                                                                      *
661 %************************************************************************
662
663 It is reasonably straightforward to set up a @Makefile@ to use with
664 GHC, assuming you name your source files the same as your modules.
665 Thus:
666
667 <tscreen><verb>
668 HC      = ghc
669 HC_OPTS = -cpp $(EXTRA_HC_OPTS)
670
671 SRCS = Main.lhs Foo.lhs Bar.lhs
672 OBJS = Main.o   Foo.o   Bar.o
673
674 .SUFFIXES : .o .hi .lhs .hc .s
675
676 cool_pgm : $(OBJS)
677         rm $@
678         $(HC) -o $@ $(HC_OPTS) $(OBJS)
679
680 # Standard suffix rules
681 .o.hi:
682         @:
683
684 .lhs.o:
685         $(HC) -c $< $(HC_OPTS)
686
687 .hs.o:
688         $(HC) -c $< $(HC_OPTS)
689
690 # Inter-module dependencies
691 Foo.o Foo.hc Foo.s    : Baz.hi          # Foo imports Baz
692 Main.o Main.hc Main.s : Foo.hi Baz.hi   # Main imports Foo and Baz
693 </verb></tscreen>
694
695 (Sophisticated @make@ variants may achieve some of the above more
696 elegantly.  Notably, @gmake@'s pattern rules let you write the more
697 comprehensible:
698
699 <tscreen><verb>
700 %.o : %.lhs
701         $(HC) -c $< $(HC_OPTS)
702 </verb></tscreen>
703
704 What we've shown should work with any @make@.)
705
706 Note the cheesy @.o.hi@ rule: It records the dependency of the
707 interface (@.hi@) file on the source.  The rule says a @.hi@ file can
708 be made from a @.o@ file by doing... nothing.  Which is true.
709
710 Note the inter-module dependencies at the end of the Makefile, which
711 take the form
712
713 <tscreen><verb>
714 Foo.o Foo.hc Foo.s    : Baz.hi          # Foo imports Baz
715 </verb></tscreen>
716
717 They tell @make@ that if any of @Foo.o@, @Foo.hc@ or @Foo.s@ have an
718 earlier modification date than @Baz.hi@, then the out-of-date file
719 must be brought up to date.  To bring it up to date, @make@ looks for
720 a rule to do so; one of the preceding suffix rules does the job
721 nicely.
722
723 Putting inter-dependencies of the form @Foo.o : Bar.hi@ into your
724 @Makefile@ by hand is rather error-prone.  Don't worry---never fear,
725 @mkdependHS@ is here! (and is distributed as part of GHC) Add the
726 following to your @Makefile@:
727
728 <tscreen><verb>
729 depend :
730         mkdependHS -- $(HC_OPTS) -- $(SRCS)
731 </verb></tscreen>
732
733 Now, before you start compiling, and any time you change the @imports@
734 in your program, do @make depend@ before you do @make cool_pgm@.
735 @mkdependHS@ will append the needed dependencies to your @Makefile@.
736 @mkdependHS@ is fully describe in Section <ref name="Makefile
737 dependencies in Haskell: using mkdependHS" id="mkdependHS">.
738
739 A few caveats about this simple scheme:
740
741 <itemize>
742
743 <item> You may need to compile some modules explicitly to create their
744 interfaces in the first place (e.g., @make Bar.o@ to create @Bar.hi@).
745
746 <item> You may have to type @make@ more than once for the dependencies
747 to have full effect.  However, a @make@ run that does nothing
748 <em>does</em> mean ``everything's up-to-date.''
749
750 <item> This scheme will work with mutually-recursive modules but,
751 again, it may take multiple iterations to ``settle.''
752
753 </itemize>
754
755 %************************************************************************
756 %*                                                                      *
757 <sect2>How to compile mutually recursive modules
758 <label id="mutual-recursion">
759 <p>
760 <nidx>module system, recursion</nidx>
761 <nidx>recursion, between modules</nidx>
762 %*                                                                      *
763 %************************************************************************
764
765 Currently, the compiler does not have proper support for dealing with
766 mutually recursive modules:
767
768 <tscreen><verb>
769 module A where
770
771 import B
772
773 newtype TA = MkTA Int
774
775 f :: TB -> TA
776 f (MkTB x) = MkTA x
777 --------
778 module B where
779
780 import A
781
782 data TB = MkTB !Int
783
784 g :: TA -> TB
785 g (MkTA x) = MkTB x
786 </verb></tscreen>
787
788 When compiling either module A and B, the compiler will try (in vain)
789 to look for the interface file of the other. So, to get mutually
790 recursive modules off the ground, you need to hand write an interface
791 file for A or B, so as to break the loop.  These hand-written
792 interface files are called @hi-boot@ files, and are placed in a file
793 called @<module>.hi-boot@.  To import from an @hi-boot@ file instead
794 of the standard @.hi@ file, use the following syntax in the importing module:
795 <nidx>hi-boot files</nidx>
796 <nidx>importing, hi-boot files</nidx>
797
798 <tscreen> <verb>
799 import {-# SOURCE #-} A
800 </verb> </tscreen>
801
802 The hand-written interface need only contain the bare minimum of
803 information needed to get the bootstrapping process started.  For
804 example, it doesn't need to contain declarations for <em/everything/
805 that module @A@ exports, only the things required by the module that
806 imports @A@ recursively.
807
808 For the example at hand, the boot interface file for A would look like
809 the following:
810
811 <tscreen><verb>
812 __interface A 1 404 where
813 __export A TA{MkTA} ;
814 1 newtype TA = MkTA PrelBase.Int ;
815 </verb></tscreen>
816
817 The syntax is essentially the same as a normal @.hi@ file
818 (unfortunately), but you can usually tailor an existing @.hi@ file to
819 make a @.hi-boot@ file.
820
821 Notice that we only put the declaration for the newtype @TA@ in the
822 @hi-boot@ file, not the signature for @f@, since @f@ isn't used by
823 @B@.
824
825 The number ``1'' after ``__interface A'' gives the version number of module A;
826 it is incremented whenever anything in A's interface file changes.  The ``404'' is
827 the version number of the interface file <em>syntax</em>; we change it when
828 we change the syntax of interface files so that you get a better error message when
829 you try to read an old-format file with a new-format compiler.
830
831 The number ``1'' at the beginning of a declaration is the <em>version
832 number</em> of that declaration: for the purposes of @.hi-boot@ files
833 these can all be set to 1.  All names must be fully qualified with the
834 <em/original/ module that an object comes from: for example, the
835 reference to @Int@ in the interface for @A@ comes from @PrelBase@,
836 which is a module internal to GHC's prelude.  It's a pain, but that's
837 the way it is.
838
839 If you want an hi-boot file to export a data type, but you don't want to give its constructors
840 (because the constructors aren't used by the SOURCE-importing module), you can write simply:
841
842 <tscreen><verb>
843 __interface A 1 404 where
844 __export A TA;
845 1 data TA
846 </verb></tscreen>
847
848 (You must write all the type parameters, but leave out the '=' and everything that follows it.)
849
850 <bf>Note:</bf> This is all a temporary solution, a version of the
851 compiler that handles mutually recursive properly without the manual
852 construction of interface files, is (allegedly) in the works.
853
854 %************************************************************************
855 %*                                                                      *
856 <sect1>Optimisation (code improvement)
857 <label id="options-optimise">
858 <p>
859 <nidx>optimisation (GHC)</nidx>
860 <nidx>improvement, code (GHC)</nidx>
861 %*                                                                      *
862 %************************************************************************
863
864 The @-O*@ options specify convenient ``packages'' of optimisation
865 flags; the @-f*@ options described later on specify
866 <em>individual</em> optimisations to be turned on/off; the @-m*@
867 options specify <em>machine-specific</em> optimisations to be turned
868 on/off.
869
870 %----------------------------------------------------------------------
871 <sect2>@-O*@: convenient ``packages'' of optimisation flags.
872 <label id="optimise-pkgs">
873 <p>
874 <nidx>-O options</nidx>
875
876 There are <em>many</em> options that affect the quality of code
877 produced by GHC.  Most people only have a general goal, something like
878 ``Compile quickly'' or ``Make my program run like greased lightning.''
879 The following ``packages'' of optimisations (or lack thereof) should
880 suffice.
881
882 Once you choose a @-O*@ ``package,'' stick with it---don't chop and
883 change.  Modules' interfaces <em>will</em> change with a shift to a new
884 @-O*@ option, and you may have to recompile a large chunk of all
885 importing modules before your program can again be run
886 safely (see Section <ref name="The recompilation checker" id="recomp">).
887
888 <descrip>
889 <tag>No @-O*@-type option specified:</tag>
890 <nidx>-O* not specified</nidx>
891 This is taken to mean: ``Please compile quickly; I'm not over-bothered
892 about compiled-code quality.''  So, for example: @ghc -c Foo.hs@
893
894 <tag>@-O@ or @-O1@:</tag>
895 <nidx>-O option</nidx>
896 <nidx>-O1 option</nidx>
897 <nidx>optimise normally</nidx>
898 Means: ``Generate good-quality code without taking too long about it.''
899 Thus, for example: @ghc -c -O Main.lhs@
900
901 <tag>@-O2@:</tag>
902 <nidx>-O2 option</nidx>
903 <nidx>optimise aggressively</nidx>
904 Means: ``Apply every non-dangerous optimisation, even if it means
905 significantly longer compile times.''
906
907 The avoided ``dangerous'' optimisations are those that can make
908 runtime or space <em>worse</em> if you're unlucky.  They are
909 normally turned on or off individually.
910
911 At the moment, @-O2@ is <em>unlikely</em> to produce
912 better code than @-O@.
913
914 <tag>@-O2-for-C@:</tag>
915 <nidx>-O2-for-C option</nidx>
916 <nidx>gcc, invoking with -O2</nidx>
917
918 Says to run GCC with @-O2@, which may be worth a few percent in
919 execution speed.  Don't forget @-fvia-C@, lest you use the native-code
920 generator and bypass GCC altogether!
921
922 <tag>@-Onot@:</tag>
923 <nidx>-Onot option</nidx>
924 <nidx>optimising, reset</nidx>
925
926 This option will make GHC ``forget'' any @-O@ish options it has seen so
927 far.  Sometimes useful; for example: @make all EXTRA_HC_OPTS=-Onot@.
928
929 <tag>@-Ofile <file>@:</tag>
930 <nidx>-Ofile &lt;file&gt; option</nidx>
931 <nidx>optimising, customised</nidx>
932
933 For those who need <em>absolute</em> control over <em>exactly</em>
934 what options are used (e.g., compiler writers, sometimes :-), a list
935 of options can be put in a file and then slurped in with @-Ofile@.
936
937 In that file, comments are of the @#@-to-end-of-line variety; blank
938 lines and most whitespace is ignored.
939
940 Please ask if you are baffled and would like an example of @-Ofile@!
941 </descrip>
942
943 At Glasgow, we don't use a @-O*@ flag for day-to-day work.  We use
944 @-O@ to get respectable speed; e.g., when we want to measure
945 something.  When we want to go for broke, we tend to use @-O -fvia-C
946 -O2-for-C@ (and we go for lots of coffee breaks).
947
948 The easiest way to see what @-O@ (etc.) ``really mean'' is to run with
949 @-v@, then stand back in amazement.  Alternatively, just look at the
950 @HsC_minus<blah>@ lists in the @ghc@ driver script.
951
952 %----------------------------------------------------------------------
953 <sect2>@-f*@: platform-independent flags
954 <p>
955 <nidx>-f* options (GHC)</nidx>
956 <nidx>-fno-* options (GHC)</nidx>
957
958 Flags can be turned <em>off</em> individually.  (NB: I hope you have a
959 good reason for doing this....) To turn off the @-ffoo@ flag, just use
960 the @-fno-foo@ flag.<nidx>-fno-&lt;opt&gt; anti-option</nidx> So, for
961 example, you can say @-O2 -fno-strictness@, which will then drop out
962 any running of the strictness analyser.
963
964 The options you are most likely to want to turn off are:
965 <itemize>
966 <item>
967 @-fno-strictness@<nidx>-fno-strictness option</nidx> (strictness
968 analyser, because it is sometimes slow),
969 <item>
970 @-fno-specialise@<nidx>-fno-specialise option</nidx> (automatic
971 specialisation of overloaded functions, because it can make your code
972 bigger) (US spelling also accepted), and
973 <item>
974 @-fno-cpr-analyse@<nidx>-fno-cpr-analyse option</nidx> switches off the CPR (constructed product
975 result) analyser.
976 </itemize>
977
978 Should you wish to turn individual flags <em>on</em>, you are advised
979 to use the @-Ofile@ option, described above.  Because the order in
980 which optimisation passes are run is sometimes crucial, it's quite
981 hard to do with command-line options.
982
983 Here are some ``dangerous'' optimisations you <em>might</em> want to try:
984 <descrip>
985 %------------------------------------------------------------------
986 <tag>@-fvia-C@:</tag>
987 <nidx>-fvia-C option</nidx>
988 <nidx>native code generator, turning off</nidx>
989
990 Compile via C, and don't use the native-code generator.  (There are
991 many cases when GHC does this on its own.)  You might pick up a little
992 bit of speed by compiling via C.  If you use @_ccall_gc_@s or
993 @_casm_@s, you probably <em>have to</em> use @-fvia-C@.
994
995 The lower-case incantation, @-fvia-c@, is synonymous.
996
997 Compiling via C will probably be slower (in compilation time) than
998 using GHC's native code generator.
999
1000 <tag>@-funfolding-interface-threshold<n>@:</tag>
1001 <nidx>-funfolding-interface-threshold option</nidx>
1002 <nidx>inlining, controlling</nidx>
1003 <nidx>unfolding, controlling</nidx>
1004 (Default: 30) By raising or lowering this number, you can raise or
1005 lower the amount of pragmatic junk that gets spewed into interface
1006 files.  (An unfolding has a ``size'' that reflects the cost in terms
1007 of ``code bloat'' of expanding that unfolding in another module.  A
1008 bigger function would be assigned a bigger cost.)
1009
1010 <tag>@-funfolding-creation-threshold<n>@:</tag>
1011 <nidx>-funfolding-creation-threshold option</nidx>
1012 <nidx>inlining, controlling</nidx>
1013 <nidx>unfolding, controlling</nidx>
1014 (Default: 30) This option is similar to
1015 @-funfolding-interface-threshold@, except that it governs unfoldings
1016 within a single module.  Increasing this figure is more likely to
1017 result in longer compile times than faster code.  The next option is
1018 more useful:
1019
1020 <tag>@-funfolding-use-threshold<n>@:</tag>
1021 <nidx>-funfolding-use-threshold option</nidx>
1022 <nidx>inlining, controlling</nidx>
1023 <nidx>unfolding, controlling</nidx>
1024 (Default: 8) This is the magic cut-off figure for unfolding: below
1025 this size, a function definition will be unfolded at the call-site,
1026 any bigger and it won't.  The size computed for a function depends on
1027 two things: the actual size of the expression minus any discounts that
1028 apply (see @-funfolding-con-discount@).
1029
1030 <tag>@-funfolding-con-discount<n>@:</tag>
1031 <nidx>-funfolding-con-discount option</nidx>
1032 <nidx>inlining, controlling</nidx>
1033 <nidx>unfolding, controlling</nidx>
1034 (Default: 2) If the compiler decides that it can eliminate some
1035 computation by performing an unfolding, then this is a discount factor
1036 that it applies to the funciton size before deciding whether to unfold
1037 it or not.
1038
1039 OK, folks, these magic numbers `30', `8', and '2' are mildly
1040 arbitrary; they are of the ``seem to be OK'' variety.  The `8' is the
1041 more critical one; it's what determines how eager GHC is about
1042 expanding unfoldings.
1043
1044 <tag>@-funbox-strict-fields@:</tag>
1045 <nidx>-funbox-strict-fields option</nidx>
1046 <nidx>strict constructor fields</nidx>
1047 <nidx>constructor fields, strict</nidx>
1048
1049 This option causes all constructor fields which are marked strict
1050 (i.e. ``!'') to be unboxed or unpacked if possible.  For example:
1051
1052 <tscreen><verb>
1053 data T = T !Float !Float
1054 </verb></tscreen>
1055
1056 will create a constructor @T@ containing two unboxed floats if the
1057 @-funbox-strict-fields@ flag is given.  This may not always be an
1058 optimisation: if the @T@ constructor is scrutinised and the floats
1059 passed to a non-strict function for example, they will have to be
1060 reboxed (this is done automatically by the compiler).
1061
1062 This option should only be used in conjunction with @-O@, in order to
1063 expose unfoldings to the compiler so the reboxing can be removed as
1064 often as possible.  For example:
1065
1066 <tscreen><verb>
1067 f :: T -> Float
1068 f (T f1 f2) = f1 + f2
1069 </verb></tscreen>
1070
1071 The compiler will avoid reboxing @f1@ and @f2@ by inlining @+@ on
1072 floats, but only when @-O@ is on.
1073
1074 Any single-constructor data is eligible for unpacking; for example
1075
1076 <tscreen><verb>
1077 data T = T !(Int,Int)
1078 </verb></tscreen>
1079
1080 will store the two @Int@s directly in the @T@ constructor, by flattening
1081 the pair.  Multi-level unpacking is also supported:
1082
1083 <tscreen><verb>
1084 data T = T !S
1085 data S = S !Int !Int
1086 </verb></tscreen>
1087
1088 will store two unboxed @Int#@s directly in the @T@ constructor.
1089
1090 <tag>@-fsemi-tagging@:</tag>
1091 This option (which <em>does not work</em> with the native-code generator)
1092 tells the compiler to add extra code to test for already-evaluated
1093 values.  You win if you have lots of such values during a run of your
1094 program, you lose otherwise.  (And you pay in extra code space.)
1095
1096 We have not played with @-fsemi-tagging@ enough to recommend it.
1097 (For all we know, it doesn't even work anymore...  Sigh.)
1098 </descrip>
1099
1100 %----------------------------------------------------------------------
1101 <sect2>@-m*@: platform-specific flags
1102 <p>
1103 <nidx>-m* options (GHC)</nidx>
1104 <nidx>platform-specific options</nidx>
1105 <nidx>machine-specific options</nidx>
1106
1107 Some flags only make sense for particular target platforms.
1108
1109 <descrip>
1110 <tag>@-mv8@:</tag>
1111 (SPARC machines)<nidx>-mv8 option (SPARC only)</nidx>
1112 Means to pass the like-named option to GCC; it says to use the
1113 Version 8 SPARC instructions, notably integer multiply and divide.
1114 The similiar @-m*@ GCC options for SPARC also work, actually.
1115
1116 <tag>@-mlong-calls@:</tag>
1117 (HPPA machines)<nidx>-mlong-calls option (HPPA only)</nidx>
1118 Means to pass the like-named option to GCC.  Required for Very Big
1119 modules, maybe.  (Probably means you're in trouble...)
1120
1121 <tag>@-monly-[32]-regs@:</tag>
1122 (iX86 machines)<nidx>-monly-N-regs option (iX86 only)</nidx>
1123 GHC tries to ``steal'' four registers from GCC, for performance
1124 reasons; it almost always works.  However, when GCC is compiling some
1125 modules with four stolen registers, it will crash, probably saying:
1126 <tscreen><verb>
1127 Foo.hc:533: fixed or forbidden register was spilled.
1128 This may be due to a compiler bug or to impossible asm
1129 statements or clauses.
1130 </verb></tscreen>
1131 Just give some registers back with @-monly-N-regs@.  Try `3' first,
1132 then `2'.  If `2' doesn't work, please report the bug to us.
1133 </descrip>
1134
1135 %----------------------------------------------------------------------
1136 <sect2>Code improvement by the C compiler.
1137 <label id="optimise-C-compiler">
1138 <p>
1139 <nidx>optimisation by GCC</nidx>
1140 <nidx>GCC optimisation</nidx>
1141
1142 The C~compiler (GCC) is run with @-O@ turned on.  (It has
1143 to be, actually).
1144
1145 If you want to run GCC with @-O2@---which may be worth a few
1146 percent in execution speed---you can give a
1147 @-O2-for-C@<nidx>-O2-for-C option</nidx> option.
1148
1149 %************************************************************************
1150 %*                                                                      *
1151 <sect1>Options related to a particular phase
1152 <label id="options-phases">
1153 <p>
1154 %*                                                                      *
1155 %************************************************************************
1156
1157 <sect2> The C pre-processor
1158 <label id="c-pre-processor">
1159 <p>
1160 <nidx>pre-processing: cpp</nidx>
1161 <nidx>C pre-processor options</nidx>
1162 <nidx>cpp, pre-processing with</nidx>
1163
1164 The C pre-processor @cpp@ is run over your Haskell code only if the
1165 @-cpp@ option <nidx>-cpp option</nidx> is given.  Unless you are
1166 building a large system with significant doses of conditional
1167 compilation, you really shouldn't need it.
1168 <descrip>
1169 <tag>@-D<foo>@:</tag>
1170 <nidx>-D&lt;name&gt; option</nidx>
1171 Define macro @<foo>@ in the usual way.  NB: does <em>not</em> affect
1172 @-D@ macros passed to the C~compiler when compiling via C!  For those,
1173 use the @-optc-Dfoo@ hack... (see Section <ref name="Forcing options
1174 to a particular phase." id="forcing-options-through">).
1175
1176 <tag>@-U<foo>@:</tag>
1177 <nidx>-U&lt;name&gt; option</nidx>
1178 Undefine macro @<foo>@ in the usual way.
1179
1180 <tag>@-I<dir>@:</tag>
1181 <nidx>-I&lt;dir&gt; option</nidx>
1182 Specify a directory in which to look for @#include@ files, in
1183 the usual C way.
1184 </descrip>
1185
1186 The @ghc@ driver pre-defines several macros when processing Haskell
1187 source code (@.hs@ or @.lhs@ files):
1188
1189 <descrip>
1190 <tag>@__HASKELL98__@:</tag>
1191 <nidx>__HASKELL98__</nidx>
1192 If defined, this means that GHC supports the language defined by the
1193 Haskell 98 report.
1194
1195 <tag>@__HASKELL__=98@:</tag>
1196 <nidx>__HASKELL__</nidx>
1197 In GHC 4.04 and later, the @__HASKELL__@ macro is defined as having
1198 the value @98@.
1199
1200 <tag>@__HASKELL1__@:</tag>
1201 <nidx>__HASKELL1__ macro</nidx>
1202 If defined to <em/n/, that means GHC supports the Haskell language
1203 defined in the Haskell report version <em/1.n/.  Currently 5.  This
1204 macro is deprecated, and will probably disappear in future versions.
1205
1206 <tag>@__GLASGOW_HASKELL__@:</tag>
1207 <nidx>__GLASGOW_HASKELL__ macro</nidx>
1208 For version <em/n/ of the GHC system, this will be @#define@d to
1209 <em/100n/.  So, for version 4.00, it is 400.
1210
1211 With any luck, @__GLASGOW_HASKELL__@ will be undefined in all other
1212 implementations that support C-style pre-processing.
1213
1214 (For reference: the comparable symbols for other systems are:
1215 @__HUGS__@ for Hugs and @__HBC__@ for Chalmers.)
1216
1217 NB. This macro is set when pre-processing both Haskell source and C
1218 source, including the C source generated from a Haskell module
1219 (ie. @.hs@, @.lhs@, @.c@ and @.hc@ files).
1220
1221 <tag>@__CONCURRENT_HASKELL__@:</tag>
1222 <nidx>__CONCURRENT_HASKELL__ macro</nidx>
1223 This symbol is defined when pre-processing Haskell (input) and
1224 pre-processing C (GHC output).  Since GHC from verion 4.00 now
1225 supports concurrent haskell by default, this symbol is always defined.
1226
1227 <tag>@__PARALLEL_HASKELL__@:</tag>
1228 <nidx>__PARALLEL_HASKELL__ macro</nidx>
1229 Only defined when @-parallel@ is in use!  This symbol is defined when
1230 pre-processing Haskell (input) and pre-processing C (GHC output).
1231 </descrip>
1232
1233 Options other than the above can be forced through to the C
1234 pre-processor with the @-opt@ flags (see
1235 Section <ref name="Forcing options to a particular phase." id="forcing-options-through">).
1236
1237 A small word of warning: @-cpp@ is not friendly to ``string
1238 gaps''.<nidx>-cpp vs string gaps</nidx><nidx>string gaps vs
1239 -cpp</nidx>.  In other words, strings such as the following:
1240
1241 <tscreen><verb>
1242         strmod = "\
1243         \ p \
1244         \ "
1245 </verb></tscreen>
1246
1247 don't work with @-cpp@; @/usr/bin/cpp@ elides the
1248 backslash-newline pairs.
1249
1250 However, it appears that if you add a space at the end of the line,
1251 then @cpp@ (at least GNU @cpp@ and possibly other @cpp@s)
1252 leaves the backslash-space pairs alone and the string gap works as
1253 expected.
1254
1255 %************************************************************************
1256 %*                                                                      *
1257 <sect2>Options affecting the C compiler (if applicable)
1258 <label id="options-C-compiler">
1259 <p>
1260 <nidx>include-file options</nidx>
1261 <nidx>C compiler options</nidx>
1262 <nidx>GCC options</nidx>
1263 %*                                                                      *
1264 %************************************************************************
1265
1266 At the moment, quite a few common C-compiler options are passed on
1267 quietly to the C compilation of Haskell-compiler-generated C files.
1268 THIS MAY CHANGE.  Meanwhile, options so sent are:
1269
1270 <tabular ca="ll">
1271 @-ansi@      | do ANSI C (not K&amp;R) @@
1272 @-pedantic@  | be so@@
1273 @-dgcc-lint@ | (hack) short for ``make GCC very paranoid''@@
1274 </tabular>
1275 <nidx>-ansi option (for GCC)</nidx>
1276 <nidx>-pedantic option (for GCC)</nidx>
1277 <nidx>-dgcc-lint option (GCC paranoia)</nidx>
1278
1279 If you are compiling with lots of @ccalls@, etc., you may need to
1280 tell the C~compiler about some @#include@ files.  There is no real
1281 pretty way to do this, but you can use this hack from the
1282 command-line:
1283
1284 <tscreen><verb>
1285 % ghc -c '-#include <X/Xlib.h>' Xstuff.lhs
1286 </verb></tscreen>
1287
1288
1289 %************************************************************************
1290 %*                                                                      *
1291 <sect2>Linking and consistency-checking
1292 <label id="options-linker">
1293 <p>
1294 <nidx>linker options</nidx>
1295 <nidx>ld options</nidx>
1296 %*                                                                      *
1297 %************************************************************************
1298
1299 GHC has to link your code with various libraries, possibly including:
1300 user-supplied, GHC-supplied, and system-supplied (@-lm@ math
1301 library, for example).
1302
1303 <descrip>
1304 <tag>@-l<FOO>@:</tag>
1305 <nidx>-l&lt;lib&gt; option</nidx>
1306 Link in a library named @lib<FOO>.a@ which resides somewhere on the
1307 library directories path.
1308
1309 Because of the sad state of most UNIX linkers, the order of such
1310 options does matter.  Thus: @ghc -lbar *.o@ is almost certainly
1311 wrong, because it will search @libbar.a@ <em>before</em> it has
1312 collected unresolved symbols from the @*.o@ files.
1313 @ghc *.o -lbar@ is probably better.
1314
1315 The linker will of course be informed about some GHC-supplied
1316 libraries automatically; these are:
1317
1318 <tabular ca="ll">
1319 <bf>-l equivalent</bf> | <bf>description</bf> @@
1320 @@
1321 @-lHSrts,-lHSclib@ | basic runtime libraries @@
1322 @-lHS@         | standard Prelude library @@
1323 @-lHS_cbits@  | C support code for standard Prelude library @@
1324 @-lgmp@        | GNU multi-precision library (for Integers)@@
1325 </tabular>
1326
1327 <nidx>-lHS library</nidx>
1328 <nidx>-lHS_cbits library</nidx>
1329 <nidx>-lHSrts library</nidx>
1330 <nidx>-lgmp library</nidx>
1331
1332 <tag>@-syslib <name>@:</tag>
1333 <nidx>-syslib &lt;name&gt; option</nidx>
1334
1335 If you are using a Haskell ``system library'' (e.g., the POSIX
1336 library), just use the @-syslib posix@ option, and the correct code
1337 should be linked in.
1338
1339 <tag>@-L<dir>@:</tag>
1340 <nidx>-L&lt;dir&gt; option</nidx>
1341 Where to find user-supplied libraries...  Prepend the directory
1342 @<dir>@ to the library directories path.
1343
1344 <tag>@-static@:</tag>
1345 <nidx>-static option</nidx>
1346 Tell the linker to avoid shared libraries.
1347
1348 <tag>@-no-link-chk@ and @-link-chk@:</tag>
1349 <nidx>-no-link-chk option</nidx>
1350 <nidx>-link-chk option</nidx>
1351 <nidx>consistency checking of executables</nidx>
1352 By default, immediately after linking an executable, GHC verifies that
1353 the pieces that went into it were compiled with compatible flags; a
1354 ``consistency check''.
1355 (This is to avoid mysterious failures caused by non-meshing of
1356 incompatibly-compiled programs; e.g., if one @.o@ file was compiled
1357 for a parallel machine and the others weren't.)  You may turn off this
1358 check with @-no-link-chk@.  You can turn it (back) on with
1359 @-link-chk@ (the default).
1360
1361 <tag><tt>-no-hs-main</tt>:</tag>
1362 <nidx>-no-hs-main option</nidx>
1363 <nidx>linking Haskell libraries with foreign code</nidx>
1364
1365 In the event you want to include ghc-compiled code as part of another
1366 (non-Haskell) program, the RTS will not be supplying its definition of
1367 <tt/main()/ at link-time, you will have to. To signal that to the
1368 driver script when linking, use <tt/-no-hs-main/.
1369
1370 Notice that since the command-line passed to the linker is rather
1371 involved, you probably want to use the ghc driver script to do the
1372 final link of your `mixed-language' application. This is not a
1373 requirement though, just try linking once with <tt/-v/ on to see what
1374 options the driver passes through to the linker.
1375
1376 </descrip>
1377
1378 %************************************************************************
1379 %*                                                                      *
1380 <sect1>Using Concurrent Haskell
1381 <p>
1382 <nidx>Concurrent Haskell---use</nidx>
1383 %*                                                                      *
1384 %************************************************************************
1385
1386 GHC (as of version 4.00) supports Concurrent Haskell by default,
1387 without requiring a special option or libraries compiled in a certain
1388 way.  To get access to the support libraries for Concurrent Haskell
1389 (ie. @Concurrent@ and friends), use the @-syslib concurrent@ option.
1390
1391 Three RTS options are provided for modifying the behaviour of the
1392 threaded runtime system.  See the descriptions of @-C[<us>]@, @-q@,
1393 and @-t<num>@ in Section <ref name="RTS options for
1394 Concurrent/Parallel Haskell" id="parallel-rts-opts">.
1395
1396 Concurrent Haskell is described in more detail in Section <ref
1397 name="Concurrent and Parallel Haskell" id="concurrent-and-parallel">.
1398
1399 %************************************************************************
1400 %*                                                                      *
1401 <sect1>Using Parallel Haskell
1402 <p>
1403 <nidx>Parallel Haskell---use</nidx>
1404 %*                                                                      *
1405 %************************************************************************
1406
1407 [You won't be able to execute parallel Haskell programs unless PVM3
1408 (Parallel Virtual Machine, version 3) is installed at your site.]
1409
1410 To compile a Haskell program for parallel execution under PVM, use the
1411 @-parallel@ option,<nidx>-parallel option</nidx> both when compiling
1412 <em>and linking</em>.  You will probably want to @import Parallel@
1413 into your Haskell modules.
1414
1415 To run your parallel program, once PVM is going, just invoke it ``as
1416 normal''.  The main extra RTS option is @-N<n>@, to say how many
1417 PVM ``processors'' your program to run on.  (For more details of
1418 all relevant RTS options, please see Section <ref name="RTS options for Concurrent/Parallel Haskell" id="parallel-rts-opts">.)
1419
1420 In truth, running Parallel Haskell programs and getting information
1421 out of them (e.g., parallelism profiles) is a battle with the vagaries of
1422 PVM, detailed in the following sections.
1423
1424 %************************************************************************
1425 %*                                                                      *
1426 <sect2>Dummy's guide to using PVM
1427 <p>
1428 <nidx>PVM, how to use</nidx>
1429 <nidx>Parallel Haskell---PVM use</nidx>
1430 %*                                                                      *
1431 %************************************************************************
1432
1433 Before you can run a parallel program under PVM, you must set the
1434 required environment variables (PVM's idea, not ours); something like,
1435 probably in your @.cshrc@ or equivalent:
1436 <tscreen><verb>
1437 setenv PVM_ROOT /wherever/you/put/it
1438 setenv PVM_ARCH `$PVM_ROOT/lib/pvmgetarch`
1439 setenv PVM_DPATH $PVM_ROOT/lib/pvmd
1440 </verb></tscreen>
1441
1442 Creating and/or controlling your ``parallel machine'' is a purely-PVM
1443 business; nothing specific to Parallel Haskell.
1444
1445 You use the @pvm@<nidx>pvm command</nidx> command to start PVM on your
1446 machine.  You can then do various things to control/monitor your
1447 ``parallel machine;'' the most useful being:
1448
1449 \begin{tabular}{ll}
1450 @Control-D@ & exit @pvm@, leaving it running \\
1451 @halt@ & kill off this ``parallel machine'' \& exit \\
1452 @add <host>@ & add @<host>@ as a processor \\
1453 @delete <host>@ & delete @<host>@ \\
1454 @reset@ & kill what's going, but leave PVM up \\
1455 @conf@       & list the current configuration \\
1456 @ps@         & report processes' status \\
1457 @pstat <pid>@ & status of a particular process \\
1458 \end{tabular}
1459
1460 The PVM documentation can tell you much, much more about @pvm@!
1461
1462 %************************************************************************
1463 %*                                                                      *
1464 <sect2>Parallelism profiles
1465 <p>
1466 <nidx>parallelism profiles</nidx>
1467 <nidx>profiles, parallelism</nidx>
1468 <nidx>visualisation tools</nidx>
1469 %*                                                                      *
1470 %************************************************************************
1471
1472 With Parallel Haskell programs, we usually don't care about the
1473 results---only with ``how parallel'' it was!  We want pretty pictures.
1474
1475 Parallelism profiles (\`a la @hbcpp@) can be generated with the
1476 @-q@<nidx>-q RTS option (concurrent, parallel)</nidx> RTS option.  The
1477 per-processor profiling info is dumped into files named
1478 @<full-path><program>.gr@.  These are then munged into a PostScript picture,
1479 which you can then display.  For example, to run your program
1480 @a.out@ on 8 processors, then view the parallelism profile, do:
1481
1482 <tscreen><verb>
1483 % ./a.out +RTS -N8 -q
1484 % grs2gr *.???.gr > temp.gr     # combine the 8 .gr files into one
1485 % gr2ps -O temp.gr              # cvt to .ps; output in temp.ps
1486 % ghostview -seascape temp.ps   # look at it!
1487 </verb></tscreen>
1488
1489 The scripts for processing the parallelism profiles are distributed
1490 in @ghc/utils/parallel/@.
1491
1492 %************************************************************************
1493 %*                                                                      *
1494 <sect2>Other useful info about running parallel programs
1495 <p>
1496 %*                                                                      *
1497 %************************************************************************
1498
1499 The ``garbage-collection statistics'' RTS options can be useful for
1500 seeing what parallel programs are doing.  If you do either
1501 @+RTS -Sstderr@<nidx>-Sstderr RTS option</nidx> or @+RTS -sstderr@, then
1502 you'll get mutator, garbage-collection, etc., times on standard
1503 error. The standard error of all PE's other than the `main thread'
1504 appears in @/tmp/pvml.nnn@, courtesy of PVM.
1505
1506 Whether doing @+RTS -Sstderr@ or not, a handy way to watch
1507 what's happening overall is: @tail -f /tmp/pvml.nnn@.
1508
1509 %************************************************************************
1510 %*                                                                      *
1511 <sect2>RTS options for Concurrent/Parallel Haskell
1512 <label id="parallel-rts-opts">
1513 <p>
1514 <nidx>RTS options, concurrent</nidx>
1515 <nidx>RTS options, parallel</nidx>
1516 <nidx>Concurrent Haskell---RTS options</nidx>
1517 <nidx>Parallel Haskell---RTS options</nidx>
1518 %*                                                                      *
1519 %************************************************************************
1520
1521 Besides the usual runtime system (RTS) options
1522 (Section <ref name="Running a compiled program" id="runtime-control">), there are a few options particularly
1523 for concurrent/parallel execution.
1524
1525 <descrip>
1526 <tag>@-N<N>@:</tag>
1527 <nidx>-N&lt;N&gt; RTS option (parallel)</nidx>
1528 (PARALLEL ONLY) Use @<N>@ PVM processors to run this program;
1529 the default is 2.
1530
1531 <tag>@-C[<us>]@:</tag>
1532 <nidx>-C&lt;us&gt; RTS option</nidx>
1533 Sets the context switch interval to @<us>@ microseconds.  A context
1534 switch will occur at the next heap allocation after the timer expires.
1535 With @-C0@ or @-C@, context switches will occur as often as
1536 possible (at every heap allocation).  By default, context switches
1537 occur every 10 milliseconds.  Note that many interval timers are only
1538 capable of 10 millisecond granularity, so the default setting may be
1539 the finest granularity possible, short of a context switch at every
1540 heap allocation.
1541
1542 [NOTE: this option currently has no effect (version 4.00).  Context
1543 switches happen when the current heap block is full, i.e. every 4k of
1544 allocation].
1545
1546 <tag>@-q[v]@:</tag>
1547 <nidx>-q RTS option</nidx>
1548 (PARALLEL ONLY) Produce a quasi-parallel profile of thread activity,
1549 in the file @<program>.qp@.  In the style of @hbcpp@, this profile
1550 records the movement of threads between the green (runnable) and red
1551 (blocked) queues.  If you specify the verbose suboption (@-qv@), the
1552 green queue is split into green (for the currently running thread
1553 only) and amber (for other runnable threads).  We do not recommend
1554 that you use the verbose suboption if you are planning to use the
1555 @hbcpp@ profiling tools or if you are context switching at every heap
1556 check (with @-C@).
1557
1558 <tag>@-t<num>@:</tag>
1559 <nidx>-t&lt;num&gt; RTS option</nidx>
1560 (PARALLEL ONLY) Limit the number of concurrent threads per processor
1561 to @<num>@.  The default is 32.  Each thread requires slightly over 1K
1562 <em>words</em> in the heap for thread state and stack objects.  (For
1563 32-bit machines, this translates to 4K bytes, and for 64-bit machines,
1564 8K bytes.)
1565
1566 <tag>@-d@:</tag>
1567 <nidx>-d RTS option (parallel)</nidx>
1568 (PARALLEL ONLY) Turn on debugging.  It pops up one xterm (or GDB, or
1569 something...) per PVM processor.  We use the standard @debugger@
1570 script that comes with PVM3, but we sometimes meddle with the
1571 @debugger2@ script.  We include ours in the GHC distribution,
1572 in @ghc/utils/pvm/@.
1573
1574 <tag>@-e<num>@:</tag>
1575 <nidx>-e&lt;num&gt; RTS option (parallel)</nidx>
1576 (PARALLEL ONLY) Limit the number of pending sparks per processor to
1577 @<num>@. The default is 100. A larger number may be appropriate if
1578 your program generates large amounts of parallelism initially.
1579
1580 <tag>@-Q<num>@:</tag>
1581 <nidx>-Q&lt;num&gt; RTS option (parallel)</nidx>
1582 (PARALLEL ONLY) Set the size of packets transmitted between processors
1583 to @<num>@. The default is 1024 words. A larger number may be
1584 appropriate if your machine has a high communication cost relative to
1585 computation speed.
1586 </descrip>