Reorganisation of the source tree
[ghc-hetmet.git] / rts / gmp / mpn / powerpc64 / sub_n.asm
diff --git a/rts/gmp/mpn/powerpc64/sub_n.asm b/rts/gmp/mpn/powerpc64/sub_n.asm
new file mode 100644 (file)
index 0000000..4de3de6
--- /dev/null
@@ -0,0 +1,61 @@
+# PowerPC-64 mpn_sub_n -- Subtract two limb vectors of the same length > 0
+# and store difference in a third limb vector.
+
+# Copyright (C) 1999, 2000 Free Software Foundation, Inc.b
+
+# This file is part of the GNU MP Library.
+
+# The GNU MP Library is free software; you can redistribute it and/or modify
+# it under the terms of the GNU Lesser General Public License as published by
+# the Free Software Foundation; either version 2.1 of the License, or (at your
+# option) any later version.
+
+# The GNU MP Library is distributed in the hope that it will be useful, but
+# WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
+# or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
+# License for more details.
+
+# You should have received a copy of the GNU Lesser General Public License
+# along with the GNU MP Library; see the file COPYING.LIB.  If not, write to
+# the Free Software Foundation, Inc., 59 Temple Place - Suite 330, Boston,
+# MA 02111-1307, USA.
+
+
+# INPUT PARAMETERS
+# res_ptr      r3
+# s1_ptr       r4
+# s2_ptr       r5
+# size         r6
+
+include(`../config.m4')
+
+ASM_START()
+PROLOGUE(mpn_sub_n)
+       mtctr   r6              # copy size into CTR
+       addic   r0,r6,-1        # set cy
+       ld      r8,0(r4)        # load least significant s1 limb
+       ld      r0,0(r5)        # load least significant s2 limb
+       addi    r3,r3,-8        # offset res_ptr, it's updated before it's used
+       bdz     .Lend           # If done, skip loop
+.Loop: ld      r9,8(r4)        # load s1 limb
+       ld      r10,8(r5)       # load s2 limb
+       subfe   r7,r0,r8        # subtract limbs with cy, set cy
+       std     r7,8(r3)        # store result limb
+       bdz     .Lexit          # decrement CTR and exit if done
+       ldu     r8,16(r4)       # load s1 limb and update s1_ptr
+       ldu     r0,16(r5)       # load s2 limb and update s2_ptr
+       subfe   r7,r10,r9       # subtract limbs with cy, set cy
+       stdu    r7,16(r3)       # store result limb and update res_ptr
+       bdnz    .Loop           # decrement CTR and loop back
+
+.Lend: subfe   r7,r0,r8
+       std     r7,8(r3)        # store ultimate result limb
+       subfe   r3,r0,r0        # load !cy into ...
+       subfic  r3,r3,0         # ... return value register
+       blr
+.Lexit:        subfe   r7,r10,r9
+       std     r7,16(r3)
+       subfe   r3,r0,r0        # load !cy into ...
+       subfic  r3,r3,0         # ... return value register
+       blr
+EPILOGUE(mpn_sub_n)