Go back to sometimes assuming intristics are local.

author Rafael Espindola <rafael.espindola@gmail.com>

Sat, 10 Mar 2018 02:42:14 +0000 (02:42 +0000)

committer Rafael Espindola <rafael.espindola@gmail.com>

Sat, 10 Mar 2018 02:42:14 +0000 (02:42 +0000)
author Rafael Espindola <rafael.espindola@gmail.com>
Sat, 10 Mar 2018 02:42:14 +0000 (02:42 +0000)
committer Rafael Espindola <rafael.espindola@gmail.com>
Sat, 10 Mar 2018 02:42:14 +0000 (02:42 +0000)
diff --git a/lib/Target/TargetMachine.cpp b/lib/Target/TargetMachine.cpp

index 2a09685..aac4078 100644 (file)
--- a/lib/Target/TargetMachine.cpp
+++ b/lib/Target/TargetMachine.cpp
@@ -116,12 +116,24 @@ bool TargetMachine::shouldAssumeDSOLocal(const Module &M,
    if (GV && GV->isDSOLocal())
      return true;
  
-  // According to the llvm language reference, we should be able to just return
-  // false in here if we have a GV, as we know it is dso_preemptable.
-  // At this point in time, the various IR producers have not been transitioned
-  // to always produce a dso_local when it is possible to do so. As a result we
-  // still have some pre-dso_local logic in here to improve the quality of the
-  // generated code:
+  // If we are not supossed to use a PLT, we cannot assume that intrinsics are
+  // local since the linker can convert some direct access to access via plt.
+  if (M.getRtLibUseGOT() && !GV)
+    return false;
+
+  // According to the llvm language reference, we should be able to
+  // just return false in here if we have a GV, as we know it is
+  // dso_preemptable.  At this point in time, the various IR producers
+  // have not been transitioned to always produce a dso_local when it
+  // is possible to do so.
+  // In the case of intrinsics, GV is null and there is nowhere to put
+  // dso_local. Returning false for those will produce worse code in some
+  // architectures. For example, on x86 the caller has to set ebx before calling
+  // a plt.
+  // As a result we still have some logic in here to improve the quality of the
+  // generated code.
+  // FIXME: Add a module level metadata for whether intrinsics should be assumed
+  // local.
  
    Reloc::Model RM = getRelocationModel();
    const Triple &TT = getTargetTriple();
@@ -137,27 +149,20 @@ bool TargetMachine::shouldAssumeDSOLocal(const Module &M,
    if (TT.isOSBinFormatCOFF() || (TT.isOSWindows() && TT.isOSBinFormatMachO()))
      return true;
  
-  // If GV is null we know that this is a call to an intrinsic. For ELF and
-  // MachO we don't need to assume those are local since the liker can trivially
-  // convert a call to a PLT to a direct call if the target (in the runtime
-  // library) turns out to be local.
-  if (!GV)
-    return false;
-
    // Most PIC code sequences that assume that a symbol is local cannot
    // produce a 0 if it turns out the symbol is undefined. While this
    // is ABI and relocation depended, it seems worth it to handle it
    // here.
-  if (isPositionIndependent() && GV->hasExternalWeakLinkage())
+  if (GV && isPositionIndependent() && GV->hasExternalWeakLinkage())
      return false;
  
-  if (!GV->hasDefaultVisibility())
+  if (GV && !GV->hasDefaultVisibility())
      return true;
  
    if (TT.isOSBinFormatMachO()) {
      if (RM == Reloc::Static)
        return true;
-    return GV->isStrongDefinitionForLinker();
+    return GV && GV->isStrongDefinitionForLinker();
    }
  
    assert(TT.isOSBinFormatELF());
@@ -167,19 +172,19 @@ bool TargetMachine::shouldAssumeDSOLocal(const Module &M,
        RM == Reloc::Static || M.getPIELevel() != PIELevel::Default;
    if (IsExecutable) {
      // If the symbol is defined, it cannot be preempted.
-    if (!GV->isDeclarationForLinker())
+    if (GV && !GV->isDeclarationForLinker())
        return true;
  
      // A symbol marked nonlazybind should not be accessed with a plt. If the
      // symbol turns out to be external, the linker will convert a direct
      // access to an access via the plt, so don't assume it is local.
-    const Function *F = dyn_cast<Function>(GV);
+    const Function *F = dyn_cast_or_null<Function>(GV);
      if (F && F->hasFnAttribute(Attribute::NonLazyBind))
        return false;
  
-    bool IsTLS = GV->isThreadLocal();
+    bool IsTLS = GV && GV->isThreadLocal();
      bool IsAccessViaCopyRelocs =
-        Options.MCOptions.MCPIECopyRelocations && isa<GlobalVariable>(GV);
+        GV && Options.MCOptions.MCPIECopyRelocations && isa<GlobalVariable>(GV);
      Triple::ArchType Arch = TT.getArch();
      bool IsPPC =
          Arch == Triple::ppc || Arch == Triple::ppc64 || Arch == Triple::ppc64le;
diff --git a/test/CodeGen/X86/finite-libcalls.ll b/test/CodeGen/X86/finite-libcalls.ll

index f3d3360..d4b79ac 100644 (file)
--- a/test/CodeGen/X86/finite-libcalls.ll
+++ b/test/CodeGen/X86/finite-libcalls.ll
@@ -9,7 +9,7 @@
  define float @exp_f32(float %x) #0 {
  ; GNU-LABEL: exp_f32:
  ; GNU:       # %bb.0:
-; GNU-NEXT:    jmp __expf_finite@PLT # TAILCALL
+; GNU-NEXT:    jmp __expf_finite # TAILCALL
  ;
  ; WIN-LABEL: exp_f32:
  ; WIN:       # %bb.0:
@@ -25,7 +25,7 @@ define float @exp_f32(float %x) #0 {
  define double @exp_f64(double %x) #0 {
  ; GNU-LABEL: exp_f64:
  ; GNU:       # %bb.0:
-; GNU-NEXT:    jmp __exp_finite@PLT # TAILCALL
+; GNU-NEXT:    jmp __exp_finite # TAILCALL
  ;
  ; WIN-LABEL: exp_f64:
  ; WIN:       # %bb.0:
@@ -72,7 +72,7 @@ define x86_fp80 @exp_f80(x86_fp80 %x) #0 {
  define float @exp2_f32(float %x) #0 {
  ; GNU-LABEL: exp2_f32:
  ; GNU:       # %bb.0:
-; GNU-NEXT:    jmp __exp2f_finite@PLT # TAILCALL
+; GNU-NEXT:    jmp __exp2f_finite # TAILCALL
  ;
  ; WIN-LABEL: exp2_f32:
  ; WIN:       # %bb.0:
@@ -88,7 +88,7 @@ define float @exp2_f32(float %x) #0 {
  define double @exp2_f64(double %x) #0 {
  ; GNU-LABEL: exp2_f64:
  ; GNU:       # %bb.0:
-; GNU-NEXT:    jmp __exp2_finite@PLT # TAILCALL
+; GNU-NEXT:    jmp __exp2_finite # TAILCALL
  ;
  ; WIN-LABEL: exp2_f64:
  ; WIN:       # %bb.0:
@@ -135,7 +135,7 @@ define x86_fp80 @exp2_f80(x86_fp80 %x) #0 {
  define float @log_f32(float %x) #0 {
  ; GNU-LABEL: log_f32:
  ; GNU:       # %bb.0:
-; GNU-NEXT:    jmp __logf_finite@PLT # TAILCALL
+; GNU-NEXT:    jmp __logf_finite # TAILCALL
  ;
  ; WIN-LABEL: log_f32:
  ; WIN:       # %bb.0:
@@ -151,7 +151,7 @@ define float @log_f32(float %x) #0 {
  define double @log_f64(double %x) #0 {
  ; GNU-LABEL: log_f64:
  ; GNU:       # %bb.0:
-; GNU-NEXT:    jmp __log_finite@PLT # TAILCALL
+; GNU-NEXT:    jmp __log_finite # TAILCALL
  ;
  ; WIN-LABEL: log_f64:
  ; WIN:       # %bb.0:
@@ -198,7 +198,7 @@ define x86_fp80 @log_f80(x86_fp80 %x) #0 {
  define float @log2_f32(float %x) #0 {
  ; GNU-LABEL: log2_f32:
  ; GNU:       # %bb.0:
-; GNU-NEXT:    jmp __log2f_finite@PLT # TAILCALL
+; GNU-NEXT:    jmp __log2f_finite # TAILCALL
  ;
  ; WIN-LABEL: log2_f32:
  ; WIN:       # %bb.0:
@@ -214,7 +214,7 @@ define float @log2_f32(float %x) #0 {
  define double @log2_f64(double %x) #0 {
  ; GNU-LABEL: log2_f64:
  ; GNU:       # %bb.0:
-; GNU-NEXT:    jmp __log2_finite@PLT # TAILCALL
+; GNU-NEXT:    jmp __log2_finite # TAILCALL
  ;
  ; WIN-LABEL: log2_f64:
  ; WIN:       # %bb.0:
@@ -261,7 +261,7 @@ define x86_fp80 @log2_f80(x86_fp80 %x) #0 {
  define float @log10_f32(float %x) #0 {
  ; GNU-LABEL: log10_f32:
  ; GNU:       # %bb.0:
-; GNU-NEXT:    jmp __log10f_finite@PLT # TAILCALL
+; GNU-NEXT:    jmp __log10f_finite # TAILCALL
  ;
  ; WIN-LABEL: log10_f32:
  ; WIN:       # %bb.0:
@@ -277,7 +277,7 @@ define float @log10_f32(float %x) #0 {
  define double @log10_f64(double %x) #0 {
  ; GNU-LABEL: log10_f64:
  ; GNU:       # %bb.0:
-; GNU-NEXT:    jmp __log10_finite@PLT # TAILCALL
+; GNU-NEXT:    jmp __log10_finite # TAILCALL
  ;
  ; WIN-LABEL: log10_f64:
  ; WIN:       # %bb.0:
@@ -325,7 +325,7 @@ define float @pow_f32(float %x) #0 {
  ; GNU-LABEL: pow_f32:
  ; GNU:       # %bb.0:
  ; GNU-NEXT:    movaps %xmm0, %xmm1
-; GNU-NEXT:    jmp __powf_finite@PLT # TAILCALL
+; GNU-NEXT:    jmp __powf_finite # TAILCALL
  ;
  ; WIN-LABEL: pow_f32:
  ; WIN:       # %bb.0:
@@ -344,7 +344,7 @@ define double @pow_f64(double %x) #0 {
  ; GNU-LABEL: pow_f64:
  ; GNU:       # %bb.0:
  ; GNU-NEXT:    movaps %xmm0, %xmm1
-; GNU-NEXT:    jmp __pow_finite@PLT # TAILCALL
+; GNU-NEXT:    jmp __pow_finite # TAILCALL
  ;
  ; WIN-LABEL: pow_f64:
  ; WIN:       # %bb.0:
diff --git a/test/CodeGen/X86/fmaxnum.ll b/test/CodeGen/X86/fmaxnum.ll

index ed43a29..9924af1 100644 (file)
--- a/test/CodeGen/X86/fmaxnum.ll
+++ b/test/CodeGen/X86/fmaxnum.ll
@@ -43,7 +43,7 @@ define float @test_fmaxf(float %x, float %y) {
  define float @test_fmaxf_minsize(float %x, float %y) minsize {
  ; CHECK-LABEL: test_fmaxf_minsize:
  ; CHECK:       # %bb.0:
-; CHECK-NEXT:    jmp fmaxf@PLT # TAILCALL
+; CHECK-NEXT:    jmp fmaxf # TAILCALL
    %z = call float @fmaxf(float %x, float %y) readnone
    ret float %z
  }
@@ -82,7 +82,7 @@ define x86_fp80 @test_fmaxl(x86_fp80 %x, x86_fp80 %y) {
  ; CHECK-NEXT:    fldt {{[0-9]+}}(%rsp)
  ; CHECK-NEXT:    fstpt {{[0-9]+}}(%rsp)
  ; CHECK-NEXT:    fstpt (%rsp)
-; CHECK-NEXT:    callq fmaxl@PLT
+; CHECK-NEXT:    callq fmaxl
  ; CHECK-NEXT:    addq $40, %rsp
  ; CHECK-NEXT:    retq
    %z = call x86_fp80 @fmaxl(x86_fp80 %x, x86_fp80 %y) readnone
@@ -144,7 +144,7 @@ define x86_fp80 @test_intrinsic_fmaxl(x86_fp80 %x, x86_fp80 %y) {
  ; CHECK-NEXT:    fldt {{[0-9]+}}(%rsp)
  ; CHECK-NEXT:    fstpt {{[0-9]+}}(%rsp)
  ; CHECK-NEXT:    fstpt (%rsp)
-; CHECK-NEXT:    callq fmaxl@PLT
+; CHECK-NEXT:    callq fmaxl
  ; CHECK-NEXT:    addq $40, %rsp
  ; CHECK-NEXT:    retq
    %z = call x86_fp80 @llvm.maxnum.f80(x86_fp80 %x, x86_fp80 %y) readnone
diff --git a/test/CodeGen/X86/fminnum.ll b/test/CodeGen/X86/fminnum.ll

index 169a6b6..46ea907 100644 (file)
--- a/test/CodeGen/X86/fminnum.ll
+++ b/test/CodeGen/X86/fminnum.ll
@@ -74,7 +74,7 @@ define x86_fp80 @test_fminl(x86_fp80 %x, x86_fp80 %y) {
  ; CHECK-NEXT:    fldt {{[0-9]+}}(%rsp)
  ; CHECK-NEXT:    fstpt {{[0-9]+}}(%rsp)
  ; CHECK-NEXT:    fstpt (%rsp)
-; CHECK-NEXT:    callq fminl@PLT
+; CHECK-NEXT:    callq fminl
  ; CHECK-NEXT:    addq $40, %rsp
  ; CHECK-NEXT:    retq
    %z = call x86_fp80 @fminl(x86_fp80 %x, x86_fp80 %y) readnone
@@ -136,7 +136,7 @@ define x86_fp80 @test_intrinsic_fminl(x86_fp80 %x, x86_fp80 %y) {
  ; CHECK-NEXT:    fldt {{[0-9]+}}(%rsp)
  ; CHECK-NEXT:    fstpt {{[0-9]+}}(%rsp)
  ; CHECK-NEXT:    fstpt (%rsp)
-; CHECK-NEXT:    callq fminl@PLT
+; CHECK-NEXT:    callq fminl
  ; CHECK-NEXT:    addq $40, %rsp
  ; CHECK-NEXT:    retq
    %z = call x86_fp80 @llvm.minnum.f80(x86_fp80 %x, x86_fp80 %y) readnone
diff --git a/test/CodeGen/X86/fp-cvt.ll b/test/CodeGen/X86/fp-cvt.ll

index 61da2a5..7a4d303 100644 (file)
--- a/test/CodeGen/X86/fp-cvt.ll
+++ b/test/CodeGen/X86/fp-cvt.ll
@@ -924,7 +924,7 @@ define x86_fp80 @floor_fp80(x86_fp80 %a0) nounwind {
  ; X86-NEXT:    subl $12, %esp
  ; X86-NEXT:    fldt {{[0-9]+}}(%esp)
  ; X86-NEXT:    fstpt (%esp)
-; X86-NEXT:    calll floorl@PLT
+; X86-NEXT:    calll floorl
  ; X86-NEXT:    addl $12, %esp
  ; X86-NEXT:    retl
  ;
@@ -933,7 +933,7 @@ define x86_fp80 @floor_fp80(x86_fp80 %a0) nounwind {
  ; X64-NEXT:    subq $24, %rsp
  ; X64-NEXT:    fldt {{[0-9]+}}(%rsp)
  ; X64-NEXT:    fstpt (%rsp)
-; X64-NEXT:    callq floorl@PLT
+; X64-NEXT:    callq floorl
  ; X64-NEXT:    addq $24, %rsp
  ; X64-NEXT:    retq
    %1 = call x86_fp80 @llvm.floor.f80(x86_fp80 %a0)
@@ -947,7 +947,7 @@ define x86_fp80 @floor_fp80_ld(x86_fp80 *%a0) nounwind {
  ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
  ; X86-NEXT:    fldt (%eax)
  ; X86-NEXT:    fstpt (%esp)
-; X86-NEXT:    calll floorl@PLT
+; X86-NEXT:    calll floorl
  ; X86-NEXT:    addl $12, %esp
  ; X86-NEXT:    retl
  ;
@@ -956,7 +956,7 @@ define x86_fp80 @floor_fp80_ld(x86_fp80 *%a0) nounwind {
  ; X64-NEXT:    subq $24, %rsp
  ; X64-NEXT:    fldt (%rdi)
  ; X64-NEXT:    fstpt (%rsp)
-; X64-NEXT:    callq floorl@PLT
+; X64-NEXT:    callq floorl
  ; X64-NEXT:    addq $24, %rsp
  ; X64-NEXT:    retq
    %1 = load x86_fp80, x86_fp80 *%a0
@@ -976,7 +976,7 @@ define x86_fp80 @ceil_fp80(x86_fp80 %a0) nounwind {
  ; X86-NEXT:    subl $12, %esp
  ; X86-NEXT:    fldt {{[0-9]+}}(%esp)
  ; X86-NEXT:    fstpt (%esp)
-; X86-NEXT:    calll ceill@PLT
+; X86-NEXT:    calll ceill
  ; X86-NEXT:    addl $12, %esp
  ; X86-NEXT:    retl
  ;
@@ -985,7 +985,7 @@ define x86_fp80 @ceil_fp80(x86_fp80 %a0) nounwind {
  ; X64-NEXT:    subq $24, %rsp
  ; X64-NEXT:    fldt {{[0-9]+}}(%rsp)
  ; X64-NEXT:    fstpt (%rsp)
-; X64-NEXT:    callq ceill@PLT
+; X64-NEXT:    callq ceill
  ; X64-NEXT:    addq $24, %rsp
  ; X64-NEXT:    retq
    %1 = call x86_fp80 @llvm.ceil.f80(x86_fp80 %a0)
@@ -999,7 +999,7 @@ define x86_fp80 @ceil_fp80_ld(x86_fp80 *%a0) nounwind {
  ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
  ; X86-NEXT:    fldt (%eax)
  ; X86-NEXT:    fstpt (%esp)
-; X86-NEXT:    calll ceill@PLT
+; X86-NEXT:    calll ceill
  ; X86-NEXT:    addl $12, %esp
  ; X86-NEXT:    retl
  ;
@@ -1008,7 +1008,7 @@ define x86_fp80 @ceil_fp80_ld(x86_fp80 *%a0) nounwind {
  ; X64-NEXT:    subq $24, %rsp
  ; X64-NEXT:    fldt (%rdi)
  ; X64-NEXT:    fstpt (%rsp)
-; X64-NEXT:    callq ceill@PLT
+; X64-NEXT:    callq ceill
  ; X64-NEXT:    addq $24, %rsp
  ; X64-NEXT:    retq
    %1 = load x86_fp80, x86_fp80 *%a0
@@ -1028,7 +1028,7 @@ define x86_fp80 @trunc_fp80(x86_fp80 %a0) nounwind {
  ; X86-NEXT:    subl $12, %esp
  ; X86-NEXT:    fldt {{[0-9]+}}(%esp)
  ; X86-NEXT:    fstpt (%esp)
-; X86-NEXT:    calll truncl@PLT
+; X86-NEXT:    calll truncl
  ; X86-NEXT:    addl $12, %esp
  ; X86-NEXT:    retl
  ;
@@ -1037,7 +1037,7 @@ define x86_fp80 @trunc_fp80(x86_fp80 %a0) nounwind {
  ; X64-NEXT:    subq $24, %rsp
  ; X64-NEXT:    fldt {{[0-9]+}}(%rsp)
  ; X64-NEXT:    fstpt (%rsp)
-; X64-NEXT:    callq truncl@PLT
+; X64-NEXT:    callq truncl
  ; X64-NEXT:    addq $24, %rsp
  ; X64-NEXT:    retq
    %1 = call x86_fp80 @llvm.trunc.f80(x86_fp80 %a0)
@@ -1051,7 +1051,7 @@ define x86_fp80 @trunc_fp80_ld(x86_fp80 *%a0) nounwind {
  ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
  ; X86-NEXT:    fldt (%eax)
  ; X86-NEXT:    fstpt (%esp)
-; X86-NEXT:    calll truncl@PLT
+; X86-NEXT:    calll truncl
  ; X86-NEXT:    addl $12, %esp
  ; X86-NEXT:    retl
  ;
@@ -1060,7 +1060,7 @@ define x86_fp80 @trunc_fp80_ld(x86_fp80 *%a0) nounwind {
  ; X64-NEXT:    subq $24, %rsp
  ; X64-NEXT:    fldt (%rdi)
  ; X64-NEXT:    fstpt (%rsp)
-; X64-NEXT:    callq truncl@PLT
+; X64-NEXT:    callq truncl
  ; X64-NEXT:    addq $24, %rsp
  ; X64-NEXT:    retq
    %1 = load x86_fp80, x86_fp80 *%a0
@@ -1080,7 +1080,7 @@ define x86_fp80 @rint_fp80(x86_fp80 %a0) nounwind {
  ; X86-NEXT:    subl $12, %esp
  ; X86-NEXT:    fldt {{[0-9]+}}(%esp)
  ; X86-NEXT:    fstpt (%esp)
-; X86-NEXT:    calll rintl@PLT
+; X86-NEXT:    calll rintl
  ; X86-NEXT:    addl $12, %esp
  ; X86-NEXT:    retl
  ;
@@ -1089,7 +1089,7 @@ define x86_fp80 @rint_fp80(x86_fp80 %a0) nounwind {
  ; X64-NEXT:    subq $24, %rsp
  ; X64-NEXT:    fldt {{[0-9]+}}(%rsp)
  ; X64-NEXT:    fstpt (%rsp)
-; X64-NEXT:    callq rintl@PLT
+; X64-NEXT:    callq rintl
  ; X64-NEXT:    addq $24, %rsp
  ; X64-NEXT:    retq
    %1 = call x86_fp80 @llvm.rint.f80(x86_fp80 %a0)
@@ -1103,7 +1103,7 @@ define x86_fp80 @rint_fp80_ld(x86_fp80 *%a0) nounwind {
  ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
  ; X86-NEXT:    fldt (%eax)
  ; X86-NEXT:    fstpt (%esp)
-; X86-NEXT:    calll rintl@PLT
+; X86-NEXT:    calll rintl
  ; X86-NEXT:    addl $12, %esp
  ; X86-NEXT:    retl
  ;
@@ -1112,7 +1112,7 @@ define x86_fp80 @rint_fp80_ld(x86_fp80 *%a0) nounwind {
  ; X64-NEXT:    subq $24, %rsp
  ; X64-NEXT:    fldt (%rdi)
  ; X64-NEXT:    fstpt (%rsp)
-; X64-NEXT:    callq rintl@PLT
+; X64-NEXT:    callq rintl
  ; X64-NEXT:    addq $24, %rsp
  ; X64-NEXT:    retq
    %1 = load x86_fp80, x86_fp80 *%a0
diff --git a/test/CodeGen/X86/fp-intrinsics.ll b/test/CodeGen/X86/fp-intrinsics.ll

index 9816875..eae3955 100644 (file)
--- a/test/CodeGen/X86/fp-intrinsics.ll
+++ b/test/CodeGen/X86/fp-intrinsics.ll
@@ -245,7 +245,7 @@ entry:
  ; Verify that fma(3.5) isn't simplified when the rounding mode is
  ; unknown.
  ; CHECK-LABEL: f17
-; FMACALL32: jmp fmaf@PLT  # TAILCALL
+; FMACALL32: jmp fmaf  # TAILCALL
  ; FMA32: vfmadd213ss
  define float @f17() {
  entry:
@@ -261,7 +261,7 @@ entry:
  ; Verify that fma(42.1) isn't simplified when the rounding mode is
  ; unknown.
  ; CHECK-LABEL: f18
-; FMACALL64: jmp fma@PLT  # TAILCALL
+; FMACALL64: jmp fma  # TAILCALL
  ; FMA64: vfmadd213sd
  define double @f18() {
  entry:
diff --git a/test/CodeGen/X86/half.ll b/test/CodeGen/X86/half.ll

index e027017..7770b99 100644 (file)
--- a/test/CodeGen/X86/half.ll
+++ b/test/CodeGen/X86/half.ll
@@ -75,7 +75,7 @@ define float @test_extend32(half* %addr) #0 {
  ; CHECK-LIBCALL-LABEL: test_extend32:
  ; CHECK-LIBCALL:       # %bb.0:
  ; CHECK-LIBCALL-NEXT:    movzwl (%rdi), %edi
-; CHECK-LIBCALL-NEXT:    jmp __gnu_h2f_ieee@PLT # TAILCALL
+; CHECK-LIBCALL-NEXT:    jmp __gnu_h2f_ieee # TAILCALL
  ;
  ; BWON-F16C-LABEL: test_extend32:
  ; BWON-F16C:       # %bb.0:
diff --git a/test/CodeGen/X86/memset-nonzero.ll b/test/CodeGen/X86/memset-nonzero.ll

index 58a4543..cc8f2b5 100644 (file)
--- a/test/CodeGen/X86/memset-nonzero.ll
+++ b/test/CodeGen/X86/memset-nonzero.ll
@@ -398,7 +398,7 @@ define void @memset_256_nonconst_bytes(i8* %x, i8 %c) {
  ; SSE-LABEL: memset_256_nonconst_bytes:
  ; SSE:       # %bb.0:
  ; SSE-NEXT:    movl $256, %edx # imm = 0x100
-; SSE-NEXT:    jmp memset@PLT # TAILCALL
+; SSE-NEXT:    jmp memset # TAILCALL
  ;
  ; SSE2FAST-LABEL: memset_256_nonconst_bytes:
  ; SSE2FAST:       # %bb.0:
diff --git a/test/CodeGen/X86/negative-sin.ll b/test/CodeGen/X86/negative-sin.ll

index 9f00dbb..c30cd27 100644 (file)
--- a/test/CodeGen/X86/negative-sin.ll
+++ b/test/CodeGen/X86/negative-sin.ll
@@ -28,7 +28,7 @@ define double @strict(double %e) nounwind {
  define double @fast(double %e) nounwind {
  ; CHECK-LABEL: fast:
  ; CHECK:       # %bb.0:
-; CHECK-NEXT:    jmp sin@PLT # TAILCALL
+; CHECK-NEXT:    jmp sin # TAILCALL
    %f = fsub fast double 0.0, %e
    %g = call double @sin(double %f) readonly
    %h = fsub fast double 0.0, %g
@@ -40,7 +40,7 @@ define double @fast(double %e) nounwind {
  define double @nsz(double %e) nounwind {
  ; CHECK-LABEL: nsz:
  ; CHECK:       # %bb.0:
-; CHECK-NEXT:    jmp sin@PLT # TAILCALL
+; CHECK-NEXT:    jmp sin # TAILCALL
    %f = fsub nsz double 0.0, %e
    %g = call double @sin(double %f) readonly
    %h = fsub nsz double 0.0, %g
@@ -88,7 +88,7 @@ define double @semi_strict2(double %e) nounwind {
  define double @fn_attr(double %e) nounwind #0 {
  ; CHECK-LABEL: fn_attr:
  ; CHECK:       # %bb.0:
-; CHECK-NEXT:    jmp sin@PLT # TAILCALL
+; CHECK-NEXT:    jmp sin # TAILCALL
    %f = fsub double 0.0, %e
    %g = call double @sin(double %f) readonly
    %h = fsub double 0.0, %g
diff --git a/test/CodeGen/X86/scalar-fp-to-i64.ll b/test/CodeGen/X86/scalar-fp-to-i64.ll

index 9da96f6..85a6cec 100644 (file)
--- a/test/CodeGen/X86/scalar-fp-to-i64.ll
+++ b/test/CodeGen/X86/scalar-fp-to-i64.ll
@@ -1439,7 +1439,7 @@ define i64 @t_to_u64(fp128 %a) nounwind {
  ; AVX512_32_LIN-NEXT:    subl $28, %esp
  ; AVX512_32_LIN-NEXT:    vmovaps {{[0-9]+}}(%esp), %xmm0
  ; AVX512_32_LIN-NEXT:    vmovups %xmm0, (%esp)
-; AVX512_32_LIN-NEXT:    calll __fixunstfdi@PLT
+; AVX512_32_LIN-NEXT:    calll __fixunstfdi
  ; AVX512_32_LIN-NEXT:    addl $28, %esp
  ; AVX512_32_LIN-NEXT:    retl
  ;
@@ -1453,7 +1453,7 @@ define i64 @t_to_u64(fp128 %a) nounwind {
  ; AVX512_64_LIN-LABEL: t_to_u64:
  ; AVX512_64_LIN:       # %bb.0:
  ; AVX512_64_LIN-NEXT:    pushq %rax
-; AVX512_64_LIN-NEXT:    callq __fixunstfdi@PLT
+; AVX512_64_LIN-NEXT:    callq __fixunstfdi
  ; AVX512_64_LIN-NEXT:    popq %rcx
  ; AVX512_64_LIN-NEXT:    retq
  ;
@@ -1474,7 +1474,7 @@ define i64 @t_to_u64(fp128 %a) nounwind {
  ; SSE3_32_LIN-NEXT:    pushl {{[0-9]+}}(%esp)
  ; SSE3_32_LIN-NEXT:    pushl {{[0-9]+}}(%esp)
  ; SSE3_32_LIN-NEXT:    pushl {{[0-9]+}}(%esp)
-; SSE3_32_LIN-NEXT:    calll __fixunstfdi@PLT
+; SSE3_32_LIN-NEXT:    calll __fixunstfdi
  ; SSE3_32_LIN-NEXT:    addl $28, %esp
  ; SSE3_32_LIN-NEXT:    retl
  ;
@@ -1488,7 +1488,7 @@ define i64 @t_to_u64(fp128 %a) nounwind {
  ; SSE3_64_LIN-LABEL: t_to_u64:
  ; SSE3_64_LIN:       # %bb.0:
  ; SSE3_64_LIN-NEXT:    pushq %rax
-; SSE3_64_LIN-NEXT:    callq __fixunstfdi@PLT
+; SSE3_64_LIN-NEXT:    callq __fixunstfdi
  ; SSE3_64_LIN-NEXT:    popq %rcx
  ; SSE3_64_LIN-NEXT:    retq
  ;
@@ -1509,7 +1509,7 @@ define i64 @t_to_u64(fp128 %a) nounwind {
  ; SSE2_32_LIN-NEXT:    pushl {{[0-9]+}}(%esp)
  ; SSE2_32_LIN-NEXT:    pushl {{[0-9]+}}(%esp)
  ; SSE2_32_LIN-NEXT:    pushl {{[0-9]+}}(%esp)
-; SSE2_32_LIN-NEXT:    calll __fixunstfdi@PLT
+; SSE2_32_LIN-NEXT:    calll __fixunstfdi
  ; SSE2_32_LIN-NEXT:    addl $28, %esp
  ; SSE2_32_LIN-NEXT:    retl
  ;
@@ -1523,7 +1523,7 @@ define i64 @t_to_u64(fp128 %a) nounwind {
  ; SSE2_64_LIN-LABEL: t_to_u64:
  ; SSE2_64_LIN:       # %bb.0:
  ; SSE2_64_LIN-NEXT:    pushq %rax
-; SSE2_64_LIN-NEXT:    callq __fixunstfdi@PLT
+; SSE2_64_LIN-NEXT:    callq __fixunstfdi
  ; SSE2_64_LIN-NEXT:    popq %rcx
  ; SSE2_64_LIN-NEXT:    retq
  ;
@@ -1544,7 +1544,7 @@ define i64 @t_to_u64(fp128 %a) nounwind {
  ; X87_LIN-NEXT:    pushl {{[0-9]+}}(%esp)
  ; X87_LIN-NEXT:    pushl {{[0-9]+}}(%esp)
  ; X87_LIN-NEXT:    pushl {{[0-9]+}}(%esp)
-; X87_LIN-NEXT:    calll __fixunstfdi@PLT
+; X87_LIN-NEXT:    calll __fixunstfdi
  ; X87_LIN-NEXT:    addl $28, %esp
  ; X87_LIN-NEXT:    retl
    %r = fptoui fp128 %a to i64
@@ -1566,7 +1566,7 @@ define i64 @t_to_s64(fp128 %a) nounwind {
  ; AVX512_32_LIN-NEXT:    subl $28, %esp
  ; AVX512_32_LIN-NEXT:    vmovaps {{[0-9]+}}(%esp), %xmm0
  ; AVX512_32_LIN-NEXT:    vmovups %xmm0, (%esp)
-; AVX512_32_LIN-NEXT:    calll __fixtfdi@PLT
+; AVX512_32_LIN-NEXT:    calll __fixtfdi
  ; AVX512_32_LIN-NEXT:    addl $28, %esp
  ; AVX512_32_LIN-NEXT:    retl
  ;
@@ -1580,7 +1580,7 @@ define i64 @t_to_s64(fp128 %a) nounwind {
  ; AVX512_64_LIN-LABEL: t_to_s64:
  ; AVX512_64_LIN:       # %bb.0:
  ; AVX512_64_LIN-NEXT:    pushq %rax
-; AVX512_64_LIN-NEXT:    callq __fixtfdi@PLT
+; AVX512_64_LIN-NEXT:    callq __fixtfdi
  ; AVX512_64_LIN-NEXT:    popq %rcx
  ; AVX512_64_LIN-NEXT:    retq
  ;
@@ -1601,7 +1601,7 @@ define i64 @t_to_s64(fp128 %a) nounwind {
  ; SSE3_32_LIN-NEXT:    pushl {{[0-9]+}}(%esp)
  ; SSE3_32_LIN-NEXT:    pushl {{[0-9]+}}(%esp)
  ; SSE3_32_LIN-NEXT:    pushl {{[0-9]+}}(%esp)
-; SSE3_32_LIN-NEXT:    calll __fixtfdi@PLT
+; SSE3_32_LIN-NEXT:    calll __fixtfdi
  ; SSE3_32_LIN-NEXT:    addl $28, %esp
  ; SSE3_32_LIN-NEXT:    retl
  ;
@@ -1615,7 +1615,7 @@ define i64 @t_to_s64(fp128 %a) nounwind {
  ; SSE3_64_LIN-LABEL: t_to_s64:
  ; SSE3_64_LIN:       # %bb.0:
  ; SSE3_64_LIN-NEXT:    pushq %rax
-; SSE3_64_LIN-NEXT:    callq __fixtfdi@PLT
+; SSE3_64_LIN-NEXT:    callq __fixtfdi
  ; SSE3_64_LIN-NEXT:    popq %rcx
  ; SSE3_64_LIN-NEXT:    retq
  ;
@@ -1636,7 +1636,7 @@ define i64 @t_to_s64(fp128 %a) nounwind {
  ; SSE2_32_LIN-NEXT:    pushl {{[0-9]+}}(%esp)
  ; SSE2_32_LIN-NEXT:    pushl {{[0-9]+}}(%esp)
  ; SSE2_32_LIN-NEXT:    pushl {{[0-9]+}}(%esp)
-; SSE2_32_LIN-NEXT:    calll __fixtfdi@PLT
+; SSE2_32_LIN-NEXT:    calll __fixtfdi
  ; SSE2_32_LIN-NEXT:    addl $28, %esp
  ; SSE2_32_LIN-NEXT:    retl
  ;
@@ -1650,7 +1650,7 @@ define i64 @t_to_s64(fp128 %a) nounwind {
  ; SSE2_64_LIN-LABEL: t_to_s64:
  ; SSE2_64_LIN:       # %bb.0:
  ; SSE2_64_LIN-NEXT:    pushq %rax
-; SSE2_64_LIN-NEXT:    callq __fixtfdi@PLT
+; SSE2_64_LIN-NEXT:    callq __fixtfdi
  ; SSE2_64_LIN-NEXT:    popq %rcx
  ; SSE2_64_LIN-NEXT:    retq
  ;
@@ -1671,7 +1671,7 @@ define i64 @t_to_s64(fp128 %a) nounwind {
  ; X87_LIN-NEXT:    pushl {{[0-9]+}}(%esp)
  ; X87_LIN-NEXT:    pushl {{[0-9]+}}(%esp)
  ; X87_LIN-NEXT:    pushl {{[0-9]+}}(%esp)
-; X87_LIN-NEXT:    calll __fixtfdi@PLT
+; X87_LIN-NEXT:    calll __fixtfdi
  ; X87_LIN-NEXT:    addl $28, %esp
  ; X87_LIN-NEXT:    retl
    %r = fptosi fp128 %a to i64
diff --git a/test/CodeGen/X86/vector-half-conversions.ll b/test/CodeGen/X86/vector-half-conversions.ll

index 570a9d6..65a90e6 100644 (file)
--- a/test/CodeGen/X86/vector-half-conversions.ll
+++ b/test/CodeGen/X86/vector-half-conversions.ll
@@ -3010,7 +3010,7 @@ define void @store_cvt_16f32_to_16i16(<16 x float> %a0, <16 x i16>* %a1) nounwin
  define i16 @cvt_f64_to_i16(double %a0) nounwind {
  ; ALL-LABEL: cvt_f64_to_i16:
  ; ALL:       # %bb.0:
-; ALL-NEXT:    jmp __truncdfhf2@PLT # TAILCALL
+; ALL-NEXT:    jmp __truncdfhf2 # TAILCALL
    %1 = fptrunc double %a0 to half
    %2 = bitcast half %1 to i16
    ret i16 %2
@@ -3023,11 +3023,11 @@ define <2 x i16> @cvt_2f64_to_2i16(<2 x double> %a0) nounwind {
  ; ALL-NEXT:    subq $16, %rsp
  ; ALL-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; ALL-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
-; ALL-NEXT:    callq __truncdfhf2@PLT
+; ALL-NEXT:    callq __truncdfhf2
  ; ALL-NEXT:    movl %eax, %ebx
  ; ALL-NEXT:    shll $16, %ebx
  ; ALL-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; ALL-NEXT:    callq __truncdfhf2@PLT
+; ALL-NEXT:    callq __truncdfhf2
  ; ALL-NEXT:    movzwl %ax, %eax
  ; ALL-NEXT:    orl %ebx, %eax
  ; ALL-NEXT:    vmovd %eax, %xmm0
@@ -3048,13 +3048,13 @@ define <4 x i16> @cvt_4f64_to_4i16(<4 x double> %a0) nounwind {
  ; AVX1-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX1-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %ebx
  ; AVX1-NEXT:    shll $16, %ebx
  ; AVX1-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX1-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movzwl %ax, %r14d
  ; AVX1-NEXT:    orl %ebx, %r14d
  ; AVX1-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
@@ -3062,11 +3062,11 @@ define <4 x i16> @cvt_4f64_to_4i16(<4 x double> %a0) nounwind {
  ; AVX1-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX1-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %ebx
  ; AVX1-NEXT:    shll $16, %ebx
  ; AVX1-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movzwl %ax, %eax
  ; AVX1-NEXT:    orl %ebx, %eax
  ; AVX1-NEXT:    shlq $32, %rax
@@ -3085,13 +3085,13 @@ define <4 x i16> @cvt_4f64_to_4i16(<4 x double> %a0) nounwind {
  ; AVX2-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX2-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movl %eax, %ebx
  ; AVX2-NEXT:    shll $16, %ebx
  ; AVX2-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX2-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movzwl %ax, %r14d
  ; AVX2-NEXT:    orl %ebx, %r14d
  ; AVX2-NEXT:    vmovupd (%rsp), %ymm0 # 32-byte Reload
@@ -3099,11 +3099,11 @@ define <4 x i16> @cvt_4f64_to_4i16(<4 x double> %a0) nounwind {
  ; AVX2-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX2-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movl %eax, %ebx
  ; AVX2-NEXT:    shll $16, %ebx
  ; AVX2-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movzwl %ax, %eax
  ; AVX2-NEXT:    orl %ebx, %eax
  ; AVX2-NEXT:    shlq $32, %rax
@@ -3122,13 +3122,13 @@ define <4 x i16> @cvt_4f64_to_4i16(<4 x double> %a0) nounwind {
  ; AVX512-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX512-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movl %eax, %ebx
  ; AVX512-NEXT:    shll $16, %ebx
  ; AVX512-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX512-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movzwl %ax, %r14d
  ; AVX512-NEXT:    orl %ebx, %r14d
  ; AVX512-NEXT:    vmovupd (%rsp), %ymm0 # 32-byte Reload
@@ -3136,11 +3136,11 @@ define <4 x i16> @cvt_4f64_to_4i16(<4 x double> %a0) nounwind {
  ; AVX512-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX512-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movl %eax, %ebx
  ; AVX512-NEXT:    shll $16, %ebx
  ; AVX512-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movzwl %ax, %eax
  ; AVX512-NEXT:    orl %ebx, %eax
  ; AVX512-NEXT:    shlq $32, %rax
@@ -3164,13 +3164,13 @@ define <8 x i16> @cvt_4f64_to_8i16_undef(<4 x double> %a0) nounwind {
  ; AVX1-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX1-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %ebx
  ; AVX1-NEXT:    shll $16, %ebx
  ; AVX1-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX1-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movzwl %ax, %r14d
  ; AVX1-NEXT:    orl %ebx, %r14d
  ; AVX1-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
@@ -3178,11 +3178,11 @@ define <8 x i16> @cvt_4f64_to_8i16_undef(<4 x double> %a0) nounwind {
  ; AVX1-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX1-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %ebx
  ; AVX1-NEXT:    shll $16, %ebx
  ; AVX1-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movzwl %ax, %eax
  ; AVX1-NEXT:    orl %ebx, %eax
  ; AVX1-NEXT:    shlq $32, %rax
@@ -3202,13 +3202,13 @@ define <8 x i16> @cvt_4f64_to_8i16_undef(<4 x double> %a0) nounwind {
  ; AVX2-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX2-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movl %eax, %ebx
  ; AVX2-NEXT:    shll $16, %ebx
  ; AVX2-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX2-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movzwl %ax, %r14d
  ; AVX2-NEXT:    orl %ebx, %r14d
  ; AVX2-NEXT:    vmovupd (%rsp), %ymm0 # 32-byte Reload
@@ -3216,11 +3216,11 @@ define <8 x i16> @cvt_4f64_to_8i16_undef(<4 x double> %a0) nounwind {
  ; AVX2-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX2-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movl %eax, %ebx
  ; AVX2-NEXT:    shll $16, %ebx
  ; AVX2-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movzwl %ax, %eax
  ; AVX2-NEXT:    orl %ebx, %eax
  ; AVX2-NEXT:    shlq $32, %rax
@@ -3240,13 +3240,13 @@ define <8 x i16> @cvt_4f64_to_8i16_undef(<4 x double> %a0) nounwind {
  ; AVX512-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX512-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movl %eax, %ebx
  ; AVX512-NEXT:    shll $16, %ebx
  ; AVX512-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX512-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movzwl %ax, %r14d
  ; AVX512-NEXT:    orl %ebx, %r14d
  ; AVX512-NEXT:    vmovupd (%rsp), %ymm0 # 32-byte Reload
@@ -3254,11 +3254,11 @@ define <8 x i16> @cvt_4f64_to_8i16_undef(<4 x double> %a0) nounwind {
  ; AVX512-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX512-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movl %eax, %ebx
  ; AVX512-NEXT:    shll $16, %ebx
  ; AVX512-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movzwl %ax, %eax
  ; AVX512-NEXT:    orl %ebx, %eax
  ; AVX512-NEXT:    shlq $32, %rax
@@ -3284,13 +3284,13 @@ define <8 x i16> @cvt_4f64_to_8i16_zero(<4 x double> %a0) nounwind {
  ; AVX1-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX1-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %ebx
  ; AVX1-NEXT:    shll $16, %ebx
  ; AVX1-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX1-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movzwl %ax, %r14d
  ; AVX1-NEXT:    orl %ebx, %r14d
  ; AVX1-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
@@ -3298,11 +3298,11 @@ define <8 x i16> @cvt_4f64_to_8i16_zero(<4 x double> %a0) nounwind {
  ; AVX1-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX1-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %ebx
  ; AVX1-NEXT:    shll $16, %ebx
  ; AVX1-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movzwl %ax, %eax
  ; AVX1-NEXT:    orl %ebx, %eax
  ; AVX1-NEXT:    shlq $32, %rax
@@ -3323,13 +3323,13 @@ define <8 x i16> @cvt_4f64_to_8i16_zero(<4 x double> %a0) nounwind {
  ; AVX2-SLOW-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX2-SLOW-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-SLOW-NEXT:    vzeroupper
-; AVX2-SLOW-NEXT:    callq __truncdfhf2@PLT
+; AVX2-SLOW-NEXT:    callq __truncdfhf2
  ; AVX2-SLOW-NEXT:    movl %eax, %ebx
  ; AVX2-SLOW-NEXT:    shll $16, %ebx
  ; AVX2-SLOW-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX2-SLOW-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX2-SLOW-NEXT:    vzeroupper
-; AVX2-SLOW-NEXT:    callq __truncdfhf2@PLT
+; AVX2-SLOW-NEXT:    callq __truncdfhf2
  ; AVX2-SLOW-NEXT:    movzwl %ax, %r14d
  ; AVX2-SLOW-NEXT:    orl %ebx, %r14d
  ; AVX2-SLOW-NEXT:    vmovupd (%rsp), %ymm0 # 32-byte Reload
@@ -3337,11 +3337,11 @@ define <8 x i16> @cvt_4f64_to_8i16_zero(<4 x double> %a0) nounwind {
  ; AVX2-SLOW-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX2-SLOW-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-SLOW-NEXT:    vzeroupper
-; AVX2-SLOW-NEXT:    callq __truncdfhf2@PLT
+; AVX2-SLOW-NEXT:    callq __truncdfhf2
  ; AVX2-SLOW-NEXT:    movl %eax, %ebx
  ; AVX2-SLOW-NEXT:    shll $16, %ebx
  ; AVX2-SLOW-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX2-SLOW-NEXT:    callq __truncdfhf2@PLT
+; AVX2-SLOW-NEXT:    callq __truncdfhf2
  ; AVX2-SLOW-NEXT:    movzwl %ax, %eax
  ; AVX2-SLOW-NEXT:    orl %ebx, %eax
  ; AVX2-SLOW-NEXT:    shlq $32, %rax
@@ -3362,13 +3362,13 @@ define <8 x i16> @cvt_4f64_to_8i16_zero(<4 x double> %a0) nounwind {
  ; AVX2-FAST-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX2-FAST-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-FAST-NEXT:    vzeroupper
-; AVX2-FAST-NEXT:    callq __truncdfhf2@PLT
+; AVX2-FAST-NEXT:    callq __truncdfhf2
  ; AVX2-FAST-NEXT:    movl %eax, %ebx
  ; AVX2-FAST-NEXT:    shll $16, %ebx
  ; AVX2-FAST-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX2-FAST-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX2-FAST-NEXT:    vzeroupper
-; AVX2-FAST-NEXT:    callq __truncdfhf2@PLT
+; AVX2-FAST-NEXT:    callq __truncdfhf2
  ; AVX2-FAST-NEXT:    movzwl %ax, %r14d
  ; AVX2-FAST-NEXT:    orl %ebx, %r14d
  ; AVX2-FAST-NEXT:    vmovupd (%rsp), %ymm0 # 32-byte Reload
@@ -3376,11 +3376,11 @@ define <8 x i16> @cvt_4f64_to_8i16_zero(<4 x double> %a0) nounwind {
  ; AVX2-FAST-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX2-FAST-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-FAST-NEXT:    vzeroupper
-; AVX2-FAST-NEXT:    callq __truncdfhf2@PLT
+; AVX2-FAST-NEXT:    callq __truncdfhf2
  ; AVX2-FAST-NEXT:    movl %eax, %ebx
  ; AVX2-FAST-NEXT:    shll $16, %ebx
  ; AVX2-FAST-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX2-FAST-NEXT:    callq __truncdfhf2@PLT
+; AVX2-FAST-NEXT:    callq __truncdfhf2
  ; AVX2-FAST-NEXT:    movzwl %ax, %eax
  ; AVX2-FAST-NEXT:    orl %ebx, %eax
  ; AVX2-FAST-NEXT:    shlq $32, %rax
@@ -3400,13 +3400,13 @@ define <8 x i16> @cvt_4f64_to_8i16_zero(<4 x double> %a0) nounwind {
  ; AVX512F-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX512F-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512F-NEXT:    vzeroupper
-; AVX512F-NEXT:    callq __truncdfhf2@PLT
+; AVX512F-NEXT:    callq __truncdfhf2
  ; AVX512F-NEXT:    movl %eax, %ebx
  ; AVX512F-NEXT:    shll $16, %ebx
  ; AVX512F-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX512F-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX512F-NEXT:    vzeroupper
-; AVX512F-NEXT:    callq __truncdfhf2@PLT
+; AVX512F-NEXT:    callq __truncdfhf2
  ; AVX512F-NEXT:    movzwl %ax, %r14d
  ; AVX512F-NEXT:    orl %ebx, %r14d
  ; AVX512F-NEXT:    vmovupd (%rsp), %ymm0 # 32-byte Reload
@@ -3414,11 +3414,11 @@ define <8 x i16> @cvt_4f64_to_8i16_zero(<4 x double> %a0) nounwind {
  ; AVX512F-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX512F-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512F-NEXT:    vzeroupper
-; AVX512F-NEXT:    callq __truncdfhf2@PLT
+; AVX512F-NEXT:    callq __truncdfhf2
  ; AVX512F-NEXT:    movl %eax, %ebx
  ; AVX512F-NEXT:    shll $16, %ebx
  ; AVX512F-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX512F-NEXT:    callq __truncdfhf2@PLT
+; AVX512F-NEXT:    callq __truncdfhf2
  ; AVX512F-NEXT:    movzwl %ax, %eax
  ; AVX512F-NEXT:    orl %ebx, %eax
  ; AVX512F-NEXT:    shlq $32, %rax
@@ -3439,13 +3439,13 @@ define <8 x i16> @cvt_4f64_to_8i16_zero(<4 x double> %a0) nounwind {
  ; AVX512VL-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX512VL-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512VL-NEXT:    vzeroupper
-; AVX512VL-NEXT:    callq __truncdfhf2@PLT
+; AVX512VL-NEXT:    callq __truncdfhf2
  ; AVX512VL-NEXT:    movl %eax, %ebx
  ; AVX512VL-NEXT:    shll $16, %ebx
  ; AVX512VL-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX512VL-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX512VL-NEXT:    vzeroupper
-; AVX512VL-NEXT:    callq __truncdfhf2@PLT
+; AVX512VL-NEXT:    callq __truncdfhf2
  ; AVX512VL-NEXT:    movzwl %ax, %r14d
  ; AVX512VL-NEXT:    orl %ebx, %r14d
  ; AVX512VL-NEXT:    vmovupd (%rsp), %ymm0 # 32-byte Reload
@@ -3453,11 +3453,11 @@ define <8 x i16> @cvt_4f64_to_8i16_zero(<4 x double> %a0) nounwind {
  ; AVX512VL-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX512VL-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512VL-NEXT:    vzeroupper
-; AVX512VL-NEXT:    callq __truncdfhf2@PLT
+; AVX512VL-NEXT:    callq __truncdfhf2
  ; AVX512VL-NEXT:    movl %eax, %ebx
  ; AVX512VL-NEXT:    shll $16, %ebx
  ; AVX512VL-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX512VL-NEXT:    callq __truncdfhf2@PLT
+; AVX512VL-NEXT:    callq __truncdfhf2
  ; AVX512VL-NEXT:    movzwl %ax, %eax
  ; AVX512VL-NEXT:    orl %ebx, %eax
  ; AVX512VL-NEXT:    shlq $32, %rax
@@ -3485,13 +3485,13 @@ define <8 x i16> @cvt_8f64_to_8i16(<8 x double> %a0) nounwind {
  ; AVX1-NEXT:    vmovupd %ymm0, {{[0-9]+}}(%rsp) # 32-byte Spill
  ; AVX1-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %ebx
  ; AVX1-NEXT:    shll $16, %ebx
  ; AVX1-NEXT:    vmovups {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
  ; AVX1-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movzwl %ax, %r15d
  ; AVX1-NEXT:    orl %ebx, %r15d
  ; AVX1-NEXT:    vmovups {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
@@ -3499,24 +3499,24 @@ define <8 x i16> @cvt_8f64_to_8i16(<8 x double> %a0) nounwind {
  ; AVX1-NEXT:    vmovapd %xmm0, {{[0-9]+}}(%rsp) # 16-byte Spill
  ; AVX1-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %ebx
  ; AVX1-NEXT:    shll $16, %ebx
  ; AVX1-NEXT:    vmovaps {{[0-9]+}}(%rsp), %xmm0 # 16-byte Reload
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movzwl %ax, %r14d
  ; AVX1-NEXT:    orl %ebx, %r14d
  ; AVX1-NEXT:    shlq $32, %r14
  ; AVX1-NEXT:    orq %r15, %r14
  ; AVX1-NEXT:    vpermilpd $1, (%rsp), %xmm0 # 16-byte Folded Reload
  ; AVX1-NEXT:    # xmm0 = mem[1,0]
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %ebx
  ; AVX1-NEXT:    shll $16, %ebx
  ; AVX1-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX1-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movzwl %ax, %r15d
  ; AVX1-NEXT:    orl %ebx, %r15d
  ; AVX1-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
@@ -3524,11 +3524,11 @@ define <8 x i16> @cvt_8f64_to_8i16(<8 x double> %a0) nounwind {
  ; AVX1-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX1-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %ebx
  ; AVX1-NEXT:    shll $16, %ebx
  ; AVX1-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movzwl %ax, %eax
  ; AVX1-NEXT:    orl %ebx, %eax
  ; AVX1-NEXT:    shlq $32, %rax
@@ -3552,13 +3552,13 @@ define <8 x i16> @cvt_8f64_to_8i16(<8 x double> %a0) nounwind {
  ; AVX2-NEXT:    vmovupd %ymm0, {{[0-9]+}}(%rsp) # 32-byte Spill
  ; AVX2-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movl %eax, %ebx
  ; AVX2-NEXT:    shll $16, %ebx
  ; AVX2-NEXT:    vmovups {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
  ; AVX2-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movzwl %ax, %r15d
  ; AVX2-NEXT:    orl %ebx, %r15d
  ; AVX2-NEXT:    vmovupd {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
@@ -3566,24 +3566,24 @@ define <8 x i16> @cvt_8f64_to_8i16(<8 x double> %a0) nounwind {
  ; AVX2-NEXT:    vmovapd %xmm0, {{[0-9]+}}(%rsp) # 16-byte Spill
  ; AVX2-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movl %eax, %ebx
  ; AVX2-NEXT:    shll $16, %ebx
  ; AVX2-NEXT:    vmovaps {{[0-9]+}}(%rsp), %xmm0 # 16-byte Reload
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movzwl %ax, %r14d
  ; AVX2-NEXT:    orl %ebx, %r14d
  ; AVX2-NEXT:    shlq $32, %r14
  ; AVX2-NEXT:    orq %r15, %r14
  ; AVX2-NEXT:    vpermilpd $1, (%rsp), %xmm0 # 16-byte Folded Reload
  ; AVX2-NEXT:    # xmm0 = mem[1,0]
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movl %eax, %ebx
  ; AVX2-NEXT:    shll $16, %ebx
  ; AVX2-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX2-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movzwl %ax, %r15d
  ; AVX2-NEXT:    orl %ebx, %r15d
  ; AVX2-NEXT:    vmovupd (%rsp), %ymm0 # 32-byte Reload
@@ -3591,11 +3591,11 @@ define <8 x i16> @cvt_8f64_to_8i16(<8 x double> %a0) nounwind {
  ; AVX2-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX2-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movl %eax, %ebx
  ; AVX2-NEXT:    shll $16, %ebx
  ; AVX2-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movzwl %ax, %eax
  ; AVX2-NEXT:    orl %ebx, %eax
  ; AVX2-NEXT:    shlq $32, %rax
@@ -3618,13 +3618,13 @@ define <8 x i16> @cvt_8f64_to_8i16(<8 x double> %a0) nounwind {
  ; AVX512-NEXT:    vmovupd %zmm0, (%rsp) # 64-byte Spill
  ; AVX512-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movl %eax, %ebx
  ; AVX512-NEXT:    shll $16, %ebx
  ; AVX512-NEXT:    vmovups (%rsp), %zmm0 # 64-byte Reload
  ; AVX512-NEXT:    # kill: def $xmm0 killed $xmm0 killed $zmm0
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movzwl %ax, %r15d
  ; AVX512-NEXT:    orl %ebx, %r15d
  ; AVX512-NEXT:    vmovupd (%rsp), %zmm0 # 64-byte Reload
@@ -3632,11 +3632,11 @@ define <8 x i16> @cvt_8f64_to_8i16(<8 x double> %a0) nounwind {
  ; AVX512-NEXT:    vmovapd %xmm0, {{[0-9]+}}(%rsp) # 16-byte Spill
  ; AVX512-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movl %eax, %ebx
  ; AVX512-NEXT:    shll $16, %ebx
  ; AVX512-NEXT:    vmovaps {{[0-9]+}}(%rsp), %xmm0 # 16-byte Reload
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movzwl %ax, %r14d
  ; AVX512-NEXT:    orl %ebx, %r14d
  ; AVX512-NEXT:    shlq $32, %r14
@@ -3646,13 +3646,13 @@ define <8 x i16> @cvt_8f64_to_8i16(<8 x double> %a0) nounwind {
  ; AVX512-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX512-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movl %eax, %ebx
  ; AVX512-NEXT:    shll $16, %ebx
  ; AVX512-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX512-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movzwl %ax, %r15d
  ; AVX512-NEXT:    orl %ebx, %r15d
  ; AVX512-NEXT:    vmovupd (%rsp), %ymm0 # 32-byte Reload
@@ -3660,11 +3660,11 @@ define <8 x i16> @cvt_8f64_to_8i16(<8 x double> %a0) nounwind {
  ; AVX512-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX512-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movl %eax, %ebx
  ; AVX512-NEXT:    shll $16, %ebx
  ; AVX512-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movzwl %ax, %eax
  ; AVX512-NEXT:    orl %ebx, %eax
  ; AVX512-NEXT:    shlq $32, %rax
@@ -3691,7 +3691,7 @@ define void @store_cvt_f64_to_i16(double %a0, i16* %a1) nounwind {
  ; ALL:       # %bb.0:
  ; ALL-NEXT:    pushq %rbx
  ; ALL-NEXT:    movq %rdi, %rbx
-; ALL-NEXT:    callq __truncdfhf2@PLT
+; ALL-NEXT:    callq __truncdfhf2
  ; ALL-NEXT:    movw %ax, (%rbx)
  ; ALL-NEXT:    popq %rbx
  ; ALL-NEXT:    retq
@@ -3710,10 +3710,10 @@ define void @store_cvt_2f64_to_2i16(<2 x double> %a0, <2 x i16>* %a1) nounwind {
  ; ALL-NEXT:    movq %rdi, %rbx
  ; ALL-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; ALL-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
-; ALL-NEXT:    callq __truncdfhf2@PLT
+; ALL-NEXT:    callq __truncdfhf2
  ; ALL-NEXT:    movl %eax, %ebp
  ; ALL-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; ALL-NEXT:    callq __truncdfhf2@PLT
+; ALL-NEXT:    callq __truncdfhf2
  ; ALL-NEXT:    movw %ax, (%rbx)
  ; ALL-NEXT:    movw %bp, 2(%rbx)
  ; ALL-NEXT:    addq $24, %rsp
@@ -3738,22 +3738,22 @@ define void @store_cvt_4f64_to_4i16(<4 x double> %a0, <4 x i16>* %a1) nounwind {
  ; AVX1-NEXT:    vmovupd %ymm0, {{[0-9]+}}(%rsp) # 32-byte Spill
  ; AVX1-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %r14d
  ; AVX1-NEXT:    vmovups {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
  ; AVX1-NEXT:    vextractf128 $1, %ymm0, %xmm0
  ; AVX1-NEXT:    vmovapd %xmm0, {{[0-9]+}}(%rsp) # 16-byte Spill
  ; AVX1-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %r15d
  ; AVX1-NEXT:    vmovups {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
  ; AVX1-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %ebp
  ; AVX1-NEXT:    vmovaps {{[0-9]+}}(%rsp), %xmm0 # 16-byte Reload
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movw %ax, 4(%rbx)
  ; AVX1-NEXT:    movw %bp, (%rbx)
  ; AVX1-NEXT:    movw %r15w, 6(%rbx)
@@ -3776,22 +3776,22 @@ define void @store_cvt_4f64_to_4i16(<4 x double> %a0, <4 x i16>* %a1) nounwind {
  ; AVX2-NEXT:    vmovupd %ymm0, {{[0-9]+}}(%rsp) # 32-byte Spill
  ; AVX2-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movl %eax, %r14d
  ; AVX2-NEXT:    vmovupd {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
  ; AVX2-NEXT:    vextractf128 $1, %ymm0, %xmm0
  ; AVX2-NEXT:    vmovapd %xmm0, {{[0-9]+}}(%rsp) # 16-byte Spill
  ; AVX2-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movl %eax, %r15d
  ; AVX2-NEXT:    vmovups {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
  ; AVX2-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movl %eax, %ebp
  ; AVX2-NEXT:    vmovaps {{[0-9]+}}(%rsp), %xmm0 # 16-byte Reload
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movw %ax, 4(%rbx)
  ; AVX2-NEXT:    movw %bp, (%rbx)
  ; AVX2-NEXT:    movw %r15w, 6(%rbx)
@@ -3814,22 +3814,22 @@ define void @store_cvt_4f64_to_4i16(<4 x double> %a0, <4 x i16>* %a1) nounwind {
  ; AVX512-NEXT:    vmovupd %ymm0, {{[0-9]+}}(%rsp) # 32-byte Spill
  ; AVX512-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movl %eax, %r14d
  ; AVX512-NEXT:    vmovupd {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
  ; AVX512-NEXT:    vextractf128 $1, %ymm0, %xmm0
  ; AVX512-NEXT:    vmovapd %xmm0, {{[0-9]+}}(%rsp) # 16-byte Spill
  ; AVX512-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movl %eax, %r15d
  ; AVX512-NEXT:    vmovups {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
  ; AVX512-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movl %eax, %ebp
  ; AVX512-NEXT:    vmovaps {{[0-9]+}}(%rsp), %xmm0 # 16-byte Reload
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movw %ax, 4(%rbx)
  ; AVX512-NEXT:    movw %bp, (%rbx)
  ; AVX512-NEXT:    movw %r15w, 6(%rbx)
@@ -3857,13 +3857,13 @@ define void @store_cvt_4f64_to_8i16_undef(<4 x double> %a0, <8 x i16>* %a1) noun
  ; AVX1-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX1-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %ebp
  ; AVX1-NEXT:    shll $16, %ebp
  ; AVX1-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX1-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movzwl %ax, %ebx
  ; AVX1-NEXT:    orl %ebp, %ebx
  ; AVX1-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
@@ -3871,11 +3871,11 @@ define void @store_cvt_4f64_to_8i16_undef(<4 x double> %a0, <8 x i16>* %a1) noun
  ; AVX1-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX1-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %ebp
  ; AVX1-NEXT:    shll $16, %ebp
  ; AVX1-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movzwl %ax, %eax
  ; AVX1-NEXT:    orl %ebp, %eax
  ; AVX1-NEXT:    shlq $32, %rax
@@ -3899,13 +3899,13 @@ define void @store_cvt_4f64_to_8i16_undef(<4 x double> %a0, <8 x i16>* %a1) noun
  ; AVX2-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX2-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movl %eax, %ebp
  ; AVX2-NEXT:    shll $16, %ebp
  ; AVX2-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX2-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movzwl %ax, %ebx
  ; AVX2-NEXT:    orl %ebp, %ebx
  ; AVX2-NEXT:    vmovupd (%rsp), %ymm0 # 32-byte Reload
@@ -3913,11 +3913,11 @@ define void @store_cvt_4f64_to_8i16_undef(<4 x double> %a0, <8 x i16>* %a1) noun
  ; AVX2-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX2-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movl %eax, %ebp
  ; AVX2-NEXT:    shll $16, %ebp
  ; AVX2-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movzwl %ax, %eax
  ; AVX2-NEXT:    orl %ebp, %eax
  ; AVX2-NEXT:    shlq $32, %rax
@@ -3941,13 +3941,13 @@ define void @store_cvt_4f64_to_8i16_undef(<4 x double> %a0, <8 x i16>* %a1) noun
  ; AVX512-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX512-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movl %eax, %ebp
  ; AVX512-NEXT:    shll $16, %ebp
  ; AVX512-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX512-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movzwl %ax, %ebx
  ; AVX512-NEXT:    orl %ebp, %ebx
  ; AVX512-NEXT:    vmovupd (%rsp), %ymm0 # 32-byte Reload
@@ -3955,11 +3955,11 @@ define void @store_cvt_4f64_to_8i16_undef(<4 x double> %a0, <8 x i16>* %a1) noun
  ; AVX512-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX512-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movl %eax, %ebp
  ; AVX512-NEXT:    shll $16, %ebp
  ; AVX512-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movzwl %ax, %eax
  ; AVX512-NEXT:    orl %ebp, %eax
  ; AVX512-NEXT:    shlq $32, %rax
@@ -3990,13 +3990,13 @@ define void @store_cvt_4f64_to_8i16_zero(<4 x double> %a0, <8 x i16>* %a1) nounw
  ; AVX1-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX1-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %ebp
  ; AVX1-NEXT:    shll $16, %ebp
  ; AVX1-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX1-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movzwl %ax, %ebx
  ; AVX1-NEXT:    orl %ebp, %ebx
  ; AVX1-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
@@ -4004,11 +4004,11 @@ define void @store_cvt_4f64_to_8i16_zero(<4 x double> %a0, <8 x i16>* %a1) nounw
  ; AVX1-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX1-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %ebp
  ; AVX1-NEXT:    shll $16, %ebp
  ; AVX1-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movzwl %ax, %eax
  ; AVX1-NEXT:    orl %ebp, %eax
  ; AVX1-NEXT:    shlq $32, %rax
@@ -4033,13 +4033,13 @@ define void @store_cvt_4f64_to_8i16_zero(<4 x double> %a0, <8 x i16>* %a1) nounw
  ; AVX2-SLOW-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX2-SLOW-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-SLOW-NEXT:    vzeroupper
-; AVX2-SLOW-NEXT:    callq __truncdfhf2@PLT
+; AVX2-SLOW-NEXT:    callq __truncdfhf2
  ; AVX2-SLOW-NEXT:    movl %eax, %ebp
  ; AVX2-SLOW-NEXT:    shll $16, %ebp
  ; AVX2-SLOW-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX2-SLOW-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX2-SLOW-NEXT:    vzeroupper
-; AVX2-SLOW-NEXT:    callq __truncdfhf2@PLT
+; AVX2-SLOW-NEXT:    callq __truncdfhf2
  ; AVX2-SLOW-NEXT:    movzwl %ax, %ebx
  ; AVX2-SLOW-NEXT:    orl %ebp, %ebx
  ; AVX2-SLOW-NEXT:    vmovupd (%rsp), %ymm0 # 32-byte Reload
@@ -4047,11 +4047,11 @@ define void @store_cvt_4f64_to_8i16_zero(<4 x double> %a0, <8 x i16>* %a1) nounw
  ; AVX2-SLOW-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX2-SLOW-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-SLOW-NEXT:    vzeroupper
-; AVX2-SLOW-NEXT:    callq __truncdfhf2@PLT
+; AVX2-SLOW-NEXT:    callq __truncdfhf2
  ; AVX2-SLOW-NEXT:    movl %eax, %ebp
  ; AVX2-SLOW-NEXT:    shll $16, %ebp
  ; AVX2-SLOW-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX2-SLOW-NEXT:    callq __truncdfhf2@PLT
+; AVX2-SLOW-NEXT:    callq __truncdfhf2
  ; AVX2-SLOW-NEXT:    movzwl %ax, %eax
  ; AVX2-SLOW-NEXT:    orl %ebp, %eax
  ; AVX2-SLOW-NEXT:    shlq $32, %rax
@@ -4076,13 +4076,13 @@ define void @store_cvt_4f64_to_8i16_zero(<4 x double> %a0, <8 x i16>* %a1) nounw
  ; AVX2-FAST-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX2-FAST-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-FAST-NEXT:    vzeroupper
-; AVX2-FAST-NEXT:    callq __truncdfhf2@PLT
+; AVX2-FAST-NEXT:    callq __truncdfhf2
  ; AVX2-FAST-NEXT:    movl %eax, %ebp
  ; AVX2-FAST-NEXT:    shll $16, %ebp
  ; AVX2-FAST-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX2-FAST-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX2-FAST-NEXT:    vzeroupper
-; AVX2-FAST-NEXT:    callq __truncdfhf2@PLT
+; AVX2-FAST-NEXT:    callq __truncdfhf2
  ; AVX2-FAST-NEXT:    movzwl %ax, %ebx
  ; AVX2-FAST-NEXT:    orl %ebp, %ebx
  ; AVX2-FAST-NEXT:    vmovupd (%rsp), %ymm0 # 32-byte Reload
@@ -4090,11 +4090,11 @@ define void @store_cvt_4f64_to_8i16_zero(<4 x double> %a0, <8 x i16>* %a1) nounw
  ; AVX2-FAST-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX2-FAST-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-FAST-NEXT:    vzeroupper
-; AVX2-FAST-NEXT:    callq __truncdfhf2@PLT
+; AVX2-FAST-NEXT:    callq __truncdfhf2
  ; AVX2-FAST-NEXT:    movl %eax, %ebp
  ; AVX2-FAST-NEXT:    shll $16, %ebp
  ; AVX2-FAST-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX2-FAST-NEXT:    callq __truncdfhf2@PLT
+; AVX2-FAST-NEXT:    callq __truncdfhf2
  ; AVX2-FAST-NEXT:    movzwl %ax, %eax
  ; AVX2-FAST-NEXT:    orl %ebp, %eax
  ; AVX2-FAST-NEXT:    shlq $32, %rax
@@ -4118,13 +4118,13 @@ define void @store_cvt_4f64_to_8i16_zero(<4 x double> %a0, <8 x i16>* %a1) nounw
  ; AVX512F-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX512F-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512F-NEXT:    vzeroupper
-; AVX512F-NEXT:    callq __truncdfhf2@PLT
+; AVX512F-NEXT:    callq __truncdfhf2
  ; AVX512F-NEXT:    movl %eax, %ebp
  ; AVX512F-NEXT:    shll $16, %ebp
  ; AVX512F-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX512F-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX512F-NEXT:    vzeroupper
-; AVX512F-NEXT:    callq __truncdfhf2@PLT
+; AVX512F-NEXT:    callq __truncdfhf2
  ; AVX512F-NEXT:    movzwl %ax, %ebx
  ; AVX512F-NEXT:    orl %ebp, %ebx
  ; AVX512F-NEXT:    vmovupd (%rsp), %ymm0 # 32-byte Reload
@@ -4132,11 +4132,11 @@ define void @store_cvt_4f64_to_8i16_zero(<4 x double> %a0, <8 x i16>* %a1) nounw
  ; AVX512F-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX512F-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512F-NEXT:    vzeroupper
-; AVX512F-NEXT:    callq __truncdfhf2@PLT
+; AVX512F-NEXT:    callq __truncdfhf2
  ; AVX512F-NEXT:    movl %eax, %ebp
  ; AVX512F-NEXT:    shll $16, %ebp
  ; AVX512F-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX512F-NEXT:    callq __truncdfhf2@PLT
+; AVX512F-NEXT:    callq __truncdfhf2
  ; AVX512F-NEXT:    movzwl %ax, %eax
  ; AVX512F-NEXT:    orl %ebp, %eax
  ; AVX512F-NEXT:    shlq $32, %rax
@@ -4161,13 +4161,13 @@ define void @store_cvt_4f64_to_8i16_zero(<4 x double> %a0, <8 x i16>* %a1) nounw
  ; AVX512VL-NEXT:    vmovupd %ymm0, (%rsp) # 32-byte Spill
  ; AVX512VL-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512VL-NEXT:    vzeroupper
-; AVX512VL-NEXT:    callq __truncdfhf2@PLT
+; AVX512VL-NEXT:    callq __truncdfhf2
  ; AVX512VL-NEXT:    movl %eax, %ebp
  ; AVX512VL-NEXT:    shll $16, %ebp
  ; AVX512VL-NEXT:    vmovups (%rsp), %ymm0 # 32-byte Reload
  ; AVX512VL-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX512VL-NEXT:    vzeroupper
-; AVX512VL-NEXT:    callq __truncdfhf2@PLT
+; AVX512VL-NEXT:    callq __truncdfhf2
  ; AVX512VL-NEXT:    movzwl %ax, %ebx
  ; AVX512VL-NEXT:    orl %ebp, %ebx
  ; AVX512VL-NEXT:    vmovupd (%rsp), %ymm0 # 32-byte Reload
@@ -4175,11 +4175,11 @@ define void @store_cvt_4f64_to_8i16_zero(<4 x double> %a0, <8 x i16>* %a1) nounw
  ; AVX512VL-NEXT:    vmovapd %xmm0, (%rsp) # 16-byte Spill
  ; AVX512VL-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512VL-NEXT:    vzeroupper
-; AVX512VL-NEXT:    callq __truncdfhf2@PLT
+; AVX512VL-NEXT:    callq __truncdfhf2
  ; AVX512VL-NEXT:    movl %eax, %ebp
  ; AVX512VL-NEXT:    shll $16, %ebp
  ; AVX512VL-NEXT:    vmovaps (%rsp), %xmm0 # 16-byte Reload
-; AVX512VL-NEXT:    callq __truncdfhf2@PLT
+; AVX512VL-NEXT:    callq __truncdfhf2
  ; AVX512VL-NEXT:    movzwl %ax, %eax
  ; AVX512VL-NEXT:    orl %ebp, %eax
  ; AVX512VL-NEXT:    shlq $32, %rax
@@ -4214,41 +4214,41 @@ define void @store_cvt_8f64_to_8i16(<8 x double> %a0, <8 x i16>* %a1) nounwind {
  ; AVX1-NEXT:    vmovupd %ymm0, {{[0-9]+}}(%rsp) # 32-byte Spill
  ; AVX1-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movw %ax, {{[0-9]+}}(%rsp) # 2-byte Spill
  ; AVX1-NEXT:    vmovups {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
  ; AVX1-NEXT:    vextractf128 $1, %ymm0, %xmm0
  ; AVX1-NEXT:    vmovapd %xmm0, {{[0-9]+}}(%rsp) # 16-byte Spill
  ; AVX1-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movw %ax, {{[0-9]+}}(%rsp) # 2-byte Spill
  ; AVX1-NEXT:    vpermilpd $1, {{[0-9]+}}(%rsp), %xmm0 # 16-byte Folded Reload
  ; AVX1-NEXT:    # xmm0 = mem[1,0]
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %r12d
  ; AVX1-NEXT:    vmovups {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
  ; AVX1-NEXT:    vextractf128 $1, %ymm0, %xmm0
  ; AVX1-NEXT:    vmovapd %xmm0, {{[0-9]+}}(%rsp) # 16-byte Spill
  ; AVX1-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %r13d
  ; AVX1-NEXT:    vmovups {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
  ; AVX1-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %ebp
  ; AVX1-NEXT:    vmovaps {{[0-9]+}}(%rsp), %xmm0 # 16-byte Reload
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %r14d
  ; AVX1-NEXT:    vmovups {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
  ; AVX1-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX1-NEXT:    vzeroupper
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movl %eax, %r15d
  ; AVX1-NEXT:    vmovaps {{[0-9]+}}(%rsp), %xmm0 # 16-byte Reload
-; AVX1-NEXT:    callq __truncdfhf2@PLT
+; AVX1-NEXT:    callq __truncdfhf2
  ; AVX1-NEXT:    movw %ax, 12(%rbx)
  ; AVX1-NEXT:    movw %r15w, 8(%rbx)
  ; AVX1-NEXT:    movw %r14w, 4(%rbx)
@@ -4282,41 +4282,41 @@ define void @store_cvt_8f64_to_8i16(<8 x double> %a0, <8 x i16>* %a1) nounwind {
  ; AVX2-NEXT:    vmovupd %ymm0, {{[0-9]+}}(%rsp) # 32-byte Spill
  ; AVX2-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movw %ax, {{[0-9]+}}(%rsp) # 2-byte Spill
  ; AVX2-NEXT:    vmovupd {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
  ; AVX2-NEXT:    vextractf128 $1, %ymm0, %xmm0
  ; AVX2-NEXT:    vmovapd %xmm0, {{[0-9]+}}(%rsp) # 16-byte Spill
  ; AVX2-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movw %ax, {{[0-9]+}}(%rsp) # 2-byte Spill
  ; AVX2-NEXT:    vpermilpd $1, {{[0-9]+}}(%rsp), %xmm0 # 16-byte Folded Reload
  ; AVX2-NEXT:    # xmm0 = mem[1,0]
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movl %eax, %r12d
  ; AVX2-NEXT:    vmovupd {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
  ; AVX2-NEXT:    vextractf128 $1, %ymm0, %xmm0
  ; AVX2-NEXT:    vmovapd %xmm0, {{[0-9]+}}(%rsp) # 16-byte Spill
  ; AVX2-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movl %eax, %r13d
  ; AVX2-NEXT:    vmovups {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
  ; AVX2-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movl %eax, %ebp
  ; AVX2-NEXT:    vmovaps {{[0-9]+}}(%rsp), %xmm0 # 16-byte Reload
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movl %eax, %r14d
  ; AVX2-NEXT:    vmovups {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
  ; AVX2-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX2-NEXT:    vzeroupper
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movl %eax, %r15d
  ; AVX2-NEXT:    vmovaps {{[0-9]+}}(%rsp), %xmm0 # 16-byte Reload
-; AVX2-NEXT:    callq __truncdfhf2@PLT
+; AVX2-NEXT:    callq __truncdfhf2
  ; AVX2-NEXT:    movw %ax, 12(%rbx)
  ; AVX2-NEXT:    movw %r15w, 8(%rbx)
  ; AVX2-NEXT:    movw %r14w, 4(%rbx)
@@ -4349,44 +4349,44 @@ define void @store_cvt_8f64_to_8i16(<8 x double> %a0, <8 x i16>* %a1) nounwind {
  ; AVX512-NEXT:    vmovupd %zmm0, {{[0-9]+}}(%rsp) # 64-byte Spill
  ; AVX512-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movw %ax, {{[0-9]+}}(%rsp) # 2-byte Spill
  ; AVX512-NEXT:    vmovupd {{[0-9]+}}(%rsp), %zmm0 # 64-byte Reload
  ; AVX512-NEXT:    vextractf128 $1, %ymm0, %xmm0
  ; AVX512-NEXT:    vmovapd %xmm0, {{[0-9]+}}(%rsp) # 16-byte Spill
  ; AVX512-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movw %ax, {{[0-9]+}}(%rsp) # 2-byte Spill
  ; AVX512-NEXT:    vmovupd {{[0-9]+}}(%rsp), %zmm0 # 64-byte Reload
  ; AVX512-NEXT:    vextractf64x4 $1, %zmm0, %ymm0
  ; AVX512-NEXT:    vmovupd %ymm0, {{[0-9]+}}(%rsp) # 32-byte Spill
  ; AVX512-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movl %eax, %r12d
  ; AVX512-NEXT:    vmovupd {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
  ; AVX512-NEXT:    vextractf128 $1, %ymm0, %xmm0
  ; AVX512-NEXT:    vmovapd %xmm0, {{[0-9]+}}(%rsp) # 16-byte Spill
  ; AVX512-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movl %eax, %r13d
  ; AVX512-NEXT:    vmovups {{[0-9]+}}(%rsp), %zmm0 # 64-byte Reload
  ; AVX512-NEXT:    # kill: def $xmm0 killed $xmm0 killed $zmm0
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movl %eax, %ebp
  ; AVX512-NEXT:    vmovaps {{[0-9]+}}(%rsp), %xmm0 # 16-byte Reload
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movl %eax, %r14d
  ; AVX512-NEXT:    vmovups {{[0-9]+}}(%rsp), %ymm0 # 32-byte Reload
  ; AVX512-NEXT:    # kill: def $xmm0 killed $xmm0 killed $ymm0
  ; AVX512-NEXT:    vzeroupper
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movl %eax, %r15d
  ; AVX512-NEXT:    vmovaps {{[0-9]+}}(%rsp), %xmm0 # 16-byte Reload
-; AVX512-NEXT:    callq __truncdfhf2@PLT
+; AVX512-NEXT:    callq __truncdfhf2
  ; AVX512-NEXT:    movw %ax, 12(%rbx)
  ; AVX512-NEXT:    movw %r15w, 8(%rbx)
  ; AVX512-NEXT:    movw %r14w, 4(%rbx)
author	Rafael Espindola <rafael.espindola@gmail.com>
	Sat, 10 Mar 2018 02:42:14 +0000 (02:42 +0000)
committer	Rafael Espindola <rafael.espindola@gmail.com>
	Sat, 10 Mar 2018 02:42:14 +0000 (02:42 +0000)
lib/Target/TargetMachine.cpp		patch \| blob \| history
test/CodeGen/X86/finite-libcalls.ll		patch \| blob \| history
test/CodeGen/X86/fmaxnum.ll		patch \| blob \| history
test/CodeGen/X86/fminnum.ll		patch \| blob \| history
test/CodeGen/X86/fp-cvt.ll		patch \| blob \| history
test/CodeGen/X86/fp-intrinsics.ll		patch \| blob \| history
test/CodeGen/X86/half.ll		patch \| blob \| history
test/CodeGen/X86/memset-nonzero.ll		patch \| blob \| history
test/CodeGen/X86/negative-sin.ll		patch \| blob \| history
test/CodeGen/X86/scalar-fp-to-i64.ll		patch \| blob \| history
test/CodeGen/X86/vector-half-conversions.ll		patch \| blob \| history