From a292a7749362ef4ca7669e1ad8ab2f0131b0c184 Mon Sep 17 00:00:00 2001 From: Simon Pilgrim Date: Fri, 15 Jun 2018 18:35:25 +0000 Subject: [PATCH] [llvm-mca][x86] Add Generic cpu resource tests Added a Generic x86 cpu set of resource tests to allow us to check all ISAs. We currently use SandyBridge as our generic CPU model, but it's better if we actually duplicate these tests for if/when we change the model, it also means we don't end up polluting the SandyBridge folder with tests for ISAs it doesn't support. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@334853 91177308-0d34-0410-b5e6-96231b3b80d8 --- test/tools/llvm-mca/X86/Generic/resources-adx.s | 55 + test/tools/llvm-mca/X86/Generic/resources-aes.s | 71 + test/tools/llvm-mca/X86/Generic/resources-avx1.s | 2403 ++++++++++++++++++++ test/tools/llvm-mca/X86/Generic/resources-avx2.s | 1074 +++++++++ test/tools/llvm-mca/X86/Generic/resources-bmi1.s | 113 + test/tools/llvm-mca/X86/Generic/resources-bmi2.s | 141 ++ test/tools/llvm-mca/X86/Generic/resources-cmov.s | 323 +++ test/tools/llvm-mca/X86/Generic/resources-f16c.s | 57 + test/tools/llvm-mca/X86/Generic/resources-fma.s | 701 ++++++ test/tools/llvm-mca/X86/Generic/resources-lzcnt.s | 50 + test/tools/llvm-mca/X86/Generic/resources-mmx.s | 393 ++++ test/tools/llvm-mca/X86/Generic/resources-popcnt.s | 50 + test/tools/llvm-mca/X86/Generic/resources-sse1.s | 461 ++++ test/tools/llvm-mca/X86/Generic/resources-sse2.s | 949 ++++++++ test/tools/llvm-mca/X86/Generic/resources-sse3.s | 96 + test/tools/llvm-mca/X86/Generic/resources-sse41.s | 366 +++ test/tools/llvm-mca/X86/Generic/resources-sse42.s | 99 + test/tools/llvm-mca/X86/Generic/resources-sse4a.s | 50 + test/tools/llvm-mca/X86/Generic/resources-ssse3.s | 253 +++ test/tools/llvm-mca/X86/Generic/resources-x86_64.s | 1708 ++++++++++++++ test/tools/llvm-mca/X86/Generic/resources-x87.s | 521 +++++ 21 files changed, 9934 insertions(+) create mode 100644 test/tools/llvm-mca/X86/Generic/resources-adx.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-aes.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-avx1.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-avx2.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-bmi1.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-bmi2.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-cmov.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-f16c.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-fma.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-lzcnt.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-mmx.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-popcnt.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-sse1.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-sse2.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-sse3.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-sse41.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-sse42.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-sse4a.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-ssse3.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-x86_64.s create mode 100644 test/tools/llvm-mca/X86/Generic/resources-x87.s diff --git a/test/tools/llvm-mca/X86/Generic/resources-adx.s b/test/tools/llvm-mca/X86/Generic/resources-adx.s new file mode 100644 index 00000000000..aac382e6d6e --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-adx.s @@ -0,0 +1,55 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +adcx %ebx, %ecx +adcx (%rbx), %ecx +adcx %rbx, %rcx +adcx (%rbx), %rcx + +adox %ebx, %ecx +adox (%rbx), %ecx +adox %rbx, %rcx +adox (%rbx), %rcx + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 2 2 0.67 adcxl %ebx, %ecx +# CHECK-NEXT: 3 7 0.67 * adcxl (%rbx), %ecx +# CHECK-NEXT: 2 2 0.67 adcxq %rbx, %rcx +# CHECK-NEXT: 3 7 0.67 * adcxq (%rbx), %rcx +# CHECK-NEXT: 2 2 0.67 adoxl %ebx, %ecx +# CHECK-NEXT: 3 7 0.67 * adoxl (%rbx), %ecx +# CHECK-NEXT: 2 2 0.67 adoxq %rbx, %rcx +# CHECK-NEXT: 3 7 0.67 * adoxq (%rbx), %rcx + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - - 6.67 2.67 - 6.67 2.00 2.00 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - adcxl %ebx, %ecx +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 adcxl (%rbx), %ecx +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - adcxq %rbx, %rcx +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 adcxq (%rbx), %rcx +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - adoxl %ebx, %ecx +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 adoxl (%rbx), %ecx +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - adoxq %rbx, %rcx +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 adoxq (%rbx), %rcx diff --git a/test/tools/llvm-mca/X86/Generic/resources-aes.s b/test/tools/llvm-mca/X86/Generic/resources-aes.s new file mode 100644 index 00000000000..3285236f054 --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-aes.s @@ -0,0 +1,71 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +aesdec %xmm0, %xmm2 +aesdec (%rax), %xmm2 + +aesdeclast %xmm0, %xmm2 +aesdeclast (%rax), %xmm2 + +aesenc %xmm0, %xmm2 +aesenc (%rax), %xmm2 + +aesenclast %xmm0, %xmm2 +aesenclast (%rax), %xmm2 + +aesimc %xmm0, %xmm2 +aesimc (%rax), %xmm2 + +aeskeygenassist $22, %xmm0, %xmm2 +aeskeygenassist $22, (%rax), %xmm2 + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 2 7 1.00 aesdec %xmm0, %xmm2 +# CHECK-NEXT: 3 13 1.00 * aesdec (%rax), %xmm2 +# CHECK-NEXT: 2 7 1.00 aesdeclast %xmm0, %xmm2 +# CHECK-NEXT: 3 13 1.00 * aesdeclast (%rax), %xmm2 +# CHECK-NEXT: 2 7 1.00 aesenc %xmm0, %xmm2 +# CHECK-NEXT: 3 13 1.00 * aesenc (%rax), %xmm2 +# CHECK-NEXT: 2 7 1.00 aesenclast %xmm0, %xmm2 +# CHECK-NEXT: 3 13 1.00 * aesenclast (%rax), %xmm2 +# CHECK-NEXT: 2 12 2.00 aesimc %xmm0, %xmm2 +# CHECK-NEXT: 3 18 2.00 * aesimc (%rax), %xmm2 +# CHECK-NEXT: 1 8 3.67 aeskeygenassist $22, %xmm0, %xmm2 +# CHECK-NEXT: 1 8 3.33 * aeskeygenassist $22, (%rax), %xmm2 + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - - 9.67 9.67 - 21.67 3.00 3.00 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - 0.33 0.33 - 1.33 - - aesdec %xmm0, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 1.33 0.50 0.50 aesdec (%rax), %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 1.33 - - aesdeclast %xmm0, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 1.33 0.50 0.50 aesdeclast (%rax), %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 1.33 - - aesenc %xmm0, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 1.33 0.50 0.50 aesenc (%rax), %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 1.33 - - aesenclast %xmm0, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 1.33 0.50 0.50 aesenclast (%rax), %xmm2 +# CHECK-NEXT: - - - - - 2.00 - - aesimc %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 2.00 0.50 0.50 aesimc (%rax), %xmm2 +# CHECK-NEXT: - - 3.67 3.67 - 3.67 - - aeskeygenassist $22, %xmm0, %xmm2 +# CHECK-NEXT: - - 3.33 3.33 - 3.33 0.50 0.50 aeskeygenassist $22, (%rax), %xmm2 diff --git a/test/tools/llvm-mca/X86/Generic/resources-avx1.s b/test/tools/llvm-mca/X86/Generic/resources-avx1.s new file mode 100644 index 00000000000..f72ab1a61aa --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-avx1.s @@ -0,0 +1,2403 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +vaddpd %xmm0, %xmm1, %xmm2 +vaddpd (%rax), %xmm1, %xmm2 + +vaddpd %ymm0, %ymm1, %ymm2 +vaddpd (%rax), %ymm1, %ymm2 + +vaddps %xmm0, %xmm1, %xmm2 +vaddps (%rax), %xmm1, %xmm2 + +vaddps %ymm0, %ymm1, %ymm2 +vaddps (%rax), %ymm1, %ymm2 + +vaddsd %xmm0, %xmm1, %xmm2 +vaddsd (%rax), %xmm1, %xmm2 + +vaddss %xmm0, %xmm1, %xmm2 +vaddss (%rax), %xmm1, %xmm2 + +vaddsubpd %xmm0, %xmm1, %xmm2 +vaddsubpd (%rax), %xmm1, %xmm2 + +vaddsubpd %ymm0, %ymm1, %ymm2 +vaddsubpd (%rax), %ymm1, %ymm2 + +vaddsubps %xmm0, %xmm1, %xmm2 +vaddsubps (%rax), %xmm1, %xmm2 + +vaddsubps %ymm0, %ymm1, %ymm2 +vaddsubps (%rax), %ymm1, %ymm2 + +vaesdec %xmm0, %xmm1, %xmm2 +vaesdec (%rax), %xmm1, %xmm2 + +vaesdeclast %xmm0, %xmm1, %xmm2 +vaesdeclast (%rax), %xmm1, %xmm2 + +vaesenc %xmm0, %xmm1, %xmm2 +vaesenc (%rax), %xmm1, %xmm2 + +vaesenclast %xmm0, %xmm1, %xmm2 +vaesenclast (%rax), %xmm1, %xmm2 + +vaesimc %xmm0, %xmm2 +vaesimc (%rax), %xmm2 + +vaeskeygenassist $22, %xmm0, %xmm2 +vaeskeygenassist $22, (%rax), %xmm2 + +vandnpd %xmm0, %xmm1, %xmm2 +vandnpd (%rax), %xmm1, %xmm2 + +vandnpd %ymm0, %ymm1, %ymm2 +vandnpd (%rax), %ymm1, %ymm2 + +vandnps %xmm0, %xmm1, %xmm2 +vandnps (%rax), %xmm1, %xmm2 + +vandnps %ymm0, %ymm1, %ymm2 +vandnps (%rax), %ymm1, %ymm2 + +vandpd %xmm0, %xmm1, %xmm2 +vandpd (%rax), %xmm1, %xmm2 + +vandpd %ymm0, %ymm1, %ymm2 +vandpd (%rax), %ymm1, %ymm2 + +vandps %xmm0, %xmm1, %xmm2 +vandps (%rax), %xmm1, %xmm2 + +vandps %ymm0, %ymm1, %ymm2 +vandps (%rax), %ymm1, %ymm2 + +vblendpd $11, %xmm0, %xmm1, %xmm2 +vblendpd $11, (%rax), %xmm1, %xmm2 + +vblendpd $11, %ymm0, %ymm1, %ymm2 +vblendpd $11, (%rax), %ymm1, %ymm2 + +vblendps $11, %xmm0, %xmm1, %xmm2 +vblendps $11, (%rax), %xmm1, %xmm2 + +vblendps $11, %ymm0, %ymm1, %ymm2 +vblendps $11, (%rax), %ymm1, %ymm2 + +vblendvpd %xmm3, %xmm0, %xmm1, %xmm2 +vblendvpd %xmm3, (%rax), %xmm1, %xmm2 + +vblendvpd %ymm3, %ymm0, %ymm1, %ymm2 +vblendvpd %ymm3, (%rax), %ymm1, %ymm2 + +vblendvps %xmm3, %xmm0, %xmm1, %xmm2 +vblendvps %xmm3, (%rax), %xmm1, %xmm2 + +vblendvps %ymm3, %ymm0, %ymm1, %ymm2 +vblendvps %ymm3, (%rax), %ymm1, %ymm2 + +vbroadcastf128 (%rax), %ymm2 + +vbroadcastsd (%rax), %ymm2 + +vbroadcastss (%rax), %xmm2 +vbroadcastss (%rax), %ymm2 + +vcmppd $0, %xmm0, %xmm1, %xmm2 +vcmppd $0, (%rax), %xmm1, %xmm2 + +vcmppd $0, %ymm0, %ymm1, %ymm2 +vcmppd $0, (%rax), %ymm1, %ymm2 + +vcmpps $0, %xmm0, %xmm1, %xmm2 +vcmpps $0, (%rax), %xmm1, %xmm2 + +vcmpps $0, %ymm0, %ymm1, %ymm2 +vcmpps $0, (%rax), %ymm1, %ymm2 + +vcmpsd $0, %xmm0, %xmm1, %xmm2 +vcmpsd $0, (%rax), %xmm1, %xmm2 + +vcmpss $0, %xmm0, %xmm1, %xmm2 +vcmpss $0, (%rax), %xmm1, %xmm2 + +vcomisd %xmm0, %xmm1 +vcomisd (%rax), %xmm1 + +vcomiss %xmm0, %xmm1 +vcomiss (%rax), %xmm1 + +vcvtdq2pd %xmm0, %xmm2 +vcvtdq2pd (%rax), %xmm2 + +vcvtdq2pd %xmm0, %ymm2 +vcvtdq2pd (%rax), %ymm2 + +vcvtdq2ps %xmm0, %xmm2 +vcvtdq2ps (%rax), %xmm2 + +vcvtdq2ps %ymm0, %ymm2 +vcvtdq2ps (%rax), %ymm2 + +vcvtpd2dqx %xmm0, %xmm2 +vcvtpd2dqx (%rax), %xmm2 + +vcvtpd2dqy %ymm0, %xmm2 +vcvtpd2dqy (%rax), %xmm2 + +vcvtpd2psx %xmm0, %xmm2 +vcvtpd2psx (%rax), %xmm2 + +vcvtpd2psy %ymm0, %xmm2 +vcvtpd2psy (%rax), %xmm2 + +vcvtps2dq %xmm0, %xmm2 +vcvtps2dq (%rax), %xmm2 + +vcvtps2dq %ymm0, %ymm2 +vcvtps2dq (%rax), %ymm2 + +vcvtps2pd %xmm0, %xmm2 +vcvtps2pd (%rax), %xmm2 + +vcvtps2pd %xmm0, %ymm2 +vcvtps2pd (%rax), %ymm2 + +vcvtsd2si %xmm0, %ecx +vcvtsd2si %xmm0, %rcx +vcvtsd2si (%rax), %ecx +vcvtsd2si (%rax), %rcx + +vcvtsd2ss %xmm0, %xmm1, %xmm2 +vcvtsd2ss (%rax), %xmm1, %xmm2 + +vcvtsi2sdl %ecx, %xmm0, %xmm2 +vcvtsi2sdq %rcx, %xmm0, %xmm2 +vcvtsi2sdl (%rax), %xmm0, %xmm2 +vcvtsi2sdq (%rax), %xmm0, %xmm2 + +vcvtsi2ssl %ecx, %xmm0, %xmm2 +vcvtsi2ssq %rcx, %xmm0, %xmm2 +vcvtsi2ssl (%rax), %xmm0, %xmm2 +vcvtsi2ssq (%rax), %xmm0, %xmm2 + +vcvtss2sd %xmm0, %xmm1, %xmm2 +vcvtss2sd (%rax), %xmm1, %xmm2 + +vcvtss2si %xmm0, %ecx +vcvtss2si %xmm0, %rcx +vcvtss2si (%rax), %ecx +vcvtss2si (%rax), %rcx + +vcvttpd2dqx %xmm0, %xmm2 +vcvttpd2dqx (%rax), %xmm2 + +vcvttpd2dqy %ymm0, %xmm2 +vcvttpd2dqy (%rax), %xmm2 + +vcvttps2dq %xmm0, %xmm2 +vcvttps2dq (%rax), %xmm2 + +vcvttps2dq %ymm0, %ymm2 +vcvttps2dq (%rax), %ymm2 + +vcvttsd2si %xmm0, %ecx +vcvttsd2si %xmm0, %rcx +vcvttsd2si (%rax), %ecx +vcvttsd2si (%rax), %rcx + +vcvttss2si %xmm0, %ecx +vcvttss2si %xmm0, %rcx +vcvttss2si (%rax), %ecx +vcvttss2si (%rax), %rcx + +vdivpd %xmm0, %xmm1, %xmm2 +vdivpd (%rax), %xmm1, %xmm2 + +vdivpd %ymm0, %ymm1, %ymm2 +vdivpd (%rax), %ymm1, %ymm2 + +vdivps %xmm0, %xmm1, %xmm2 +vdivps (%rax), %xmm1, %xmm2 + +vdivps %ymm0, %ymm1, %ymm2 +vdivps (%rax), %ymm1, %ymm2 + +vdivsd %xmm0, %xmm1, %xmm2 +vdivsd (%rax), %xmm1, %xmm2 + +vdivss %xmm0, %xmm1, %xmm2 +vdivss (%rax), %xmm1, %xmm2 + +vdppd $22, %xmm0, %xmm1, %xmm2 +vdppd $22, (%rax), %xmm1, %xmm2 + +vdpps $22, %xmm0, %xmm1, %xmm2 +vdpps $22, (%rax), %xmm1, %xmm2 + +vdpps $22, %ymm0, %ymm1, %ymm2 +vdpps $22, (%rax), %ymm1, %ymm2 + +vextractf128 $1, %ymm0, %xmm2 +vextractf128 $1, %ymm0, (%rax) + +vextractps $1, %xmm0, %rcx +vextractps $1, %xmm0, (%rax) + +vhaddpd %xmm0, %xmm1, %xmm2 +vhaddpd (%rax), %xmm1, %xmm2 + +vhaddpd %ymm0, %ymm1, %ymm2 +vhaddpd (%rax), %ymm1, %ymm2 + +vhaddps %xmm0, %xmm1, %xmm2 +vhaddps (%rax), %xmm1, %xmm2 + +vhaddps %ymm0, %ymm1, %ymm2 +vhaddps (%rax), %ymm1, %ymm2 + +vhsubpd %xmm0, %xmm1, %xmm2 +vhsubpd (%rax), %xmm1, %xmm2 + +vhsubpd %ymm0, %ymm1, %ymm2 +vhsubpd (%rax), %ymm1, %ymm2 + +vhsubps %xmm0, %xmm1, %xmm2 +vhsubps (%rax), %xmm1, %xmm2 + +vhsubps %ymm0, %ymm1, %ymm2 +vhsubps (%rax), %ymm1, %ymm2 + +vinsertf128 $1, %xmm0, %ymm1, %ymm2 +vinsertf128 $1, (%rax), %ymm1, %ymm2 + +vinsertps $1, %xmm0, %xmm1, %xmm2 +vinsertps $1, (%rax), %xmm1, %xmm2 + +vlddqu (%rax), %xmm2 +vlddqu (%rax), %ymm2 + +vldmxcsr (%rax) + +vmaskmovdqu %xmm0, %xmm1 + +vmaskmovpd (%rax), %xmm0, %xmm2 +vmaskmovpd (%rax), %ymm0, %ymm2 + +vmaskmovpd %xmm0, %xmm1, (%rax) +vmaskmovpd %ymm0, %ymm1, (%rax) + +vmaskmovps (%rax), %xmm0, %xmm2 +vmaskmovps (%rax), %ymm0, %ymm2 + +vmaskmovps %xmm0, %xmm1, (%rax) +vmaskmovps %ymm0, %ymm1, (%rax) + +vmaxpd %xmm0, %xmm1, %xmm2 +vmaxpd (%rax), %xmm1, %xmm2 + +vmaxpd %ymm0, %ymm1, %ymm2 +vmaxpd (%rax), %ymm1, %ymm2 + +vmaxps %xmm0, %xmm1, %xmm2 +vmaxps (%rax), %xmm1, %xmm2 + +vmaxps %ymm0, %ymm1, %ymm2 +vmaxps (%rax), %ymm1, %ymm2 + +vmaxsd %xmm0, %xmm1, %xmm2 +vmaxsd (%rax), %xmm1, %xmm2 + +vmaxss %xmm0, %xmm1, %xmm2 +vmaxss (%rax), %xmm1, %xmm2 + +vminpd %xmm0, %xmm1, %xmm2 +vminpd (%rax), %xmm1, %xmm2 + +vminpd %ymm0, %ymm1, %ymm2 +vminpd (%rax), %ymm1, %ymm2 + +vminps %xmm0, %xmm1, %xmm2 +vminps (%rax), %xmm1, %xmm2 + +vminps %ymm0, %ymm1, %ymm2 +vminps (%rax), %ymm1, %ymm2 + +vminsd %xmm0, %xmm1, %xmm2 +vminsd (%rax), %xmm1, %xmm2 + +vminss %xmm0, %xmm1, %xmm2 +vminss (%rax), %xmm1, %xmm2 + +vmovapd %xmm0, %xmm2 +vmovapd %xmm0, (%rax) +vmovapd (%rax), %xmm2 + +vmovapd %ymm0, %ymm2 +vmovapd %ymm0, (%rax) +vmovapd (%rax), %ymm2 + +vmovaps %xmm0, %xmm2 +vmovaps %xmm0, (%rax) +vmovaps (%rax), %xmm2 + +vmovaps %ymm0, %ymm2 +vmovaps %ymm0, (%rax) +vmovaps (%rax), %ymm2 + +vmovd %eax, %xmm2 +vmovd (%rax), %xmm2 + +vmovd %xmm0, %ecx +vmovd %xmm0, (%rax) + +vmovddup %xmm0, %xmm2 +vmovddup (%rax), %xmm2 + +vmovddup %ymm0, %ymm2 +vmovddup (%rax), %ymm2 + +vmovdqa %xmm0, %xmm2 +vmovdqa %xmm0, (%rax) +vmovdqa (%rax), %xmm2 + +vmovdqa %ymm0, %ymm2 +vmovdqa %ymm0, (%rax) +vmovdqa (%rax), %ymm2 + +vmovdqu %xmm0, %xmm2 +vmovdqu %xmm0, (%rax) +vmovdqu (%rax), %xmm2 + +vmovdqu %ymm0, %ymm2 +vmovdqu %ymm0, (%rax) +vmovdqu (%rax), %ymm2 + +vmovhlps %xmm0, %xmm1, %xmm2 +vmovlhps %xmm0, %xmm1, %xmm2 + +vmovhpd %xmm0, (%rax) +vmovhpd (%rax), %xmm1, %xmm2 + +vmovhps %xmm0, (%rax) +vmovhps (%rax), %xmm1, %xmm2 + +vmovlpd %xmm0, (%rax) +vmovlpd (%rax), %xmm1, %xmm2 + +vmovlps %xmm0, (%rax) +vmovlps (%rax), %xmm1, %xmm2 + +vmovmskpd %xmm0, %rcx +vmovmskpd %ymm0, %rcx + +vmovmskps %xmm0, %rcx +vmovmskps %ymm0, %rcx + +vmovntdq %xmm0, (%rax) +vmovntdq %ymm0, (%rax) + +vmovntdqa (%rax), %xmm2 +vmovntdqa (%rax), %ymm2 + +vmovntpd %xmm0, (%rax) +vmovntpd %ymm0, (%rax) + +vmovntps %xmm0, (%rax) +vmovntps %ymm0, (%rax) + +vmovq %xmm0, %xmm2 + +vmovq %rax, %xmm2 +vmovq (%rax), %xmm2 + +vmovq %xmm0, %rcx +vmovq %xmm0, (%rax) + +vmovsd %xmm0, %xmm1, %xmm2 +vmovsd %xmm0, (%rax) +vmovsd (%rax), %xmm2 + +vmovshdup %xmm0, %xmm2 +vmovshdup (%rax), %xmm2 + +vmovshdup %ymm0, %ymm2 +vmovshdup (%rax), %ymm2 + +vmovsldup %xmm0, %xmm2 +vmovsldup (%rax), %xmm2 + +vmovsldup %ymm0, %ymm2 +vmovsldup (%rax), %ymm2 + +vmovss %xmm0, %xmm1, %xmm2 +vmovss %xmm0, (%rax) +vmovss (%rax), %xmm2 + +vmovupd %xmm0, %xmm2 +vmovupd %xmm0, (%rax) +vmovupd (%rax), %xmm2 + +vmovupd %ymm0, %ymm2 +vmovupd %ymm0, (%rax) +vmovupd (%rax), %ymm2 + +vmovups %xmm0, %xmm2 +vmovups %xmm0, (%rax) +vmovups (%rax), %xmm2 + +vmovups %ymm0, %ymm2 +vmovups %ymm0, (%rax) +vmovups (%rax), %ymm2 + +vmpsadbw $1, %xmm0, %xmm1, %xmm2 +vmpsadbw $1, (%rax), %xmm1, %xmm2 + +vmulpd %xmm0, %xmm1, %xmm2 +vmulpd (%rax), %xmm1, %xmm2 + +vmulpd %ymm0, %ymm1, %ymm2 +vmulpd (%rax), %ymm1, %ymm2 + +vmulps %xmm0, %xmm1, %xmm2 +vmulps (%rax), %xmm1, %xmm2 + +vmulps %ymm0, %ymm1, %ymm2 +vmulps (%rax), %ymm1, %ymm2 + +vmulsd %xmm0, %xmm1, %xmm2 +vmulsd (%rax), %xmm1, %xmm2 + +vmulss %xmm0, %xmm1, %xmm2 +vmulss (%rax), %xmm1, %xmm2 + +vorpd %xmm0, %xmm1, %xmm2 +vorpd (%rax), %xmm1, %xmm2 + +vorpd %ymm0, %ymm1, %ymm2 +vorpd (%rax), %ymm1, %ymm2 + +vorps %xmm0, %xmm1, %xmm2 +vorps (%rax), %xmm1, %xmm2 + +vorps %ymm0, %ymm1, %ymm2 +vorps (%rax), %ymm1, %ymm2 + +vpabsb %xmm0, %xmm2 +vpabsb (%rax), %xmm2 + +vpabsd %xmm0, %xmm2 +vpabsd (%rax), %xmm2 + +vpabsw %xmm0, %xmm2 +vpabsw (%rax), %xmm2 + +vpackssdw %xmm0, %xmm1, %xmm2 +vpackssdw (%rax), %xmm1, %xmm2 + +vpacksswb %xmm0, %xmm1, %xmm2 +vpacksswb (%rax), %xmm1, %xmm2 + +vpackusdw %xmm0, %xmm1, %xmm2 +vpackusdw (%rax), %xmm1, %xmm2 + +vpackuswb %xmm0, %xmm1, %xmm2 +vpackuswb (%rax), %xmm1, %xmm2 + +vpaddb %xmm0, %xmm1, %xmm2 +vpaddb (%rax), %xmm1, %xmm2 + +vpaddd %xmm0, %xmm1, %xmm2 +vpaddd (%rax), %xmm1, %xmm2 + +vpaddq %xmm0, %xmm1, %xmm2 +vpaddq (%rax), %xmm1, %xmm2 + +vpaddsb %xmm0, %xmm1, %xmm2 +vpaddsb (%rax), %xmm1, %xmm2 + +vpaddsw %xmm0, %xmm1, %xmm2 +vpaddsw (%rax), %xmm1, %xmm2 + +vpaddusb %xmm0, %xmm1, %xmm2 +vpaddusb (%rax), %xmm1, %xmm2 + +vpaddusw %xmm0, %xmm1, %xmm2 +vpaddusw (%rax), %xmm1, %xmm2 + +vpaddw %xmm0, %xmm1, %xmm2 +vpaddw (%rax), %xmm1, %xmm2 + +vpalignr $1, %xmm0, %xmm1, %xmm2 +vpalignr $1, (%rax), %xmm1, %xmm2 + +vpand %xmm0, %xmm1, %xmm2 +vpand (%rax), %xmm1, %xmm2 + +vpandn %xmm0, %xmm1, %xmm2 +vpandn (%rax), %xmm1, %xmm2 + +vpavgb %xmm0, %xmm1, %xmm2 +vpavgb (%rax), %xmm1, %xmm2 + +vpavgw %xmm0, %xmm1, %xmm2 +vpavgw (%rax), %xmm1, %xmm2 + +vpblendvb %xmm3, %xmm0, %xmm1, %xmm2 +vpblendvb %xmm3, (%rax), %xmm1, %xmm2 + +vpblendw $11, %xmm0, %xmm1, %xmm2 +vpblendw $11, (%rax), %xmm1, %xmm2 + +vpclmulqdq $11, %xmm0, %xmm1, %xmm2 +vpclmulqdq $11, (%rax), %xmm1, %xmm2 + +vpcmpeqb %xmm0, %xmm1, %xmm2 +vpcmpeqb (%rax), %xmm1, %xmm2 + +vpcmpeqd %xmm0, %xmm1, %xmm2 +vpcmpeqd (%rax), %xmm1, %xmm2 + +vpcmpeqq %xmm0, %xmm1, %xmm2 +vpcmpeqq (%rax), %xmm1, %xmm2 + +vpcmpeqw %xmm0, %xmm1, %xmm2 +vpcmpeqw (%rax), %xmm1, %xmm2 + +vpcmpgtb %xmm0, %xmm1, %xmm2 +vpcmpgtb (%rax), %xmm1, %xmm2 + +vpcmpgtd %xmm0, %xmm1, %xmm2 +vpcmpgtd (%rax), %xmm1, %xmm2 + +vpcmpgtq %xmm0, %xmm1, %xmm2 +vpcmpgtq (%rax), %xmm1, %xmm2 + +vpcmpgtw %xmm0, %xmm1, %xmm2 +vpcmpgtw (%rax), %xmm1, %xmm2 + +vperm2f128 $1, %ymm0, %ymm1, %ymm2 +vperm2f128 $1, (%rax), %ymm1, %ymm2 + +vpermilpd $1, %xmm0, %xmm2 +vpermilpd $1, (%rax), %xmm2 +vpermilpd %xmm0, %xmm1, %xmm2 +vpermilpd (%rax), %xmm1, %xmm2 + +vpermilpd $1, %ymm0, %ymm2 +vpermilpd $1, (%rax), %ymm2 +vpermilpd %ymm0, %ymm1, %ymm2 +vpermilpd (%rax), %ymm1, %ymm2 + +vpermilps $1, %xmm0, %xmm2 +vpermilps $1, (%rax), %xmm2 +vpermilps %xmm0, %xmm1, %xmm2 +vpermilps (%rax), %xmm1, %xmm2 + +vpermilps $1, %ymm0, %ymm2 +vpermilps $1, (%rax), %ymm2 +vpermilps %ymm0, %ymm1, %ymm2 +vpermilps (%rax), %ymm1, %ymm2 + +vpextrb $1, %xmm0, %ecx +vpextrb $1, %xmm0, (%rax) + +vpextrd $1, %xmm0, %ecx +vpextrd $1, %xmm0, (%rax) + +vpextrq $1, %xmm0, %rcx +vpextrq $1, %xmm0, (%rax) + +vpextrw $1, %xmm0, %ecx +vpextrw $1, %xmm0, (%rax) + +vphaddd %xmm0, %xmm1, %xmm2 +vphaddd (%rax), %xmm1, %xmm2 + +vphaddsw %xmm0, %xmm1, %xmm2 +vphaddsw (%rax), %xmm1, %xmm2 + +vphaddw %xmm0, %xmm1, %xmm2 +vphaddw (%rax), %xmm1, %xmm2 + +vphminposuw %xmm0, %xmm2 +vphminposuw (%rax), %xmm2 + +vphsubd %xmm0, %xmm1, %xmm2 +vphsubd (%rax), %xmm1, %xmm2 + +vphsubsw %xmm0, %xmm1, %xmm2 +vphsubsw (%rax), %xmm1, %xmm2 + +vphsubw %xmm0, %xmm1, %xmm2 +vphsubw (%rax), %xmm1, %xmm2 + +vpinsrb $1, %eax, %xmm1, %xmm2 +vpinsrb $1, (%rax), %xmm1, %xmm2 + +vpinsrd $1, %eax, %xmm1, %xmm2 +vpinsrd $1, (%rax), %xmm1, %xmm2 + +vpinsrq $1, %rax, %xmm1, %xmm2 +vpinsrq $1, (%rax), %xmm1, %xmm2 + +vpinsrw $1, %eax, %xmm1, %xmm2 +vpinsrw $1, (%rax), %xmm1, %xmm2 + +vpmaddubsw %xmm0, %xmm1, %xmm2 +vpmaddubsw (%rax), %xmm1, %xmm2 + +vpmaddwd %xmm0, %xmm1, %xmm2 +vpmaddwd (%rax), %xmm1, %xmm2 + +vpmaxsb %xmm0, %xmm1, %xmm2 +vpmaxsb (%rax), %xmm1, %xmm2 + +vpmaxsd %xmm0, %xmm1, %xmm2 +vpmaxsd (%rax), %xmm1, %xmm2 + +vpmaxsw %xmm0, %xmm1, %xmm2 +vpmaxsw (%rax), %xmm1, %xmm2 + +vpmaxub %xmm0, %xmm1, %xmm2 +vpmaxub (%rax), %xmm1, %xmm2 + +vpmaxud %xmm0, %xmm1, %xmm2 +vpmaxud (%rax), %xmm1, %xmm2 + +vpmaxuw %xmm0, %xmm1, %xmm2 +vpmaxuw (%rax), %xmm1, %xmm2 + +vpminsb %xmm0, %xmm1, %xmm2 +vpminsb (%rax), %xmm1, %xmm2 + +vpminsd %xmm0, %xmm1, %xmm2 +vpminsd (%rax), %xmm1, %xmm2 + +vpminsw %xmm0, %xmm1, %xmm2 +vpminsw (%rax), %xmm1, %xmm2 + +vpminub %xmm0, %xmm1, %xmm2 +vpminub (%rax), %xmm1, %xmm2 + +vpminud %xmm0, %xmm1, %xmm2 +vpminud (%rax), %xmm1, %xmm2 + +vpminuw %xmm0, %xmm1, %xmm2 +vpminuw (%rax), %xmm1, %xmm2 + +vpmovmskb %xmm0, %rcx + +vpmovsxbd %xmm0, %xmm2 +vpmovsxbd (%rax), %xmm2 + +vpmovsxbq %xmm0, %xmm2 +vpmovsxbq (%rax), %xmm2 + +vpmovsxbw %xmm0, %xmm2 +vpmovsxbw (%rax), %xmm2 + +vpmovsxdq %xmm0, %xmm2 +vpmovsxdq (%rax), %xmm2 + +vpmovsxwd %xmm0, %xmm2 +vpmovsxwd (%rax), %xmm2 + +vpmovsxwq %xmm0, %xmm2 +vpmovsxwq (%rax), %xmm2 + +vpmovzxbd %xmm0, %xmm2 +vpmovzxbd (%rax), %xmm2 + +vpmovzxbq %xmm0, %xmm2 +vpmovzxbq (%rax), %xmm2 + +vpmovzxbw %xmm0, %xmm2 +vpmovzxbw (%rax), %xmm2 + +vpmovzxdq %xmm0, %xmm2 +vpmovzxdq (%rax), %xmm2 + +vpmovzxwd %xmm0, %xmm2 +vpmovzxwd (%rax), %xmm2 + +vpmovzxwq %xmm0, %xmm2 +vpmovzxwq (%rax), %xmm2 + +vpmuldq %xmm0, %xmm1, %xmm2 +vpmuldq (%rax), %xmm1, %xmm2 + +vpmulhrsw %xmm0, %xmm1, %xmm2 +vpmulhrsw (%rax), %xmm1, %xmm2 + +vpmulhuw %xmm0, %xmm1, %xmm2 +vpmulhuw (%rax), %xmm1, %xmm2 + +vpmulhw %xmm0, %xmm1, %xmm2 +vpmulhw (%rax), %xmm1, %xmm2 + +vpmulld %xmm0, %xmm1, %xmm2 +vpmulld (%rax), %xmm1, %xmm2 + +vpmullw %xmm0, %xmm1, %xmm2 +vpmullw (%rax), %xmm1, %xmm2 + +vpmuludq %xmm0, %xmm1, %xmm2 +vpmuludq (%rax), %xmm1, %xmm2 + +vpor %xmm0, %xmm1, %xmm2 +vpor (%rax), %xmm1, %xmm2 + +vpsadbw %xmm0, %xmm1, %xmm2 +vpsadbw (%rax), %xmm1, %xmm2 + +vpshufb %xmm0, %xmm1, %xmm2 +vpshufb (%rax), %xmm1, %xmm2 + +vpshufd $1, %xmm0, %xmm2 +vpshufd $1, (%rax), %xmm2 + +vpshufhw $1, %xmm0, %xmm2 +vpshufhw $1, (%rax), %xmm2 + +vpshuflw $1, %xmm0, %xmm2 +vpshuflw $1, (%rax), %xmm2 + +vpsignb %xmm0, %xmm1, %xmm2 +vpsignb (%rax), %xmm1, %xmm2 + +vpsignd %xmm0, %xmm1, %xmm2 +vpsignd (%rax), %xmm1, %xmm2 + +vpsignw %xmm0, %xmm1, %xmm2 +vpsignw (%rax), %xmm1, %xmm2 + +vpslld $1, %xmm0, %xmm2 +vpslld %xmm0, %xmm1, %xmm2 +vpslld (%rax), %xmm1, %xmm2 + +vpslldq $1, %xmm1, %xmm2 + +vpsllq $1, %xmm0, %xmm2 +vpsllq %xmm0, %xmm1, %xmm2 +vpsllq (%rax), %xmm1, %xmm2 + +vpsllw $1, %xmm0, %xmm2 +vpsllw %xmm0, %xmm1, %xmm2 +vpsllw (%rax), %xmm1, %xmm2 + +vpsrad $1, %xmm0, %xmm2 +vpsrad %xmm0, %xmm1, %xmm2 +vpsrad (%rax), %xmm1, %xmm2 + +vpsraw $1, %xmm0, %xmm2 +vpsraw %xmm0, %xmm1, %xmm2 +vpsraw (%rax), %xmm1, %xmm2 + +vpsrld $1, %xmm0, %xmm2 +vpsrld %xmm0, %xmm1, %xmm2 +vpsrld (%rax), %xmm1, %xmm2 + +vpsrldq $1, %xmm1, %xmm2 + +vpsrlq $1, %xmm0, %xmm2 +vpsrlq %xmm0, %xmm1, %xmm2 +vpsrlq (%rax), %xmm1, %xmm2 + +vpsrlw $1, %xmm0, %xmm2 +vpsrlw %xmm0, %xmm1, %xmm2 +vpsrlw (%rax), %xmm1, %xmm2 + +vpsubb %xmm0, %xmm1, %xmm2 +vpsubb (%rax), %xmm1, %xmm2 + +vpsubd %xmm0, %xmm1, %xmm2 +vpsubd (%rax), %xmm1, %xmm2 + +vpsubq %xmm0, %xmm1, %xmm2 +vpsubq (%rax), %xmm1, %xmm2 + +vpsubsb %xmm0, %xmm1, %xmm2 +vpsubsb (%rax), %xmm1, %xmm2 + +vpsubsw %xmm0, %xmm1, %xmm2 +vpsubsw (%rax), %xmm1, %xmm2 + +vpsubusb %xmm0, %xmm1, %xmm2 +vpsubusb (%rax), %xmm1, %xmm2 + +vpsubusw %xmm0, %xmm1, %xmm2 +vpsubusw (%rax), %xmm1, %xmm2 + +vpsubw %xmm0, %xmm1, %xmm2 +vpsubw (%rax), %xmm1, %xmm2 + +vptest %xmm0, %xmm1 +vptest (%rax), %xmm1 + +vptest %ymm0, %ymm1 +vptest (%rax), %ymm1 + +vpunpckhbw %xmm0, %xmm1, %xmm2 +vpunpckhbw (%rax), %xmm1, %xmm2 + +vpunpckhdq %xmm0, %xmm1, %xmm2 +vpunpckhdq (%rax), %xmm1, %xmm2 + +vpunpckhqdq %xmm0, %xmm1, %xmm2 +vpunpckhqdq (%rax), %xmm1, %xmm2 + +vpunpckhwd %xmm0, %xmm1, %xmm2 +vpunpckhwd (%rax), %xmm1, %xmm2 + +vpunpcklbw %xmm0, %xmm1, %xmm2 +vpunpcklbw (%rax), %xmm1, %xmm2 + +vpunpckldq %xmm0, %xmm1, %xmm2 +vpunpckldq (%rax), %xmm1, %xmm2 + +vpunpcklqdq %xmm0, %xmm1, %xmm2 +vpunpcklqdq (%rax), %xmm1, %xmm2 + +vpunpcklwd %xmm0, %xmm1, %xmm2 +vpunpcklwd (%rax), %xmm1, %xmm2 + +vpxor %xmm0, %xmm1, %xmm2 +vpxor (%rax), %xmm1, %xmm2 + +vrcpps %xmm0, %xmm2 +vrcpps (%rax), %xmm2 + +vrcpps %ymm0, %ymm2 +vrcpps (%rax), %ymm2 + +vrcpss %xmm0, %xmm1, %xmm2 +vrcpss (%rax), %xmm1, %xmm2 + +vroundpd $1, %xmm0, %xmm2 +vroundpd $1, (%rax), %xmm2 + +vroundpd $1, %ymm0, %ymm2 +vroundpd $1, (%rax), %ymm2 + +vroundps $1, %xmm0, %xmm2 +vroundps $1, (%rax), %xmm2 + +vroundps $1, %ymm0, %ymm2 +vroundps $1, (%rax), %ymm2 + +vroundsd $1, %xmm0, %xmm1, %xmm2 +vroundsd $1, (%rax), %xmm1, %xmm2 + +vroundss $1, %xmm0, %xmm1, %xmm2 +vroundss $1, (%rax), %xmm1, %xmm2 + +vrsqrtps %xmm0, %xmm2 +vrsqrtps (%rax), %xmm2 + +vrsqrtps %ymm0, %ymm2 +vrsqrtps (%rax), %ymm2 + +vrsqrtss %xmm0, %xmm1, %xmm2 +vrsqrtss (%rax), %xmm1, %xmm2 + +vshufpd $1, %xmm0, %xmm1, %xmm2 +vshufpd $1, (%rax), %xmm1, %xmm2 + +vshufpd $1, %ymm0, %ymm1, %ymm2 +vshufpd $1, (%rax), %ymm1, %ymm2 + +vshufps $1, %xmm0, %xmm1, %xmm2 +vshufps $1, (%rax), %xmm1, %xmm2 + +vshufps $1, %ymm0, %ymm1, %ymm2 +vshufps $1, (%rax), %ymm1, %ymm2 + +vsqrtpd %xmm0, %xmm2 +vsqrtpd (%rax), %xmm2 + +vsqrtpd %ymm0, %ymm2 +vsqrtpd (%rax), %ymm2 + +vsqrtps %xmm0, %xmm2 +vsqrtps (%rax), %xmm2 + +vsqrtps %ymm0, %ymm2 +vsqrtps (%rax), %ymm2 + +vsqrtsd %xmm0, %xmm1, %xmm2 +vsqrtsd (%rax), %xmm1, %xmm2 + +vsqrtss %xmm0, %xmm1, %xmm2 +vsqrtss (%rax), %xmm1, %xmm2 + +vstmxcsr (%rax) + +vsubpd %xmm0, %xmm1, %xmm2 +vsubpd (%rax), %xmm1, %xmm2 + +vsubpd %ymm0, %ymm1, %ymm2 +vsubpd (%rax), %ymm1, %ymm2 + +vsubps %xmm0, %xmm1, %xmm2 +vsubps (%rax), %xmm1, %xmm2 + +vsubps %ymm0, %ymm1, %ymm2 +vsubps (%rax), %ymm1, %ymm2 + +vsubsd %xmm0, %xmm1, %xmm2 +vsubsd (%rax), %xmm1, %xmm2 + +vsubss %xmm0, %xmm1, %xmm2 +vsubss (%rax), %xmm1, %xmm2 + +vtestpd %xmm0, %xmm1 +vtestpd (%rax), %xmm1 + +vtestpd %ymm0, %ymm1 +vtestpd (%rax), %ymm1 + +vtestps %xmm0, %xmm1 +vtestps (%rax), %xmm1 + +vtestps %ymm0, %ymm1 +vtestps (%rax), %ymm1 + +vucomisd %xmm0, %xmm1 +vucomisd (%rax), %xmm1 + +vucomiss %xmm0, %xmm1 +vucomiss (%rax), %xmm1 + +vunpckhpd %xmm0, %xmm1, %xmm2 +vunpckhpd (%rax), %xmm1, %xmm2 + +vunpckhpd %ymm0, %ymm1, %ymm2 +vunpckhpd (%rax), %ymm1, %ymm2 + +vunpckhps %xmm0, %xmm1, %xmm2 +vunpckhps (%rax), %xmm1, %xmm2 + +vunpckhps %ymm0, %ymm1, %ymm2 +vunpckhps (%rax), %ymm1, %ymm2 + +vunpcklpd %xmm0, %xmm1, %xmm2 +vunpcklpd (%rax), %xmm1, %xmm2 + +vunpcklpd %ymm0, %ymm1, %ymm2 +vunpcklpd (%rax), %ymm1, %ymm2 + +vunpcklps %xmm0, %xmm1, %xmm2 +vunpcklps (%rax), %xmm1, %xmm2 + +vunpcklps %ymm0, %ymm1, %ymm2 +vunpcklps (%rax), %ymm1, %ymm2 + +vxorpd %xmm0, %xmm1, %xmm2 +vxorpd (%rax), %xmm1, %xmm2 + +vxorpd %ymm0, %ymm1, %ymm2 +vxorpd (%rax), %ymm1, %ymm2 + +vxorps %xmm0, %xmm1, %xmm2 +vxorps (%rax), %xmm1, %xmm2 + +vxorps %ymm0, %ymm1, %ymm2 +vxorps (%rax), %ymm1, %ymm2 + +vzeroall +vzeroupper + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 1 3 1.00 vaddpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vaddpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vaddpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 1.00 * vaddpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 3 1.00 vaddps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vaddps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vaddps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 1.00 * vaddps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 3 1.00 vaddsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vaddsd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vaddss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vaddss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vaddsubpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vaddsubpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vaddsubpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 1.00 * vaddsubpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 3 1.00 vaddsubps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vaddsubps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vaddsubps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 1.00 * vaddsubps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 2 7 1.00 vaesdec %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 3 13 1.00 * vaesdec (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 vaesdeclast %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 3 13 1.00 * vaesdeclast (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 vaesenc %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 3 13 1.00 * vaesenc (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 vaesenclast %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 3 13 1.00 * vaesenclast (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 2 12 2.00 vaesimc %xmm0, %xmm2 +# CHECK-NEXT: 3 18 2.00 * vaesimc (%rax), %xmm2 +# CHECK-NEXT: 1 8 3.67 vaeskeygenassist $22, %xmm0, %xmm2 +# CHECK-NEXT: 1 8 3.33 * vaeskeygenassist $22, (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 vandnpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vandnpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vandnpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vandnpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vandnps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vandnps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vandnps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vandnps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vandpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vandpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vandpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vandpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vandps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vandps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vandps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vandps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vblendpd $11, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vblendpd $11, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vblendpd $11, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vblendpd $11, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vblendps $11, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vblendps $11, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vblendps $11, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vblendps $11, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 2 2 1.00 vblendvpd %xmm3, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 3 8 1.00 * vblendvpd %xmm3, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 2 2 1.00 vblendvpd %ymm3, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 3 9 1.00 * vblendvpd %ymm3, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 2 2 1.00 vblendvps %xmm3, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 3 8 1.00 * vblendvps %xmm3, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 2 2 1.00 vblendvps %ymm3, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 3 9 1.00 * vblendvps %ymm3, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 2 7 1.00 * vbroadcastf128 (%rax), %ymm2 +# CHECK-NEXT: 1 7 0.50 * vbroadcastsd (%rax), %ymm2 +# CHECK-NEXT: 1 6 0.50 * vbroadcastss (%rax), %xmm2 +# CHECK-NEXT: 1 7 0.50 * vbroadcastss (%rax), %ymm2 +# CHECK-NEXT: 1 3 1.00 vcmppd $0, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vcmppd $0, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vcmppd $0, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 1.00 * vcmppd $0, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 3 1.00 vcmpps $0, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vcmpps $0, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vcmpps $0, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 1.00 * vcmpps $0, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 3 1.00 vcmpsd $0, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vcmpsd $0, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vcmpss $0, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vcmpss $0, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 2 2 1.00 vcomisd %xmm0, %xmm1 +# CHECK-NEXT: 3 8 1.00 * vcomisd (%rax), %xmm1 +# CHECK-NEXT: 2 2 1.00 vcomiss %xmm0, %xmm1 +# CHECK-NEXT: 3 8 1.00 * vcomiss (%rax), %xmm1 +# CHECK-NEXT: 2 4 1.00 vcvtdq2pd %xmm0, %xmm2 +# CHECK-NEXT: 3 10 1.00 * vcvtdq2pd (%rax), %xmm2 +# CHECK-NEXT: 2 4 1.00 vcvtdq2pd %xmm0, %ymm2 +# CHECK-NEXT: 3 10 1.00 * vcvtdq2pd (%rax), %ymm2 +# CHECK-NEXT: 1 3 1.00 vcvtdq2ps %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vcvtdq2ps (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 vcvtdq2ps %ymm0, %ymm2 +# CHECK-NEXT: 2 10 1.00 * vcvtdq2ps (%rax), %ymm2 +# CHECK-NEXT: 2 4 1.00 vcvtpd2dq %xmm0, %xmm2 +# CHECK-NEXT: 3 10 1.00 * vcvtpd2dqx (%rax), %xmm2 +# CHECK-NEXT: 2 4 1.00 vcvtpd2dq %ymm0, %xmm2 +# CHECK-NEXT: 3 11 1.00 * vcvtpd2dqy (%rax), %xmm2 +# CHECK-NEXT: 2 4 1.00 vcvtpd2ps %xmm0, %xmm2 +# CHECK-NEXT: 3 10 1.00 * vcvtpd2psx (%rax), %xmm2 +# CHECK-NEXT: 2 4 1.00 vcvtpd2ps %ymm0, %xmm2 +# CHECK-NEXT: 3 11 1.00 * vcvtpd2psy (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 vcvtps2dq %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vcvtps2dq (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 vcvtps2dq %ymm0, %ymm2 +# CHECK-NEXT: 2 10 1.00 * vcvtps2dq (%rax), %ymm2 +# CHECK-NEXT: 2 2 1.00 vcvtps2pd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vcvtps2pd (%rax), %xmm2 +# CHECK-NEXT: 2 2 1.00 vcvtps2pd %xmm0, %ymm2 +# CHECK-NEXT: 2 7 1.00 * vcvtps2pd (%rax), %ymm2 +# CHECK-NEXT: 2 5 1.00 vcvtsd2si %xmm0, %ecx +# CHECK-NEXT: 2 5 1.00 vcvtsd2si %xmm0, %rcx +# CHECK-NEXT: 3 10 1.00 * vcvtsd2si (%rax), %ecx +# CHECK-NEXT: 3 10 1.00 * vcvtsd2si (%rax), %rcx +# CHECK-NEXT: 2 4 1.00 vcvtsd2ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 3 10 1.00 * vcvtsd2ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 2 4 1.00 vcvtsi2sdl %ecx, %xmm0, %xmm2 +# CHECK-NEXT: 2 4 1.00 vcvtsi2sdq %rcx, %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vcvtsi2sdl (%rax), %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vcvtsi2sdq (%rax), %xmm0, %xmm2 +# CHECK-NEXT: 3 5 2.00 vcvtsi2ssl %ecx, %xmm0, %xmm2 +# CHECK-NEXT: 3 5 2.00 vcvtsi2ssq %rcx, %xmm0, %xmm2 +# CHECK-NEXT: 3 10 1.00 * vcvtsi2ssl (%rax), %xmm0, %xmm2 +# CHECK-NEXT: 3 10 1.00 * vcvtsi2ssq (%rax), %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 vcvtss2sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vcvtss2sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 2 5 1.00 vcvtss2si %xmm0, %ecx +# CHECK-NEXT: 2 5 1.00 vcvtss2si %xmm0, %rcx +# CHECK-NEXT: 3 10 1.00 * vcvtss2si (%rax), %ecx +# CHECK-NEXT: 3 10 1.00 * vcvtss2si (%rax), %rcx +# CHECK-NEXT: 2 4 1.00 vcvttpd2dq %xmm0, %xmm2 +# CHECK-NEXT: 3 10 1.00 * vcvttpd2dqx (%rax), %xmm2 +# CHECK-NEXT: 2 4 1.00 vcvttpd2dq %ymm0, %xmm2 +# CHECK-NEXT: 3 11 1.00 * vcvttpd2dqy (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 vcvttps2dq %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vcvttps2dq (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 vcvttps2dq %ymm0, %ymm2 +# CHECK-NEXT: 2 10 1.00 * vcvttps2dq (%rax), %ymm2 +# CHECK-NEXT: 2 5 1.00 vcvttsd2si %xmm0, %ecx +# CHECK-NEXT: 2 5 1.00 vcvttsd2si %xmm0, %rcx +# CHECK-NEXT: 3 10 1.00 * vcvttsd2si (%rax), %ecx +# CHECK-NEXT: 3 10 1.00 * vcvttsd2si (%rax), %rcx +# CHECK-NEXT: 2 5 1.00 vcvttss2si %xmm0, %ecx +# CHECK-NEXT: 2 5 1.00 vcvttss2si %xmm0, %rcx +# CHECK-NEXT: 3 10 1.00 * vcvttss2si (%rax), %ecx +# CHECK-NEXT: 3 10 1.00 * vcvttss2si (%rax), %rcx +# CHECK-NEXT: 1 22 22.00 vdivpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 28 22.00 * vdivpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 3 45 44.00 vdivpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 4 52 44.00 * vdivpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 14 14.00 vdivps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 20 14.00 * vdivps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 3 29 28.00 vdivps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 4 36 28.00 * vdivps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 22 22.00 vdivsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 28 22.00 * vdivsd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 14 14.00 vdivss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 20 14.00 * vdivss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 3 9 1.00 vdppd $22, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 4 15 1.00 * vdppd $22, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 4 12 2.00 vdpps $22, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 5 18 2.00 * vdpps $22, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 4 12 2.00 vdpps $22, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 5 19 2.00 * vdpps $22, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vextractf128 $1, %ymm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 * vextractf128 $1, %ymm0, (%rax) +# CHECK-NEXT: 2 3 1.00 vextractps $1, %xmm0, %ecx +# CHECK-NEXT: 3 5 1.00 * vextractps $1, %xmm0, (%rax) +# CHECK-NEXT: 3 5 2.00 vhaddpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 4 11 2.00 * vhaddpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 3 5 2.00 vhaddpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 4 12 2.00 * vhaddpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 3 5 2.00 vhaddps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 4 11 2.00 * vhaddps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 3 5 2.00 vhaddps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 4 12 2.00 * vhaddps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 3 5 2.00 vhsubpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 4 11 2.00 * vhsubpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 3 5 2.00 vhsubpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 4 12 2.00 * vhsubpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 3 5 2.00 vhsubps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 4 11 2.00 * vhsubps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 3 5 2.00 vhsubps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 4 12 2.00 * vhsubps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vinsertf128 $1, %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 7 0.50 * vinsertf128 $1, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vinsertps $1, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vinsertps $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 6 0.50 * vlddqu (%rax), %xmm2 +# CHECK-NEXT: 1 7 0.50 * vlddqu (%rax), %ymm2 +# CHECK-NEXT: 4 5 1.00 * * * vldmxcsr (%rax) +# CHECK-NEXT: 1 1 1.00 * * * vmaskmovdqu %xmm0, %xmm1 +# CHECK-NEXT: 3 8 1.00 * vmaskmovpd (%rax), %xmm0, %xmm2 +# CHECK-NEXT: 3 9 1.00 * vmaskmovpd (%rax), %ymm0, %ymm2 +# CHECK-NEXT: 3 5 1.00 * * vmaskmovpd %xmm0, %xmm1, (%rax) +# CHECK-NEXT: 3 5 1.00 * * vmaskmovpd %ymm0, %ymm1, (%rax) +# CHECK-NEXT: 3 8 1.00 * vmaskmovps (%rax), %xmm0, %xmm2 +# CHECK-NEXT: 3 9 1.00 * vmaskmovps (%rax), %ymm0, %ymm2 +# CHECK-NEXT: 3 5 1.00 * * vmaskmovps %xmm0, %xmm1, (%rax) +# CHECK-NEXT: 3 5 1.00 * * vmaskmovps %ymm0, %ymm1, (%rax) +# CHECK-NEXT: 1 3 1.00 vmaxpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vmaxpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vmaxpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 1.00 * vmaxpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 3 1.00 vmaxps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vmaxps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vmaxps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 1.00 * vmaxps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 3 1.00 vmaxsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vmaxsd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vmaxss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vmaxss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vminpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vminpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vminpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 1.00 * vminpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 3 1.00 vminps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vminps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vminps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 1.00 * vminps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 3 1.00 vminsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vminsd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vminss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vminss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vmovapd %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 * vmovapd %xmm0, (%rax) +# CHECK-NEXT: 1 6 0.50 * vmovapd (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 vmovapd %ymm0, %ymm2 +# CHECK-NEXT: 1 1 1.00 * vmovapd %ymm0, (%rax) +# CHECK-NEXT: 1 7 0.50 * vmovapd (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vmovaps %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 * vmovaps %xmm0, (%rax) +# CHECK-NEXT: 1 6 0.50 * vmovaps (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 vmovaps %ymm0, %ymm2 +# CHECK-NEXT: 1 1 1.00 * vmovaps %ymm0, (%rax) +# CHECK-NEXT: 1 7 0.50 * vmovaps (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vmovd %eax, %xmm2 +# CHECK-NEXT: 1 6 0.50 * vmovd (%rax), %xmm2 +# CHECK-NEXT: 1 2 1.00 vmovd %xmm0, %ecx +# CHECK-NEXT: 1 1 1.00 * vmovd %xmm0, (%rax) +# CHECK-NEXT: 1 1 1.00 vmovddup %xmm0, %xmm2 +# CHECK-NEXT: 1 6 0.50 * vmovddup (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 vmovddup %ymm0, %ymm2 +# CHECK-NEXT: 1 7 0.50 * vmovddup (%rax), %ymm2 +# CHECK-NEXT: 1 1 0.33 vmovdqa %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 * vmovdqa %xmm0, (%rax) +# CHECK-NEXT: 1 6 0.50 * vmovdqa (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 vmovdqa %ymm0, %ymm2 +# CHECK-NEXT: 1 1 1.00 * vmovdqa %ymm0, (%rax) +# CHECK-NEXT: 1 7 0.50 * vmovdqa (%rax), %ymm2 +# CHECK-NEXT: 1 1 0.33 vmovdqu %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 * vmovdqu %xmm0, (%rax) +# CHECK-NEXT: 1 6 0.50 * vmovdqu (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 vmovdqu %ymm0, %ymm2 +# CHECK-NEXT: 1 1 1.00 * vmovdqu %ymm0, (%rax) +# CHECK-NEXT: 1 7 0.50 * vmovdqu (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vmovhlps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vmovlhps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 * vmovhpd %xmm0, (%rax) +# CHECK-NEXT: 2 7 1.00 * vmovhpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 * vmovhps %xmm0, (%rax) +# CHECK-NEXT: 2 7 1.00 * vmovhps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 * vmovlpd %xmm0, (%rax) +# CHECK-NEXT: 2 7 1.00 * vmovlpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 * vmovlps %xmm0, (%rax) +# CHECK-NEXT: 2 7 1.00 * vmovlps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 2 1.00 vmovmskpd %xmm0, %ecx +# CHECK-NEXT: 1 2 1.00 vmovmskpd %ymm0, %ecx +# CHECK-NEXT: 1 2 1.00 vmovmskps %xmm0, %ecx +# CHECK-NEXT: 1 2 1.00 vmovmskps %ymm0, %ecx +# CHECK-NEXT: 1 1 1.00 * vmovntdq %xmm0, (%rax) +# CHECK-NEXT: 1 1 1.00 * vmovntdq %ymm0, (%rax) +# CHECK-NEXT: 1 6 0.50 * vmovntdqa (%rax), %xmm2 +# CHECK-NEXT: 1 7 0.50 * vmovntdqa (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 * vmovntpd %xmm0, (%rax) +# CHECK-NEXT: 1 1 1.00 * vmovntpd %ymm0, (%rax) +# CHECK-NEXT: 1 1 1.00 * vmovntps %xmm0, (%rax) +# CHECK-NEXT: 1 1 1.00 * vmovntps %ymm0, (%rax) +# CHECK-NEXT: 1 1 0.33 vmovq %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 vmovq %rax, %xmm2 +# CHECK-NEXT: 1 6 0.50 * vmovq (%rax), %xmm2 +# CHECK-NEXT: 1 2 1.00 vmovq %xmm0, %rcx +# CHECK-NEXT: 1 1 1.00 * vmovq %xmm0, (%rax) +# CHECK-NEXT: 1 1 1.00 vmovsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 * vmovsd %xmm0, (%rax) +# CHECK-NEXT: 1 6 0.50 * vmovsd (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 vmovshdup %xmm0, %xmm2 +# CHECK-NEXT: 1 6 0.50 * vmovshdup (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 vmovshdup %ymm0, %ymm2 +# CHECK-NEXT: 1 7 0.50 * vmovshdup (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vmovsldup %xmm0, %xmm2 +# CHECK-NEXT: 1 6 0.50 * vmovsldup (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 vmovsldup %ymm0, %ymm2 +# CHECK-NEXT: 1 7 0.50 * vmovsldup (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vmovss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 * vmovss %xmm0, (%rax) +# CHECK-NEXT: 1 6 0.50 * vmovss (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 vmovupd %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 * vmovupd %xmm0, (%rax) +# CHECK-NEXT: 1 6 0.50 * vmovupd (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 vmovupd %ymm0, %ymm2 +# CHECK-NEXT: 1 1 1.00 * vmovupd %ymm0, (%rax) +# CHECK-NEXT: 1 7 0.50 * vmovupd (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vmovups %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 * vmovups %xmm0, (%rax) +# CHECK-NEXT: 1 6 0.50 * vmovups (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 vmovups %ymm0, %ymm2 +# CHECK-NEXT: 1 1 1.00 * vmovups %ymm0, (%rax) +# CHECK-NEXT: 1 7 0.50 * vmovups (%rax), %ymm2 +# CHECK-NEXT: 3 7 1.00 vmpsadbw $1, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 4 13 1.00 * vmpsadbw $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 1.00 vmulpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vmulpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 1.00 vmulpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 12 1.00 * vmulpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 1.00 vmulps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vmulps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 1.00 vmulps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 12 1.00 * vmulps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 1.00 vmulsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vmulsd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 1.00 vmulss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vmulss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vorpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vorpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vorpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vorpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vorps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vorps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vorps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vorps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpabsb %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpabsb (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 vpabsd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpabsd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 vpabsw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpabsw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 vpackssdw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpackssdw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpacksswb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpacksswb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpackusdw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpackusdw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpackuswb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpackuswb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpaddb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpaddb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpaddd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpaddd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpaddq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpaddq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpaddsb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpaddsb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpaddsw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpaddsw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpaddusb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpaddusb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpaddusw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpaddusw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpaddw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpaddw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpalignr $1, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpalignr $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.33 vpand %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpand (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.33 vpandn %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpandn (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpavgb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpavgb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpavgw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpavgw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 2 2 1.00 vpblendvb %xmm3, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 3 8 1.00 * vpblendvb %xmm3, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpblendw $11, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpblendw $11, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 14 6.00 vpclmulqdq $11, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 1 14 5.67 * vpclmulqdq $11, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpcmpeqb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpcmpeqb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpcmpeqd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpcmpeqd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpcmpeqq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpcmpeqq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpcmpeqw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpcmpeqw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpcmpgtb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpcmpgtb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpcmpgtd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpcmpgtd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 1.00 vpcmpgtq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vpcmpgtq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpcmpgtw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpcmpgtw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vperm2f128 $1, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vperm2f128 $1, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpermilpd $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vpermilpd $1, (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 vpermilpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vpermilpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vpermilpd $1, %ymm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpermilpd $1, (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vpermilpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpermilpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpermilps $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vpermilps $1, (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 vpermilps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vpermilps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vpermilps $1, %ymm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpermilps $1, (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vpermilps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpermilps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 2 3 1.00 vpextrb $1, %xmm0, %ecx +# CHECK-NEXT: 3 5 1.00 * vpextrb $1, %xmm0, (%rax) +# CHECK-NEXT: 2 3 1.00 vpextrd $1, %xmm0, %ecx +# CHECK-NEXT: 4 5 1.00 * vpextrd $1, %xmm0, (%rax) +# CHECK-NEXT: 2 3 1.00 vpextrq $1, %xmm0, %rcx +# CHECK-NEXT: 4 5 1.00 * vpextrq $1, %xmm0, (%rax) +# CHECK-NEXT: 2 3 1.00 vpextrw $1, %xmm0, %ecx +# CHECK-NEXT: 3 5 1.00 * vpextrw $1, %xmm0, (%rax) +# CHECK-NEXT: 3 3 1.50 vphaddd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 4 9 1.50 * vphaddd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 3 3 1.50 vphaddsw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 4 9 1.50 * vphaddsw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 3 3 1.50 vphaddw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 4 9 1.50 * vphaddw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 1.00 vphminposuw %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vphminposuw (%rax), %xmm2 +# CHECK-NEXT: 3 3 1.50 vphsubd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 4 9 1.50 * vphsubd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 3 3 1.50 vphsubsw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 4 9 1.50 * vphsubsw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 3 3 1.50 vphsubw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 4 9 1.50 * vphsubw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 2 2 1.00 vpinsrb $1, %eax, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpinsrb $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 2 2 1.00 vpinsrd $1, %eax, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpinsrd $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 2 2 1.00 vpinsrq $1, %rax, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpinsrq $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 2 2 1.00 vpinsrw $1, %eax, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpinsrw $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 1.00 vpmaddubsw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vpmaddubsw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 1.00 vpmaddwd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vpmaddwd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpmaxsb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpmaxsb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpmaxsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpmaxsd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpmaxsw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpmaxsw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpmaxub %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpmaxub (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpmaxud %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpmaxud (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpmaxuw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpmaxuw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpminsb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpminsb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpminsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpminsd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpminsw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpminsw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpminub %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpminub (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpminud %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpminud (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpminuw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpminuw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 2 1.00 vpmovmskb %xmm0, %ecx +# CHECK-NEXT: 1 1 0.50 vpmovsxbd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpmovsxbd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 vpmovsxbq %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpmovsxbq (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 vpmovsxbw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpmovsxbw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 vpmovsxdq %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpmovsxdq (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 vpmovsxwd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpmovsxwd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 vpmovsxwq %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpmovsxwq (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 vpmovzxbd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpmovzxbd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 vpmovzxbq %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpmovzxbq (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 vpmovzxbw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpmovzxbw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 vpmovzxdq %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpmovzxdq (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 vpmovzxwd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpmovzxwd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 vpmovzxwq %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpmovzxwq (%rax), %xmm2 +# CHECK-NEXT: 1 5 1.00 vpmuldq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vpmuldq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 1.00 vpmulhrsw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vpmulhrsw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 1.00 vpmulhuw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vpmulhuw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 1.00 vpmulhw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vpmulhw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 1.00 vpmulld %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vpmulld (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 1.00 vpmullw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vpmullw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 1.00 vpmuludq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vpmuludq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.33 vpor %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpor (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 1.00 vpsadbw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vpsadbw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpshufb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpshufb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpshufd $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpshufd $1, (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 vpshufhw $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpshufhw $1, (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 vpshuflw $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpshuflw $1, (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 vpsignb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpsignb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpsignd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpsignd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpsignw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpsignw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vpslld $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 2 1.00 vpslld %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 3 8 1.00 * vpslld (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpslldq $1, %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vpsllq $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 2 1.00 vpsllq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 3 8 1.00 * vpsllq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vpsllw $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 2 1.00 vpsllw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 3 8 1.00 * vpsllw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vpsrad $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 2 1.00 vpsrad %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 3 8 1.00 * vpsrad (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vpsraw $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 2 1.00 vpsraw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 3 8 1.00 * vpsraw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vpsrld $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 2 1.00 vpsrld %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 3 8 1.00 * vpsrld (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpsrldq $1, %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vpsrlq $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 2 1.00 vpsrlq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 3 8 1.00 * vpsrlq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vpsrlw $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 2 1.00 vpsrlw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 3 8 1.00 * vpsrlw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpsubb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpsubb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpsubd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpsubd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpsubq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpsubq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpsubsb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpsubsb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpsubsw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpsubsw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpsubusb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpsubusb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpsubusw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpsubusw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpsubw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpsubw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 2 2 1.00 vptest %xmm0, %xmm1 +# CHECK-NEXT: 3 8 1.00 * vptest (%rax), %xmm1 +# CHECK-NEXT: 2 2 1.00 vptest %ymm0, %ymm1 +# CHECK-NEXT: 3 9 1.00 * vptest (%rax), %ymm1 +# CHECK-NEXT: 1 1 0.50 vpunpckhbw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpunpckhbw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpunpckhdq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpunpckhdq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpunpckhqdq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpunpckhqdq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpunpckhwd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpunpckhwd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpunpcklbw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpunpcklbw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpunpckldq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpunpckldq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpunpcklqdq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpunpcklqdq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpunpcklwd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpunpcklwd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.33 vpxor %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpxor (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 1.00 vrcpps %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vrcpps (%rax), %xmm2 +# CHECK-NEXT: 3 7 2.00 vrcpps %ymm0, %ymm2 +# CHECK-NEXT: 4 14 2.00 * vrcpps (%rax), %ymm2 +# CHECK-NEXT: 1 5 1.00 vrcpss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vrcpss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vroundpd $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vroundpd $1, (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 vroundpd $1, %ymm0, %ymm2 +# CHECK-NEXT: 2 10 1.00 * vroundpd $1, (%rax), %ymm2 +# CHECK-NEXT: 1 3 1.00 vroundps $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vroundps $1, (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 vroundps $1, %ymm0, %ymm2 +# CHECK-NEXT: 2 10 1.00 * vroundps $1, (%rax), %ymm2 +# CHECK-NEXT: 1 3 1.00 vroundsd $1, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vroundsd $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vroundss $1, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vroundss $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 1.00 vrsqrtps %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vrsqrtps (%rax), %xmm2 +# CHECK-NEXT: 3 7 2.00 vrsqrtps %ymm0, %ymm2 +# CHECK-NEXT: 4 14 2.00 * vrsqrtps (%rax), %ymm2 +# CHECK-NEXT: 1 5 1.00 vrsqrtss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 11 1.00 * vrsqrtss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vshufpd $1, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vshufpd $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vshufpd $1, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vshufpd $1, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vshufps $1, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vshufps $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vshufps $1, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vshufps $1, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 21 21.00 vsqrtpd %xmm0, %xmm2 +# CHECK-NEXT: 2 27 21.00 * vsqrtpd (%rax), %xmm2 +# CHECK-NEXT: 3 45 44.00 vsqrtpd %ymm0, %ymm2 +# CHECK-NEXT: 4 52 44.00 * vsqrtpd (%rax), %ymm2 +# CHECK-NEXT: 1 14 14.00 vsqrtps %xmm0, %xmm2 +# CHECK-NEXT: 2 20 14.00 * vsqrtps (%rax), %xmm2 +# CHECK-NEXT: 3 29 28.00 vsqrtps %ymm0, %ymm2 +# CHECK-NEXT: 4 36 28.00 * vsqrtps (%rax), %ymm2 +# CHECK-NEXT: 1 21 21.00 vsqrtsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 27 21.00 * vsqrtsd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 14 14.00 vsqrtss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 20 14.00 * vsqrtss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 4 5 1.00 * * * vstmxcsr (%rax) +# CHECK-NEXT: 1 3 1.00 vsubpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vsubpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vsubpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 1.00 * vsubpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 3 1.00 vsubps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vsubps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vsubps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 1.00 * vsubps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 3 1.00 vsubsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vsubsd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 3 1.00 vsubss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 9 1.00 * vsubss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vtestpd %xmm0, %xmm1 +# CHECK-NEXT: 2 7 1.00 * vtestpd (%rax), %xmm1 +# CHECK-NEXT: 1 1 1.00 vtestpd %ymm0, %ymm1 +# CHECK-NEXT: 2 8 1.00 * vtestpd (%rax), %ymm1 +# CHECK-NEXT: 1 1 1.00 vtestps %xmm0, %xmm1 +# CHECK-NEXT: 2 7 1.00 * vtestps (%rax), %xmm1 +# CHECK-NEXT: 1 1 1.00 vtestps %ymm0, %ymm1 +# CHECK-NEXT: 2 8 1.00 * vtestps (%rax), %ymm1 +# CHECK-NEXT: 2 2 1.00 vucomisd %xmm0, %xmm1 +# CHECK-NEXT: 3 8 1.00 * vucomisd (%rax), %xmm1 +# CHECK-NEXT: 2 2 1.00 vucomiss %xmm0, %xmm1 +# CHECK-NEXT: 3 8 1.00 * vucomiss (%rax), %xmm1 +# CHECK-NEXT: 1 1 1.00 vunpckhpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vunpckhpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vunpckhpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vunpckhpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vunpckhps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vunpckhps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vunpckhps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vunpckhps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vunpcklpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vunpcklpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vunpcklpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vunpcklpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vunpcklps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vunpcklps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vunpcklps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vunpcklps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vxorpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vxorpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vxorpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vxorpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vxorps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vxorps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vxorps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vxorps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 100 0.33 * * * vzeroall +# CHECK-NEXT: 1 100 0.33 * * * vzeroupper + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - 572.00 225.17 307.67 39.00 354.17 177.50 177.50 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - - 1.00 - - - - vaddpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vaddpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vaddpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vaddpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - - - vaddps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vaddps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vaddps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vaddps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - - - vaddsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vaddsd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vaddss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vaddss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vaddsubpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vaddsubpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vaddsubpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vaddsubpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - - - vaddsubps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vaddsubps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vaddsubps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vaddsubps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.33 0.33 - 1.33 - - vaesdec %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 1.33 0.50 0.50 vaesdec (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 1.33 - - vaesdeclast %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 1.33 0.50 0.50 vaesdeclast (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 1.33 - - vaesenc %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 1.33 0.50 0.50 vaesenc (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 1.33 - - vaesenclast %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 1.33 0.50 0.50 vaesenclast (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 2.00 - - vaesimc %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 2.00 0.50 0.50 vaesimc (%rax), %xmm2 +# CHECK-NEXT: - - 3.67 3.67 - 3.67 - - vaeskeygenassist $22, %xmm0, %xmm2 +# CHECK-NEXT: - - 3.33 3.33 - 3.33 0.50 0.50 vaeskeygenassist $22, (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vandnpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vandnpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vandnpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vandnpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vandnps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vandnps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vandnps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vandnps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vandpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vandpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vandpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vandpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vandps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vandps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vandps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vandps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 - - 0.50 - - vblendpd $11, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 - - 0.50 0.50 0.50 vblendpd $11, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 - - 0.50 - - vblendpd $11, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 - - 0.50 0.50 0.50 vblendpd $11, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 - - 0.50 - - vblendps $11, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 - - 0.50 0.50 0.50 vblendps $11, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 - - 0.50 - - vblendps $11, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 - - 0.50 0.50 0.50 vblendps $11, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - 1.00 - - vblendvpd %xmm3, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - 1.00 0.50 0.50 vblendvpd %xmm3, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - 1.00 - - vblendvpd %ymm3, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - 1.00 0.50 0.50 vblendvpd %ymm3, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - 1.00 - - vblendvps %xmm3, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - 1.00 0.50 0.50 vblendvps %xmm3, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - 1.00 - - vblendvps %ymm3, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - 1.00 0.50 0.50 vblendvps %ymm3, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vbroadcastf128 (%rax), %ymm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vbroadcastsd (%rax), %ymm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vbroadcastss (%rax), %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vbroadcastss (%rax), %ymm2 +# CHECK-NEXT: - - - 1.00 - - - - vcmppd $0, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vcmppd $0, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vcmppd $0, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vcmppd $0, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - - - vcmpps $0, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vcmpps $0, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vcmpps $0, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vcmpps $0, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - - - vcmpsd $0, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vcmpsd $0, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vcmpss $0, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vcmpss $0, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 1.00 - - - - vcomisd %xmm0, %xmm1 +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 vcomisd (%rax), %xmm1 +# CHECK-NEXT: - - 1.00 1.00 - - - - vcomiss %xmm0, %xmm1 +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 vcomiss (%rax), %xmm1 +# CHECK-NEXT: - - - 1.00 - 1.00 - - vcvtdq2pd %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 vcvtdq2pd (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 - - vcvtdq2pd %xmm0, %ymm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 vcvtdq2pd (%rax), %ymm2 +# CHECK-NEXT: - - - 1.00 - - - - vcvtdq2ps %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vcvtdq2ps (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vcvtdq2ps %ymm0, %ymm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vcvtdq2ps (%rax), %ymm2 +# CHECK-NEXT: - - - 1.00 - 1.00 - - vcvtpd2dq %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 vcvtpd2dqx (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 - - vcvtpd2dq %ymm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 vcvtpd2dqy (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 - - vcvtpd2ps %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 vcvtpd2psx (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 - - vcvtpd2ps %ymm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 vcvtpd2psy (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vcvtps2dq %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vcvtps2dq (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vcvtps2dq %ymm0, %ymm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vcvtps2dq (%rax), %ymm2 +# CHECK-NEXT: - - 1.00 - - 1.00 - - vcvtps2pd %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vcvtps2pd (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - 1.00 - - vcvtps2pd %xmm0, %ymm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vcvtps2pd (%rax), %ymm2 +# CHECK-NEXT: - - 1.00 1.00 - - - - vcvtsd2si %xmm0, %ecx +# CHECK-NEXT: - - 1.00 1.00 - - - - vcvtsd2si %xmm0, %rcx +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 vcvtsd2si (%rax), %ecx +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 vcvtsd2si (%rax), %rcx +# CHECK-NEXT: - - - 1.00 - 1.00 - - vcvtsd2ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 vcvtsd2ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 - - vcvtsi2sdl %ecx, %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 - - vcvtsi2sdq %rcx, %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vcvtsi2sdl (%rax), %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vcvtsi2sdq (%rax), %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 2.00 - - vcvtsi2ssl %ecx, %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 2.00 - - vcvtsi2ssq %rcx, %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 vcvtsi2ssl (%rax), %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 vcvtsi2ssq (%rax), %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vcvtss2sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vcvtss2sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 1.00 - - - - vcvtss2si %xmm0, %ecx +# CHECK-NEXT: - - 1.00 1.00 - - - - vcvtss2si %xmm0, %rcx +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 vcvtss2si (%rax), %ecx +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 vcvtss2si (%rax), %rcx +# CHECK-NEXT: - - - 1.00 - 1.00 - - vcvttpd2dq %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 vcvttpd2dqx (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 - - vcvttpd2dq %ymm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 vcvttpd2dqy (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vcvttps2dq %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vcvttps2dq (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vcvttps2dq %ymm0, %ymm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vcvttps2dq (%rax), %ymm2 +# CHECK-NEXT: - - 1.00 1.00 - - - - vcvttsd2si %xmm0, %ecx +# CHECK-NEXT: - - 1.00 1.00 - - - - vcvttsd2si %xmm0, %rcx +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 vcvttsd2si (%rax), %ecx +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 vcvttsd2si (%rax), %rcx +# CHECK-NEXT: - - 1.00 1.00 - - - - vcvttss2si %xmm0, %ecx +# CHECK-NEXT: - - 1.00 1.00 - - - - vcvttss2si %xmm0, %rcx +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 vcvttss2si (%rax), %ecx +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 vcvttss2si (%rax), %rcx +# CHECK-NEXT: - 22.00 1.00 - - - - - vdivpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - 22.00 1.00 - - - 0.50 0.50 vdivpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - 44.00 2.50 - - 0.50 - - vdivpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - 44.00 2.50 - - 0.50 0.50 0.50 vdivpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - 14.00 1.00 - - - - - vdivps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - 14.00 1.00 - - - 0.50 0.50 vdivps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - 28.00 2.50 - - 0.50 - - vdivps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - 28.00 2.50 - - 0.50 0.50 0.50 vdivps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - 22.00 1.00 - - - - - vdivsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - 22.00 1.00 - - - 0.50 0.50 vdivsd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - 14.00 1.00 - - - - - vdivss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - 14.00 1.00 - - - 0.50 0.50 vdivss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 1.00 - 1.00 - - vdppd $22, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 1.00 - 1.00 0.50 0.50 vdppd $22, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 2.00 - 1.00 - - vdpps $22, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 2.00 - 1.00 0.50 0.50 vdpps $22, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 2.00 - 1.00 - - vdpps $22, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 2.00 - 1.00 0.50 0.50 vdpps $22, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vextractf128 $1, %ymm0, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vextractf128 $1, %ymm0, (%rax) +# CHECK-NEXT: - - 1.00 - - 1.00 - - vextractps $1, %xmm0, %ecx +# CHECK-NEXT: - - - - 1.00 1.00 0.50 0.50 vextractps $1, %xmm0, (%rax) +# CHECK-NEXT: - - - 1.00 - 2.00 - - vhaddpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - 2.00 0.50 0.50 vhaddpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - 2.00 - - vhaddpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - 2.00 0.50 0.50 vhaddpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - 2.00 - - vhaddps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - 2.00 0.50 0.50 vhaddps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - 2.00 - - vhaddps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - 2.00 0.50 0.50 vhaddps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - 2.00 - - vhsubpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - 2.00 0.50 0.50 vhsubpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - 2.00 - - vhsubpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - 2.00 0.50 0.50 vhsubpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - 2.00 - - vhsubps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - 2.00 0.50 0.50 vhsubps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - 2.00 - - vhsubps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - 2.00 0.50 0.50 vhsubps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vinsertf128 $1, %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 - - 0.50 0.50 0.50 vinsertf128 $1, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vinsertps $1, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vinsertps $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vlddqu (%rax), %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vlddqu (%rax), %ymm2 +# CHECK-NEXT: - - 1.00 - 1.00 1.00 0.50 0.50 vldmxcsr (%rax) +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmaskmovdqu %xmm0, %xmm1 +# CHECK-NEXT: - - 1.00 - - 1.00 0.50 0.50 vmaskmovpd (%rax), %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - 1.00 0.50 0.50 vmaskmovpd (%rax), %ymm0, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 1.00 - 0.50 0.50 vmaskmovpd %xmm0, %xmm1, (%rax) +# CHECK-NEXT: - - 0.50 0.50 1.00 - 0.50 0.50 vmaskmovpd %ymm0, %ymm1, (%rax) +# CHECK-NEXT: - - 1.00 - - 1.00 0.50 0.50 vmaskmovps (%rax), %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - 1.00 0.50 0.50 vmaskmovps (%rax), %ymm0, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 1.00 - 0.50 0.50 vmaskmovps %xmm0, %xmm1, (%rax) +# CHECK-NEXT: - - 0.50 0.50 1.00 - 0.50 0.50 vmaskmovps %ymm0, %ymm1, (%rax) +# CHECK-NEXT: - - - 1.00 - - - - vmaxpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vmaxpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vmaxpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vmaxpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - - - vmaxps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vmaxps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vmaxps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vmaxps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - - - vmaxsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vmaxsd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vmaxss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vmaxss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vminpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vminpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vminpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vminpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - - - vminps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vminps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vminps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vminps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - - - vminsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vminsd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vminss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vminss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vmovapd %xmm0, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovapd %xmm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovapd (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vmovapd %ymm0, %ymm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovapd %ymm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovapd (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vmovaps %xmm0, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovaps %xmm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovaps (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vmovaps %ymm0, %ymm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovaps %ymm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovaps (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vmovd %eax, %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovd (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vmovd %xmm0, %ecx +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovd %xmm0, (%rax) +# CHECK-NEXT: - - - - - 1.00 - - vmovddup %xmm0, %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovddup (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vmovddup %ymm0, %ymm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovddup (%rax), %ymm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - vmovdqa %xmm0, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovdqa %xmm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovdqa (%rax), %xmm2 +# CHECK-NEXT: - - 0.50 - - 0.50 - - vmovdqa %ymm0, %ymm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovdqa %ymm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovdqa (%rax), %ymm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - vmovdqu %xmm0, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovdqu %xmm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovdqu (%rax), %xmm2 +# CHECK-NEXT: - - 0.50 - - 0.50 - - vmovdqu %ymm0, %ymm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovdqu %ymm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovdqu (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vmovhlps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vmovlhps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovhpd %xmm0, (%rax) +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vmovhpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovhps %xmm0, (%rax) +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vmovhps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovlpd %xmm0, (%rax) +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vmovlpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovlps %xmm0, (%rax) +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vmovlps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vmovmskpd %xmm0, %ecx +# CHECK-NEXT: - - 1.00 - - - - - vmovmskpd %ymm0, %ecx +# CHECK-NEXT: - - 1.00 - - - - - vmovmskps %xmm0, %ecx +# CHECK-NEXT: - - 1.00 - - - - - vmovmskps %ymm0, %ecx +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovntdq %xmm0, (%rax) +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovntdq %ymm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovntdqa (%rax), %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovntdqa (%rax), %ymm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovntpd %xmm0, (%rax) +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovntpd %ymm0, (%rax) +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovntps %xmm0, (%rax) +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovntps %ymm0, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - vmovq %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vmovq %rax, %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovq (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vmovq %xmm0, %rcx +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovq %xmm0, (%rax) +# CHECK-NEXT: - - - - - 1.00 - - vmovsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovsd %xmm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovsd (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vmovshdup %xmm0, %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovshdup (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vmovshdup %ymm0, %ymm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovshdup (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vmovsldup %xmm0, %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovsldup (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vmovsldup %ymm0, %ymm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovsldup (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vmovss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovss %xmm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovss (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vmovupd %xmm0, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovupd %xmm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovupd (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vmovupd %ymm0, %ymm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovupd %ymm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovupd (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vmovups %xmm0, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovups %xmm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovups (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vmovups %ymm0, %ymm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vmovups %ymm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovups (%rax), %ymm2 +# CHECK-NEXT: - - 1.00 1.00 - 1.00 - - vmpsadbw $1, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 1.00 - 1.00 0.50 0.50 vmpsadbw $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vmulpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vmulpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vmulpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vmulpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vmulps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vmulps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vmulps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vmulps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vmulsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vmulsd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vmulss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vmulss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vorpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vorpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vorpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vorpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vorps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vorps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vorps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vorps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpabsb %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpabsb (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpabsd %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpabsd (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpabsw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpabsw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpackssdw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpackssdw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpacksswb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpacksswb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpackusdw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpackusdw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpackuswb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpackuswb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpaddb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpaddb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpaddd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpaddd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpaddq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpaddq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpaddsb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpaddsb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpaddsw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpaddsw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpaddusb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpaddusb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpaddusw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpaddusw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpaddw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpaddw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpalignr $1, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpalignr $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - vpand %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 vpand (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - vpandn %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 vpandn (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpavgb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpavgb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpavgw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpavgw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 - - vpblendvb %xmm3, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 vpblendvb %xmm3, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpblendw $11, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpblendw $11, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 6.00 6.00 - 6.00 - - vpclmulqdq $11, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 5.67 5.67 - 5.67 0.50 0.50 vpclmulqdq $11, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpcmpeqb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpcmpeqb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpcmpeqd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpcmpeqd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpcmpeqq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpcmpeqq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpcmpeqw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpcmpeqw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpcmpgtb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpcmpgtb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpcmpgtd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpcmpgtd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpcmpgtq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpcmpgtq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpcmpgtw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpcmpgtw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vperm2f128 $1, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vperm2f128 $1, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpermilpd $1, %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpermilpd $1, (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vpermilpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpermilpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vpermilpd $1, %ymm0, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpermilpd $1, (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpermilpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpermilpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpermilps $1, %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpermilps $1, (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vpermilps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpermilps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vpermilps $1, %ymm0, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpermilps $1, (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpermilps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpermilps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpextrb $1, %xmm0, %ecx +# CHECK-NEXT: - - - 0.50 1.00 0.50 0.50 0.50 vpextrb $1, %xmm0, (%rax) +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpextrd $1, %xmm0, %ecx +# CHECK-NEXT: - - 1.00 0.50 1.00 0.50 0.50 0.50 vpextrd $1, %xmm0, (%rax) +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpextrq $1, %xmm0, %rcx +# CHECK-NEXT: - - 1.00 0.50 1.00 0.50 0.50 0.50 vpextrq $1, %xmm0, (%rax) +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpextrw $1, %xmm0, %ecx +# CHECK-NEXT: - - - 0.50 1.00 0.50 0.50 0.50 vpextrw $1, %xmm0, (%rax) +# CHECK-NEXT: - - - 1.50 - 1.50 - - vphaddd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 vphaddd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - vphaddsw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 vphaddsw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - vphaddw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 vphaddw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vphminposuw %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vphminposuw (%rax), %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - vphsubd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 vphsubd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - vphsubsw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 vphsubsw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - vphsubw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 vphsubw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 1.50 - - vpinsrb $1, %eax, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpinsrb $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 1.50 - - vpinsrd $1, %eax, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpinsrd $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 1.50 - - vpinsrq $1, %rax, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpinsrq $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 1.50 - - vpinsrw $1, %eax, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpinsrw $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmaddubsw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpmaddubsw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmaddwd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpmaddwd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmaxsb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmaxsb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmaxsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmaxsd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmaxsw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmaxsw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmaxub %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmaxub (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmaxud %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmaxud (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmaxuw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmaxuw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpminsb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpminsb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpminsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpminsd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpminsw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpminsw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpminub %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpminub (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpminud %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpminud (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpminuw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpminuw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmovmskb %xmm0, %ecx +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmovsxbd %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmovsxbd (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmovsxbq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmovsxbq (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmovsxbw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmovsxbw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmovsxdq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmovsxdq (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmovsxwd %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmovsxwd (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmovsxwq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmovsxwq (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmovzxbd %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmovzxbd (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmovzxbq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmovzxbq (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmovzxbw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmovzxbw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmovzxdq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmovzxdq (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmovzxwd %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmovzxwd (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmovzxwq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmovzxwq (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmuldq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpmuldq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmulhrsw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpmulhrsw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmulhuw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpmulhuw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmulhw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpmulhw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmulld %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpmulld (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmullw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpmullw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmuludq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpmuludq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - vpor %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 vpor (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsadbw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpsadbw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpshufb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpshufb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpshufd $1, %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpshufd $1, (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpshufhw $1, %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpshufhw $1, (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpshuflw $1, %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpshuflw $1, (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsignb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsignb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsignd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsignd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsignw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsignw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpslld $1, %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpslld %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 vpslld (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpslldq $1, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsllq $1, %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpsllq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 vpsllq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsllw $1, %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpsllw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 vpsllw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsrad $1, %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpsrad %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 vpsrad (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsraw $1, %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpsraw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 vpsraw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsrld $1, %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpsrld %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 vpsrld (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsrldq $1, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsrlq $1, %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpsrlq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 vpsrlq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsrlw $1, %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpsrlw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 vpsrlw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsubb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsubb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsubd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsubd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsubq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsubq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsubsb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsubsb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsubsw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsubsw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsubusb %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsubusb (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsubusw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsubusw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsubw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsubw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - 1.00 - - vptest %xmm0, %xmm1 +# CHECK-NEXT: - - 1.00 - - 1.00 0.50 0.50 vptest (%rax), %xmm1 +# CHECK-NEXT: - - 1.00 - - 1.00 - - vptest %ymm0, %ymm1 +# CHECK-NEXT: - - 1.00 - - 1.00 0.50 0.50 vptest (%rax), %ymm1 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpunpckhbw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpunpckhbw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpunpckhdq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpunpckhdq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpunpckhqdq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpunpckhqdq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpunpckhwd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpunpckhwd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpunpcklbw %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpunpcklbw (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpunpckldq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpunpckldq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpunpcklqdq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpunpcklqdq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpunpcklwd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpunpcklwd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - vpxor %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 vpxor (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vrcpps %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vrcpps (%rax), %xmm2 +# CHECK-NEXT: - - 2.50 - - 0.50 - - vrcpps %ymm0, %ymm2 +# CHECK-NEXT: - - 2.50 - - 0.50 0.50 0.50 vrcpps (%rax), %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vrcpss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vrcpss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vroundpd $1, %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vroundpd $1, (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vroundpd $1, %ymm0, %ymm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vroundpd $1, (%rax), %ymm2 +# CHECK-NEXT: - - - 1.00 - - - - vroundps $1, %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vroundps $1, (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vroundps $1, %ymm0, %ymm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vroundps $1, (%rax), %ymm2 +# CHECK-NEXT: - - - 1.00 - - - - vroundsd $1, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vroundsd $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vroundss $1, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vroundss $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vrsqrtps %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vrsqrtps (%rax), %xmm2 +# CHECK-NEXT: - - 2.50 - - 0.50 - - vrsqrtps %ymm0, %ymm2 +# CHECK-NEXT: - - 2.50 - - 0.50 0.50 0.50 vrsqrtps (%rax), %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vrsqrtss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vrsqrtss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vshufpd $1, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vshufpd $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vshufpd $1, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vshufpd $1, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vshufps $1, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vshufps $1, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vshufps $1, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vshufps $1, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - 21.00 1.00 - - - - - vsqrtpd %xmm0, %xmm2 +# CHECK-NEXT: - 21.00 1.00 - - - 0.50 0.50 vsqrtpd (%rax), %xmm2 +# CHECK-NEXT: - 44.00 2.50 - - 0.50 - - vsqrtpd %ymm0, %ymm2 +# CHECK-NEXT: - 44.00 2.50 - - 0.50 0.50 0.50 vsqrtpd (%rax), %ymm2 +# CHECK-NEXT: - 14.00 1.00 - - - - - vsqrtps %xmm0, %xmm2 +# CHECK-NEXT: - 14.00 1.00 - - - 0.50 0.50 vsqrtps (%rax), %xmm2 +# CHECK-NEXT: - 28.00 2.50 - - 0.50 - - vsqrtps %ymm0, %ymm2 +# CHECK-NEXT: - 28.00 2.50 - - 0.50 0.50 0.50 vsqrtps (%rax), %ymm2 +# CHECK-NEXT: - 21.00 1.00 - - - - - vsqrtsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - 21.00 1.00 - - - 0.50 0.50 vsqrtsd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - 14.00 1.00 - - - - - vsqrtss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - 14.00 1.00 - - - 0.50 0.50 vsqrtss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - 1.00 1.00 0.50 0.50 vstmxcsr (%rax) +# CHECK-NEXT: - - - 1.00 - - - - vsubpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vsubpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vsubpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vsubpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - - - vsubps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vsubps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vsubps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vsubps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - - - - vsubsd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vsubsd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vsubss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vsubss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vtestpd %xmm0, %xmm1 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vtestpd (%rax), %xmm1 +# CHECK-NEXT: - - 1.00 - - - - - vtestpd %ymm0, %ymm1 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vtestpd (%rax), %ymm1 +# CHECK-NEXT: - - 1.00 - - - - - vtestps %xmm0, %xmm1 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vtestps (%rax), %xmm1 +# CHECK-NEXT: - - 1.00 - - - - - vtestps %ymm0, %ymm1 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vtestps (%rax), %ymm1 +# CHECK-NEXT: - - 1.00 1.00 - - - - vucomisd %xmm0, %xmm1 +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 vucomisd (%rax), %xmm1 +# CHECK-NEXT: - - 1.00 1.00 - - - - vucomiss %xmm0, %xmm1 +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 vucomiss (%rax), %xmm1 +# CHECK-NEXT: - - - - - 1.00 - - vunpckhpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vunpckhpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vunpckhpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vunpckhpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vunpckhps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vunpckhps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vunpckhps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vunpckhps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vunpcklpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vunpcklpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vunpcklpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vunpcklpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vunpcklps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vunpcklps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vunpcklps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vunpcklps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vxorpd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vxorpd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vxorpd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vxorpd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vxorps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vxorps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vxorps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vxorps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - vzeroall +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - vzeroupper diff --git a/test/tools/llvm-mca/X86/Generic/resources-avx2.s b/test/tools/llvm-mca/X86/Generic/resources-avx2.s new file mode 100644 index 00000000000..4568034768e --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-avx2.s @@ -0,0 +1,1074 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +vbroadcasti128 (%rax), %ymm0 + +vbroadcastsd %xmm0, %ymm0 +vbroadcastss %xmm0, %ymm0 + +vextracti128 $1, %ymm0, %xmm2 +vextracti128 $1, %ymm0, (%rax) + +vgatherdpd %xmm0, (%rax,%xmm1,2), %xmm2 +vgatherdpd %ymm0, (%rax,%xmm1,2), %ymm2 + +vgatherdps %xmm0, (%rax,%xmm1,2), %xmm2 +vgatherdps %ymm0, (%rax,%ymm1,2), %ymm2 + +vgatherqpd %xmm0, (%rax,%xmm1,2), %xmm2 +vgatherqpd %ymm0, (%rax,%ymm1,2), %ymm2 + +vgatherqps %xmm0, (%rax,%xmm1,2), %xmm2 +vgatherqps %xmm0, (%rax,%ymm1,2), %xmm2 + +vinserti128 $1, %xmm0, %ymm1, %ymm2 +vinserti128 $1, (%rax), %ymm1, %ymm2 + +vmovntdqa (%rax), %ymm0 + +vmpsadbw $1, %ymm0, %ymm1, %ymm2 +vmpsadbw $1, (%rax), %ymm1, %ymm2 + +vpabsb %ymm0, %ymm2 +vpabsb (%rax), %ymm2 + +vpabsd %ymm0, %ymm2 +vpabsd (%rax), %ymm2 + +vpabsw %ymm0, %ymm2 +vpabsw (%rax), %ymm2 + +vpackssdw %ymm0, %ymm1, %ymm2 +vpackssdw (%rax), %ymm1, %ymm2 + +vpacksswb %ymm0, %ymm1, %ymm2 +vpacksswb (%rax), %ymm1, %ymm2 + +vpackusdw %ymm0, %ymm1, %ymm2 +vpackusdw (%rax), %ymm1, %ymm2 + +vpackuswb %ymm0, %ymm1, %ymm2 +vpackuswb (%rax), %ymm1, %ymm2 + +vpaddb %ymm0, %ymm1, %ymm2 +vpaddb (%rax), %ymm1, %ymm2 + +vpaddd %ymm0, %ymm1, %ymm2 +vpaddd (%rax), %ymm1, %ymm2 + +vpaddq %ymm0, %ymm1, %ymm2 +vpaddq (%rax), %ymm1, %ymm2 + +vpaddsb %ymm0, %ymm1, %ymm2 +vpaddsb (%rax), %ymm1, %ymm2 + +vpaddsw %ymm0, %ymm1, %ymm2 +vpaddsw (%rax), %ymm1, %ymm2 + +vpaddusb %ymm0, %ymm1, %ymm2 +vpaddusb (%rax), %ymm1, %ymm2 + +vpaddusw %ymm0, %ymm1, %ymm2 +vpaddusw (%rax), %ymm1, %ymm2 + +vpaddw %ymm0, %ymm1, %ymm2 +vpaddw (%rax), %ymm1, %ymm2 + +vpalignr $1, %ymm0, %ymm1, %ymm2 +vpalignr $1, (%rax), %ymm1, %ymm2 + +vpand %ymm0, %ymm1, %ymm2 +vpand (%rax), %ymm1, %ymm2 + +vpandn %ymm0, %ymm1, %ymm2 +vpandn (%rax), %ymm1, %ymm2 + +vpavgb %ymm0, %ymm1, %ymm2 +vpavgb (%rax), %ymm1, %ymm2 + +vpavgw %ymm0, %ymm1, %ymm2 +vpavgw (%rax), %ymm1, %ymm2 + +vpblendd $11, %xmm0, %xmm1, %xmm2 +vpblendd $11, (%rax), %xmm1, %xmm2 + +vpblendd $11, %ymm0, %ymm1, %ymm2 +vpblendd $11, (%rax), %ymm1, %ymm2 + +vpblendvb %ymm3, %ymm0, %ymm1, %ymm2 +vpblendvb %ymm3, (%rax), %ymm1, %ymm2 + +vpblendw $11, %ymm0, %ymm1, %ymm2 +vpblendw $11, (%rax), %ymm1, %ymm2 + +vpbroadcastb %xmm0, %xmm0 +vpbroadcastb (%rax), %xmm0 + +vpbroadcastb %xmm0, %ymm0 +vpbroadcastb (%rax), %ymm0 + +vpbroadcastd %xmm0, %xmm0 +vpbroadcastd (%rax), %xmm0 + +vpbroadcastd %xmm0, %ymm0 +vpbroadcastd (%rax), %ymm0 + +vpbroadcastq %xmm0, %xmm0 +vpbroadcastq (%rax), %xmm0 + +vpbroadcastq %xmm0, %ymm0 +vpbroadcastq (%rax), %ymm0 + +vpbroadcastw %xmm0, %xmm0 +vpbroadcastw (%rax), %xmm0 + +vpbroadcastw %xmm0, %ymm0 +vpbroadcastw (%rax), %ymm0 + +vpcmpeqb %ymm0, %ymm1, %ymm2 +vpcmpeqb (%rax), %ymm1, %ymm2 + +vpcmpeqd %ymm0, %ymm1, %ymm2 +vpcmpeqd (%rax), %ymm1, %ymm2 + +vpcmpeqq %ymm0, %ymm1, %ymm2 +vpcmpeqq (%rax), %ymm1, %ymm2 + +vpcmpeqw %ymm0, %ymm1, %ymm2 +vpcmpeqw (%rax), %ymm1, %ymm2 + +vpcmpgtb %ymm0, %ymm1, %ymm2 +vpcmpgtb (%rax), %ymm1, %ymm2 + +vpcmpgtd %ymm0, %ymm1, %ymm2 +vpcmpgtd (%rax), %ymm1, %ymm2 + +vpcmpgtq %ymm0, %ymm1, %ymm2 +vpcmpgtq (%rax), %ymm1, %ymm2 + +vpcmpgtw %ymm0, %ymm1, %ymm2 +vpcmpgtw (%rax), %ymm1, %ymm2 + +vpermd %ymm0, %ymm1, %ymm2 +vpermd (%rax), %ymm1, %ymm2 + +vpermpd $1, %ymm0, %ymm2 +vpermpd $1, (%rax), %ymm2 + +vpermps %ymm0, %ymm1, %ymm2 +vpermps (%rax), %ymm1, %ymm2 + +vpermq $1, %ymm0, %ymm2 +vpermq $1, (%rax), %ymm2 + +vpgatherdd %xmm0, (%rax,%xmm1,2), %xmm2 +vpgatherdd %ymm0, (%rax,%ymm1,2), %ymm2 + +vpgatherdq %xmm0, (%rax,%xmm1,2), %xmm2 +vpgatherdq %ymm0, (%rax,%xmm1,2), %ymm2 + +vpgatherqd %xmm0, (%rax,%xmm1,2), %xmm2 +vpgatherqq %ymm0, (%rax,%ymm1,2), %ymm2 + +vpgatherqq %xmm0, (%rax,%xmm1,2), %xmm2 +vpgatherqq %ymm0, (%rax,%ymm1,2), %ymm2 + +vphaddd %ymm0, %ymm1, %ymm2 +vphaddd (%rax), %ymm1, %ymm2 + +vphaddsw %ymm0, %ymm1, %ymm2 +vphaddsw (%rax), %ymm1, %ymm2 + +vphaddw %ymm0, %ymm1, %ymm2 +vphaddw (%rax), %ymm1, %ymm2 + +vphsubd %ymm0, %ymm1, %ymm2 +vphsubd (%rax), %ymm1, %ymm2 + +vphsubsw %ymm0, %ymm1, %ymm2 +vphsubsw (%rax), %ymm1, %ymm2 + +vphsubw %ymm0, %ymm1, %ymm2 +vphsubw (%rax), %ymm1, %ymm2 + +vpmaddubsw %ymm0, %ymm1, %ymm2 +vpmaddubsw (%rax), %ymm1, %ymm2 + +vpmaddwd %ymm0, %ymm1, %ymm2 +vpmaddwd (%rax), %ymm1, %ymm2 + +vpmaskmovd (%rax), %xmm0, %xmm2 +vpmaskmovd (%rax), %ymm0, %ymm2 + +vpmaskmovd %xmm0, %xmm1, (%rax) +vpmaskmovd %ymm0, %ymm1, (%rax) + +vpmaskmovq (%rax), %xmm0, %xmm2 +vpmaskmovq (%rax), %ymm0, %ymm2 + +vpmaskmovq %xmm0, %xmm1, (%rax) +vpmaskmovq %ymm0, %ymm1, (%rax) + +vpmaxsb %ymm0, %ymm1, %ymm2 +vpmaxsb (%rax), %ymm1, %ymm2 + +vpmaxsd %ymm0, %ymm1, %ymm2 +vpmaxsd (%rax), %ymm1, %ymm2 + +vpmaxsw %ymm0, %ymm1, %ymm2 +vpmaxsw (%rax), %ymm1, %ymm2 + +vpmaxub %ymm0, %ymm1, %ymm2 +vpmaxub (%rax), %ymm1, %ymm2 + +vpmaxud %ymm0, %ymm1, %ymm2 +vpmaxud (%rax), %ymm1, %ymm2 + +vpmaxuw %ymm0, %ymm1, %ymm2 +vpmaxuw (%rax), %ymm1, %ymm2 + +vpminsb %ymm0, %ymm1, %ymm2 +vpminsb (%rax), %ymm1, %ymm2 + +vpminsd %ymm0, %ymm1, %ymm2 +vpminsd (%rax), %ymm1, %ymm2 + +vpminsw %ymm0, %ymm1, %ymm2 +vpminsw (%rax), %ymm1, %ymm2 + +vpminub %ymm0, %ymm1, %ymm2 +vpminub (%rax), %ymm1, %ymm2 + +vpminud %ymm0, %ymm1, %ymm2 +vpminud (%rax), %ymm1, %ymm2 + +vpminuw %ymm0, %ymm1, %ymm2 +vpminuw (%rax), %ymm1, %ymm2 + +vpmovmskb %ymm0, %rcx + +vpmovsxbd %xmm0, %ymm2 +vpmovsxbd (%rax), %ymm2 + +vpmovsxbq %xmm0, %ymm2 +vpmovsxbq (%rax), %ymm2 + +vpmovsxbw %xmm0, %ymm2 +vpmovsxbw (%rax), %ymm2 + +vpmovsxdq %xmm0, %ymm2 +vpmovsxdq (%rax), %ymm2 + +vpmovsxwd %xmm0, %ymm2 +vpmovsxwd (%rax), %ymm2 + +vpmovsxwq %xmm0, %ymm2 +vpmovsxwq (%rax), %ymm2 + +vpmovzxbd %xmm0, %ymm2 +vpmovzxbd (%rax), %ymm2 + +vpmovzxbq %xmm0, %ymm2 +vpmovzxbq (%rax), %ymm2 + +vpmovzxbw %xmm0, %ymm2 +vpmovzxbw (%rax), %ymm2 + +vpmovzxdq %xmm0, %ymm2 +vpmovzxdq (%rax), %ymm2 + +vpmovzxwd %xmm0, %ymm2 +vpmovzxwd (%rax), %ymm2 + +vpmovzxwq %xmm0, %ymm2 +vpmovzxwq (%rax), %ymm2 + +vpmuldq %ymm0, %ymm1, %ymm2 +vpmuldq (%rax), %ymm1, %ymm2 + +vpmulhrsw %ymm0, %ymm1, %ymm2 +vpmulhrsw (%rax), %ymm1, %ymm2 + +vpmulhuw %ymm0, %ymm1, %ymm2 +vpmulhuw (%rax), %ymm1, %ymm2 + +vpmulhw %ymm0, %ymm1, %ymm2 +vpmulhw (%rax), %ymm1, %ymm2 + +vpmulld %ymm0, %ymm1, %ymm2 +vpmulld (%rax), %ymm1, %ymm2 + +vpmullw %ymm0, %ymm1, %ymm2 +vpmullw (%rax), %ymm1, %ymm2 + +vpmuludq %ymm0, %ymm1, %ymm2 +vpmuludq (%rax), %ymm1, %ymm2 + +vpor %ymm0, %ymm1, %ymm2 +vpor (%rax), %ymm1, %ymm2 + +vpsadbw %ymm0, %ymm1, %ymm2 +vpsadbw (%rax), %ymm1, %ymm2 + +vpshufb %ymm0, %ymm1, %ymm2 +vpshufb (%rax), %ymm1, %ymm2 + +vpshufd $1, %ymm0, %ymm2 +vpshufd $1, (%rax), %ymm2 + +vpshufhw $1, %ymm0, %ymm2 +vpshufhw $1, (%rax), %ymm2 + +vpshuflw $1, %ymm0, %ymm2 +vpshuflw $1, (%rax), %ymm2 + +vpsignb %ymm0, %ymm1, %ymm2 +vpsignb (%rax), %ymm1, %ymm2 + +vpsignd %ymm0, %ymm1, %ymm2 +vpsignd (%rax), %ymm1, %ymm2 + +vpsignw %ymm0, %ymm1, %ymm2 +vpsignw (%rax), %ymm1, %ymm2 + +vpslld $1, %ymm0, %ymm2 +vpslld %xmm0, %ymm1, %ymm2 +vpslld (%rax), %ymm1, %ymm2 + +vpslldq $1, %ymm1, %ymm2 + +vpsllq $1, %ymm0, %ymm2 +vpsllq %xmm0, %ymm1, %ymm2 +vpsllq (%rax), %ymm1, %ymm2 + +vpsllvd %xmm0, %xmm1, %xmm2 +vpsllvd (%rax), %xmm1, %xmm2 + +vpsllvd %ymm0, %ymm1, %ymm2 +vpsllvd (%rax), %ymm1, %ymm2 + +vpsllvq %xmm0, %xmm1, %xmm2 +vpsllvq (%rax), %xmm1, %xmm2 + +vpsllvq %ymm0, %ymm1, %ymm2 +vpsllvq (%rax), %ymm1, %ymm2 + +vpsllw $1, %ymm0, %ymm2 +vpsllw %xmm0, %ymm1, %ymm2 +vpsllw (%rax), %ymm1, %ymm2 + +vpsrad $1, %ymm0, %ymm2 +vpsrad %xmm0, %ymm1, %ymm2 +vpsrad (%rax), %ymm1, %ymm2 + +vpsravd %xmm0, %xmm1, %xmm2 +vpsravd (%rax), %xmm1, %xmm2 + +vpsravd %ymm0, %ymm1, %ymm2 +vpsravd (%rax), %ymm1, %ymm2 + +vpsraw $1, %ymm0, %ymm2 +vpsraw %xmm0, %ymm1, %ymm2 +vpsraw (%rax), %ymm1, %ymm2 + +vpsrld $1, %ymm0, %ymm2 +vpsrld %xmm0, %ymm1, %ymm2 +vpsrld (%rax), %ymm1, %ymm2 + +vpsrldq $1, %ymm1, %ymm2 + +vpsrlq $1, %ymm0, %ymm2 +vpsrlq %xmm0, %ymm1, %ymm2 +vpsrlq (%rax), %ymm1, %ymm2 + +vpsrlvd %xmm0, %xmm1, %xmm2 +vpsrlvd (%rax), %xmm1, %xmm2 + +vpsrlvd %ymm0, %ymm1, %ymm2 +vpsrlvd (%rax), %ymm1, %ymm2 + +vpsrlvq %xmm0, %xmm1, %xmm2 +vpsrlvq (%rax), %xmm1, %xmm2 + +vpsrlvq %ymm0, %ymm1, %ymm2 +vpsrlvq (%rax), %ymm1, %ymm2 + +vpsrlw $1, %ymm0, %ymm2 +vpsrlw %xmm0, %ymm1, %ymm2 +vpsrlw (%rax), %ymm1, %ymm2 + +vpsubb %ymm0, %ymm1, %ymm2 +vpsubb (%rax), %ymm1, %ymm2 + +vpsubd %ymm0, %ymm1, %ymm2 +vpsubd (%rax), %ymm1, %ymm2 + +vpsubq %ymm0, %ymm1, %ymm2 +vpsubq (%rax), %ymm1, %ymm2 + +vpsubsb %ymm0, %ymm1, %ymm2 +vpsubsb (%rax), %ymm1, %ymm2 + +vpsubsw %ymm0, %ymm1, %ymm2 +vpsubsw (%rax), %ymm1, %ymm2 + +vpsubusb %ymm0, %ymm1, %ymm2 +vpsubusb (%rax), %ymm1, %ymm2 + +vpsubusw %ymm0, %ymm1, %ymm2 +vpsubusw (%rax), %ymm1, %ymm2 + +vpsubw %ymm0, %ymm1, %ymm2 +vpsubw (%rax), %ymm1, %ymm2 + +vpunpckhbw %ymm0, %ymm1, %ymm2 +vpunpckhbw (%rax), %ymm1, %ymm2 + +vpunpckhdq %ymm0, %ymm1, %ymm2 +vpunpckhdq (%rax), %ymm1, %ymm2 + +vpunpckhqdq %ymm0, %ymm1, %ymm2 +vpunpckhqdq (%rax), %ymm1, %ymm2 + +vpunpckhwd %ymm0, %ymm1, %ymm2 +vpunpckhwd (%rax), %ymm1, %ymm2 + +vpunpcklbw %ymm0, %ymm1, %ymm2 +vpunpcklbw (%rax), %ymm1, %ymm2 + +vpunpckldq %ymm0, %ymm1, %ymm2 +vpunpckldq (%rax), %ymm1, %ymm2 + +vpunpcklqdq %ymm0, %ymm1, %ymm2 +vpunpcklqdq (%rax), %ymm1, %ymm2 + +vpunpcklwd %ymm0, %ymm1, %ymm2 +vpunpcklwd (%rax), %ymm1, %ymm2 + +vpxor %ymm0, %ymm1, %ymm2 +vpxor (%rax), %ymm1, %ymm2 + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 2 6 1.00 * vbroadcasti128 (%rax), %ymm0 +# CHECK-NEXT: 1 1 1.00 vbroadcastsd %xmm0, %ymm0 +# CHECK-NEXT: 1 1 1.00 vbroadcastss %xmm0, %ymm0 +# CHECK-NEXT: 1 1 1.00 vextracti128 $1, %ymm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 * vextracti128 $1, %ymm0, (%rax) +# CHECK-NEXT: 1 5 0.50 * vgatherdpd %xmm0, (%rax,%xmm1,2), %xmm2 +# CHECK-NEXT: 1 5 0.50 * vgatherdpd %ymm0, (%rax,%xmm1,2), %ymm2 +# CHECK-NEXT: 1 5 0.50 * vgatherdps %xmm0, (%rax,%xmm1,2), %xmm2 +# CHECK-NEXT: 1 5 0.50 * vgatherdps %ymm0, (%rax,%ymm1,2), %ymm2 +# CHECK-NEXT: 1 5 0.50 * vgatherqpd %xmm0, (%rax,%xmm1,2), %xmm2 +# CHECK-NEXT: 1 5 0.50 * vgatherqpd %ymm0, (%rax,%ymm1,2), %ymm2 +# CHECK-NEXT: 1 5 0.50 * vgatherqps %xmm0, (%rax,%xmm1,2), %xmm2 +# CHECK-NEXT: 1 5 0.50 * vgatherqps %xmm0, (%rax,%ymm1,2), %xmm2 +# CHECK-NEXT: 1 1 1.00 vinserti128 $1, %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vinserti128 $1, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 7 0.50 * vmovntdqa (%rax), %ymm0 +# CHECK-NEXT: 3 7 1.00 vmpsadbw $1, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 4 14 1.00 * vmpsadbw $1, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpabsb %ymm0, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpabsb (%rax), %ymm2 +# CHECK-NEXT: 1 1 0.50 vpabsd %ymm0, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpabsd (%rax), %ymm2 +# CHECK-NEXT: 1 1 0.50 vpabsw %ymm0, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpabsw (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vpackssdw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpackssdw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpacksswb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpacksswb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpackusdw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpackusdw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpackuswb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpackuswb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpaddb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpaddb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpaddd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpaddd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpaddq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpaddq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpaddsb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpaddsb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpaddsw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpaddsw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpaddusb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpaddusb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpaddusw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpaddusw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpaddw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpaddw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpalignr $1, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpalignr $1, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.33 vpand %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpand (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.33 vpandn %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpandn (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpavgb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpavgb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpavgw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpavgw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpblendd $11, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 0.50 * vpblendd $11, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 0.50 vpblendd $11, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpblendd $11, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 2 2 1.00 vpblendvb %ymm3, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 3 9 1.00 * vpblendvb %ymm3, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpblendw $11, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpblendw $11, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpbroadcastb %xmm0, %xmm0 +# CHECK-NEXT: 2 7 0.50 * vpbroadcastb (%rax), %xmm0 +# CHECK-NEXT: 1 1 1.00 vpbroadcastb %xmm0, %ymm0 +# CHECK-NEXT: 2 7 0.50 * vpbroadcastb (%rax), %ymm0 +# CHECK-NEXT: 1 1 0.50 vpbroadcastd %xmm0, %xmm0 +# CHECK-NEXT: 2 7 0.50 * vpbroadcastd (%rax), %xmm0 +# CHECK-NEXT: 1 1 1.00 vpbroadcastd %xmm0, %ymm0 +# CHECK-NEXT: 2 7 0.50 * vpbroadcastd (%rax), %ymm0 +# CHECK-NEXT: 1 1 0.50 vpbroadcastq %xmm0, %xmm0 +# CHECK-NEXT: 2 7 0.50 * vpbroadcastq (%rax), %xmm0 +# CHECK-NEXT: 1 1 1.00 vpbroadcastq %xmm0, %ymm0 +# CHECK-NEXT: 2 7 0.50 * vpbroadcastq (%rax), %ymm0 +# CHECK-NEXT: 1 1 0.50 vpbroadcastw %xmm0, %xmm0 +# CHECK-NEXT: 2 7 0.50 * vpbroadcastw (%rax), %xmm0 +# CHECK-NEXT: 1 1 1.00 vpbroadcastw %xmm0, %ymm0 +# CHECK-NEXT: 2 7 0.50 * vpbroadcastw (%rax), %ymm0 +# CHECK-NEXT: 1 1 0.50 vpcmpeqb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpcmpeqb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpcmpeqd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpcmpeqd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpcmpeqq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpcmpeqq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpcmpeqw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpcmpeqw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpcmpgtb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpcmpgtb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpcmpgtd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpcmpgtd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpcmpgtq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpcmpgtq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpcmpgtw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpcmpgtw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpermd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpermd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpermpd $1, %ymm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpermpd $1, (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vpermps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpermps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpermq $1, %ymm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpermq $1, (%rax), %ymm2 +# CHECK-NEXT: 1 5 0.50 * vpgatherdd %xmm0, (%rax,%xmm1,2), %xmm2 +# CHECK-NEXT: 1 5 0.50 * vpgatherdd %ymm0, (%rax,%ymm1,2), %ymm2 +# CHECK-NEXT: 1 5 0.50 * vpgatherdq %xmm0, (%rax,%xmm1,2), %xmm2 +# CHECK-NEXT: 1 5 0.50 * vpgatherdq %ymm0, (%rax,%xmm1,2), %ymm2 +# CHECK-NEXT: 1 5 0.50 * vpgatherqd %xmm0, (%rax,%xmm1,2), %xmm2 +# CHECK-NEXT: 1 5 0.50 * vpgatherqq %ymm0, (%rax,%ymm1,2), %ymm2 +# CHECK-NEXT: 1 5 0.50 * vpgatherqq %xmm0, (%rax,%xmm1,2), %xmm2 +# CHECK-NEXT: 1 5 0.50 * vpgatherqq %ymm0, (%rax,%ymm1,2), %ymm2 +# CHECK-NEXT: 3 3 1.50 vphaddd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 4 10 1.50 * vphaddd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 3 3 1.50 vphaddsw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 4 10 1.50 * vphaddsw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 3 3 1.50 vphaddw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 4 10 1.50 * vphaddw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 3 3 1.50 vphsubd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 4 10 1.50 * vphsubd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 3 3 1.50 vphsubsw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 4 10 1.50 * vphsubsw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 3 3 1.50 vphsubw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 4 10 1.50 * vphsubw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 1.00 vpmaddubsw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 12 1.00 * vpmaddubsw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 1.00 vpmaddwd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 12 1.00 * vpmaddwd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 3 8 1.00 * vpmaskmovd (%rax), %xmm0, %xmm2 +# CHECK-NEXT: 3 9 1.00 * vpmaskmovd (%rax), %ymm0, %ymm2 +# CHECK-NEXT: 3 5 1.00 * * vpmaskmovd %xmm0, %xmm1, (%rax) +# CHECK-NEXT: 3 5 1.00 * * vpmaskmovd %ymm0, %ymm1, (%rax) +# CHECK-NEXT: 3 8 1.00 * vpmaskmovq (%rax), %xmm0, %xmm2 +# CHECK-NEXT: 3 9 1.00 * vpmaskmovq (%rax), %ymm0, %ymm2 +# CHECK-NEXT: 3 5 1.00 * * vpmaskmovq %xmm0, %xmm1, (%rax) +# CHECK-NEXT: 3 5 1.00 * * vpmaskmovq %ymm0, %ymm1, (%rax) +# CHECK-NEXT: 1 1 0.50 vpmaxsb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpmaxsb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpmaxsd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpmaxsd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpmaxsw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpmaxsw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpmaxub %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpmaxub (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpmaxud %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpmaxud (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpmaxuw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpmaxuw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpminsb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpminsb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpminsd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpminsd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpminsw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpminsw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpminub %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpminub (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpminud %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpminud (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpminuw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpminuw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 2 1.00 vpmovmskb %ymm0, %ecx +# CHECK-NEXT: 1 1 1.00 vpmovsxbd %xmm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpmovsxbd (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vpmovsxbq %xmm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpmovsxbq (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vpmovsxbw %xmm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpmovsxbw (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vpmovsxdq %xmm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpmovsxdq (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vpmovsxwd %xmm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpmovsxwd (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vpmovsxwq %xmm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpmovsxwq (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vpmovzxbd %xmm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpmovzxbd (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vpmovzxbq %xmm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpmovzxbq (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vpmovzxbw %xmm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpmovzxbw (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vpmovzxdq %xmm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpmovzxdq (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vpmovzxwd %xmm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpmovzxwd (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vpmovzxwq %xmm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpmovzxwq (%rax), %ymm2 +# CHECK-NEXT: 1 5 1.00 vpmuldq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 12 1.00 * vpmuldq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 1.00 vpmulhrsw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 12 1.00 * vpmulhrsw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 1.00 vpmulhuw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 12 1.00 * vpmulhuw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 1.00 vpmulhw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 12 1.00 * vpmulhw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 1.00 vpmulld %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 12 1.00 * vpmulld (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 1.00 vpmullw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 12 1.00 * vpmullw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 1.00 vpmuludq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 12 1.00 * vpmuludq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.33 vpor %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpor (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 1.00 vpsadbw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 12 1.00 * vpsadbw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpshufb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpshufb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpshufd $1, %ymm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpshufd $1, (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vpshufhw $1, %ymm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpshufhw $1, (%rax), %ymm2 +# CHECK-NEXT: 1 1 1.00 vpshuflw $1, %ymm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpshuflw $1, (%rax), %ymm2 +# CHECK-NEXT: 1 1 0.50 vpsignb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpsignb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpsignd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpsignd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpsignw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpsignw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpslld $1, %ymm0, %ymm2 +# CHECK-NEXT: 2 4 1.00 vpslld %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: 3 11 1.00 * vpslld (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpslldq $1, %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpsllq $1, %ymm0, %ymm2 +# CHECK-NEXT: 2 4 1.00 vpsllq %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: 3 11 1.00 * vpsllq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpsllvd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vpsllvd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vpsllvd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpsllvd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpsllvq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vpsllvq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vpsllvq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpsllvq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpsllw $1, %ymm0, %ymm2 +# CHECK-NEXT: 2 4 1.00 vpsllw %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: 3 11 1.00 * vpsllw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpsrad $1, %ymm0, %ymm2 +# CHECK-NEXT: 2 4 1.00 vpsrad %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: 3 11 1.00 * vpsrad (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpsravd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vpsravd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vpsravd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpsravd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpsraw $1, %ymm0, %ymm2 +# CHECK-NEXT: 2 4 1.00 vpsraw %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: 3 11 1.00 * vpsraw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpsrld $1, %ymm0, %ymm2 +# CHECK-NEXT: 2 4 1.00 vpsrld %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: 3 11 1.00 * vpsrld (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpsrldq $1, %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpsrlq $1, %ymm0, %ymm2 +# CHECK-NEXT: 2 4 1.00 vpsrlq %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: 3 11 1.00 * vpsrlq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpsrlvd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vpsrlvd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vpsrlvd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpsrlvd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpsrlvq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 7 1.00 * vpsrlvq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 1 1.00 vpsrlvq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpsrlvq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpsrlw $1, %ymm0, %ymm2 +# CHECK-NEXT: 2 4 1.00 vpsrlw %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: 3 11 1.00 * vpsrlw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpsubb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpsubb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpsubd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpsubd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpsubq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpsubq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpsubsb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpsubsb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpsubsw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpsubsw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpsubusb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpsubusb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpsubusw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpsubusw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.50 vpsubw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpsubw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpunpckhbw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpunpckhbw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpunpckhdq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpunpckhdq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpunpckhqdq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpunpckhqdq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpunpckhwd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpunpckhwd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpunpcklbw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpunpcklbw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpunpckldq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpunpckldq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpunpcklqdq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpunpcklqdq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 1.00 vpunpcklwd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vpunpcklwd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 1 0.33 vpxor %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 8 0.50 * vpxor (%rax), %ymm1, %ymm2 + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - - 75.67 88.67 5.00 166.67 78.00 78.00 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vbroadcasti128 (%rax), %ymm0 +# CHECK-NEXT: - - - - - 1.00 - - vbroadcastsd %xmm0, %ymm0 +# CHECK-NEXT: - - - - - 1.00 - - vbroadcastss %xmm0, %ymm0 +# CHECK-NEXT: - - - - - 1.00 - - vextracti128 $1, %ymm0, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 vextracti128 $1, %ymm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 vgatherdpd %xmm0, (%rax,%xmm1,2), %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vgatherdpd %ymm0, (%rax,%xmm1,2), %ymm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vgatherdps %xmm0, (%rax,%xmm1,2), %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vgatherdps %ymm0, (%rax,%ymm1,2), %ymm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vgatherqpd %xmm0, (%rax,%xmm1,2), %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vgatherqpd %ymm0, (%rax,%ymm1,2), %ymm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vgatherqps %xmm0, (%rax,%xmm1,2), %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vgatherqps %xmm0, (%rax,%ymm1,2), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - vinserti128 $1, %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vinserti128 $1, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vmovntdqa (%rax), %ymm0 +# CHECK-NEXT: - - 1.00 1.00 - 1.00 - - vmpsadbw $1, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 1.00 - 1.00 0.50 0.50 vmpsadbw $1, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpabsb %ymm0, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpabsb (%rax), %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpabsd %ymm0, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpabsd (%rax), %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpabsw %ymm0, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpabsw (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpackssdw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpackssdw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpacksswb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpacksswb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpackusdw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpackusdw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpackuswb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpackuswb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpaddb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpaddb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpaddd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpaddd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpaddq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpaddq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpaddsb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpaddsb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpaddsw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpaddsw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpaddusb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpaddusb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpaddusw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpaddusw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpaddw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpaddw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpalignr $1, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpalignr $1, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - vpand %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 vpand (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - vpandn %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 vpandn (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpavgb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpavgb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpavgw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpavgw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpblendd $11, %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpblendd $11, (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpblendd $11, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpblendd $11, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - 1.00 - - vpblendvb %ymm3, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 vpblendvb %ymm3, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpblendw $11, %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpblendw $11, (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpbroadcastb %xmm0, %xmm0 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpbroadcastb (%rax), %xmm0 +# CHECK-NEXT: - - - - - 1.00 - - vpbroadcastb %xmm0, %ymm0 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpbroadcastb (%rax), %ymm0 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpbroadcastd %xmm0, %xmm0 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpbroadcastd (%rax), %xmm0 +# CHECK-NEXT: - - - - - 1.00 - - vpbroadcastd %xmm0, %ymm0 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpbroadcastd (%rax), %ymm0 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpbroadcastq %xmm0, %xmm0 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpbroadcastq (%rax), %xmm0 +# CHECK-NEXT: - - - - - 1.00 - - vpbroadcastq %xmm0, %ymm0 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpbroadcastq (%rax), %ymm0 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpbroadcastw %xmm0, %xmm0 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpbroadcastw (%rax), %xmm0 +# CHECK-NEXT: - - - - - 1.00 - - vpbroadcastw %xmm0, %ymm0 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpbroadcastw (%rax), %ymm0 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpcmpeqb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpcmpeqb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpcmpeqd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpcmpeqd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpcmpeqq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpcmpeqq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpcmpeqw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpcmpeqw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpcmpgtb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpcmpgtb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpcmpgtd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpcmpgtd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpcmpgtq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpcmpgtq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpcmpgtw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpcmpgtw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpermd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpermd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpermpd $1, %ymm0, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpermpd $1, (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpermps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpermps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpermq $1, %ymm0, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpermq $1, (%rax), %ymm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vpgatherdd %xmm0, (%rax,%xmm1,2), %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vpgatherdd %ymm0, (%rax,%ymm1,2), %ymm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vpgatherdq %xmm0, (%rax,%xmm1,2), %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vpgatherdq %ymm0, (%rax,%xmm1,2), %ymm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vpgatherqd %xmm0, (%rax,%xmm1,2), %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vpgatherqq %ymm0, (%rax,%ymm1,2), %ymm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vpgatherqq %xmm0, (%rax,%xmm1,2), %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 vpgatherqq %ymm0, (%rax,%ymm1,2), %ymm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - vphaddd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 vphaddd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - vphaddsw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 vphaddsw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - vphaddw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 vphaddw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - vphsubd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 vphsubd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - vphsubsw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 vphsubsw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - vphsubw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 vphsubw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmaddubsw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpmaddubsw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmaddwd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpmaddwd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - 1.00 0.50 0.50 vpmaskmovd (%rax), %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - 1.00 0.50 0.50 vpmaskmovd (%rax), %ymm0, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 1.00 - 0.50 0.50 vpmaskmovd %xmm0, %xmm1, (%rax) +# CHECK-NEXT: - - 0.50 0.50 1.00 - 0.50 0.50 vpmaskmovd %ymm0, %ymm1, (%rax) +# CHECK-NEXT: - - 1.00 - - 1.00 0.50 0.50 vpmaskmovq (%rax), %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - 1.00 0.50 0.50 vpmaskmovq (%rax), %ymm0, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 1.00 - 0.50 0.50 vpmaskmovq %xmm0, %xmm1, (%rax) +# CHECK-NEXT: - - 0.50 0.50 1.00 - 0.50 0.50 vpmaskmovq %ymm0, %ymm1, (%rax) +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmaxsb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmaxsb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmaxsd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmaxsd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmaxsw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmaxsw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmaxub %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmaxub (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmaxud %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmaxud (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpmaxuw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpmaxuw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpminsb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpminsb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpminsd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpminsd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpminsw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpminsw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpminub %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpminub (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpminud %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpminud (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpminuw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpminuw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmovmskb %ymm0, %ecx +# CHECK-NEXT: - - - - - 1.00 - - vpmovsxbd %xmm0, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpmovsxbd (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpmovsxbq %xmm0, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpmovsxbq (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpmovsxbw %xmm0, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpmovsxbw (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpmovsxdq %xmm0, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpmovsxdq (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpmovsxwd %xmm0, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpmovsxwd (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpmovsxwq %xmm0, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpmovsxwq (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpmovzxbd %xmm0, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpmovzxbd (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpmovzxbq %xmm0, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpmovzxbq (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpmovzxbw %xmm0, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpmovzxbw (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpmovzxdq %xmm0, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpmovzxdq (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpmovzxwd %xmm0, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpmovzxwd (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpmovzxwq %xmm0, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpmovzxwq (%rax), %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmuldq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpmuldq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmulhrsw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpmulhrsw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmulhuw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpmulhuw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmulhw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpmulhw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmulld %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpmulld (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmullw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpmullw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpmuludq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpmuludq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - vpor %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 vpor (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsadbw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpsadbw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpshufb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpshufb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpshufd $1, %ymm0, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpshufd $1, (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpshufhw $1, %ymm0, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpshufhw $1, (%rax), %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpshuflw $1, %ymm0, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpshuflw $1, (%rax), %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsignb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsignb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsignd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsignd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsignw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsignw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpslld $1, %ymm0, %ymm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpslld %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 vpslld (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpslldq $1, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsllq $1, %ymm0, %ymm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpsllq %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 vpsllq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsllvd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpsllvd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsllvd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpsllvd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsllvq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpsllvq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsllvq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpsllvq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsllw $1, %ymm0, %ymm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpsllw %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 vpsllw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsrad $1, %ymm0, %ymm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpsrad %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 vpsrad (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsravd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpsravd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsravd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpsravd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsraw $1, %ymm0, %ymm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpsraw %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 vpsraw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsrld $1, %ymm0, %ymm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpsrld %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 vpsrld (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpsrldq $1, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsrlq $1, %ymm0, %ymm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpsrlq %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 vpsrlq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsrlvd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpsrlvd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsrlvd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpsrlvd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsrlvq %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpsrlvq (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsrlvq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 vpsrlvq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 - - - - - vpsrlw $1, %ymm0, %ymm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - vpsrlw %xmm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 vpsrlw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsubb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsubb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsubd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsubd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsubq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsubq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsubsb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsubsb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsubsw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsubsw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsubusb %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsubusb (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsubusw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsubusw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - vpsubw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 vpsubw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpunpckhbw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpunpckhbw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpunpckhdq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpunpckhdq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpunpckhqdq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpunpckhqdq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpunpckhwd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpunpckhwd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpunpcklbw %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpunpcklbw (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpunpckldq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpunpckldq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpunpcklqdq %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpunpcklqdq (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 - - vpunpcklwd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 vpunpcklwd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - vpxor %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 vpxor (%rax), %ymm1, %ymm2 diff --git a/test/tools/llvm-mca/X86/Generic/resources-bmi1.s b/test/tools/llvm-mca/X86/Generic/resources-bmi1.s new file mode 100644 index 00000000000..38e3ba903dd --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-bmi1.s @@ -0,0 +1,113 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +andn %eax, %ebx, %ecx +andn (%rax), %ebx, %ecx + +andn %rax, %rbx, %rcx +andn (%rax), %rbx, %rcx + +bextr %eax, %ebx, %ecx +bextr %eax, (%rbx), %ecx + +bextr %rax, %rbx, %rcx +bextr %rax, (%rbx), %rcx + +blsi %eax, %ecx +blsi (%rax), %ecx + +blsi %rax, %rcx +blsi (%rax), %rcx + +blsmsk %eax, %ecx +blsmsk (%rax), %ecx + +blsmsk %rax, %rcx +blsmsk (%rax), %rcx + +blsr %eax, %ecx +blsr (%rax), %ecx + +blsr %rax, %rcx +blsr (%rax), %rcx + +tzcnt %eax, %ecx +tzcnt (%rax), %ecx + +tzcnt %rax, %rcx +tzcnt (%rax), %rcx + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 1 1 0.33 andnl %eax, %ebx, %ecx +# CHECK-NEXT: 2 6 0.50 * andnl (%rax), %ebx, %ecx +# CHECK-NEXT: 1 1 0.33 andnq %rax, %rbx, %rcx +# CHECK-NEXT: 2 6 0.50 * andnq (%rax), %rbx, %rcx +# CHECK-NEXT: 2 2 1.00 bextrl %eax, %ebx, %ecx +# CHECK-NEXT: 3 7 1.00 * bextrl %eax, (%rbx), %ecx +# CHECK-NEXT: 2 2 1.00 bextrq %rax, %rbx, %rcx +# CHECK-NEXT: 3 7 1.00 * bextrq %rax, (%rbx), %rcx +# CHECK-NEXT: 1 1 0.33 blsil %eax, %ecx +# CHECK-NEXT: 2 6 0.50 * blsil (%rax), %ecx +# CHECK-NEXT: 1 1 0.33 blsiq %rax, %rcx +# CHECK-NEXT: 2 6 0.50 * blsiq (%rax), %rcx +# CHECK-NEXT: 1 1 0.33 blsmskl %eax, %ecx +# CHECK-NEXT: 2 6 0.50 * blsmskl (%rax), %ecx +# CHECK-NEXT: 1 1 0.33 blsmskq %rax, %rcx +# CHECK-NEXT: 2 6 0.50 * blsmskq (%rax), %rcx +# CHECK-NEXT: 1 1 0.33 blsrl %eax, %ecx +# CHECK-NEXT: 2 6 0.50 * blsrl (%rax), %ecx +# CHECK-NEXT: 1 1 0.33 blsrq %rax, %rcx +# CHECK-NEXT: 2 6 0.50 * blsrq (%rax), %rcx +# CHECK-NEXT: 1 3 1.00 tzcntl %eax, %ecx +# CHECK-NEXT: 2 8 1.00 * tzcntl (%rax), %ecx +# CHECK-NEXT: 1 3 1.00 tzcntq %rax, %rcx +# CHECK-NEXT: 2 8 1.00 * tzcntq (%rax), %rcx + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - - 7.33 13.33 - 7.33 6.00 6.00 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - andnl %eax, %ebx, %ecx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 andnl (%rax), %ebx, %ecx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - andnq %rax, %rbx, %rcx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 andnq (%rax), %rbx, %rcx +# CHECK-NEXT: - - 0.50 1.00 - 0.50 - - bextrl %eax, %ebx, %ecx +# CHECK-NEXT: - - 0.50 1.00 - 0.50 0.50 0.50 bextrl %eax, (%rbx), %ecx +# CHECK-NEXT: - - 0.50 1.00 - 0.50 - - bextrq %rax, %rbx, %rcx +# CHECK-NEXT: - - 0.50 1.00 - 0.50 0.50 0.50 bextrq %rax, (%rbx), %rcx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - blsil %eax, %ecx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 blsil (%rax), %ecx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - blsiq %rax, %rcx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 blsiq (%rax), %rcx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - blsmskl %eax, %ecx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 blsmskl (%rax), %ecx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - blsmskq %rax, %rcx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 blsmskq (%rax), %rcx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - blsrl %eax, %ecx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 blsrl (%rax), %ecx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - blsrq %rax, %rcx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 blsrq (%rax), %rcx +# CHECK-NEXT: - - - 1.00 - - - - tzcntl %eax, %ecx +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 tzcntl (%rax), %ecx +# CHECK-NEXT: - - - 1.00 - - - - tzcntq %rax, %rcx +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 tzcntq (%rax), %rcx diff --git a/test/tools/llvm-mca/X86/Generic/resources-bmi2.s b/test/tools/llvm-mca/X86/Generic/resources-bmi2.s new file mode 100644 index 00000000000..1ba3cc339a4 --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-bmi2.s @@ -0,0 +1,141 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +bzhi %eax, %ebx, %ecx +bzhi %eax, (%rbx), %ecx + +bzhi %rax, %rbx, %rcx +bzhi %rax, (%rbx), %rcx + +mulx %eax, %ebx, %ecx +mulx (%rax), %ebx, %ecx + +mulx %rax, %rbx, %rcx +mulx (%rax), %rbx, %rcx + +pdep %eax, %ebx, %ecx +pdep (%rax), %ebx, %ecx + +pdep %rax, %rbx, %rcx +pdep (%rax), %rbx, %rcx + +pext %eax, %ebx, %ecx +pext (%rax), %ebx, %ecx + +pext %rax, %rbx, %rcx +pext (%rax), %rbx, %rcx + +rorx $1, %eax, %ecx +rorx $1, (%rax), %ecx + +rorx $1, %rax, %rcx +rorx $1, (%rax), %rcx + +sarx %eax, %ebx, %ecx +sarx %eax, (%rbx), %ecx + +sarx %rax, %rbx, %rcx +sarx %rax, (%rbx), %rcx + +shlx %eax, %ebx, %ecx +shlx %eax, (%rbx), %ecx + +shlx %rax, %rbx, %rcx +shlx %rax, (%rbx), %rcx + +shrx %eax, %ebx, %ecx +shrx %eax, (%rbx), %ecx + +shrx %rax, %rbx, %rcx +shrx %rax, (%rbx), %rcx + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 1 1 1.00 bzhil %eax, %ebx, %ecx +# CHECK-NEXT: 2 6 1.00 * bzhil %eax, (%rbx), %ecx +# CHECK-NEXT: 1 1 1.00 bzhiq %rax, %rbx, %rcx +# CHECK-NEXT: 2 6 1.00 * bzhiq %rax, (%rbx), %rcx +# CHECK-NEXT: 2 3 1.00 mulxl %eax, %ebx, %ecx +# CHECK-NEXT: 3 8 1.00 * mulxl (%rax), %ebx, %ecx +# CHECK-NEXT: 2 3 1.00 mulxq %rax, %rbx, %rcx +# CHECK-NEXT: 3 8 1.00 * mulxq (%rax), %rbx, %rcx +# CHECK-NEXT: 1 1 0.33 pdepl %eax, %ebx, %ecx +# CHECK-NEXT: 2 6 0.50 * pdepl (%rax), %ebx, %ecx +# CHECK-NEXT: 1 1 0.33 pdepq %rax, %rbx, %rcx +# CHECK-NEXT: 2 6 0.50 * pdepq (%rax), %rbx, %rcx +# CHECK-NEXT: 1 1 0.33 pextl %eax, %ebx, %ecx +# CHECK-NEXT: 2 6 0.50 * pextl (%rax), %ebx, %ecx +# CHECK-NEXT: 1 1 0.33 pextq %rax, %rbx, %rcx +# CHECK-NEXT: 2 6 0.50 * pextq (%rax), %rbx, %rcx +# CHECK-NEXT: 1 1 0.50 rorxl $1, %eax, %ecx +# CHECK-NEXT: 2 6 0.50 * rorxl $1, (%rax), %ecx +# CHECK-NEXT: 1 1 0.50 rorxq $1, %rax, %rcx +# CHECK-NEXT: 2 6 0.50 * rorxq $1, (%rax), %rcx +# CHECK-NEXT: 1 1 0.50 sarxl %eax, %ebx, %ecx +# CHECK-NEXT: 2 6 0.50 * sarxl %eax, (%rbx), %ecx +# CHECK-NEXT: 1 1 0.50 sarxq %rax, %rbx, %rcx +# CHECK-NEXT: 2 6 0.50 * sarxq %rax, (%rbx), %rcx +# CHECK-NEXT: 1 1 0.50 shlxl %eax, %ebx, %ecx +# CHECK-NEXT: 2 6 0.50 * shlxl %eax, (%rbx), %ecx +# CHECK-NEXT: 1 1 0.50 shlxq %rax, %rbx, %rcx +# CHECK-NEXT: 2 6 0.50 * shlxq %rax, (%rbx), %rcx +# CHECK-NEXT: 1 1 0.50 shrxl %eax, %ebx, %ecx +# CHECK-NEXT: 2 6 0.50 * shrxl %eax, (%rbx), %ecx +# CHECK-NEXT: 1 1 0.50 shrxq %rax, %rbx, %rcx +# CHECK-NEXT: 2 6 0.50 * shrxq %rax, (%rbx), %rcx + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - - 10.67 10.67 - 10.67 8.00 8.00 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - - 1.00 - - - - bzhil %eax, %ebx, %ecx +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 bzhil %eax, (%rbx), %ecx +# CHECK-NEXT: - - - 1.00 - - - - bzhiq %rax, %rbx, %rcx +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 bzhiq %rax, (%rbx), %rcx +# CHECK-NEXT: - - - 1.00 - - - - mulxl %eax, %ebx, %ecx +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 mulxl (%rax), %ebx, %ecx +# CHECK-NEXT: - - - 1.00 - - - - mulxq %rax, %rbx, %rcx +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 mulxq (%rax), %rbx, %rcx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - pdepl %eax, %ebx, %ecx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 pdepl (%rax), %ebx, %ecx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - pdepq %rax, %rbx, %rcx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 pdepq (%rax), %rbx, %rcx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - pextl %eax, %ebx, %ecx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 pextl (%rax), %ebx, %ecx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - pextq %rax, %rbx, %rcx +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 pextq (%rax), %rbx, %rcx +# CHECK-NEXT: - - 0.50 - - 0.50 - - rorxl $1, %eax, %ecx +# CHECK-NEXT: - - 0.50 - - 0.50 0.50 0.50 rorxl $1, (%rax), %ecx +# CHECK-NEXT: - - 0.50 - - 0.50 - - rorxq $1, %rax, %rcx +# CHECK-NEXT: - - 0.50 - - 0.50 0.50 0.50 rorxq $1, (%rax), %rcx +# CHECK-NEXT: - - 0.50 - - 0.50 - - sarxl %eax, %ebx, %ecx +# CHECK-NEXT: - - 0.50 - - 0.50 0.50 0.50 sarxl %eax, (%rbx), %ecx +# CHECK-NEXT: - - 0.50 - - 0.50 - - sarxq %rax, %rbx, %rcx +# CHECK-NEXT: - - 0.50 - - 0.50 0.50 0.50 sarxq %rax, (%rbx), %rcx +# CHECK-NEXT: - - 0.50 - - 0.50 - - shlxl %eax, %ebx, %ecx +# CHECK-NEXT: - - 0.50 - - 0.50 0.50 0.50 shlxl %eax, (%rbx), %ecx +# CHECK-NEXT: - - 0.50 - - 0.50 - - shlxq %rax, %rbx, %rcx +# CHECK-NEXT: - - 0.50 - - 0.50 0.50 0.50 shlxq %rax, (%rbx), %rcx +# CHECK-NEXT: - - 0.50 - - 0.50 - - shrxl %eax, %ebx, %ecx +# CHECK-NEXT: - - 0.50 - - 0.50 0.50 0.50 shrxl %eax, (%rbx), %ecx +# CHECK-NEXT: - - 0.50 - - 0.50 - - shrxq %rax, %rbx, %rcx +# CHECK-NEXT: - - 0.50 - - 0.50 0.50 0.50 shrxq %rax, (%rbx), %rcx diff --git a/test/tools/llvm-mca/X86/Generic/resources-cmov.s b/test/tools/llvm-mca/X86/Generic/resources-cmov.s new file mode 100644 index 00000000000..410ebf6d7d7 --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-cmov.s @@ -0,0 +1,323 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +cmovow %si, %di +cmovnow %si, %di +cmovbw %si, %di +cmovaew %si, %di +cmovew %si, %di +cmovnew %si, %di +cmovbew %si, %di +cmovaw %si, %di +cmovsw %si, %di +cmovnsw %si, %di +cmovpw %si, %di +cmovnpw %si, %di +cmovlw %si, %di +cmovgew %si, %di +cmovlew %si, %di +cmovgw %si, %di + +cmovow (%rax), %di +cmovnow (%rax), %di +cmovbw (%rax), %di +cmovaew (%rax), %di +cmovew (%rax), %di +cmovnew (%rax), %di +cmovbew (%rax), %di +cmovaw (%rax), %di +cmovsw (%rax), %di +cmovnsw (%rax), %di +cmovpw (%rax), %di +cmovnpw (%rax), %di +cmovlw (%rax), %di +cmovgew (%rax), %di +cmovlew (%rax), %di +cmovgw (%rax), %di + +cmovol %esi, %edi +cmovnol %esi, %edi +cmovbl %esi, %edi +cmovael %esi, %edi +cmovel %esi, %edi +cmovnel %esi, %edi +cmovbel %esi, %edi +cmoval %esi, %edi +cmovsl %esi, %edi +cmovnsl %esi, %edi +cmovpl %esi, %edi +cmovnpl %esi, %edi +cmovll %esi, %edi +cmovgel %esi, %edi +cmovlel %esi, %edi +cmovgl %esi, %edi + +cmovol (%rax), %edi +cmovnol (%rax), %edi +cmovbl (%rax), %edi +cmovael (%rax), %edi +cmovel (%rax), %edi +cmovnel (%rax), %edi +cmovbel (%rax), %edi +cmoval (%rax), %edi +cmovsl (%rax), %edi +cmovnsl (%rax), %edi +cmovpl (%rax), %edi +cmovnpl (%rax), %edi +cmovll (%rax), %edi +cmovgel (%rax), %edi +cmovlel (%rax), %edi +cmovgl (%rax), %edi + +cmovoq %rsi, %rdi +cmovnoq %rsi, %rdi +cmovbq %rsi, %rdi +cmovaeq %rsi, %rdi +cmoveq %rsi, %rdi +cmovneq %rsi, %rdi +cmovbeq %rsi, %rdi +cmovaq %rsi, %rdi +cmovsq %rsi, %rdi +cmovnsq %rsi, %rdi +cmovpq %rsi, %rdi +cmovnpq %rsi, %rdi +cmovlq %rsi, %rdi +cmovgeq %rsi, %rdi +cmovleq %rsi, %rdi +cmovgq %rsi, %rdi + +cmovoq (%rax), %rdi +cmovnoq (%rax), %rdi +cmovbq (%rax), %rdi +cmovaeq (%rax), %rdi +cmoveq (%rax), %rdi +cmovneq (%rax), %rdi +cmovbeq (%rax), %rdi +cmovaq (%rax), %rdi +cmovsq (%rax), %rdi +cmovnsq (%rax), %rdi +cmovpq (%rax), %rdi +cmovnpq (%rax), %rdi +cmovlq (%rax), %rdi +cmovgeq (%rax), %rdi +cmovleq (%rax), %rdi +cmovgq (%rax), %rdi + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 2 2 0.67 cmovow %si, %di +# CHECK-NEXT: 2 2 0.67 cmovnow %si, %di +# CHECK-NEXT: 2 2 0.67 cmovbw %si, %di +# CHECK-NEXT: 2 2 0.67 cmovaew %si, %di +# CHECK-NEXT: 2 2 0.67 cmovew %si, %di +# CHECK-NEXT: 2 2 0.67 cmovnew %si, %di +# CHECK-NEXT: 3 3 1.00 cmovbew %si, %di +# CHECK-NEXT: 3 3 1.00 cmovaw %si, %di +# CHECK-NEXT: 2 2 0.67 cmovsw %si, %di +# CHECK-NEXT: 2 2 0.67 cmovnsw %si, %di +# CHECK-NEXT: 2 2 0.67 cmovpw %si, %di +# CHECK-NEXT: 2 2 0.67 cmovnpw %si, %di +# CHECK-NEXT: 2 2 0.67 cmovlw %si, %di +# CHECK-NEXT: 2 2 0.67 cmovgew %si, %di +# CHECK-NEXT: 2 2 0.67 cmovlew %si, %di +# CHECK-NEXT: 2 2 0.67 cmovgw %si, %di +# CHECK-NEXT: 3 7 0.67 * cmovow (%rax), %di +# CHECK-NEXT: 3 7 0.67 * cmovnow (%rax), %di +# CHECK-NEXT: 3 7 0.67 * cmovbw (%rax), %di +# CHECK-NEXT: 3 7 0.67 * cmovaew (%rax), %di +# CHECK-NEXT: 3 7 0.67 * cmovew (%rax), %di +# CHECK-NEXT: 3 7 0.67 * cmovnew (%rax), %di +# CHECK-NEXT: 4 8 1.00 * cmovbew (%rax), %di +# CHECK-NEXT: 4 8 1.00 * cmovaw (%rax), %di +# CHECK-NEXT: 3 7 0.67 * cmovsw (%rax), %di +# CHECK-NEXT: 3 7 0.67 * cmovnsw (%rax), %di +# CHECK-NEXT: 3 7 0.67 * cmovpw (%rax), %di +# CHECK-NEXT: 3 7 0.67 * cmovnpw (%rax), %di +# CHECK-NEXT: 3 7 0.67 * cmovlw (%rax), %di +# CHECK-NEXT: 3 7 0.67 * cmovgew (%rax), %di +# CHECK-NEXT: 3 7 0.67 * cmovlew (%rax), %di +# CHECK-NEXT: 3 7 0.67 * cmovgw (%rax), %di +# CHECK-NEXT: 2 2 0.67 cmovol %esi, %edi +# CHECK-NEXT: 2 2 0.67 cmovnol %esi, %edi +# CHECK-NEXT: 2 2 0.67 cmovbl %esi, %edi +# CHECK-NEXT: 2 2 0.67 cmovael %esi, %edi +# CHECK-NEXT: 2 2 0.67 cmovel %esi, %edi +# CHECK-NEXT: 2 2 0.67 cmovnel %esi, %edi +# CHECK-NEXT: 3 3 1.00 cmovbel %esi, %edi +# CHECK-NEXT: 3 3 1.00 cmoval %esi, %edi +# CHECK-NEXT: 2 2 0.67 cmovsl %esi, %edi +# CHECK-NEXT: 2 2 0.67 cmovnsl %esi, %edi +# CHECK-NEXT: 2 2 0.67 cmovpl %esi, %edi +# CHECK-NEXT: 2 2 0.67 cmovnpl %esi, %edi +# CHECK-NEXT: 2 2 0.67 cmovll %esi, %edi +# CHECK-NEXT: 2 2 0.67 cmovgel %esi, %edi +# CHECK-NEXT: 2 2 0.67 cmovlel %esi, %edi +# CHECK-NEXT: 2 2 0.67 cmovgl %esi, %edi +# CHECK-NEXT: 3 7 0.67 * cmovol (%rax), %edi +# CHECK-NEXT: 3 7 0.67 * cmovnol (%rax), %edi +# CHECK-NEXT: 3 7 0.67 * cmovbl (%rax), %edi +# CHECK-NEXT: 3 7 0.67 * cmovael (%rax), %edi +# CHECK-NEXT: 3 7 0.67 * cmovel (%rax), %edi +# CHECK-NEXT: 3 7 0.67 * cmovnel (%rax), %edi +# CHECK-NEXT: 4 8 1.00 * cmovbel (%rax), %edi +# CHECK-NEXT: 4 8 1.00 * cmoval (%rax), %edi +# CHECK-NEXT: 3 7 0.67 * cmovsl (%rax), %edi +# CHECK-NEXT: 3 7 0.67 * cmovnsl (%rax), %edi +# CHECK-NEXT: 3 7 0.67 * cmovpl (%rax), %edi +# CHECK-NEXT: 3 7 0.67 * cmovnpl (%rax), %edi +# CHECK-NEXT: 3 7 0.67 * cmovll (%rax), %edi +# CHECK-NEXT: 3 7 0.67 * cmovgel (%rax), %edi +# CHECK-NEXT: 3 7 0.67 * cmovlel (%rax), %edi +# CHECK-NEXT: 3 7 0.67 * cmovgl (%rax), %edi +# CHECK-NEXT: 2 2 0.67 cmovoq %rsi, %rdi +# CHECK-NEXT: 2 2 0.67 cmovnoq %rsi, %rdi +# CHECK-NEXT: 2 2 0.67 cmovbq %rsi, %rdi +# CHECK-NEXT: 2 2 0.67 cmovaeq %rsi, %rdi +# CHECK-NEXT: 2 2 0.67 cmoveq %rsi, %rdi +# CHECK-NEXT: 2 2 0.67 cmovneq %rsi, %rdi +# CHECK-NEXT: 3 3 1.00 cmovbeq %rsi, %rdi +# CHECK-NEXT: 3 3 1.00 cmovaq %rsi, %rdi +# CHECK-NEXT: 2 2 0.67 cmovsq %rsi, %rdi +# CHECK-NEXT: 2 2 0.67 cmovnsq %rsi, %rdi +# CHECK-NEXT: 2 2 0.67 cmovpq %rsi, %rdi +# CHECK-NEXT: 2 2 0.67 cmovnpq %rsi, %rdi +# CHECK-NEXT: 2 2 0.67 cmovlq %rsi, %rdi +# CHECK-NEXT: 2 2 0.67 cmovgeq %rsi, %rdi +# CHECK-NEXT: 2 2 0.67 cmovleq %rsi, %rdi +# CHECK-NEXT: 2 2 0.67 cmovgq %rsi, %rdi +# CHECK-NEXT: 3 7 0.67 * cmovoq (%rax), %rdi +# CHECK-NEXT: 3 7 0.67 * cmovnoq (%rax), %rdi +# CHECK-NEXT: 3 7 0.67 * cmovbq (%rax), %rdi +# CHECK-NEXT: 3 7 0.67 * cmovaeq (%rax), %rdi +# CHECK-NEXT: 3 7 0.67 * cmoveq (%rax), %rdi +# CHECK-NEXT: 3 7 0.67 * cmovneq (%rax), %rdi +# CHECK-NEXT: 4 8 1.00 * cmovbeq (%rax), %rdi +# CHECK-NEXT: 4 8 1.00 * cmovaq (%rax), %rdi +# CHECK-NEXT: 3 7 0.67 * cmovsq (%rax), %rdi +# CHECK-NEXT: 3 7 0.67 * cmovnsq (%rax), %rdi +# CHECK-NEXT: 3 7 0.67 * cmovpq (%rax), %rdi +# CHECK-NEXT: 3 7 0.67 * cmovnpq (%rax), %rdi +# CHECK-NEXT: 3 7 0.67 * cmovlq (%rax), %rdi +# CHECK-NEXT: 3 7 0.67 * cmovgeq (%rax), %rdi +# CHECK-NEXT: 3 7 0.67 * cmovleq (%rax), %rdi +# CHECK-NEXT: 3 7 0.67 * cmovgq (%rax), %rdi + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - - 86.00 32.00 - 86.00 24.00 24.00 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovow %si, %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovnow %si, %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovbw %si, %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovaew %si, %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovew %si, %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovnew %si, %di +# CHECK-NEXT: - - 1.33 0.33 - 1.33 - - cmovbew %si, %di +# CHECK-NEXT: - - 1.33 0.33 - 1.33 - - cmovaw %si, %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovsw %si, %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovnsw %si, %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovpw %si, %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovnpw %si, %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovlw %si, %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovgew %si, %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovlew %si, %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovgw %si, %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovow (%rax), %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovnow (%rax), %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovbw (%rax), %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovaew (%rax), %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovew (%rax), %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovnew (%rax), %di +# CHECK-NEXT: - - 1.33 0.33 - 1.33 0.50 0.50 cmovbew (%rax), %di +# CHECK-NEXT: - - 1.33 0.33 - 1.33 0.50 0.50 cmovaw (%rax), %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovsw (%rax), %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovnsw (%rax), %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovpw (%rax), %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovnpw (%rax), %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovlw (%rax), %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovgew (%rax), %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovlew (%rax), %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovgw (%rax), %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovol %esi, %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovnol %esi, %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovbl %esi, %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovael %esi, %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovel %esi, %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovnel %esi, %edi +# CHECK-NEXT: - - 1.33 0.33 - 1.33 - - cmovbel %esi, %edi +# CHECK-NEXT: - - 1.33 0.33 - 1.33 - - cmoval %esi, %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovsl %esi, %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovnsl %esi, %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovpl %esi, %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovnpl %esi, %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovll %esi, %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovgel %esi, %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovlel %esi, %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovgl %esi, %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovol (%rax), %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovnol (%rax), %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovbl (%rax), %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovael (%rax), %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovel (%rax), %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovnel (%rax), %edi +# CHECK-NEXT: - - 1.33 0.33 - 1.33 0.50 0.50 cmovbel (%rax), %edi +# CHECK-NEXT: - - 1.33 0.33 - 1.33 0.50 0.50 cmoval (%rax), %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovsl (%rax), %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovnsl (%rax), %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovpl (%rax), %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovnpl (%rax), %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovll (%rax), %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovgel (%rax), %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovlel (%rax), %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovgl (%rax), %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovoq %rsi, %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovnoq %rsi, %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovbq %rsi, %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovaeq %rsi, %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmoveq %rsi, %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovneq %rsi, %rdi +# CHECK-NEXT: - - 1.33 0.33 - 1.33 - - cmovbeq %rsi, %rdi +# CHECK-NEXT: - - 1.33 0.33 - 1.33 - - cmovaq %rsi, %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovsq %rsi, %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovnsq %rsi, %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovpq %rsi, %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovnpq %rsi, %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovlq %rsi, %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovgeq %rsi, %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovleq %rsi, %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - cmovgq %rsi, %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovoq (%rax), %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovnoq (%rax), %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovbq (%rax), %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovaeq (%rax), %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmoveq (%rax), %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovneq (%rax), %rdi +# CHECK-NEXT: - - 1.33 0.33 - 1.33 0.50 0.50 cmovbeq (%rax), %rdi +# CHECK-NEXT: - - 1.33 0.33 - 1.33 0.50 0.50 cmovaq (%rax), %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovsq (%rax), %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovnsq (%rax), %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovpq (%rax), %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovnpq (%rax), %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovlq (%rax), %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovgeq (%rax), %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovleq (%rax), %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 cmovgq (%rax), %rdi diff --git a/test/tools/llvm-mca/X86/Generic/resources-f16c.s b/test/tools/llvm-mca/X86/Generic/resources-f16c.s new file mode 100644 index 00000000000..3353fcd3e75 --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-f16c.s @@ -0,0 +1,57 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +vcvtph2ps %xmm0, %xmm2 +vcvtph2ps (%rax), %xmm2 + +vcvtph2ps %xmm0, %ymm2 +vcvtph2ps (%rax), %ymm2 + +vcvtps2ph $0, %xmm0, %xmm2 +vcvtps2ph $0, %xmm0, (%rax) + +vcvtps2ph $0, %ymm0, %xmm2 +vcvtps2ph $0, %ymm0, (%rax) + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 1 3 1.00 vcvtph2ps %xmm0, %xmm2 +# CHECK-NEXT: 2 8 1.00 * vcvtph2ps (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 vcvtph2ps %xmm0, %ymm2 +# CHECK-NEXT: 2 8 1.00 * vcvtph2ps (%rax), %ymm2 +# CHECK-NEXT: 1 3 1.00 vcvtps2ph $0, %xmm0, %xmm2 +# CHECK-NEXT: 1 4 1.00 * vcvtps2ph $0, %xmm0, (%rax) +# CHECK-NEXT: 1 3 1.00 vcvtps2ph $0, %ymm0, %xmm2 +# CHECK-NEXT: 1 4 1.00 * vcvtps2ph $0, %ymm0, (%rax) + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - - - 8.00 2.00 - 2.00 2.00 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - - 1.00 - - - - vcvtph2ps %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vcvtph2ps (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - vcvtph2ps %xmm0, %ymm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 vcvtph2ps (%rax), %ymm2 +# CHECK-NEXT: - - - 1.00 - - - - vcvtps2ph $0, %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 1.00 - 0.50 0.50 vcvtps2ph $0, %xmm0, (%rax) +# CHECK-NEXT: - - - 1.00 - - - - vcvtps2ph $0, %ymm0, %xmm2 +# CHECK-NEXT: - - - 1.00 1.00 - 0.50 0.50 vcvtps2ph $0, %ymm0, (%rax) diff --git a/test/tools/llvm-mca/X86/Generic/resources-fma.s b/test/tools/llvm-mca/X86/Generic/resources-fma.s new file mode 100644 index 00000000000..4521448bbaf --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-fma.s @@ -0,0 +1,701 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +vfmadd132pd %xmm0, %xmm1, %xmm2 +vfmadd132pd (%rax), %xmm1, %xmm2 + +vfmadd132pd %ymm0, %ymm1, %ymm2 +vfmadd132pd (%rax), %ymm1, %ymm2 + +vfmadd213pd %xmm0, %xmm1, %xmm2 +vfmadd213pd (%rax), %xmm1, %xmm2 + +vfmadd213pd %ymm0, %ymm1, %ymm2 +vfmadd213pd (%rax), %ymm1, %ymm2 + +vfmadd231pd %xmm0, %xmm1, %xmm2 +vfmadd231pd (%rax), %xmm1, %xmm2 + +vfmadd231pd %ymm0, %ymm1, %ymm2 +vfmadd231pd (%rax), %ymm1, %ymm2 + +vfmadd132ps %xmm0, %xmm1, %xmm2 +vfmadd132ps (%rax), %xmm1, %xmm2 + +vfmadd132ps %ymm0, %ymm1, %ymm2 +vfmadd132ps (%rax), %ymm1, %ymm2 + +vfmadd213ps %xmm0, %xmm1, %xmm2 +vfmadd213ps (%rax), %xmm1, %xmm2 + +vfmadd213ps %ymm0, %ymm1, %ymm2 +vfmadd213ps (%rax), %ymm1, %ymm2 + +vfmadd231ps %xmm0, %xmm1, %xmm2 +vfmadd231ps (%rax), %xmm1, %xmm2 + +vfmadd231ps %ymm0, %ymm1, %ymm2 +vfmadd231ps (%rax), %ymm1, %ymm2 + +vfmadd132sd %xmm0, %xmm1, %xmm2 +vfmadd132sd (%rax), %xmm1, %xmm2 + +vfmadd213sd %xmm0, %xmm1, %xmm2 +vfmadd213sd (%rax), %xmm1, %xmm2 + +vfmadd231sd %xmm0, %xmm1, %xmm2 +vfmadd231sd (%rax), %xmm1, %xmm2 + +vfmadd132ss %xmm0, %xmm1, %xmm2 +vfmadd132ss (%rax), %xmm1, %xmm2 + +vfmadd213ss %xmm0, %xmm1, %xmm2 +vfmadd213ss (%rax), %xmm1, %xmm2 + +vfmadd231ss %xmm0, %xmm1, %xmm2 +vfmadd231ss (%rax), %xmm1, %xmm2 + +vfmaddsub132pd %xmm0, %xmm1, %xmm2 +vfmaddsub132pd (%rax), %xmm1, %xmm2 + +vfmaddsub132pd %ymm0, %ymm1, %ymm2 +vfmaddsub132pd (%rax), %ymm1, %ymm2 + +vfmaddsub213pd %xmm0, %xmm1, %xmm2 +vfmaddsub213pd (%rax), %xmm1, %xmm2 + +vfmaddsub213pd %ymm0, %ymm1, %ymm2 +vfmaddsub213pd (%rax), %ymm1, %ymm2 + +vfmaddsub231pd %xmm0, %xmm1, %xmm2 +vfmaddsub231pd (%rax), %xmm1, %xmm2 + +vfmaddsub231pd %ymm0, %ymm1, %ymm2 +vfmaddsub231pd (%rax), %ymm1, %ymm2 + +vfmaddsub132ps %xmm0, %xmm1, %xmm2 +vfmaddsub132ps (%rax), %xmm1, %xmm2 + +vfmaddsub132ps %ymm0, %ymm1, %ymm2 +vfmaddsub132ps (%rax), %ymm1, %ymm2 + +vfmaddsub213ps %xmm0, %xmm1, %xmm2 +vfmaddsub213ps (%rax), %xmm1, %xmm2 + +vfmaddsub213ps %ymm0, %ymm1, %ymm2 +vfmaddsub213ps (%rax), %ymm1, %ymm2 + +vfmaddsub231ps %xmm0, %xmm1, %xmm2 +vfmaddsub231ps (%rax), %xmm1, %xmm2 + +vfmaddsub231ps %ymm0, %ymm1, %ymm2 +vfmaddsub231ps (%rax), %ymm1, %ymm2 + +vfmsub132pd %xmm0, %xmm1, %xmm2 +vfmsub132pd (%rax), %xmm1, %xmm2 + +vfmsub132pd %ymm0, %ymm1, %ymm2 +vfmsub132pd (%rax), %ymm1, %ymm2 + +vfmsub213pd %xmm0, %xmm1, %xmm2 +vfmsub213pd (%rax), %xmm1, %xmm2 + +vfmsub213pd %ymm0, %ymm1, %ymm2 +vfmsub213pd (%rax), %ymm1, %ymm2 + +vfmsub231pd %xmm0, %xmm1, %xmm2 +vfmsub231pd (%rax), %xmm1, %xmm2 + +vfmsub231pd %ymm0, %ymm1, %ymm2 +vfmsub231pd (%rax), %ymm1, %ymm2 + +vfmsub132ps %xmm0, %xmm1, %xmm2 +vfmsub132ps (%rax), %xmm1, %xmm2 + +vfmsub132ps %ymm0, %ymm1, %ymm2 +vfmsub132ps (%rax), %ymm1, %ymm2 + +vfmsub213ps %xmm0, %xmm1, %xmm2 +vfmsub213ps (%rax), %xmm1, %xmm2 + +vfmsub213ps %ymm0, %ymm1, %ymm2 +vfmsub213ps (%rax), %ymm1, %ymm2 + +vfmsub231ps %xmm0, %xmm1, %xmm2 +vfmsub231ps (%rax), %xmm1, %xmm2 + +vfmsub231ps %ymm0, %ymm1, %ymm2 +vfmsub231ps (%rax), %ymm1, %ymm2 + +vfmsub132sd %xmm0, %xmm1, %xmm2 +vfmsub132sd (%rax), %xmm1, %xmm2 + +vfmsub213sd %xmm0, %xmm1, %xmm2 +vfmsub213sd (%rax), %xmm1, %xmm2 + +vfmsub231sd %xmm0, %xmm1, %xmm2 +vfmsub231sd (%rax), %xmm1, %xmm2 + +vfmsub132ss %xmm0, %xmm1, %xmm2 +vfmsub132ss (%rax), %xmm1, %xmm2 + +vfmsub213ss %xmm0, %xmm1, %xmm2 +vfmsub213ss (%rax), %xmm1, %xmm2 + +vfmsub231ss %xmm0, %xmm1, %xmm2 +vfmsub231ss (%rax), %xmm1, %xmm2 + +vfmsubadd132pd %xmm0, %xmm1, %xmm2 +vfmsubadd132pd (%rax), %xmm1, %xmm2 + +vfmsubadd132pd %ymm0, %ymm1, %ymm2 +vfmsubadd132pd (%rax), %ymm1, %ymm2 + +vfmsubadd213pd %xmm0, %xmm1, %xmm2 +vfmsubadd213pd (%rax), %xmm1, %xmm2 + +vfmsubadd213pd %ymm0, %ymm1, %ymm2 +vfmsubadd213pd (%rax), %ymm1, %ymm2 + +vfmsubadd231pd %xmm0, %xmm1, %xmm2 +vfmsubadd231pd (%rax), %xmm1, %xmm2 + +vfmsubadd231pd %ymm0, %ymm1, %ymm2 +vfmsubadd231pd (%rax), %ymm1, %ymm2 + +vfmsubadd132ps %xmm0, %xmm1, %xmm2 +vfmsubadd132ps (%rax), %xmm1, %xmm2 + +vfmsubadd132ps %ymm0, %ymm1, %ymm2 +vfmsubadd132ps (%rax), %ymm1, %ymm2 + +vfmsubadd213ps %xmm0, %xmm1, %xmm2 +vfmsubadd213ps (%rax), %xmm1, %xmm2 + +vfmsubadd213ps %ymm0, %ymm1, %ymm2 +vfmsubadd213ps (%rax), %ymm1, %ymm2 + +vfmsubadd231ps %xmm0, %xmm1, %xmm2 +vfmsubadd231ps (%rax), %xmm1, %xmm2 + +vfmsubadd231ps %ymm0, %ymm1, %ymm2 +vfmsubadd231ps (%rax), %ymm1, %ymm2 + +vfnmadd132pd %xmm0, %xmm1, %xmm2 +vfnmadd132pd (%rax), %xmm1, %xmm2 + +vfnmadd132pd %ymm0, %ymm1, %ymm2 +vfnmadd132pd (%rax), %ymm1, %ymm2 + +vfnmadd213pd %xmm0, %xmm1, %xmm2 +vfnmadd213pd (%rax), %xmm1, %xmm2 + +vfnmadd213pd %ymm0, %ymm1, %ymm2 +vfnmadd213pd (%rax), %ymm1, %ymm2 + +vfnmadd231pd %xmm0, %xmm1, %xmm2 +vfnmadd231pd (%rax), %xmm1, %xmm2 + +vfnmadd231pd %ymm0, %ymm1, %ymm2 +vfnmadd231pd (%rax), %ymm1, %ymm2 + +vfnmadd132ps %xmm0, %xmm1, %xmm2 +vfnmadd132ps (%rax), %xmm1, %xmm2 + +vfnmadd132ps %ymm0, %ymm1, %ymm2 +vfnmadd132ps (%rax), %ymm1, %ymm2 + +vfnmadd213ps %xmm0, %xmm1, %xmm2 +vfnmadd213ps (%rax), %xmm1, %xmm2 + +vfnmadd213ps %ymm0, %ymm1, %ymm2 +vfnmadd213ps (%rax), %ymm1, %ymm2 + +vfnmadd231ps %xmm0, %xmm1, %xmm2 +vfnmadd231ps (%rax), %xmm1, %xmm2 + +vfnmadd231ps %ymm0, %ymm1, %ymm2 +vfnmadd231ps (%rax), %ymm1, %ymm2 + +vfnmadd132sd %xmm0, %xmm1, %xmm2 +vfnmadd132sd (%rax), %xmm1, %xmm2 + +vfnmadd213sd %xmm0, %xmm1, %xmm2 +vfnmadd213sd (%rax), %xmm1, %xmm2 + +vfnmadd231sd %xmm0, %xmm1, %xmm2 +vfnmadd231sd (%rax), %xmm1, %xmm2 + +vfnmadd132ss %xmm0, %xmm1, %xmm2 +vfnmadd132ss (%rax), %xmm1, %xmm2 + +vfnmadd213ss %xmm0, %xmm1, %xmm2 +vfnmadd213ss (%rax), %xmm1, %xmm2 + +vfnmadd231ss %xmm0, %xmm1, %xmm2 +vfnmadd231ss (%rax), %xmm1, %xmm2 + +vfnmsub132pd %xmm0, %xmm1, %xmm2 +vfnmsub132pd (%rax), %xmm1, %xmm2 + +vfnmsub132pd %ymm0, %ymm1, %ymm2 +vfnmsub132pd (%rax), %ymm1, %ymm2 + +vfnmsub213pd %xmm0, %xmm1, %xmm2 +vfnmsub213pd (%rax), %xmm1, %xmm2 + +vfnmsub213pd %ymm0, %ymm1, %ymm2 +vfnmsub213pd (%rax), %ymm1, %ymm2 + +vfnmsub231pd %xmm0, %xmm1, %xmm2 +vfnmsub231pd (%rax), %xmm1, %xmm2 + +vfnmsub231pd %ymm0, %ymm1, %ymm2 +vfnmsub231pd (%rax), %ymm1, %ymm2 + +vfnmsub132ps %xmm0, %xmm1, %xmm2 +vfnmsub132ps (%rax), %xmm1, %xmm2 + +vfnmsub132ps %ymm0, %ymm1, %ymm2 +vfnmsub132ps (%rax), %ymm1, %ymm2 + +vfnmsub213ps %xmm0, %xmm1, %xmm2 +vfnmsub213ps (%rax), %xmm1, %xmm2 + +vfnmsub213ps %ymm0, %ymm1, %ymm2 +vfnmsub213ps (%rax), %ymm1, %ymm2 + +vfnmsub231ps %xmm0, %xmm1, %xmm2 +vfnmsub231ps (%rax), %xmm1, %xmm2 + +vfnmsub231ps %ymm0, %ymm1, %ymm2 +vfnmsub231ps (%rax), %ymm1, %ymm2 + +vfnmsub132sd %xmm0, %xmm1, %xmm2 +vfnmsub132sd (%rax), %xmm1, %xmm2 + +vfnmsub213sd %xmm0, %xmm1, %xmm2 +vfnmsub213sd (%rax), %xmm1, %xmm2 + +vfnmsub231sd %xmm0, %xmm1, %xmm2 +vfnmsub231sd (%rax), %xmm1, %xmm2 + +vfnmsub132ss %xmm0, %xmm1, %xmm2 +vfnmsub132ss (%rax), %xmm1, %xmm2 + +vfnmsub213ss %xmm0, %xmm1, %xmm2 +vfnmsub213ss (%rax), %xmm1, %xmm2 + +vfnmsub231ss %xmm0, %xmm1, %xmm2 +vfnmsub231ss (%rax), %xmm1, %xmm2 + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 1 5 0.50 vfmadd132pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmadd132pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmadd132pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmadd132pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmadd213pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmadd213pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmadd213pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmadd213pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmadd231pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmadd231pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmadd231pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmadd231pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmadd132ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmadd132ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmadd132ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmadd132ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmadd213ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmadd213ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmadd213ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmadd213ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmadd231ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmadd231ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmadd231ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmadd231ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmadd132sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmadd132sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmadd213sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmadd213sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmadd231sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmadd231sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmadd132ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmadd132ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmadd213ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmadd213ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmadd231ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmadd231ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmaddsub132pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmaddsub132pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmaddsub132pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmaddsub132pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmaddsub213pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmaddsub213pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmaddsub213pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmaddsub213pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmaddsub231pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmaddsub231pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmaddsub231pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmaddsub231pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmaddsub132ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmaddsub132ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmaddsub132ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmaddsub132ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmaddsub213ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmaddsub213ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmaddsub213ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmaddsub213ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmaddsub231ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmaddsub231ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmaddsub231ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmaddsub231ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmsub132pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmsub132pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmsub132pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmsub132pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmsub213pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmsub213pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmsub213pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmsub213pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmsub231pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmsub231pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmsub231pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmsub231pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmsub132ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmsub132ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmsub132ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmsub132ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmsub213ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmsub213ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmsub213ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmsub213ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmsub231ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmsub231ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmsub231ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmsub231ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmsub132sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmsub132sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmsub213sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmsub213sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmsub231sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmsub231sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmsub132ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmsub132ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmsub213ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmsub213ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmsub231ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmsub231ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmsubadd132pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmsubadd132pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmsubadd132pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmsubadd132pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmsubadd213pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmsubadd213pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmsubadd213pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmsubadd213pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmsubadd231pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmsubadd231pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmsubadd231pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmsubadd231pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmsubadd132ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmsubadd132ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmsubadd132ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmsubadd132ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmsubadd213ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmsubadd213ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmsubadd213ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmsubadd213ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfmsubadd231ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfmsubadd231ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfmsubadd231ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfmsubadd231ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfnmadd132pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmadd132pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmadd132pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfnmadd132pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfnmadd213pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmadd213pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmadd213pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfnmadd213pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfnmadd231pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmadd231pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmadd231pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfnmadd231pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfnmadd132ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmadd132ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmadd132ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfnmadd132ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfnmadd213ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmadd213ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmadd213ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfnmadd213ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfnmadd231ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmadd231ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmadd231ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfnmadd231ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfnmadd132sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmadd132sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmadd213sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmadd213sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmadd231sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmadd231sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmadd132ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmadd132ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmadd213ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmadd213ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmadd231ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmadd231ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmsub132pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmsub132pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmsub132pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfnmsub132pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfnmsub213pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmsub213pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmsub213pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfnmsub213pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfnmsub231pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmsub231pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmsub231pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfnmsub231pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfnmsub132ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmsub132ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmsub132ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfnmsub132ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfnmsub213ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmsub213ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmsub213ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfnmsub213ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfnmsub231ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmsub231ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmsub231ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: 2 10 0.50 * vfnmsub231ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: 1 5 0.50 vfnmsub132sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmsub132sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmsub213sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmsub213sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmsub231sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmsub231sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmsub132ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmsub132ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmsub213ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmsub213ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: 1 5 0.50 vfnmsub231ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: 2 10 0.50 * vfnmsub231ss (%rax), %xmm1, %xmm2 + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - - 96.00 96.00 - - 48.00 48.00 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmadd132pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmadd132pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmadd132pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmadd132pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmadd213pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmadd213pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmadd213pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmadd213pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmadd231pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmadd231pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmadd231pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmadd231pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmadd132ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmadd132ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmadd132ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmadd132ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmadd213ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmadd213ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmadd213ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmadd213ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmadd231ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmadd231ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmadd231ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmadd231ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmadd132sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmadd132sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmadd213sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmadd213sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmadd231sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmadd231sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmadd132ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmadd132ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmadd213ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmadd213ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmadd231ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmadd231ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmaddsub132pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmaddsub132pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmaddsub132pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmaddsub132pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmaddsub213pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmaddsub213pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmaddsub213pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmaddsub213pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmaddsub231pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmaddsub231pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmaddsub231pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmaddsub231pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmaddsub132ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmaddsub132ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmaddsub132ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmaddsub132ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmaddsub213ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmaddsub213ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmaddsub213ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmaddsub213ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmaddsub231ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmaddsub231ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmaddsub231ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmaddsub231ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsub132pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsub132pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsub132pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsub132pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsub213pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsub213pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsub213pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsub213pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsub231pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsub231pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsub231pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsub231pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsub132ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsub132ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsub132ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsub132ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsub213ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsub213ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsub213ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsub213ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsub231ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsub231ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsub231ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsub231ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsub132sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsub132sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsub213sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsub213sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsub231sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsub231sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsub132ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsub132ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsub213ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsub213ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsub231ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsub231ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsubadd132pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsubadd132pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsubadd132pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsubadd132pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsubadd213pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsubadd213pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsubadd213pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsubadd213pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsubadd231pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsubadd231pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsubadd231pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsubadd231pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsubadd132ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsubadd132ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsubadd132ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsubadd132ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsubadd213ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsubadd213ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsubadd213ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsubadd213ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsubadd231ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsubadd231ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfmsubadd231ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfmsubadd231ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmadd132pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmadd132pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmadd132pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmadd132pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmadd213pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmadd213pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmadd213pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmadd213pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmadd231pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmadd231pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmadd231pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmadd231pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmadd132ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmadd132ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmadd132ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmadd132ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmadd213ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmadd213ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmadd213ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmadd213ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmadd231ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmadd231ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmadd231ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmadd231ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmadd132sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmadd132sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmadd213sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmadd213sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmadd231sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmadd231sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmadd132ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmadd132ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmadd213ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmadd213ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmadd231ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmadd231ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmsub132pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmsub132pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmsub132pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmsub132pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmsub213pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmsub213pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmsub213pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmsub213pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmsub231pd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmsub231pd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmsub231pd %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmsub231pd (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmsub132ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmsub132ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmsub132ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmsub132ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmsub213ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmsub213ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmsub213ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmsub213ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmsub231ps %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmsub231ps (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmsub231ps %ymm0, %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmsub231ps (%rax), %ymm1, %ymm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmsub132sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmsub132sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmsub213sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmsub213sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmsub231sd %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmsub231sd (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmsub132ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmsub132ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmsub213ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmsub213ss (%rax), %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - - - vfnmsub231ss %xmm0, %xmm1, %xmm2 +# CHECK-NEXT: - - 0.50 0.50 - - 0.50 0.50 vfnmsub231ss (%rax), %xmm1, %xmm2 diff --git a/test/tools/llvm-mca/X86/Generic/resources-lzcnt.s b/test/tools/llvm-mca/X86/Generic/resources-lzcnt.s new file mode 100644 index 00000000000..98d97e6e1cd --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-lzcnt.s @@ -0,0 +1,50 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +lzcntw %cx, %cx +lzcntw (%rax), %cx + +lzcntl %eax, %ecx +lzcntl (%rax), %ecx + +lzcntq %rax, %rcx +lzcntq (%rax), %rcx + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 1 3 1.00 lzcntw %cx, %cx +# CHECK-NEXT: 2 8 1.00 * lzcntw (%rax), %cx +# CHECK-NEXT: 1 3 1.00 lzcntl %eax, %ecx +# CHECK-NEXT: 2 8 1.00 * lzcntl (%rax), %ecx +# CHECK-NEXT: 1 3 1.00 lzcntq %rax, %rcx +# CHECK-NEXT: 2 8 1.00 * lzcntq (%rax), %rcx + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - - - 6.00 - - 1.50 1.50 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - - 1.00 - - - - lzcntw %cx, %cx +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 lzcntw (%rax), %cx +# CHECK-NEXT: - - - 1.00 - - - - lzcntl %eax, %ecx +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 lzcntl (%rax), %ecx +# CHECK-NEXT: - - - 1.00 - - - - lzcntq %rax, %rcx +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 lzcntq (%rax), %rcx diff --git a/test/tools/llvm-mca/X86/Generic/resources-mmx.s b/test/tools/llvm-mca/X86/Generic/resources-mmx.s new file mode 100644 index 00000000000..a536047ea1a --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-mmx.s @@ -0,0 +1,393 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +emms + +movd %eax, %mm2 +movd (%rax), %mm2 + +movd %mm0, %ecx +movd %mm0, (%rax) + +movq %rax, %mm2 +movq (%rax), %mm2 + +movq %mm0, %rcx +movq %mm0, (%rax) + +packsswb %mm0, %mm2 +packsswb (%rax), %mm2 + +packssdw %mm0, %mm2 +packssdw (%rax), %mm2 + +packuswb %mm0, %mm2 +packuswb (%rax), %mm2 + +paddb %mm0, %mm2 +paddb (%rax), %mm2 + +paddd %mm0, %mm2 +paddd (%rax), %mm2 + +paddsb %mm0, %mm2 +paddsb (%rax), %mm2 + +paddsw %mm0, %mm2 +paddsw (%rax), %mm2 + +paddusb %mm0, %mm2 +paddusb (%rax), %mm2 + +paddusw %mm0, %mm2 +paddusw (%rax), %mm2 + +paddw %mm0, %mm2 +paddw (%rax), %mm2 + +pand %mm0, %mm2 +pand (%rax), %mm2 + +pandn %mm0, %mm2 +pandn (%rax), %mm2 + +pcmpeqb %mm0, %mm2 +pcmpeqb (%rax), %mm2 + +pcmpeqd %mm0, %mm2 +pcmpeqd (%rax), %mm2 + +pcmpeqw %mm0, %mm2 +pcmpeqw (%rax), %mm2 + +pcmpgtb %mm0, %mm2 +pcmpgtb (%rax), %mm2 + +pcmpgtd %mm0, %mm2 +pcmpgtd (%rax), %mm2 + +pcmpgtw %mm0, %mm2 +pcmpgtw (%rax), %mm2 + +pmaddwd %mm0, %mm2 +pmaddwd (%rax), %mm2 + +pmulhw %mm0, %mm2 +pmulhw (%rax), %mm2 + +pmullw %mm0, %mm2 +pmullw (%rax), %mm2 + +por %mm0, %mm2 +por (%rax), %mm2 + +pslld $1, %mm2 +pslld %mm0, %mm2 +pslld (%rax), %mm2 + +psllq $1, %mm2 +psllq %mm0, %mm2 +psllq (%rax), %mm2 + +psllw $1, %mm2 +psllw %mm0, %mm2 +psllw (%rax), %mm2 + +psrad $1, %mm2 +psrad %mm0, %mm2 +psrad (%rax), %mm2 + +psraw $1, %mm2 +psraw %mm0, %mm2 +psraw (%rax), %mm2 + +psrld $1, %mm2 +psrld %mm0, %mm2 +psrld (%rax), %mm2 + +psrlq $1, %mm2 +psrlq %mm0, %mm2 +psrlq (%rax), %mm2 + +psrlw $1, %mm2 +psrlw %mm0, %mm2 +psrlw (%rax), %mm2 + +psubb %mm0, %mm2 +psubb (%rax), %mm2 + +psubd %mm0, %mm2 +psubd (%rax), %mm2 + +psubsb %mm0, %mm2 +psubsb (%rax), %mm2 + +psubsw %mm0, %mm2 +psubsw (%rax), %mm2 + +psubusb %mm0, %mm2 +psubusb (%rax), %mm2 + +psubusw %mm0, %mm2 +psubusw (%rax), %mm2 + +psubw %mm0, %mm2 +psubw (%rax), %mm2 + +punpckhbw %mm0, %mm2 +punpckhbw (%rax), %mm2 + +punpckhdq %mm0, %mm2 +punpckhdq (%rax), %mm2 + +punpckhwd %mm0, %mm2 +punpckhwd (%rax), %mm2 + +punpcklbw %mm0, %mm2 +punpcklbw (%rax), %mm2 + +punpckldq %mm0, %mm2 +punpckldq (%rax), %mm2 + +punpcklwd %mm0, %mm2 +punpcklwd (%rax), %mm2 + +pxor %mm0, %mm2 +pxor (%rax), %mm2 + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 31 31 10.33 * * * emms +# CHECK-NEXT: 1 1 1.00 movd %eax, %mm2 +# CHECK-NEXT: 1 5 0.50 * movd (%rax), %mm2 +# CHECK-NEXT: 1 2 1.00 movd %mm0, %ecx +# CHECK-NEXT: 1 1 1.00 * * movd %mm0, (%rax) +# CHECK-NEXT: 1 1 1.00 movq %rax, %mm2 +# CHECK-NEXT: 1 5 0.50 * movq (%rax), %mm2 +# CHECK-NEXT: 1 2 1.00 movq %mm0, %rcx +# CHECK-NEXT: 1 1 1.00 * movq %mm0, (%rax) +# CHECK-NEXT: 1 1 1.00 packsswb %mm0, %mm2 +# CHECK-NEXT: 2 6 1.00 * packsswb (%rax), %mm2 +# CHECK-NEXT: 1 1 1.00 packssdw %mm0, %mm2 +# CHECK-NEXT: 2 6 1.00 * packssdw (%rax), %mm2 +# CHECK-NEXT: 1 1 1.00 packuswb %mm0, %mm2 +# CHECK-NEXT: 2 6 1.00 * packuswb (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 paddb %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * paddb (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 paddd %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * paddd (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 paddsb %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * paddsb (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 paddsw %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * paddsw (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 paddusb %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * paddusb (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 paddusw %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * paddusw (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 paddw %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * paddw (%rax), %mm2 +# CHECK-NEXT: 1 1 0.33 pand %mm0, %mm2 +# CHECK-NEXT: 2 6 0.50 * pand (%rax), %mm2 +# CHECK-NEXT: 1 1 0.33 pandn %mm0, %mm2 +# CHECK-NEXT: 2 6 0.50 * pandn (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 pcmpeqb %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * pcmpeqb (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 pcmpeqd %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * pcmpeqd (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 pcmpeqw %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * pcmpeqw (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 pcmpgtb %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * pcmpgtb (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 pcmpgtd %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * pcmpgtd (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 pcmpgtw %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * pcmpgtw (%rax), %mm2 +# CHECK-NEXT: 1 5 1.00 pmaddwd %mm0, %mm2 +# CHECK-NEXT: 2 10 1.00 * pmaddwd (%rax), %mm2 +# CHECK-NEXT: 1 5 1.00 pmulhw %mm0, %mm2 +# CHECK-NEXT: 2 10 1.00 * pmulhw (%rax), %mm2 +# CHECK-NEXT: 1 5 1.00 pmullw %mm0, %mm2 +# CHECK-NEXT: 2 10 1.00 * pmullw (%rax), %mm2 +# CHECK-NEXT: 1 1 0.33 por %mm0, %mm2 +# CHECK-NEXT: 2 6 0.50 * por (%rax), %mm2 +# CHECK-NEXT: 1 1 1.00 pslld $1, %mm2 +# CHECK-NEXT: 1 1 1.00 pslld %mm0, %mm2 +# CHECK-NEXT: 2 6 1.00 * pslld (%rax), %mm2 +# CHECK-NEXT: 1 1 1.00 psllq $1, %mm2 +# CHECK-NEXT: 1 1 1.00 psllq %mm0, %mm2 +# CHECK-NEXT: 2 6 1.00 * psllq (%rax), %mm2 +# CHECK-NEXT: 1 1 1.00 psllw $1, %mm2 +# CHECK-NEXT: 1 1 1.00 psllw %mm0, %mm2 +# CHECK-NEXT: 2 6 1.00 * psllw (%rax), %mm2 +# CHECK-NEXT: 1 1 1.00 psrad $1, %mm2 +# CHECK-NEXT: 1 1 1.00 psrad %mm0, %mm2 +# CHECK-NEXT: 2 6 1.00 * psrad (%rax), %mm2 +# CHECK-NEXT: 1 1 1.00 psraw $1, %mm2 +# CHECK-NEXT: 1 1 1.00 psraw %mm0, %mm2 +# CHECK-NEXT: 2 6 1.00 * psraw (%rax), %mm2 +# CHECK-NEXT: 1 1 1.00 psrld $1, %mm2 +# CHECK-NEXT: 1 1 1.00 psrld %mm0, %mm2 +# CHECK-NEXT: 2 6 1.00 * psrld (%rax), %mm2 +# CHECK-NEXT: 1 1 1.00 psrlq $1, %mm2 +# CHECK-NEXT: 1 1 1.00 psrlq %mm0, %mm2 +# CHECK-NEXT: 2 6 1.00 * psrlq (%rax), %mm2 +# CHECK-NEXT: 1 1 1.00 psrlw $1, %mm2 +# CHECK-NEXT: 1 1 1.00 psrlw %mm0, %mm2 +# CHECK-NEXT: 2 6 1.00 * psrlw (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 psubb %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * psubb (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 psubd %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * psubd (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 psubsb %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * psubsb (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 psubsw %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * psubsw (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 psubusb %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * psubusb (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 psubusw %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * psubusw (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 psubw %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * psubw (%rax), %mm2 +# CHECK-NEXT: 1 1 1.00 punpckhbw %mm0, %mm2 +# CHECK-NEXT: 2 6 1.00 * punpckhbw (%rax), %mm2 +# CHECK-NEXT: 1 1 1.00 punpckhdq %mm0, %mm2 +# CHECK-NEXT: 2 6 1.00 * punpckhdq (%rax), %mm2 +# CHECK-NEXT: 1 1 1.00 punpckhwd %mm0, %mm2 +# CHECK-NEXT: 2 6 1.00 * punpckhwd (%rax), %mm2 +# CHECK-NEXT: 1 1 1.00 punpcklbw %mm0, %mm2 +# CHECK-NEXT: 2 6 1.00 * punpcklbw (%rax), %mm2 +# CHECK-NEXT: 1 1 1.00 punpckldq %mm0, %mm2 +# CHECK-NEXT: 2 6 1.00 * punpckldq (%rax), %mm2 +# CHECK-NEXT: 1 1 1.00 punpcklwd %mm0, %mm2 +# CHECK-NEXT: 2 6 1.00 * punpcklwd (%rax), %mm2 +# CHECK-NEXT: 1 1 0.33 pxor %mm0, %mm2 +# CHECK-NEXT: 2 6 0.50 * pxor (%rax), %mm2 + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - - 21.00 53.00 2.00 57.00 24.00 24.00 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - 10.33 10.33 - 10.33 - - emms +# CHECK-NEXT: - - - - - 1.00 - - movd %eax, %mm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 movd (%rax), %mm2 +# CHECK-NEXT: - - 1.00 - - - - - movd %mm0, %ecx +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movd %mm0, (%rax) +# CHECK-NEXT: - - - - - 1.00 - - movq %rax, %mm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 movq (%rax), %mm2 +# CHECK-NEXT: - - 1.00 - - - - - movq %mm0, %rcx +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movq %mm0, (%rax) +# CHECK-NEXT: - - - - - 1.00 - - packsswb %mm0, %mm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 packsswb (%rax), %mm2 +# CHECK-NEXT: - - - - - 1.00 - - packssdw %mm0, %mm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 packssdw (%rax), %mm2 +# CHECK-NEXT: - - - - - 1.00 - - packuswb %mm0, %mm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 packuswb (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - paddb %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 paddb (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - paddd %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 paddd (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - paddsb %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 paddsb (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - paddsw %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 paddsw (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - paddusb %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 paddusb (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - paddusw %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 paddusw (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - paddw %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 paddw (%rax), %mm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - pand %mm0, %mm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 pand (%rax), %mm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - pandn %mm0, %mm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 pandn (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - pcmpeqb %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 pcmpeqb (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - pcmpeqd %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 pcmpeqd (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - pcmpeqw %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 pcmpeqw (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - pcmpgtb %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 pcmpgtb (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - pcmpgtd %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 pcmpgtd (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - pcmpgtw %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 pcmpgtw (%rax), %mm2 +# CHECK-NEXT: - - 1.00 - - - - - pmaddwd %mm0, %mm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 pmaddwd (%rax), %mm2 +# CHECK-NEXT: - - 1.00 - - - - - pmulhw %mm0, %mm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 pmulhw (%rax), %mm2 +# CHECK-NEXT: - - 1.00 - - - - - pmullw %mm0, %mm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 pmullw (%rax), %mm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - por %mm0, %mm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 por (%rax), %mm2 +# CHECK-NEXT: - - - - - 1.00 - - pslld $1, %mm2 +# CHECK-NEXT: - - - - - 1.00 - - pslld %mm0, %mm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 pslld (%rax), %mm2 +# CHECK-NEXT: - - - - - 1.00 - - psllq $1, %mm2 +# CHECK-NEXT: - - - - - 1.00 - - psllq %mm0, %mm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 psllq (%rax), %mm2 +# CHECK-NEXT: - - - - - 1.00 - - psllw $1, %mm2 +# CHECK-NEXT: - - - - - 1.00 - - psllw %mm0, %mm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 psllw (%rax), %mm2 +# CHECK-NEXT: - - - - - 1.00 - - psrad $1, %mm2 +# CHECK-NEXT: - - - - - 1.00 - - psrad %mm0, %mm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 psrad (%rax), %mm2 +# CHECK-NEXT: - - - - - 1.00 - - psraw $1, %mm2 +# CHECK-NEXT: - - - - - 1.00 - - psraw %mm0, %mm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 psraw (%rax), %mm2 +# CHECK-NEXT: - - - - - 1.00 - - psrld $1, %mm2 +# CHECK-NEXT: - - - - - 1.00 - - psrld %mm0, %mm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 psrld (%rax), %mm2 +# CHECK-NEXT: - - - - - 1.00 - - psrlq $1, %mm2 +# CHECK-NEXT: - - - - - 1.00 - - psrlq %mm0, %mm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 psrlq (%rax), %mm2 +# CHECK-NEXT: - - - - - 1.00 - - psrlw $1, %mm2 +# CHECK-NEXT: - - - - - 1.00 - - psrlw %mm0, %mm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 psrlw (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - psubb %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 psubb (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - psubd %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 psubd (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - psubsb %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 psubsb (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - psubsw %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 psubsw (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - psubusb %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 psubusb (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - psubusw %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 psubusw (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - psubw %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 psubw (%rax), %mm2 +# CHECK-NEXT: - - - - - 1.00 - - punpckhbw %mm0, %mm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 punpckhbw (%rax), %mm2 +# CHECK-NEXT: - - - - - 1.00 - - punpckhdq %mm0, %mm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 punpckhdq (%rax), %mm2 +# CHECK-NEXT: - - - - - 1.00 - - punpckhwd %mm0, %mm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 punpckhwd (%rax), %mm2 +# CHECK-NEXT: - - - - - 1.00 - - punpcklbw %mm0, %mm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 punpcklbw (%rax), %mm2 +# CHECK-NEXT: - - - - - 1.00 - - punpckldq %mm0, %mm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 punpckldq (%rax), %mm2 +# CHECK-NEXT: - - - - - 1.00 - - punpcklwd %mm0, %mm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 punpcklwd (%rax), %mm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - pxor %mm0, %mm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 pxor (%rax), %mm2 diff --git a/test/tools/llvm-mca/X86/Generic/resources-popcnt.s b/test/tools/llvm-mca/X86/Generic/resources-popcnt.s new file mode 100644 index 00000000000..e2512043a1a --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-popcnt.s @@ -0,0 +1,50 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +popcntw %cx, %cx +popcntw (%rax), %cx + +popcntl %eax, %ecx +popcntl (%rax), %ecx + +popcntq %rax, %rcx +popcntq (%rax), %rcx + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 1 3 1.00 popcntw %cx, %cx +# CHECK-NEXT: 2 9 1.00 * popcntw (%rax), %cx +# CHECK-NEXT: 1 3 1.00 popcntl %eax, %ecx +# CHECK-NEXT: 2 9 1.00 * popcntl (%rax), %ecx +# CHECK-NEXT: 1 3 1.00 popcntq %rax, %rcx +# CHECK-NEXT: 2 9 1.00 * popcntq (%rax), %rcx + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - - - 6.00 - - 1.50 1.50 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - - 1.00 - - - - popcntw %cx, %cx +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 popcntw (%rax), %cx +# CHECK-NEXT: - - - 1.00 - - - - popcntl %eax, %ecx +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 popcntl (%rax), %ecx +# CHECK-NEXT: - - - 1.00 - - - - popcntq %rax, %rcx +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 popcntq (%rax), %rcx diff --git a/test/tools/llvm-mca/X86/Generic/resources-sse1.s b/test/tools/llvm-mca/X86/Generic/resources-sse1.s new file mode 100644 index 00000000000..2ed19ec9e9a --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-sse1.s @@ -0,0 +1,461 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +addps %xmm0, %xmm2 +addps (%rax), %xmm2 + +addss %xmm0, %xmm2 +addss (%rax), %xmm2 + +andnps %xmm0, %xmm2 +andnps (%rax), %xmm2 + +andps %xmm0, %xmm2 +andps (%rax), %xmm2 + +cmpps $0, %xmm0, %xmm2 +cmpps $0, (%rax), %xmm2 + +cmpss $0, %xmm0, %xmm2 +cmpss $0, (%rax), %xmm2 + +comiss %xmm0, %xmm1 +comiss (%rax), %xmm1 + +cvtpi2ps %mm0, %xmm2 +cvtpi2ps (%rax), %xmm2 + +cvtps2pi %xmm0, %mm2 +cvtps2pi (%rax), %mm2 + +cvtsi2ss %ecx, %xmm2 +cvtsi2ss %rcx, %xmm2 +cvtsi2ss (%rax), %xmm2 +cvtsi2ss (%rax), %xmm2 + +cvtss2si %xmm0, %ecx +cvtss2si %xmm0, %rcx +cvtss2si (%rax), %ecx +cvtss2si (%rax), %rcx + +cvttps2pi %xmm0, %mm2 +cvttps2pi (%rax), %mm2 + +cvttss2si %xmm0, %ecx +cvttss2si %xmm0, %rcx +cvttss2si (%rax), %ecx +cvttss2si (%rax), %rcx + +divps %xmm0, %xmm2 +divps (%rax), %xmm2 + +divss %xmm0, %xmm2 +divss (%rax), %xmm2 + +ldmxcsr (%rax) + +maskmovq %mm0, %mm1 + +maxps %xmm0, %xmm2 +maxps (%rax), %xmm2 + +maxss %xmm0, %xmm2 +maxss (%rax), %xmm2 + +minps %xmm0, %xmm2 +minps (%rax), %xmm2 + +minss %xmm0, %xmm2 +minss (%rax), %xmm2 + +movaps %xmm0, %xmm2 +movaps %xmm0, (%rax) +movaps (%rax), %xmm2 + +movhlps %xmm0, %xmm2 +movlhps %xmm0, %xmm2 + +movhps %xmm0, (%rax) +movhps (%rax), %xmm2 + +movlps %xmm0, (%rax) +movlps (%rax), %xmm2 + +movmskps %xmm0, %rcx + +movntps %xmm0, (%rax) +movntq %mm0, (%rax) + +movss %xmm0, %xmm2 +movss %xmm0, (%rax) +movss (%rax), %xmm2 + +movups %xmm0, %xmm2 +movups %xmm0, (%rax) +movups (%rax), %xmm2 + +mulps %xmm0, %xmm2 +mulps (%rax), %xmm2 + +mulss %xmm0, %xmm2 +mulss (%rax), %xmm2 + +orps %xmm0, %xmm2 +orps (%rax), %xmm2 + +pavgb %mm0, %mm2 +pavgb (%rax), %mm2 + +pavgw %mm0, %mm2 +pavgw (%rax), %mm2 + +pextrw $1, %mm0, %rcx + +pinsrw $1, %rax, %mm2 +pinsrw $1, (%rax), %mm2 + +pmaxsw %mm0, %mm2 +pmaxsw (%rax), %mm2 + +pmaxub %mm0, %mm2 +pmaxub (%rax), %mm2 + +pminsw %mm0, %mm2 +pminsw (%rax), %mm2 + +pminub %mm0, %mm2 +pminub (%rax), %mm2 + +pmovmskb %xmm0, %rcx + +pmulhuw %mm0, %mm2 +pmulhuw (%rax), %mm2 + +prefetcht0 (%rax) +prefetcht1 (%rax) +prefetcht2 (%rax) +prefetchnta (%rax) + +psadbw %mm0, %mm2 +psadbw (%rax), %mm2 + +pshufw $1, %mm0, %mm2 +pshufw $1, (%rax), %mm2 + +rcpps %xmm0, %xmm2 +rcpps (%rax), %xmm2 + +rcpss %xmm0, %xmm2 +rcpss (%rax), %xmm2 + +rsqrtps %xmm0, %xmm2 +rsqrtps (%rax), %xmm2 + +rsqrtss %xmm0, %xmm2 +rsqrtss (%rax), %xmm2 + +sfence + +shufps $1, %xmm0, %xmm2 +shufps $1, (%rax), %xmm2 + +sqrtps %xmm0, %xmm2 +sqrtps (%rax), %xmm2 + +sqrtss %xmm0, %xmm2 +sqrtss (%rax), %xmm2 + +stmxcsr (%rax) + +subps %xmm0, %xmm2 +subps (%rax), %xmm2 + +subss %xmm0, %xmm2 +subss (%rax), %xmm2 + +ucomiss %xmm0, %xmm1 +ucomiss (%rax), %xmm1 + +unpckhps %xmm0, %xmm2 +unpckhps (%rax), %xmm2 + +unpcklps %xmm0, %xmm2 +unpcklps (%rax), %xmm2 + +xorps %xmm0, %xmm2 +xorps (%rax), %xmm2 + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 1 3 1.00 addps %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * addps (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 addss %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * addss (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 andnps %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * andnps (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 andps %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * andps (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 cmpps $0, %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * cmpps $0, (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 cmpss $0, %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * cmpss $0, (%rax), %xmm2 +# CHECK-NEXT: 2 2 1.00 comiss %xmm0, %xmm1 +# CHECK-NEXT: 3 8 1.00 * comiss (%rax), %xmm1 +# CHECK-NEXT: 1 3 1.00 cvtpi2ps %mm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * cvtpi2ps (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 cvtps2pi %xmm0, %mm2 +# CHECK-NEXT: 2 9 1.00 * cvtps2pi (%rax), %mm2 +# CHECK-NEXT: 3 5 2.00 cvtsi2ssl %ecx, %xmm2 +# CHECK-NEXT: 3 5 2.00 cvtsi2ssq %rcx, %xmm2 +# CHECK-NEXT: 3 10 1.00 * cvtsi2ssl (%rax), %xmm2 +# CHECK-NEXT: 3 10 1.00 * cvtsi2ssl (%rax), %xmm2 +# CHECK-NEXT: 2 5 1.00 cvtss2si %xmm0, %ecx +# CHECK-NEXT: 2 5 1.00 cvtss2si %xmm0, %rcx +# CHECK-NEXT: 3 9 1.00 * cvtss2si (%rax), %ecx +# CHECK-NEXT: 3 9 1.00 * cvtss2si (%rax), %rcx +# CHECK-NEXT: 1 3 1.00 cvttps2pi %xmm0, %mm2 +# CHECK-NEXT: 2 9 1.00 * cvttps2pi (%rax), %mm2 +# CHECK-NEXT: 2 5 1.00 cvttss2si %xmm0, %ecx +# CHECK-NEXT: 2 5 1.00 cvttss2si %xmm0, %rcx +# CHECK-NEXT: 3 9 1.00 * cvttss2si (%rax), %ecx +# CHECK-NEXT: 3 9 1.00 * cvttss2si (%rax), %rcx +# CHECK-NEXT: 1 14 14.00 divps %xmm0, %xmm2 +# CHECK-NEXT: 2 20 14.00 * divps (%rax), %xmm2 +# CHECK-NEXT: 1 14 14.00 divss %xmm0, %xmm2 +# CHECK-NEXT: 2 20 14.00 * divss (%rax), %xmm2 +# CHECK-NEXT: 4 5 1.00 * * * ldmxcsr (%rax) +# CHECK-NEXT: 1 1 1.00 * * * maskmovq %mm0, %mm1 +# CHECK-NEXT: 1 3 1.00 maxps %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * maxps (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 maxss %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * maxss (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 minps %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * minps (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 minss %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * minss (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 movaps %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 * movaps %xmm0, (%rax) +# CHECK-NEXT: 1 6 0.50 * movaps (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 movhlps %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 movlhps %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 * movhps %xmm0, (%rax) +# CHECK-NEXT: 2 7 1.00 * movhps (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 * movlps %xmm0, (%rax) +# CHECK-NEXT: 2 7 1.00 * movlps (%rax), %xmm2 +# CHECK-NEXT: 1 2 1.00 movmskps %xmm0, %ecx +# CHECK-NEXT: 1 1 1.00 * movntps %xmm0, (%rax) +# CHECK-NEXT: 1 1 1.00 * * * movntq %mm0, (%rax) +# CHECK-NEXT: 1 1 1.00 movss %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 * movss %xmm0, (%rax) +# CHECK-NEXT: 1 6 0.50 * movss (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 movups %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 * movups %xmm0, (%rax) +# CHECK-NEXT: 1 6 0.50 * movups (%rax), %xmm2 +# CHECK-NEXT: 1 5 1.00 mulps %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * mulps (%rax), %xmm2 +# CHECK-NEXT: 1 5 1.00 mulss %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * mulss (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 orps %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * orps (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 pavgb %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * pavgb (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 pavgw %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * pavgw (%rax), %mm2 +# CHECK-NEXT: 2 3 1.00 pextrw $1, %mm0, %ecx +# CHECK-NEXT: 2 2 1.00 pinsrw $1, %eax, %mm2 +# CHECK-NEXT: 2 7 0.50 * pinsrw $1, (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 pmaxsw %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * pmaxsw (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 pmaxub %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * pmaxub (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 pminsw %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * pminsw (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 pminub %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * pminub (%rax), %mm2 +# CHECK-NEXT: 1 2 1.00 pmovmskb %xmm0, %ecx +# CHECK-NEXT: 1 5 1.00 pmulhuw %mm0, %mm2 +# CHECK-NEXT: 2 10 1.00 * pmulhuw (%rax), %mm2 +# CHECK-NEXT: 1 5 0.50 * * prefetcht0 (%rax) +# CHECK-NEXT: 1 5 0.50 * * prefetcht1 (%rax) +# CHECK-NEXT: 1 5 0.50 * * prefetcht2 (%rax) +# CHECK-NEXT: 1 5 0.50 * * prefetchnta (%rax) +# CHECK-NEXT: 1 5 1.00 psadbw %mm0, %mm2 +# CHECK-NEXT: 2 10 1.00 * psadbw (%rax), %mm2 +# CHECK-NEXT: 1 1 1.00 pshufw $1, %mm0, %mm2 +# CHECK-NEXT: 2 6 1.00 * pshufw $1, (%rax), %mm2 +# CHECK-NEXT: 1 5 1.00 rcpps %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * rcpps (%rax), %xmm2 +# CHECK-NEXT: 1 5 1.00 rcpss %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * rcpss (%rax), %xmm2 +# CHECK-NEXT: 1 5 1.00 rsqrtps %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * rsqrtps (%rax), %xmm2 +# CHECK-NEXT: 1 5 1.00 rsqrtss %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * rsqrtss (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 * * * sfence +# CHECK-NEXT: 1 1 1.00 shufps $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * shufps $1, (%rax), %xmm2 +# CHECK-NEXT: 1 14 14.00 sqrtps %xmm0, %xmm2 +# CHECK-NEXT: 2 20 14.00 * sqrtps (%rax), %xmm2 +# CHECK-NEXT: 1 14 14.00 sqrtss %xmm0, %xmm2 +# CHECK-NEXT: 2 20 14.00 * sqrtss (%rax), %xmm2 +# CHECK-NEXT: 4 5 1.00 * * * stmxcsr (%rax) +# CHECK-NEXT: 1 3 1.00 subps %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * subps (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 subss %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * subss (%rax), %xmm2 +# CHECK-NEXT: 2 2 1.00 ucomiss %xmm0, %xmm1 +# CHECK-NEXT: 3 8 1.00 * ucomiss (%rax), %xmm1 +# CHECK-NEXT: 1 1 1.00 unpckhps %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * unpckhps (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 unpcklps %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * unpcklps (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 xorps %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * xorps (%rax), %xmm2 + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - 112.00 41.00 55.50 10.00 34.50 33.50 33.50 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - - 1.00 - - - - addps %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 addps (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - addss %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 addss (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - andnps %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 andnps (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - andps %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 andps (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - cmpps $0, %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 cmpps $0, (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - cmpss $0, %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 cmpss $0, (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 1.00 - - - - comiss %xmm0, %xmm1 +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 comiss (%rax), %xmm1 +# CHECK-NEXT: - - - 1.00 - - - - cvtpi2ps %mm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 cvtpi2ps (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - cvtps2pi %xmm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 cvtps2pi (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - 2.00 - - cvtsi2ssl %ecx, %xmm2 +# CHECK-NEXT: - - - 1.00 - 2.00 - - cvtsi2ssq %rcx, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 cvtsi2ssl (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 cvtsi2ssl (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 1.00 - - - - cvtss2si %xmm0, %ecx +# CHECK-NEXT: - - 1.00 1.00 - - - - cvtss2si %xmm0, %rcx +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 cvtss2si (%rax), %ecx +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 cvtss2si (%rax), %rcx +# CHECK-NEXT: - - - 1.00 - - - - cvttps2pi %xmm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 cvttps2pi (%rax), %mm2 +# CHECK-NEXT: - - 1.00 1.00 - - - - cvttss2si %xmm0, %ecx +# CHECK-NEXT: - - 1.00 1.00 - - - - cvttss2si %xmm0, %rcx +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 cvttss2si (%rax), %ecx +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 cvttss2si (%rax), %rcx +# CHECK-NEXT: - 14.00 1.00 - - - - - divps %xmm0, %xmm2 +# CHECK-NEXT: - 14.00 1.00 - - - 0.50 0.50 divps (%rax), %xmm2 +# CHECK-NEXT: - 14.00 1.00 - - - - - divss %xmm0, %xmm2 +# CHECK-NEXT: - 14.00 1.00 - - - 0.50 0.50 divss (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - 1.00 1.00 0.50 0.50 ldmxcsr (%rax) +# CHECK-NEXT: - - - - - 1.00 - - maskmovq %mm0, %mm1 +# CHECK-NEXT: - - - 1.00 - - - - maxps %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 maxps (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - maxss %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 maxss (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - minps %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 minps (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - minss %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 minss (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - movaps %xmm0, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movaps %xmm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 movaps (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - movhlps %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - movlhps %xmm0, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movhps %xmm0, (%rax) +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 movhps (%rax), %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movlps %xmm0, (%rax) +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 movlps (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - movmskps %xmm0, %ecx +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movntps %xmm0, (%rax) +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movntq %mm0, (%rax) +# CHECK-NEXT: - - - - - 1.00 - - movss %xmm0, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movss %xmm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 movss (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - movups %xmm0, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movups %xmm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 movups (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - mulps %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 mulps (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - mulss %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 mulss (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - orps %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 orps (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - pavgb %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 pavgb (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - pavgw %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 pavgw (%rax), %mm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - pextrw $1, %mm0, %ecx +# CHECK-NEXT: - - - 0.50 - 1.50 - - pinsrw $1, %eax, %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pinsrw $1, (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - pmaxsw %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 pmaxsw (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - pmaxub %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 pmaxub (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - pminsw %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 pminsw (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - pminub %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 pminub (%rax), %mm2 +# CHECK-NEXT: - - 1.00 - - - - - pmovmskb %xmm0, %ecx +# CHECK-NEXT: - - 1.00 - - - - - pmulhuw %mm0, %mm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 pmulhuw (%rax), %mm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 prefetcht0 (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 prefetcht1 (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 prefetcht2 (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 prefetchnta (%rax) +# CHECK-NEXT: - - 1.00 - - - - - psadbw %mm0, %mm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 psadbw (%rax), %mm2 +# CHECK-NEXT: - - - - - 1.00 - - pshufw $1, %mm0, %mm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 pshufw $1, (%rax), %mm2 +# CHECK-NEXT: - - 1.00 - - - - - rcpps %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 rcpps (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - rcpss %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 rcpss (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - rsqrtps %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 rsqrtps (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - rsqrtss %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 rsqrtss (%rax), %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 sfence +# CHECK-NEXT: - - - - - 1.00 - - shufps $1, %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 shufps $1, (%rax), %xmm2 +# CHECK-NEXT: - 14.00 1.00 - - - - - sqrtps %xmm0, %xmm2 +# CHECK-NEXT: - 14.00 1.00 - - - 0.50 0.50 sqrtps (%rax), %xmm2 +# CHECK-NEXT: - 14.00 1.00 - - - - - sqrtss %xmm0, %xmm2 +# CHECK-NEXT: - 14.00 1.00 - - - 0.50 0.50 sqrtss (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - 1.00 1.00 0.50 0.50 stmxcsr (%rax) +# CHECK-NEXT: - - - 1.00 - - - - subps %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 subps (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - subss %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 subss (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 1.00 - - - - ucomiss %xmm0, %xmm1 +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 ucomiss (%rax), %xmm1 +# CHECK-NEXT: - - - - - 1.00 - - unpckhps %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 unpckhps (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - unpcklps %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 unpcklps (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - xorps %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 xorps (%rax), %xmm2 diff --git a/test/tools/llvm-mca/X86/Generic/resources-sse2.s b/test/tools/llvm-mca/X86/Generic/resources-sse2.s new file mode 100644 index 00000000000..6983e307ca0 --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-sse2.s @@ -0,0 +1,949 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +addpd %xmm0, %xmm2 +addpd (%rax), %xmm2 + +addsd %xmm0, %xmm2 +addsd (%rax), %xmm2 + +andnpd %xmm0, %xmm2 +andnpd (%rax), %xmm2 + +andpd %xmm0, %xmm2 +andpd (%rax), %xmm2 + +clflush (%rax) + +cmppd $0, %xmm0, %xmm2 +cmppd $0, (%rax), %xmm2 + +cmpsd $0, %xmm0, %xmm2 +cmpsd $0, (%rax), %xmm2 + +comisd %xmm0, %xmm1 +comisd (%rax), %xmm1 + +cvtdq2pd %xmm0, %xmm2 +cvtdq2pd (%rax), %xmm2 + +cvtdq2ps %xmm0, %xmm2 +cvtdq2ps (%rax), %xmm2 + +cvtpd2dq %xmm0, %xmm2 +cvtpd2dq (%rax), %xmm2 + +cvtpd2pi %xmm0, %mm2 +cvtpd2pi (%rax), %mm2 + +cvtpd2ps %xmm0, %xmm2 +cvtpd2ps (%rax), %xmm2 + +cvtpi2pd %mm0, %xmm2 +cvtpi2pd (%rax), %xmm2 + +cvtps2dq %xmm0, %xmm2 +cvtps2dq (%rax), %xmm2 + +cvtps2pd %xmm0, %xmm2 +cvtps2pd (%rax), %xmm2 + +cvtsd2si %xmm0, %ecx +cvtsd2si %xmm0, %rcx +cvtsd2si (%rax), %ecx +cvtsd2si (%rax), %rcx + +cvtsd2ss %xmm0, %xmm2 +cvtsd2ss (%rax), %xmm2 + +cvtsi2sd %ecx, %xmm2 +cvtsi2sd %rcx, %xmm2 +cvtsi2sd (%rax), %xmm2 +cvtsi2sd (%rax), %xmm2 + +cvtss2sd %xmm0, %xmm2 +cvtss2sd (%rax), %xmm2 + +cvttpd2dq %xmm0, %xmm2 +cvttpd2dq (%rax), %xmm2 + +cvttpd2pi %xmm0, %mm2 +cvttpd2pi (%rax), %mm2 + +cvttps2dq %xmm0, %xmm2 +cvttps2dq (%rax), %xmm2 + +cvttsd2si %xmm0, %ecx +cvttsd2si %xmm0, %rcx +cvttsd2si (%rax), %ecx +cvttsd2si (%rax), %rcx + +divpd %xmm0, %xmm2 +divpd (%rax), %xmm2 + +divsd %xmm0, %xmm2 +divsd (%rax), %xmm2 + +lfence + +maskmovdqu %xmm0, %xmm1 + +maxpd %xmm0, %xmm2 +maxpd (%rax), %xmm2 + +maxsd %xmm0, %xmm2 +maxsd (%rax), %xmm2 + +minpd %xmm0, %xmm2 +minpd (%rax), %xmm2 + +minsd %xmm0, %xmm2 +minsd (%rax), %xmm2 + +movapd %xmm0, %xmm2 +movapd %xmm0, (%rax) +movapd (%rax), %xmm2 + +movd %eax, %xmm2 +movd (%rax), %xmm2 + +movd %xmm0, %ecx +movd %xmm0, (%rax) + +movdqa %xmm0, %xmm2 +movdqa %xmm0, (%rax) +movdqa (%rax), %xmm2 + +movdqu %xmm0, %xmm2 +movdqu %xmm0, (%rax) +movdqu (%rax), %xmm2 + +movdq2q %xmm0, %mm2 + +movhpd %xmm0, (%rax) +movhpd (%rax), %xmm2 + +movlpd %xmm0, (%rax) +movlpd (%rax), %xmm2 + +movmskpd %xmm0, %rcx + +movntil %eax, (%rax) +movntiq %rax, (%rax) + +movntdq %xmm0, (%rax) +movntpd %xmm0, (%rax) + +movq %xmm0, %xmm2 + +movq %rax, %xmm2 +movq (%rax), %xmm2 + +movq %xmm0, %rcx +movq %xmm0, (%rax) + +movq2dq %mm0, %xmm2 + +movsd %xmm0, %xmm2 +movsd %xmm0, (%rax) +movsd (%rax), %xmm2 + +movupd %xmm0, %xmm2 +movupd %xmm0, (%rax) +movupd (%rax), %xmm2 + +mulpd %xmm0, %xmm2 +mulpd (%rax), %xmm2 + +mulsd %xmm0, %xmm2 +mulsd (%rax), %xmm2 + +orpd %xmm0, %xmm2 +orpd (%rax), %xmm2 + +packssdw %xmm0, %xmm2 +packssdw (%rax), %xmm2 + +packsswb %xmm0, %xmm2 +packsswb (%rax), %xmm2 + +packuswb %xmm0, %xmm2 +packuswb (%rax), %xmm2 + +paddb %xmm0, %xmm2 +paddb (%rax), %xmm2 + +paddd %xmm0, %xmm2 +paddd (%rax), %xmm2 + +paddq %mm0, %mm2 +paddq (%rax), %mm2 + +paddq %xmm0, %xmm2 +paddq (%rax), %xmm2 + +paddsb %xmm0, %xmm2 +paddsb (%rax), %xmm2 + +paddsw %xmm0, %xmm2 +paddsw (%rax), %xmm2 + +paddusb %xmm0, %xmm2 +paddusb (%rax), %xmm2 + +paddusw %xmm0, %xmm2 +paddusw (%rax), %xmm2 + +paddw %xmm0, %xmm2 +paddw (%rax), %xmm2 + +pand %xmm0, %xmm2 +pand (%rax), %xmm2 + +pandn %xmm0, %xmm2 +pandn (%rax), %xmm2 + +pavgb %xmm0, %xmm2 +pavgb (%rax), %xmm2 + +pavgw %xmm0, %xmm2 +pavgw (%rax), %xmm2 + +pcmpeqb %xmm0, %xmm2 +pcmpeqb (%rax), %xmm2 + +pcmpeqd %xmm0, %xmm2 +pcmpeqd (%rax), %xmm2 + +pcmpeqw %xmm0, %xmm2 +pcmpeqw (%rax), %xmm2 + +pcmpgtb %xmm0, %xmm2 +pcmpgtb (%rax), %xmm2 + +pcmpgtd %xmm0, %xmm2 +pcmpgtd (%rax), %xmm2 + +pcmpgtw %xmm0, %xmm2 +pcmpgtw (%rax), %xmm2 + +pextrw $1, %xmm0, %rcx + +pmaddwd %xmm0, %xmm2 +pmaddwd (%rax), %xmm2 + +pmaxsw %xmm0, %xmm2 +pmaxsw (%rax), %xmm2 + +pmaxub %xmm0, %xmm2 +pmaxub (%rax), %xmm2 + +pminsw %xmm0, %xmm2 +pminsw (%rax), %xmm2 + +pminub %xmm0, %xmm2 +pminub (%rax), %xmm2 + +pmovmskb %xmm0, %rcx + +pmulhuw %xmm0, %xmm2 +pmulhuw (%rax), %xmm2 + +pmulhw %xmm0, %xmm2 +pmulhw (%rax), %xmm2 + +pmullw %xmm0, %xmm2 +pmullw (%rax), %xmm2 + +pmuludq %mm0, %mm2 +pmuludq (%rax), %mm2 + +pmuludq %xmm0, %xmm2 +pmuludq (%rax), %xmm2 + +por %xmm0, %xmm2 +por (%rax), %xmm2 + +psadbw %xmm0, %xmm2 +psadbw (%rax), %xmm2 + +pshufd $1, %xmm0, %xmm2 +pshufd $1, (%rax), %xmm2 + +pshufhw $1, %xmm0, %xmm2 +pshufhw $1, (%rax), %xmm2 + +pshuflw $1, %xmm0, %xmm2 +pshuflw $1, (%rax), %xmm2 + +pslld $1, %xmm2 +pslld %xmm0, %xmm2 +pslld (%rax), %xmm2 + +pslldq $1, %xmm2 + +psllq $1, %xmm2 +psllq %xmm0, %xmm2 +psllq (%rax), %xmm2 + +psllw $1, %xmm2 +psllw %xmm0, %xmm2 +psllw (%rax), %xmm2 + +psrad $1, %xmm2 +psrad %xmm0, %xmm2 +psrad (%rax), %xmm2 + +psraw $1, %xmm2 +psraw %xmm0, %xmm2 +psraw (%rax), %xmm2 + +psrld $1, %xmm2 +psrld %xmm0, %xmm2 +psrld (%rax), %xmm2 + +psrldq $1, %xmm2 + +psrlq $1, %xmm2 +psrlq %xmm0, %xmm2 +psrlq (%rax), %xmm2 + +psrlw $1, %xmm2 +psrlw %xmm0, %xmm2 +psrlw (%rax), %xmm2 + +psubb %xmm0, %xmm2 +psubb (%rax), %xmm2 + +psubd %xmm0, %xmm2 +psubd (%rax), %xmm2 + +psubq %mm0, %mm2 +psubq (%rax), %mm2 + +psubq %xmm0, %xmm2 +psubq (%rax), %xmm2 + +psubsb %xmm0, %xmm2 +psubsb (%rax), %xmm2 + +psubsw %xmm0, %xmm2 +psubsw (%rax), %xmm2 + +psubusb %xmm0, %xmm2 +psubusb (%rax), %xmm2 + +psubusw %xmm0, %xmm2 +psubusw (%rax), %xmm2 + +psubw %xmm0, %xmm2 +psubw (%rax), %xmm2 + +punpckhbw %xmm0, %xmm2 +punpckhbw (%rax), %xmm2 + +punpckhdq %xmm0, %xmm2 +punpckhdq (%rax), %xmm2 + +punpckhqdq %xmm0, %xmm2 +punpckhqdq (%rax), %xmm2 + +punpckhwd %xmm0, %xmm2 +punpckhwd (%rax), %xmm2 + +punpcklbw %xmm0, %xmm2 +punpcklbw (%rax), %xmm2 + +punpckldq %xmm0, %xmm2 +punpckldq (%rax), %xmm2 + +punpcklqdq %xmm0, %xmm2 +punpcklqdq (%rax), %xmm2 + +punpcklwd %xmm0, %xmm2 +punpcklwd (%rax), %xmm2 + +pxor %xmm0, %xmm2 +pxor (%rax), %xmm2 + +shufpd $1, %xmm0, %xmm2 +shufpd $1, (%rax), %xmm2 + +sqrtpd %xmm0, %xmm2 +sqrtpd (%rax), %xmm2 + +sqrtsd %xmm0, %xmm2 +sqrtsd (%rax), %xmm2 + +subpd %xmm0, %xmm2 +subpd (%rax), %xmm2 + +subsd %xmm0, %xmm2 +subsd (%rax), %xmm2 + +ucomisd %xmm0, %xmm1 +ucomisd (%rax), %xmm1 + +unpckhpd %xmm0, %xmm2 +unpckhpd (%rax), %xmm2 + +unpcklpd %xmm0, %xmm2 +unpcklpd (%rax), %xmm2 + +xorpd %xmm0, %xmm2 +xorpd (%rax), %xmm2 + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 1 3 1.00 addpd %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * addpd (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 addsd %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * addsd (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 andnpd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * andnpd (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 andpd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * andpd (%rax), %xmm2 +# CHECK-NEXT: 4 5 1.00 * * * clflush (%rax) +# CHECK-NEXT: 1 3 1.00 cmppd $0, %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * cmppd $0, (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 cmpsd $0, %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * cmpsd $0, (%rax), %xmm2 +# CHECK-NEXT: 2 2 1.00 comisd %xmm0, %xmm1 +# CHECK-NEXT: 3 8 1.00 * comisd (%rax), %xmm1 +# CHECK-NEXT: 2 4 1.00 cvtdq2pd %xmm0, %xmm2 +# CHECK-NEXT: 3 10 1.00 * cvtdq2pd (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 cvtdq2ps %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * cvtdq2ps (%rax), %xmm2 +# CHECK-NEXT: 2 4 1.00 cvtpd2dq %xmm0, %xmm2 +# CHECK-NEXT: 3 10 1.00 * cvtpd2dq (%rax), %xmm2 +# CHECK-NEXT: 2 4 1.00 cvtpd2pi %xmm0, %mm2 +# CHECK-NEXT: 3 10 1.00 * cvtpd2pi (%rax), %mm2 +# CHECK-NEXT: 2 4 1.00 cvtpd2ps %xmm0, %xmm2 +# CHECK-NEXT: 3 10 1.00 * cvtpd2ps (%rax), %xmm2 +# CHECK-NEXT: 2 4 1.00 cvtpi2pd %mm0, %xmm2 +# CHECK-NEXT: 3 10 1.00 * cvtpi2pd (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 cvtps2dq %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * cvtps2dq (%rax), %xmm2 +# CHECK-NEXT: 2 2 1.00 cvtps2pd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * cvtps2pd (%rax), %xmm2 +# CHECK-NEXT: 2 5 1.00 cvtsd2si %xmm0, %ecx +# CHECK-NEXT: 2 5 1.00 cvtsd2si %xmm0, %rcx +# CHECK-NEXT: 3 9 1.00 * cvtsd2si (%rax), %ecx +# CHECK-NEXT: 3 9 1.00 * cvtsd2si (%rax), %rcx +# CHECK-NEXT: 2 4 1.00 cvtsd2ss %xmm0, %xmm2 +# CHECK-NEXT: 3 10 1.00 * cvtsd2ss (%rax), %xmm2 +# CHECK-NEXT: 2 4 1.00 cvtsi2sdl %ecx, %xmm2 +# CHECK-NEXT: 2 4 1.00 cvtsi2sdq %rcx, %xmm2 +# CHECK-NEXT: 2 9 1.00 * cvtsi2sdl (%rax), %xmm2 +# CHECK-NEXT: 2 9 1.00 * cvtsi2sdl (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 cvtss2sd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * cvtss2sd (%rax), %xmm2 +# CHECK-NEXT: 2 4 1.00 cvttpd2dq %xmm0, %xmm2 +# CHECK-NEXT: 3 10 1.00 * cvttpd2dq (%rax), %xmm2 +# CHECK-NEXT: 2 4 1.00 cvttpd2pi %xmm0, %mm2 +# CHECK-NEXT: 3 10 1.00 * cvttpd2pi (%rax), %mm2 +# CHECK-NEXT: 1 3 1.00 cvttps2dq %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * cvttps2dq (%rax), %xmm2 +# CHECK-NEXT: 2 5 1.00 cvttsd2si %xmm0, %ecx +# CHECK-NEXT: 2 5 1.00 cvttsd2si %xmm0, %rcx +# CHECK-NEXT: 3 9 1.00 * cvttsd2si (%rax), %ecx +# CHECK-NEXT: 3 9 1.00 * cvttsd2si (%rax), %rcx +# CHECK-NEXT: 1 22 22.00 divpd %xmm0, %xmm2 +# CHECK-NEXT: 2 28 22.00 * divpd (%rax), %xmm2 +# CHECK-NEXT: 1 22 22.00 divsd %xmm0, %xmm2 +# CHECK-NEXT: 2 28 22.00 * divsd (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 * * * lfence +# CHECK-NEXT: 1 1 1.00 * * * maskmovdqu %xmm0, %xmm1 +# CHECK-NEXT: 1 3 1.00 maxpd %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * maxpd (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 maxsd %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * maxsd (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 minpd %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * minpd (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 minsd %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * minsd (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 movapd %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 * movapd %xmm0, (%rax) +# CHECK-NEXT: 1 6 0.50 * movapd (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 movd %eax, %xmm2 +# CHECK-NEXT: 1 6 0.50 * movd (%rax), %xmm2 +# CHECK-NEXT: 1 2 1.00 movd %xmm0, %ecx +# CHECK-NEXT: 1 1 1.00 * movd %xmm0, (%rax) +# CHECK-NEXT: 1 1 0.33 movdqa %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 * movdqa %xmm0, (%rax) +# CHECK-NEXT: 1 6 0.50 * movdqa (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.33 movdqu %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 * movdqu %xmm0, (%rax) +# CHECK-NEXT: 1 6 0.50 * movdqu (%rax), %xmm2 +# CHECK-NEXT: 2 2 1.00 movdq2q %xmm0, %mm2 +# CHECK-NEXT: 1 1 1.00 * movhpd %xmm0, (%rax) +# CHECK-NEXT: 2 7 1.00 * movhpd (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 * movlpd %xmm0, (%rax) +# CHECK-NEXT: 2 7 1.00 * movlpd (%rax), %xmm2 +# CHECK-NEXT: 1 2 1.00 movmskpd %xmm0, %ecx +# CHECK-NEXT: 1 1 1.00 * movntil %eax, (%rax) +# CHECK-NEXT: 1 1 1.00 * movntiq %rax, (%rax) +# CHECK-NEXT: 1 1 1.00 * movntdq %xmm0, (%rax) +# CHECK-NEXT: 1 1 1.00 * movntpd %xmm0, (%rax) +# CHECK-NEXT: 1 1 0.33 movq %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 movq %rax, %xmm2 +# CHECK-NEXT: 1 6 0.50 * movq (%rax), %xmm2 +# CHECK-NEXT: 1 2 1.00 movq %xmm0, %rcx +# CHECK-NEXT: 1 1 1.00 * movq %xmm0, (%rax) +# CHECK-NEXT: 1 1 0.33 movq2dq %mm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 movsd %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 * movsd %xmm0, (%rax) +# CHECK-NEXT: 1 6 0.50 * movsd (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 movupd %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 * movupd %xmm0, (%rax) +# CHECK-NEXT: 1 6 0.50 * movupd (%rax), %xmm2 +# CHECK-NEXT: 1 5 1.00 mulpd %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * mulpd (%rax), %xmm2 +# CHECK-NEXT: 1 5 1.00 mulsd %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * mulsd (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 orpd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * orpd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 packssdw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * packssdw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 packsswb %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * packsswb (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 packuswb %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * packuswb (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 paddb %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * paddb (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 paddd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * paddd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 paddq %mm0, %mm2 +# CHECK-NEXT: 2 7 0.50 * paddq (%rax), %mm2 +# CHECK-NEXT: 1 1 0.50 paddq %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * paddq (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 paddsb %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * paddsb (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 paddsw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * paddsw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 paddusb %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * paddusb (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 paddusw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * paddusw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 paddw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * paddw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.33 pand %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pand (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.33 pandn %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pandn (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pavgb %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pavgb (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pavgw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pavgw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pcmpeqb %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pcmpeqb (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pcmpeqd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pcmpeqd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pcmpeqw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pcmpeqw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pcmpgtb %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pcmpgtb (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pcmpgtd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pcmpgtd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pcmpgtw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pcmpgtw (%rax), %xmm2 +# CHECK-NEXT: 2 3 1.00 pextrw $1, %xmm0, %ecx +# CHECK-NEXT: 1 5 1.00 pmaddwd %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * pmaddwd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pmaxsw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pmaxsw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pmaxub %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pmaxub (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pminsw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pminsw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pminub %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pminub (%rax), %xmm2 +# CHECK-NEXT: 1 2 1.00 pmovmskb %xmm0, %ecx +# CHECK-NEXT: 1 5 1.00 pmulhuw %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * pmulhuw (%rax), %xmm2 +# CHECK-NEXT: 1 5 1.00 pmulhw %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * pmulhw (%rax), %xmm2 +# CHECK-NEXT: 1 5 1.00 pmullw %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * pmullw (%rax), %xmm2 +# CHECK-NEXT: 1 5 1.00 pmuludq %mm0, %mm2 +# CHECK-NEXT: 2 10 1.00 * pmuludq (%rax), %mm2 +# CHECK-NEXT: 1 5 1.00 pmuludq %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * pmuludq (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.33 por %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * por (%rax), %xmm2 +# CHECK-NEXT: 1 5 1.00 psadbw %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * psadbw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pshufd $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pshufd $1, (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pshufhw $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pshufhw $1, (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pshuflw $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pshuflw $1, (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 pslld $1, %xmm2 +# CHECK-NEXT: 2 2 1.00 pslld %xmm0, %xmm2 +# CHECK-NEXT: 3 8 1.00 * pslld (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pslldq $1, %xmm2 +# CHECK-NEXT: 1 1 1.00 psllq $1, %xmm2 +# CHECK-NEXT: 2 2 1.00 psllq %xmm0, %xmm2 +# CHECK-NEXT: 3 8 1.00 * psllq (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 psllw $1, %xmm2 +# CHECK-NEXT: 2 2 1.00 psllw %xmm0, %xmm2 +# CHECK-NEXT: 3 8 1.00 * psllw (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 psrad $1, %xmm2 +# CHECK-NEXT: 2 2 1.00 psrad %xmm0, %xmm2 +# CHECK-NEXT: 3 8 1.00 * psrad (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 psraw $1, %xmm2 +# CHECK-NEXT: 2 2 1.00 psraw %xmm0, %xmm2 +# CHECK-NEXT: 3 8 1.00 * psraw (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 psrld $1, %xmm2 +# CHECK-NEXT: 2 2 1.00 psrld %xmm0, %xmm2 +# CHECK-NEXT: 3 8 1.00 * psrld (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 psrldq $1, %xmm2 +# CHECK-NEXT: 1 1 1.00 psrlq $1, %xmm2 +# CHECK-NEXT: 2 2 1.00 psrlq %xmm0, %xmm2 +# CHECK-NEXT: 3 8 1.00 * psrlq (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 psrlw $1, %xmm2 +# CHECK-NEXT: 2 2 1.00 psrlw %xmm0, %xmm2 +# CHECK-NEXT: 3 8 1.00 * psrlw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 psubb %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * psubb (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 psubd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * psubd (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 psubq %mm0, %mm2 +# CHECK-NEXT: 2 8 1.00 * psubq (%rax), %mm2 +# CHECK-NEXT: 1 1 0.50 psubq %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * psubq (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 psubsb %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * psubsb (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 psubsw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * psubsw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 psubusb %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * psubusb (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 psubusw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * psubusw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 psubw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * psubw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 punpckhbw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * punpckhbw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 punpckhdq %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * punpckhdq (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 punpckhqdq %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * punpckhqdq (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 punpckhwd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * punpckhwd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 punpcklbw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * punpcklbw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 punpckldq %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * punpckldq (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 punpcklqdq %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * punpcklqdq (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 punpcklwd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * punpcklwd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.33 pxor %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pxor (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 shufpd $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * shufpd $1, (%rax), %xmm2 +# CHECK-NEXT: 1 21 21.00 sqrtpd %xmm0, %xmm2 +# CHECK-NEXT: 2 27 21.00 * sqrtpd (%rax), %xmm2 +# CHECK-NEXT: 1 21 21.00 sqrtsd %xmm0, %xmm2 +# CHECK-NEXT: 2 27 21.00 * sqrtsd (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 subpd %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * subpd (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 subsd %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * subsd (%rax), %xmm2 +# CHECK-NEXT: 2 2 1.00 ucomisd %xmm0, %xmm1 +# CHECK-NEXT: 3 8 1.00 * ucomisd (%rax), %xmm1 +# CHECK-NEXT: 1 1 1.00 unpckhpd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * unpckhpd (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 unpcklpd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * unpcklpd (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 xorpd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * xorpd (%rax), %xmm2 + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - 172.00 75.83 117.33 16.00 98.83 66.00 66.00 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - - 1.00 - - - - addpd %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 addpd (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - addsd %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 addsd (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - andnpd %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 andnpd (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - andpd %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 andpd (%rax), %xmm2 +# CHECK-NEXT: - - 0.50 0.50 1.00 1.00 0.50 0.50 clflush (%rax) +# CHECK-NEXT: - - - 1.00 - - - - cmppd $0, %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 cmppd $0, (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - cmpsd $0, %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 cmpsd $0, (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 1.00 - - - - comisd %xmm0, %xmm1 +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 comisd (%rax), %xmm1 +# CHECK-NEXT: - - - 1.00 - 1.00 - - cvtdq2pd %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 cvtdq2pd (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - cvtdq2ps %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 cvtdq2ps (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 - - cvtpd2dq %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 cvtpd2dq (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 - - cvtpd2pi %xmm0, %mm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 cvtpd2pi (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - 1.00 - - cvtpd2ps %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 cvtpd2ps (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 - - cvtpi2pd %mm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 cvtpi2pd (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - cvtps2dq %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 cvtps2dq (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - 1.00 - - cvtps2pd %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 cvtps2pd (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 1.00 - - - - cvtsd2si %xmm0, %ecx +# CHECK-NEXT: - - 1.00 1.00 - - - - cvtsd2si %xmm0, %rcx +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 cvtsd2si (%rax), %ecx +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 cvtsd2si (%rax), %rcx +# CHECK-NEXT: - - - 1.00 - 1.00 - - cvtsd2ss %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 cvtsd2ss (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 - - cvtsi2sdl %ecx, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 - - cvtsi2sdq %rcx, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 cvtsi2sdl (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 cvtsi2sdl (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - cvtss2sd %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 cvtss2sd (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 - - cvttpd2dq %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 cvttpd2dq (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 - - cvttpd2pi %xmm0, %mm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 cvttpd2pi (%rax), %mm2 +# CHECK-NEXT: - - - 1.00 - - - - cvttps2dq %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 cvttps2dq (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 1.00 - - - - cvttsd2si %xmm0, %ecx +# CHECK-NEXT: - - 1.00 1.00 - - - - cvttsd2si %xmm0, %rcx +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 cvttsd2si (%rax), %ecx +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 cvttsd2si (%rax), %rcx +# CHECK-NEXT: - 22.00 1.00 - - - - - divpd %xmm0, %xmm2 +# CHECK-NEXT: - 22.00 1.00 - - - 0.50 0.50 divpd (%rax), %xmm2 +# CHECK-NEXT: - 22.00 1.00 - - - - - divsd %xmm0, %xmm2 +# CHECK-NEXT: - 22.00 1.00 - - - 0.50 0.50 divsd (%rax), %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 lfence +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 maskmovdqu %xmm0, %xmm1 +# CHECK-NEXT: - - - 1.00 - - - - maxpd %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 maxpd (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - maxsd %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 maxsd (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - minpd %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 minpd (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - minsd %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 minsd (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - movapd %xmm0, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movapd %xmm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 movapd (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - movd %eax, %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 movd (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - movd %xmm0, %ecx +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movd %xmm0, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - movdqa %xmm0, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movdqa %xmm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 movdqa (%rax), %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - movdqu %xmm0, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movdqu %xmm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 movdqu (%rax), %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 1.33 - - movdq2q %xmm0, %mm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movhpd %xmm0, (%rax) +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 movhpd (%rax), %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movlpd %xmm0, (%rax) +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 movlpd (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - movmskpd %xmm0, %ecx +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movntil %eax, (%rax) +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movntiq %rax, (%rax) +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movntdq %xmm0, (%rax) +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movntpd %xmm0, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - movq %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - movq %rax, %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 movq (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - movq %xmm0, %rcx +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movq %xmm0, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - movq2dq %mm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - movsd %xmm0, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movsd %xmm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 movsd (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - movupd %xmm0, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movupd %xmm0, (%rax) +# CHECK-NEXT: - - - - - - 0.50 0.50 movupd (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - mulpd %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 mulpd (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - mulsd %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 mulsd (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - orpd %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 orpd (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - packssdw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 packssdw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - packsswb %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 packsswb (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - packuswb %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 packuswb (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - paddb %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 paddb (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - paddd %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 paddd (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - paddq %mm0, %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 paddq (%rax), %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - paddq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 paddq (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - paddsb %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 paddsb (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - paddsw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 paddsw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - paddusb %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 paddusb (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - paddusw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 paddusw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - paddw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 paddw (%rax), %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - pand %xmm0, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 pand (%rax), %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - pandn %xmm0, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 pandn (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pavgb %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pavgb (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pavgw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pavgw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pcmpeqb %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pcmpeqb (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pcmpeqd %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pcmpeqd (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pcmpeqw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pcmpeqw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pcmpgtb %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pcmpgtb (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pcmpgtd %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pcmpgtd (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pcmpgtw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pcmpgtw (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - pextrw $1, %xmm0, %ecx +# CHECK-NEXT: - - 1.00 - - - - - pmaddwd %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 pmaddwd (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pmaxsw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pmaxsw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pmaxub %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pmaxub (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pminsw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pminsw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pminub %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pminub (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - pmovmskb %xmm0, %ecx +# CHECK-NEXT: - - 1.00 - - - - - pmulhuw %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 pmulhuw (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - pmulhw %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 pmulhw (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - pmullw %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 pmullw (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - pmuludq %mm0, %mm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 pmuludq (%rax), %mm2 +# CHECK-NEXT: - - 1.00 - - - - - pmuludq %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 pmuludq (%rax), %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - por %xmm0, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 por (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - psadbw %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 psadbw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pshufd $1, %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pshufd $1, (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pshufhw $1, %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pshufhw $1, (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pshuflw $1, %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pshuflw $1, (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - pslld $1, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - pslld %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 pslld (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pslldq $1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - psllq $1, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - psllq %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 psllq (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - psllw $1, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - psllw %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 psllw (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - psrad $1, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - psrad %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 psrad (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - psraw $1, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - psraw %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 psraw (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - psrld $1, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - psrld %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 psrld (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - psrldq $1, %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - psrlq $1, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - psrlq %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 psrlq (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - psrlw $1, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - psrlw %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 0.50 0.50 psrlw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - psubb %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 psubb (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - psubd %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 psubd (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - psubq %mm0, %mm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 psubq (%rax), %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - psubq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 psubq (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - psubsb %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 psubsb (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - psubsw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 psubsw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - psubusb %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 psubusb (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - psubusw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 psubusw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - psubw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 psubw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - punpckhbw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 punpckhbw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - punpckhdq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 punpckhdq (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - punpckhqdq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 punpckhqdq (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - punpckhwd %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 punpckhwd (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - punpcklbw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 punpcklbw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - punpckldq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 punpckldq (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - punpcklqdq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 punpcklqdq (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - punpcklwd %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 punpcklwd (%rax), %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - pxor %xmm0, %xmm2 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 pxor (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - shufpd $1, %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 shufpd $1, (%rax), %xmm2 +# CHECK-NEXT: - 21.00 1.00 - - - - - sqrtpd %xmm0, %xmm2 +# CHECK-NEXT: - 21.00 1.00 - - - 0.50 0.50 sqrtpd (%rax), %xmm2 +# CHECK-NEXT: - 21.00 1.00 - - - - - sqrtsd %xmm0, %xmm2 +# CHECK-NEXT: - 21.00 1.00 - - - 0.50 0.50 sqrtsd (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - subpd %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 subpd (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - subsd %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 subsd (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 1.00 - - - - ucomisd %xmm0, %xmm1 +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 ucomisd (%rax), %xmm1 +# CHECK-NEXT: - - - - - 1.00 - - unpckhpd %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 unpckhpd (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - unpcklpd %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 unpcklpd (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - xorpd %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 xorpd (%rax), %xmm2 diff --git a/test/tools/llvm-mca/X86/Generic/resources-sse3.s b/test/tools/llvm-mca/X86/Generic/resources-sse3.s new file mode 100644 index 00000000000..5bd42025296 --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-sse3.s @@ -0,0 +1,96 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +addsubpd %xmm0, %xmm2 +addsubpd (%rax), %xmm2 + +addsubps %xmm0, %xmm2 +addsubps (%rax), %xmm2 + +haddpd %xmm0, %xmm2 +haddpd (%rax), %xmm2 + +haddps %xmm0, %xmm2 +haddps (%rax), %xmm2 + +hsubpd %xmm0, %xmm2 +hsubpd (%rax), %xmm2 + +hsubps %xmm0, %xmm2 +hsubps (%rax), %xmm2 + +lddqu (%rax), %xmm2 + +movddup %xmm0, %xmm2 +movddup (%rax), %xmm2 + +movshdup %xmm0, %xmm2 +movshdup (%rax), %xmm2 + +movsldup %xmm0, %xmm2 +movsldup (%rax), %xmm2 + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 1 3 1.00 addsubpd %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * addsubpd (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 addsubps %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * addsubps (%rax), %xmm2 +# CHECK-NEXT: 3 5 2.00 haddpd %xmm0, %xmm2 +# CHECK-NEXT: 4 11 2.00 * haddpd (%rax), %xmm2 +# CHECK-NEXT: 3 5 2.00 haddps %xmm0, %xmm2 +# CHECK-NEXT: 4 11 2.00 * haddps (%rax), %xmm2 +# CHECK-NEXT: 3 5 2.00 hsubpd %xmm0, %xmm2 +# CHECK-NEXT: 4 11 2.00 * hsubpd (%rax), %xmm2 +# CHECK-NEXT: 3 5 2.00 hsubps %xmm0, %xmm2 +# CHECK-NEXT: 4 11 2.00 * hsubps (%rax), %xmm2 +# CHECK-NEXT: 1 6 0.50 * lddqu (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 movddup %xmm0, %xmm2 +# CHECK-NEXT: 1 6 0.50 * movddup (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 movshdup %xmm0, %xmm2 +# CHECK-NEXT: 1 6 0.50 * movshdup (%rax), %xmm2 +# CHECK-NEXT: 1 1 1.00 movsldup %xmm0, %xmm2 +# CHECK-NEXT: 1 6 0.50 * movsldup (%rax), %xmm2 + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - - - 12.00 - 19.00 5.00 5.00 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - - 1.00 - - - - addsubpd %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 addsubpd (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - addsubps %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 addsubps (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - 2.00 - - haddpd %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 2.00 0.50 0.50 haddpd (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - 2.00 - - haddps %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 2.00 0.50 0.50 haddps (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - 2.00 - - hsubpd %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 2.00 0.50 0.50 hsubpd (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - 2.00 - - hsubps %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 2.00 0.50 0.50 hsubps (%rax), %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 lddqu (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - movddup %xmm0, %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 movddup (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - movshdup %xmm0, %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 movshdup (%rax), %xmm2 +# CHECK-NEXT: - - - - - 1.00 - - movsldup %xmm0, %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 movsldup (%rax), %xmm2 diff --git a/test/tools/llvm-mca/X86/Generic/resources-sse41.s b/test/tools/llvm-mca/X86/Generic/resources-sse41.s new file mode 100644 index 00000000000..5b8569bbb50 --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-sse41.s @@ -0,0 +1,366 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +blendpd $11, %xmm0, %xmm2 +blendpd $11, (%rax), %xmm2 + +blendps $11, %xmm0, %xmm2 +blendps $11, (%rax), %xmm2 + +blendvpd %xmm0, %xmm2 +blendvpd (%rax), %xmm2 + +blendvps %xmm0, %xmm2 +blendvps (%rax), %xmm2 + +dppd $22, %xmm0, %xmm2 +dppd $22, (%rax), %xmm2 + +dpps $22, %xmm0, %xmm2 +dpps $22, (%rax), %xmm2 + +extractps $1, %xmm0, %rcx +extractps $1, %xmm0, (%rax) + +insertps $1, %xmm0, %xmm2 +insertps $1, (%rax), %xmm2 + +movntdqa (%rax), %xmm2 + +mpsadbw $1, %xmm0, %xmm2 +mpsadbw $1, (%rax), %xmm2 + +packusdw %xmm0, %xmm2 +packusdw (%rax), %xmm2 + +pblendvb %xmm0, %xmm2 +pblendvb (%rax), %xmm2 + +pblendw $11, %xmm0, %xmm2 +pblendw $11, (%rax), %xmm2 + +pcmpeqq %xmm0, %xmm2 +pcmpeqq (%rax), %xmm2 + +pextrb $1, %xmm0, %ecx +pextrb $1, %xmm0, (%rax) + +pextrd $1, %xmm0, %ecx +pextrd $1, %xmm0, (%rax) + +pextrq $1, %xmm0, %rcx +pextrq $1, %xmm0, (%rax) + +pextrw $1, %xmm0, (%rax) + +phminposuw %xmm0, %xmm2 +phminposuw (%rax), %xmm2 + +pinsrb $1, %eax, %xmm1 +pinsrb $1, (%rax), %xmm1 + +pinsrd $1, %eax, %xmm1 +pinsrd $1, (%rax), %xmm1 + +pinsrq $1, %rax, %xmm1 +pinsrq $1, (%rax), %xmm1 + +pmaxsb %xmm0, %xmm2 +pmaxsb (%rax), %xmm2 + +pmaxsd %xmm0, %xmm2 +pmaxsd (%rax), %xmm2 + +pmaxud %xmm0, %xmm2 +pmaxud (%rax), %xmm2 + +pmaxuw %xmm0, %xmm2 +pmaxuw (%rax), %xmm2 + +pminsb %xmm0, %xmm2 +pminsb (%rax), %xmm2 + +pminsd %xmm0, %xmm2 +pminsd (%rax), %xmm2 + +pminud %xmm0, %xmm2 +pminud (%rax), %xmm2 + +pminuw %xmm0, %xmm2 +pminuw (%rax), %xmm2 + +pmovsxbd %xmm0, %xmm2 +pmovsxbd (%rax), %xmm2 + +pmovsxbq %xmm0, %xmm2 +pmovsxbq (%rax), %xmm2 + +pmovsxbw %xmm0, %xmm2 +pmovsxbw (%rax), %xmm2 + +pmovsxdq %xmm0, %xmm2 +pmovsxdq (%rax), %xmm2 + +pmovsxwd %xmm0, %xmm2 +pmovsxwd (%rax), %xmm2 + +pmovsxwq %xmm0, %xmm2 +pmovsxwq (%rax), %xmm2 + +pmovzxbd %xmm0, %xmm2 +pmovzxbd (%rax), %xmm2 + +pmovzxbq %xmm0, %xmm2 +pmovzxbq (%rax), %xmm2 + +pmovzxbw %xmm0, %xmm2 +pmovzxbw (%rax), %xmm2 + +pmovzxdq %xmm0, %xmm2 +pmovzxdq (%rax), %xmm2 + +pmovzxwd %xmm0, %xmm2 +pmovzxwd (%rax), %xmm2 + +pmovzxwq %xmm0, %xmm2 +pmovzxwq (%rax), %xmm2 + +pmuldq %xmm0, %xmm2 +pmuldq (%rax), %xmm2 + +pmulld %xmm0, %xmm2 +pmulld (%rax), %xmm2 + +ptest %xmm0, %xmm1 +ptest (%rax), %xmm1 + +roundpd $1, %xmm0, %xmm2 +roundpd $1, (%rax), %xmm2 + +roundps $1, %xmm0, %xmm2 +roundps $1, (%rax), %xmm2 + +roundsd $1, %xmm0, %xmm2 +roundsd $1, (%rax), %xmm2 + +roundss $1, %xmm0, %xmm2 +roundss $1, (%rax), %xmm2 + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 1 1 0.50 blendpd $11, %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * blendpd $11, (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 blendps $11, %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * blendps $11, (%rax), %xmm2 +# CHECK-NEXT: 2 2 1.00 blendvpd %xmm0, %xmm0, %xmm2 +# CHECK-NEXT: 3 8 1.00 * blendvpd %xmm0, (%rax), %xmm2 +# CHECK-NEXT: 2 2 1.00 blendvps %xmm0, %xmm0, %xmm2 +# CHECK-NEXT: 3 8 1.00 * blendvps %xmm0, (%rax), %xmm2 +# CHECK-NEXT: 3 9 1.00 dppd $22, %xmm0, %xmm2 +# CHECK-NEXT: 4 15 1.00 * dppd $22, (%rax), %xmm2 +# CHECK-NEXT: 4 12 2.00 dpps $22, %xmm0, %xmm2 +# CHECK-NEXT: 5 18 2.00 * dpps $22, (%rax), %xmm2 +# CHECK-NEXT: 2 3 1.00 extractps $1, %xmm0, %ecx +# CHECK-NEXT: 3 5 1.00 * extractps $1, %xmm0, (%rax) +# CHECK-NEXT: 1 1 1.00 insertps $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 7 1.00 * insertps $1, (%rax), %xmm2 +# CHECK-NEXT: 1 6 0.50 * movntdqa (%rax), %xmm2 +# CHECK-NEXT: 3 7 1.00 mpsadbw $1, %xmm0, %xmm2 +# CHECK-NEXT: 4 13 1.00 * mpsadbw $1, (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 packusdw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * packusdw (%rax), %xmm2 +# CHECK-NEXT: 2 2 1.00 pblendvb %xmm0, %xmm0, %xmm2 +# CHECK-NEXT: 3 8 1.00 * pblendvb %xmm0, (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pblendw $11, %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pblendw $11, (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pcmpeqq %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pcmpeqq (%rax), %xmm2 +# CHECK-NEXT: 2 3 1.00 pextrb $1, %xmm0, %ecx +# CHECK-NEXT: 3 5 1.00 * pextrb $1, %xmm0, (%rax) +# CHECK-NEXT: 2 3 1.00 pextrd $1, %xmm0, %ecx +# CHECK-NEXT: 4 5 1.00 * pextrd $1, %xmm0, (%rax) +# CHECK-NEXT: 2 3 1.00 pextrq $1, %xmm0, %rcx +# CHECK-NEXT: 4 5 1.00 * pextrq $1, %xmm0, (%rax) +# CHECK-NEXT: 3 5 1.00 * pextrw $1, %xmm0, (%rax) +# CHECK-NEXT: 1 5 1.00 phminposuw %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * phminposuw (%rax), %xmm2 +# CHECK-NEXT: 2 2 1.00 pinsrb $1, %eax, %xmm1 +# CHECK-NEXT: 2 7 0.50 * pinsrb $1, (%rax), %xmm1 +# CHECK-NEXT: 2 2 1.00 pinsrd $1, %eax, %xmm1 +# CHECK-NEXT: 2 7 0.50 * pinsrd $1, (%rax), %xmm1 +# CHECK-NEXT: 2 2 1.00 pinsrq $1, %rax, %xmm1 +# CHECK-NEXT: 2 7 0.50 * pinsrq $1, (%rax), %xmm1 +# CHECK-NEXT: 1 1 0.50 pmaxsb %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pmaxsb (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pmaxsd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pmaxsd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pmaxud %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pmaxud (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pmaxuw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pmaxuw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pminsb %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pminsb (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pminsd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pminsd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pminud %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pminud (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pminuw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pminuw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pmovsxbd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pmovsxbd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pmovsxbq %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pmovsxbq (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pmovsxbw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pmovsxbw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pmovsxdq %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pmovsxdq (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pmovsxwd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pmovsxwd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pmovsxwq %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pmovsxwq (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pmovzxbd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pmovzxbd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pmovzxbq %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pmovzxbq (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pmovzxbw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pmovzxbw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pmovzxdq %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pmovzxdq (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pmovzxwd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pmovzxwd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pmovzxwq %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pmovzxwq (%rax), %xmm2 +# CHECK-NEXT: 1 5 1.00 pmuldq %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * pmuldq (%rax), %xmm2 +# CHECK-NEXT: 1 5 1.00 pmulld %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * pmulld (%rax), %xmm2 +# CHECK-NEXT: 2 2 1.00 ptest %xmm0, %xmm1 +# CHECK-NEXT: 3 8 1.00 * ptest (%rax), %xmm1 +# CHECK-NEXT: 1 3 1.00 roundpd $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * roundpd $1, (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 roundps $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * roundps $1, (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 roundsd $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * roundsd $1, (%rax), %xmm2 +# CHECK-NEXT: 1 3 1.00 roundss $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 9 1.00 * roundss $1, (%rax), %xmm2 + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - - 26.00 47.50 5.00 52.50 24.50 24.50 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - 0.50 - - 0.50 - - blendpd $11, %xmm0, %xmm2 +# CHECK-NEXT: - - 0.50 - - 0.50 0.50 0.50 blendpd $11, (%rax), %xmm2 +# CHECK-NEXT: - - 0.50 - - 0.50 - - blendps $11, %xmm0, %xmm2 +# CHECK-NEXT: - - 0.50 - - 0.50 0.50 0.50 blendps $11, (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - 1.00 - - blendvpd %xmm0, %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - 1.00 0.50 0.50 blendvpd %xmm0, (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - 1.00 - - blendvps %xmm0, %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - 1.00 0.50 0.50 blendvps %xmm0, (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 1.00 - 1.00 - - dppd $22, %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 1.00 - 1.00 0.50 0.50 dppd $22, (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 2.00 - 1.00 - - dpps $22, %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 2.00 - 1.00 0.50 0.50 dpps $22, (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - 1.00 - - extractps $1, %xmm0, %ecx +# CHECK-NEXT: - - - - 1.00 1.00 0.50 0.50 extractps $1, %xmm0, (%rax) +# CHECK-NEXT: - - - - - 1.00 - - insertps $1, %xmm0, %xmm2 +# CHECK-NEXT: - - - - - 1.00 0.50 0.50 insertps $1, (%rax), %xmm2 +# CHECK-NEXT: - - - - - - 0.50 0.50 movntdqa (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 1.00 - 1.00 - - mpsadbw $1, %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 1.00 - 1.00 0.50 0.50 mpsadbw $1, (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - packusdw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 packusdw (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 - - pblendvb %xmm0, %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - 1.00 0.50 0.50 pblendvb %xmm0, (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pblendw $11, %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pblendw $11, (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pcmpeqq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pcmpeqq (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - pextrb $1, %xmm0, %ecx +# CHECK-NEXT: - - - 0.50 1.00 0.50 0.50 0.50 pextrb $1, %xmm0, (%rax) +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - pextrd $1, %xmm0, %ecx +# CHECK-NEXT: - - 1.00 0.50 1.00 0.50 0.50 0.50 pextrd $1, %xmm0, (%rax) +# CHECK-NEXT: - - 1.00 0.50 - 0.50 - - pextrq $1, %xmm0, %rcx +# CHECK-NEXT: - - 1.00 0.50 1.00 0.50 0.50 0.50 pextrq $1, %xmm0, (%rax) +# CHECK-NEXT: - - - 0.50 1.00 0.50 0.50 0.50 pextrw $1, %xmm0, (%rax) +# CHECK-NEXT: - - 1.00 - - - - - phminposuw %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 phminposuw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 1.50 - - pinsrb $1, %eax, %xmm1 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pinsrb $1, (%rax), %xmm1 +# CHECK-NEXT: - - - 0.50 - 1.50 - - pinsrd $1, %eax, %xmm1 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pinsrd $1, (%rax), %xmm1 +# CHECK-NEXT: - - - 0.50 - 1.50 - - pinsrq $1, %rax, %xmm1 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pinsrq $1, (%rax), %xmm1 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pmaxsb %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pmaxsb (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pmaxsd %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pmaxsd (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pmaxud %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pmaxud (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pmaxuw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pmaxuw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pminsb %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pminsb (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pminsd %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pminsd (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pminud %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pminud (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pminuw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pminuw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pmovsxbd %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pmovsxbd (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pmovsxbq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pmovsxbq (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pmovsxbw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pmovsxbw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pmovsxdq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pmovsxdq (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pmovsxwd %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pmovsxwd (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pmovsxwq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pmovsxwq (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pmovzxbd %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pmovzxbd (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pmovzxbq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pmovzxbq (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pmovzxbw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pmovzxbw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pmovzxdq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pmovzxdq (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pmovzxwd %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pmovzxwd (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pmovzxwq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pmovzxwq (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - pmuldq %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 pmuldq (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - pmulld %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 pmulld (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - 1.00 - - ptest %xmm0, %xmm1 +# CHECK-NEXT: - - 1.00 - - 1.00 0.50 0.50 ptest (%rax), %xmm1 +# CHECK-NEXT: - - - 1.00 - - - - roundpd $1, %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 roundpd $1, (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - roundps $1, %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 roundps $1, (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - roundsd $1, %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 roundsd $1, (%rax), %xmm2 +# CHECK-NEXT: - - - 1.00 - - - - roundss $1, %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 roundss $1, (%rax), %xmm2 diff --git a/test/tools/llvm-mca/X86/Generic/resources-sse42.s b/test/tools/llvm-mca/X86/Generic/resources-sse42.s new file mode 100644 index 00000000000..c8bb81c98b3 --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-sse42.s @@ -0,0 +1,99 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +crc32b %al, %ecx +crc32b (%rax), %ecx + +crc32l %eax, %ecx +crc32l (%rax), %ecx + +crc32w %ax, %ecx +crc32w (%rax), %ecx + +crc32b %al, %rcx +crc32b (%rax), %rcx + +crc32q %rax, %rcx +crc32q (%rax), %rcx + +pcmpestri $1, %xmm0, %xmm2 +pcmpestri $1, (%rax), %xmm2 + +pcmpestrm $1, %xmm0, %xmm2 +pcmpestrm $1, (%rax), %xmm2 + +pcmpistri $1, %xmm0, %xmm2 +pcmpistri $1, (%rax), %xmm2 + +pcmpistrm $1, %xmm0, %xmm2 +pcmpistrm $1, (%rax), %xmm2 + +pcmpgtq %xmm0, %xmm2 +pcmpgtq (%rax), %xmm2 + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 1 3 1.00 crc32b %al, %ecx +# CHECK-NEXT: 2 8 1.00 * crc32b (%rax), %ecx +# CHECK-NEXT: 1 3 1.00 crc32l %eax, %ecx +# CHECK-NEXT: 2 8 1.00 * crc32l (%rax), %ecx +# CHECK-NEXT: 1 3 1.00 crc32w %ax, %ecx +# CHECK-NEXT: 2 8 1.00 * crc32w (%rax), %ecx +# CHECK-NEXT: 1 3 1.00 crc32b %al, %rcx +# CHECK-NEXT: 2 8 1.00 * crc32b (%rax), %rcx +# CHECK-NEXT: 1 3 1.00 crc32q %rax, %rcx +# CHECK-NEXT: 2 8 1.00 * crc32q (%rax), %rcx +# CHECK-NEXT: 1 4 2.67 pcmpestri $1, %xmm0, %xmm2 +# CHECK-NEXT: 1 4 2.33 * pcmpestri $1, (%rax), %xmm2 +# CHECK-NEXT: 1 11 2.67 pcmpestrm $1, %xmm0, %xmm2 +# CHECK-NEXT: 1 11 2.33 * pcmpestrm $1, (%rax), %xmm2 +# CHECK-NEXT: 3 11 3.00 pcmpistri $1, %xmm0, %xmm2 +# CHECK-NEXT: 4 17 3.00 * pcmpistri $1, (%rax), %xmm2 +# CHECK-NEXT: 3 11 3.00 pcmpistrm $1, %xmm0, %xmm2 +# CHECK-NEXT: 4 17 3.00 * pcmpistrm $1, (%rax), %xmm2 +# CHECK-NEXT: 1 5 1.00 pcmpgtq %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * pcmpgtq (%rax), %xmm2 + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - - 24.00 20.00 - 10.00 5.00 5.00 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - - 1.00 - - - - crc32b %al, %ecx +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 crc32b (%rax), %ecx +# CHECK-NEXT: - - - 1.00 - - - - crc32l %eax, %ecx +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 crc32l (%rax), %ecx +# CHECK-NEXT: - - - 1.00 - - - - crc32w %ax, %ecx +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 crc32w (%rax), %ecx +# CHECK-NEXT: - - - 1.00 - - - - crc32b %al, %rcx +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 crc32b (%rax), %rcx +# CHECK-NEXT: - - - 1.00 - - - - crc32q %rax, %rcx +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 crc32q (%rax), %rcx +# CHECK-NEXT: - - 2.67 2.67 - 2.67 - - pcmpestri $1, %xmm0, %xmm2 +# CHECK-NEXT: - - 2.33 2.33 - 2.33 0.50 0.50 pcmpestri $1, (%rax), %xmm2 +# CHECK-NEXT: - - 2.67 2.67 - 2.67 - - pcmpestrm $1, %xmm0, %xmm2 +# CHECK-NEXT: - - 2.33 2.33 - 2.33 0.50 0.50 pcmpestrm $1, (%rax), %xmm2 +# CHECK-NEXT: - - 3.00 - - - - - pcmpistri $1, %xmm0, %xmm2 +# CHECK-NEXT: - - 3.00 - - - 0.50 0.50 pcmpistri $1, (%rax), %xmm2 +# CHECK-NEXT: - - 3.00 - - - - - pcmpistrm $1, %xmm0, %xmm2 +# CHECK-NEXT: - - 3.00 - - - 0.50 0.50 pcmpistrm $1, (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - pcmpgtq %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 pcmpgtq (%rax), %xmm2 diff --git a/test/tools/llvm-mca/X86/Generic/resources-sse4a.s b/test/tools/llvm-mca/X86/Generic/resources-sse4a.s new file mode 100644 index 00000000000..dae11b450a2 --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-sse4a.s @@ -0,0 +1,50 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +extrq %xmm0, %xmm2 +extrq $22, $2, %xmm2 + +insertq %xmm0, %xmm2 +insertq $22, $22, %xmm0, %xmm2 + +movntsd %xmm0, (%rax) +movntss %xmm0, (%rax) + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 1 1 0.50 extrq %xmm0, %xmm2 +# CHECK-NEXT: 1 1 0.50 extrq $22, $2, %xmm2 +# CHECK-NEXT: 1 1 0.50 insertq %xmm0, %xmm2 +# CHECK-NEXT: 1 1 0.50 insertq $22, $22, %xmm0, %xmm2 +# CHECK-NEXT: 1 1 1.00 * movntsd %xmm0, (%rax) +# CHECK-NEXT: 1 1 1.00 * movntss %xmm0, (%rax) + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - - - 2.00 2.00 2.00 1.00 1.00 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - - 0.50 - 0.50 - - extrq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - extrq $22, $2, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - insertq %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - insertq $22, $22, %xmm0, %xmm2 +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movntsd %xmm0, (%rax) +# CHECK-NEXT: - - - - 1.00 - 0.50 0.50 movntss %xmm0, (%rax) diff --git a/test/tools/llvm-mca/X86/Generic/resources-ssse3.s b/test/tools/llvm-mca/X86/Generic/resources-ssse3.s new file mode 100644 index 00000000000..4e486b4761e --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-ssse3.s @@ -0,0 +1,253 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +pabsb %mm0, %mm2 +pabsb (%rax), %mm2 + +pabsb %xmm0, %xmm2 +pabsb (%rax), %xmm2 + +pabsd %mm0, %mm2 +pabsd (%rax), %mm2 + +pabsd %xmm0, %xmm2 +pabsd (%rax), %xmm2 + +pabsw %mm0, %mm2 +pabsw (%rax), %mm2 + +pabsw %xmm0, %xmm2 +pabsw (%rax), %xmm2 + +palignr $1, %mm0, %mm2 +palignr $1, (%rax), %mm2 + +palignr $1, %xmm0, %xmm2 +palignr $1, (%rax), %xmm2 + +phaddd %mm0, %mm2 +phaddd (%rax), %mm2 + +phaddd %xmm0, %xmm2 +phaddd (%rax), %xmm2 + +phaddsw %mm0, %mm2 +phaddsw (%rax), %mm2 + +phaddsw %xmm0, %xmm2 +phaddsw (%rax), %xmm2 + +phaddw %mm0, %mm2 +phaddw (%rax), %mm2 + +phaddw %xmm0, %xmm2 +phaddw (%rax), %xmm2 + +phsubd %mm0, %mm2 +phsubd (%rax), %mm2 + +phsubd %xmm0, %xmm2 +phsubd (%rax), %xmm2 + +phsubsw %mm0, %mm2 +phsubsw (%rax), %mm2 + +phsubsw %xmm0, %xmm2 +phsubsw (%rax), %xmm2 + +phsubw %mm0, %mm2 +phsubw (%rax), %mm2 + +phsubw %xmm0, %xmm2 +phsubw (%rax), %xmm2 + +pmaddubsw %mm0, %mm2 +pmaddubsw (%rax), %mm2 + +pmaddubsw %xmm0, %xmm2 +pmaddubsw (%rax), %xmm2 + +pmulhrsw %mm0, %mm2 +pmulhrsw (%rax), %mm2 + +pmulhrsw %xmm0, %xmm2 +pmulhrsw (%rax), %xmm2 + +pshufb %mm0, %mm2 +pshufb (%rax), %mm2 + +pshufb %xmm0, %xmm2 +pshufb (%rax), %xmm2 + +psignb %mm0, %mm2 +psignb (%rax), %mm2 + +psignb %xmm0, %xmm2 +psignb (%rax), %xmm2 + +psignd %mm0, %mm2 +psignd (%rax), %mm2 + +psignd %xmm0, %xmm2 +psignd (%rax), %xmm2 + +psignw %mm0, %mm2 +psignw (%rax), %mm2 + +psignw %xmm0, %xmm2 +psignw (%rax), %xmm2 + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 1 1 0.50 pabsb %mm0, %mm2 +# CHECK-NEXT: 2 6 0.50 * pabsb (%rax), %mm2 +# CHECK-NEXT: 1 1 0.50 pabsb %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pabsb (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pabsd %mm0, %mm2 +# CHECK-NEXT: 2 6 0.50 * pabsd (%rax), %mm2 +# CHECK-NEXT: 1 1 0.50 pabsd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pabsd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pabsw %mm0, %mm2 +# CHECK-NEXT: 2 6 0.50 * pabsw (%rax), %mm2 +# CHECK-NEXT: 1 1 0.50 pabsw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pabsw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 palignr $1, %mm0, %mm2 +# CHECK-NEXT: 2 6 0.50 * palignr $1, (%rax), %mm2 +# CHECK-NEXT: 1 1 0.50 palignr $1, %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * palignr $1, (%rax), %xmm2 +# CHECK-NEXT: 3 3 1.50 phaddd %mm0, %mm2 +# CHECK-NEXT: 4 8 1.50 * phaddd (%rax), %mm2 +# CHECK-NEXT: 3 3 1.50 phaddd %xmm0, %xmm2 +# CHECK-NEXT: 4 9 1.50 * phaddd (%rax), %xmm2 +# CHECK-NEXT: 3 3 1.50 phaddsw %mm0, %mm2 +# CHECK-NEXT: 4 8 1.50 * phaddsw (%rax), %mm2 +# CHECK-NEXT: 3 3 1.50 phaddsw %xmm0, %xmm2 +# CHECK-NEXT: 4 9 1.50 * phaddsw (%rax), %xmm2 +# CHECK-NEXT: 3 3 1.50 phaddw %mm0, %mm2 +# CHECK-NEXT: 4 8 1.50 * phaddw (%rax), %mm2 +# CHECK-NEXT: 3 3 1.50 phaddw %xmm0, %xmm2 +# CHECK-NEXT: 4 9 1.50 * phaddw (%rax), %xmm2 +# CHECK-NEXT: 3 3 1.50 phsubd %mm0, %mm2 +# CHECK-NEXT: 4 8 1.50 * phsubd (%rax), %mm2 +# CHECK-NEXT: 3 3 1.50 phsubd %xmm0, %xmm2 +# CHECK-NEXT: 4 9 1.50 * phsubd (%rax), %xmm2 +# CHECK-NEXT: 3 3 1.50 phsubsw %mm0, %mm2 +# CHECK-NEXT: 4 8 1.50 * phsubsw (%rax), %mm2 +# CHECK-NEXT: 3 3 1.50 phsubsw %xmm0, %xmm2 +# CHECK-NEXT: 4 9 1.50 * phsubsw (%rax), %xmm2 +# CHECK-NEXT: 3 3 1.50 phsubw %mm0, %mm2 +# CHECK-NEXT: 4 8 1.50 * phsubw (%rax), %mm2 +# CHECK-NEXT: 3 3 1.50 phsubw %xmm0, %xmm2 +# CHECK-NEXT: 4 9 1.50 * phsubw (%rax), %xmm2 +# CHECK-NEXT: 1 5 1.00 pmaddubsw %mm0, %mm2 +# CHECK-NEXT: 2 10 1.00 * pmaddubsw (%rax), %mm2 +# CHECK-NEXT: 1 5 1.00 pmaddubsw %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * pmaddubsw (%rax), %xmm2 +# CHECK-NEXT: 1 5 1.00 pmulhrsw %mm0, %mm2 +# CHECK-NEXT: 2 10 1.00 * pmulhrsw (%rax), %mm2 +# CHECK-NEXT: 1 5 1.00 pmulhrsw %xmm0, %xmm2 +# CHECK-NEXT: 2 11 1.00 * pmulhrsw (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 pshufb %mm0, %mm2 +# CHECK-NEXT: 2 6 0.50 * pshufb (%rax), %mm2 +# CHECK-NEXT: 1 1 0.50 pshufb %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * pshufb (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 psignb %mm0, %mm2 +# CHECK-NEXT: 2 6 0.50 * psignb (%rax), %mm2 +# CHECK-NEXT: 1 1 0.50 psignb %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * psignb (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 psignd %mm0, %mm2 +# CHECK-NEXT: 2 6 0.50 * psignd (%rax), %mm2 +# CHECK-NEXT: 1 1 0.50 psignd %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * psignd (%rax), %xmm2 +# CHECK-NEXT: 1 1 0.50 psignw %mm0, %mm2 +# CHECK-NEXT: 2 6 0.50 * psignw (%rax), %mm2 +# CHECK-NEXT: 1 1 0.50 psignw %xmm0, %xmm2 +# CHECK-NEXT: 2 7 0.50 * psignw (%rax), %xmm2 + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - - 8.00 52.00 - 52.00 16.00 16.00 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - - 0.50 - 0.50 - - pabsb %mm0, %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pabsb (%rax), %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pabsb %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pabsb (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pabsd %mm0, %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pabsd (%rax), %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pabsd %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pabsd (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pabsw %mm0, %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pabsw (%rax), %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pabsw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pabsw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - palignr $1, %mm0, %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 palignr $1, (%rax), %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - palignr $1, %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 palignr $1, (%rax), %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - phaddd %mm0, %mm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 phaddd (%rax), %mm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - phaddd %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 phaddd (%rax), %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - phaddsw %mm0, %mm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 phaddsw (%rax), %mm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - phaddsw %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 phaddsw (%rax), %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - phaddw %mm0, %mm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 phaddw (%rax), %mm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - phaddw %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 phaddw (%rax), %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - phsubd %mm0, %mm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 phsubd (%rax), %mm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - phsubd %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 phsubd (%rax), %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - phsubsw %mm0, %mm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 phsubsw (%rax), %mm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - phsubsw %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 phsubsw (%rax), %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - phsubw %mm0, %mm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 phsubw (%rax), %mm2 +# CHECK-NEXT: - - - 1.50 - 1.50 - - phsubw %xmm0, %xmm2 +# CHECK-NEXT: - - - 1.50 - 1.50 0.50 0.50 phsubw (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - pmaddubsw %mm0, %mm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 pmaddubsw (%rax), %mm2 +# CHECK-NEXT: - - 1.00 - - - - - pmaddubsw %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 pmaddubsw (%rax), %xmm2 +# CHECK-NEXT: - - 1.00 - - - - - pmulhrsw %mm0, %mm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 pmulhrsw (%rax), %mm2 +# CHECK-NEXT: - - 1.00 - - - - - pmulhrsw %xmm0, %xmm2 +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 pmulhrsw (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pshufb %mm0, %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pshufb (%rax), %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - pshufb %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 pshufb (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - psignb %mm0, %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 psignb (%rax), %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - psignb %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 psignb (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - psignd %mm0, %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 psignd (%rax), %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - psignd %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 psignd (%rax), %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - psignw %mm0, %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 psignw (%rax), %mm2 +# CHECK-NEXT: - - - 0.50 - 0.50 - - psignw %xmm0, %xmm2 +# CHECK-NEXT: - - - 0.50 - 0.50 0.50 0.50 psignw (%rax), %xmm2 diff --git a/test/tools/llvm-mca/X86/Generic/resources-x86_64.s b/test/tools/llvm-mca/X86/Generic/resources-x86_64.s new file mode 100644 index 00000000000..ca655c41e20 --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-x86_64.s @@ -0,0 +1,1708 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +adcb $7, %al +adcb $7, %dil +adcb $7, (%rax) +adcb %sil, %dil +adcb %sil, (%rax) +adcb (%rax), %dil + +adcw $511, %ax +adcw $511, %di +adcw $511, (%rax) +adcw $7, %di +adcw $7, (%rax) +adcw %si, %di +adcw %si, (%rax) +adcw (%rax), %di + +adcl $665536, %eax +adcl $665536, %edi +adcl $665536, (%rax) +adcl $7, %edi +adcl $7, (%rax) +adcl %esi, %edi +adcl %esi, (%rax) +adcl (%rax), %edi + +adcq $665536, %rax +adcq $665536, %rdi +adcq $665536, (%rax) +adcq $7, %rdi +adcq $7, (%rax) +adcq %rsi, %rdi +adcq %rsi, (%rax) +adcq (%rax), %rdi + +addb $7, %al +addb $7, %dil +addb $7, (%rax) +addb %sil, %dil +addb %sil, (%rax) +addb (%rax), %dil + +addw $511, %ax +addw $511, %di +addw $511, (%rax) +addw $7, %di +addw $7, (%rax) +addw %si, %di +addw %si, (%rax) +addw (%rax), %di + +addl $665536, %eax +addl $665536, %edi +addl $665536, (%rax) +addl $7, %edi +addl $7, (%rax) +addl %esi, %edi +addl %esi, (%rax) +addl (%rax), %edi + +addq $665536, %rax +addq $665536, %rdi +addq $665536, (%rax) +addq $7, %rdi +addq $7, (%rax) +addq %rsi, %rdi +addq %rsi, (%rax) +addq (%rax), %rdi + +andb $7, %al +andb $7, %dil +andb $7, (%rax) +andb %sil, %dil +andb %sil, (%rax) +andb (%rax), %dil + +andw $511, %ax +andw $511, %di +andw $511, (%rax) +andw $7, %di +andw $7, (%rax) +andw %si, %di +andw %si, (%rax) +andw (%rax), %di + +andl $665536, %eax +andl $665536, %edi +andl $665536, (%rax) +andl $7, %edi +andl $7, (%rax) +andl %esi, %edi +andl %esi, (%rax) +andl (%rax), %edi + +andq $665536, %rax +andq $665536, %rdi +andq $665536, (%rax) +andq $7, %rdi +andq $7, (%rax) +andq %rsi, %rdi +andq %rsi, (%rax) +andq (%rax), %rdi + +btw %si, %di +btcw %si, %di +btrw %si, %di +btsw %si, %di +btw %si, (%rax) +btcw %si, (%rax) +btrw %si, (%rax) +btsw %si, (%rax) +btw $7, %di +btcw $7, %di +btrw $7, %di +btsw $7, %di +btw $7, (%rax) +btcw $7, (%rax) +btrw $7, (%rax) +btsw $7, (%rax) + +btl %esi, %edi +btcl %esi, %edi +btrl %esi, %edi +btsl %esi, %edi +btl %esi, (%rax) +btcl %esi, (%rax) +btrl %esi, (%rax) +btsl %esi, (%rax) +btl $7, %edi +btcl $7, %edi +btrl $7, %edi +btsl $7, %edi +btl $7, (%rax) +btcl $7, (%rax) +btrl $7, (%rax) +btsl $7, (%rax) + +btq %rsi, %rdi +btcq %rsi, %rdi +btrq %rsi, %rdi +btsq %rsi, %rdi +btq %rsi, (%rax) +btcq %rsi, (%rax) +btrq %rsi, (%rax) +btsq %rsi, (%rax) +btq $7, %rdi +btcq $7, %rdi +btrq $7, %rdi +btsq $7, %rdi +btq $7, (%rax) +btcq $7, (%rax) +btrq $7, (%rax) +btsq $7, (%rax) + +clc + +decb %dil +decb (%rax) +decw %di +decw (%rax) +decl %edi +decl (%rax) +decq %rdi +decq (%rax) + +divb %dil +divb (%rax) +divw %si +divw (%rax) +divl %edx +divl (%rax) +divq %rcx +divq (%rax) + +idivb %dil +idivb (%rax) +idivw %si +idivw (%rax) +idivl %edx +idivl (%rax) +idivq %rcx +idivq (%rax) + +imulb %dil +imulb (%rax) + +imulw %di +imulw (%rax) +imulw %si, %di +imulw (%rax), %di +imulw $511, %si, %di +imulw $511, (%rax), %di +imulw $7, %si, %di +imulw $7, (%rax), %di + +imull %edi +imull (%rax) +imull %esi, %edi +imull (%rax), %edi +imull $665536, %esi, %edi +imull $665536, (%rax), %edi +imull $7, %esi, %edi +imull $7, (%rax), %edi + +imulq %rdi +imulq (%rax) +imulq %rsi, %rdi +imulq (%rax), %rdi +imulq $665536, %rsi, %rdi +imulq $665536, (%rax), %rdi +imulq $7, %rsi, %rdi +imulq $7, (%rax), %rdi + +incb %dil +incb (%rax) +incw %di +incw (%rax) +incl %edi +incl (%rax) +incq %rdi +incq (%rax) + +mulb %dil +mulb (%rax) +mulw %si +mulw (%rax) +mull %edx +mull (%rax) +mulq %rcx +mulq (%rax) + +negb %dil +negb (%r8) +negw %si +negw (%r9) +negl %edx +negl (%rax) +negq %rcx +negq (%r10) + +nop +nopw %di +nopw (%rcx) +nopl %esi +nopl (%r8) +nopq %rdx +nopq (%r9) + +notb %dil +notb (%r8) +notw %si +notw (%r9) +notl %edx +notl (%rax) +notq %rcx +notq (%r10) + +orb $7, %al +orb $7, %dil +orb $7, (%rax) +orb %sil, %dil +orb %sil, (%rax) +orb (%rax), %dil + +orw $511, %ax +orw $511, %di +orw $511, (%rax) +orw $7, %di +orw $7, (%rax) +orw %si, %di +orw %si, (%rax) +orw (%rax), %di + +orl $665536, %eax +orl $665536, %edi +orl $665536, (%rax) +orl $7, %edi +orl $7, (%rax) +orl %esi, %edi +orl %esi, (%rax) +orl (%rax), %edi + +orq $665536, %rax +orq $665536, %rdi +orq $665536, (%rax) +orq $7, %rdi +orq $7, (%rax) +orq %rsi, %rdi +orq %rsi, (%rax) +orq (%rax), %rdi + +rclb %dil +rcrb %dil +rclb (%rax) +rcrb (%rax) +rclb $7, %dil +rcrb $7, %dil +rclb $7, (%rax) +rcrb $7, (%rax) +rclb %cl, %dil +rcrb %cl, %dil +rclb %cl, (%rax) +rcrb %cl, (%rax) + +rclw %di +rcrw %di +rclw (%rax) +rcrw (%rax) +rclw $7, %di +rcrw $7, %di +rclw $7, (%rax) +rcrw $7, (%rax) +rclw %cl, %di +rcrw %cl, %di +rclw %cl, (%rax) +rcrw %cl, (%rax) + +rcll %edi +rcrl %edi +rcll (%rax) +rcrl (%rax) +rcll $7, %edi +rcrl $7, %edi +rcll $7, (%rax) +rcrl $7, (%rax) +rcll %cl, %edi +rcrl %cl, %edi +rcll %cl, (%rax) +rcrl %cl, (%rax) + +rclq %rdi +rcrq %rdi +rclq (%rax) +rcrq (%rax) +rclq $7, %rdi +rcrq $7, %rdi +rclq $7, (%rax) +rcrq $7, (%rax) +rclq %cl, %rdi +rcrq %cl, %rdi +rclq %cl, (%rax) +rcrq %cl, (%rax) + +rolb %dil +rorb %dil +rolb (%rax) +rorb (%rax) +rolb $7, %dil +rorb $7, %dil +rolb $7, (%rax) +rorb $7, (%rax) +rolb %cl, %dil +rorb %cl, %dil +rolb %cl, (%rax) +rorb %cl, (%rax) + +rolw %di +rorw %di +rolw (%rax) +rorw (%rax) +rolw $7, %di +rorw $7, %di +rolw $7, (%rax) +rorw $7, (%rax) +rolw %cl, %di +rorw %cl, %di +rolw %cl, (%rax) +rorw %cl, (%rax) + +roll %edi +rorl %edi +roll (%rax) +rorl (%rax) +roll $7, %edi +rorl $7, %edi +roll $7, (%rax) +rorl $7, (%rax) +roll %cl, %edi +rorl %cl, %edi +roll %cl, (%rax) +rorl %cl, (%rax) + +rolq %rdi +rorq %rdi +rolq (%rax) +rorq (%rax) +rolq $7, %rdi +rorq $7, %rdi +rolq $7, (%rax) +rorq $7, (%rax) +rolq %cl, %rdi +rorq %cl, %rdi +rolq %cl, (%rax) +rorq %cl, (%rax) + +sarb %dil +shlb %dil +shrb %dil +sarb (%rax) +shlb (%rax) +shrb (%rax) +sarb $7, %dil +shlb $7, %dil +shrb $7, %dil +sarb $7, (%rax) +shlb $7, (%rax) +shrb $7, (%rax) +sarb %cl, %dil +shlb %cl, %dil +shrb %cl, %dil +sarb %cl, (%rax) +shlb %cl, (%rax) +shrb %cl, (%rax) + +sarw %di +shlw %di +shrw %di +sarw (%rax) +shlw (%rax) +shrw (%rax) +sarw $7, %di +shlw $7, %di +shrw $7, %di +sarw $7, (%rax) +shlw $7, (%rax) +shrw $7, (%rax) +sarw %cl, %di +shlw %cl, %di +shrw %cl, %di +sarw %cl, (%rax) +shlw %cl, (%rax) +shrw %cl, (%rax) + +sarl %edi +shll %edi +shrl %edi +sarl (%rax) +shll (%rax) +shrl (%rax) +sarl $7, %edi +shll $7, %edi +shrl $7, %edi +sarl $7, (%rax) +shll $7, (%rax) +shrl $7, (%rax) +sarl %cl, %edi +shll %cl, %edi +shrl %cl, %edi +sarl %cl, (%rax) +shll %cl, (%rax) +shrl %cl, (%rax) + +sarq %rdi +shlq %rdi +shrq %rdi +sarq (%rax) +shlq (%rax) +shrq (%rax) +sarq $7, %rdi +shlq $7, %rdi +shrq $7, %rdi +sarq $7, (%rax) +shlq $7, (%rax) +shrq $7, (%rax) +sarq %cl, %rdi +shlq %cl, %rdi +shrq %cl, %rdi +sarq %cl, (%rax) +shlq %cl, (%rax) +shrq %cl, (%rax) + +sbbb $7, %al +sbbb $7, %dil +sbbb $7, (%rax) +sbbb %sil, %dil +sbbb %sil, (%rax) +sbbb (%rax), %dil + +sbbw $511, %ax +sbbw $511, %di +sbbw $511, (%rax) +sbbw $7, %di +sbbw $7, (%rax) +sbbw %si, %di +sbbw %si, (%rax) +sbbw (%rax), %di + +sbbl $665536, %eax +sbbl $665536, %edi +sbbl $665536, (%rax) +sbbl $7, %edi +sbbl $7, (%rax) +sbbl %esi, %edi +sbbl %esi, (%rax) +sbbl (%rax), %edi + +sbbq $665536, %rax +sbbq $665536, %rdi +sbbq $665536, (%rax) +sbbq $7, %rdi +sbbq $7, (%rax) +sbbq %rsi, %rdi +sbbq %rsi, (%rax) +sbbq (%rax), %rdi + +shldw %cl, %si, %di +shrdw %cl, %si, %di +shldw %cl, %si, (%rax) +shrdw %cl, %si, (%rax) +shldw $7, %si, %di +shrdw $7, %si, %di +shldw $7, %si, (%rax) +shrdw $7, %si, (%rax) + +shldl %cl, %esi, %edi +shrdl %cl, %esi, %edi +shldl %cl, %esi, (%rax) +shrdl %cl, %esi, (%rax) +shldl $7, %esi, %edi +shrdl $7, %esi, %edi +shldl $7, %esi, (%rax) +shrdl $7, %esi, (%rax) + +shldq %cl, %rsi, %rdi +shrdq %cl, %rsi, %rdi +shldq %cl, %rsi, (%rax) +shrdq %cl, %rsi, (%rax) +shldq $7, %rsi, %rdi +shrdq $7, %rsi, %rdi +shldq $7, %rsi, (%rax) +shrdq $7, %rsi, (%rax) + +subb $7, %al +subb $7, %dil +subb $7, (%rax) +subb %sil, %dil +subb %sil, (%rax) +subb (%rax), %dil + +subw $511, %ax +subw $511, %di +subw $511, (%rax) +subw $7, %di +subw $7, (%rax) +subw %si, %di +subw %si, (%rax) +subw (%rax), %di + +subl $665536, %eax +subl $665536, %edi +subl $665536, (%rax) +subl $7, %edi +subl $7, (%rax) +subl %esi, %edi +subl %esi, (%rax) +subl (%rax), %edi + +subq $665536, %rax +subq $665536, %rdi +subq $665536, (%rax) +subq $7, %rdi +subq $7, (%rax) +subq %rsi, %rdi +subq %rsi, (%rax) +subq (%rax), %rdi + +xorb $7, %al +xorb $7, %dil +xorb $7, (%rax) +xorb %sil, %dil +xorb %sil, (%rax) +xorb (%rax), %dil + +xorw $511, %ax +xorw $511, %di +xorw $511, (%rax) +xorw $7, %di +xorw $7, (%rax) +xorw %si, %di +xorw %si, (%rax) +xorw (%rax), %di + +xorl $665536, %eax +xorl $665536, %edi +xorl $665536, (%rax) +xorl $7, %edi +xorl $7, (%rax) +xorl %esi, %edi +xorl %esi, (%rax) +xorl (%rax), %edi + +xorq $665536, %rax +xorq $665536, %rdi +xorq $665536, (%rax) +xorq $7, %rdi +xorq $7, (%rax) +xorq %rsi, %rdi +xorq %rsi, (%rax) +xorq (%rax), %rdi + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 2 2 0.67 adcb $7, %al +# CHECK-NEXT: 2 2 0.67 adcb $7, %dil +# CHECK-NEXT: 6 9 1.00 * * adcb $7, (%rax) +# CHECK-NEXT: 2 2 0.67 adcb %sil, %dil +# CHECK-NEXT: 6 9 1.00 * * adcb %sil, (%rax) +# CHECK-NEXT: 3 7 0.67 * adcb (%rax), %dil +# CHECK-NEXT: 2 2 0.67 adcw $511, %ax +# CHECK-NEXT: 2 2 0.67 adcw $511, %di +# CHECK-NEXT: 6 9 1.00 * * adcw $511, (%rax) +# CHECK-NEXT: 2 2 0.67 adcw $7, %di +# CHECK-NEXT: 6 9 1.00 * * adcw $7, (%rax) +# CHECK-NEXT: 2 2 0.67 adcw %si, %di +# CHECK-NEXT: 6 9 1.00 * * adcw %si, (%rax) +# CHECK-NEXT: 3 7 0.67 * adcw (%rax), %di +# CHECK-NEXT: 2 2 0.67 adcl $665536, %eax +# CHECK-NEXT: 2 2 0.67 adcl $665536, %edi +# CHECK-NEXT: 6 9 1.00 * * adcl $665536, (%rax) +# CHECK-NEXT: 2 2 0.67 adcl $7, %edi +# CHECK-NEXT: 6 9 1.00 * * adcl $7, (%rax) +# CHECK-NEXT: 2 2 0.67 adcl %esi, %edi +# CHECK-NEXT: 6 9 1.00 * * adcl %esi, (%rax) +# CHECK-NEXT: 3 7 0.67 * adcl (%rax), %edi +# CHECK-NEXT: 2 2 0.67 adcq $665536, %rax +# CHECK-NEXT: 2 2 0.67 adcq $665536, %rdi +# CHECK-NEXT: 6 9 1.00 * * adcq $665536, (%rax) +# CHECK-NEXT: 2 2 0.67 adcq $7, %rdi +# CHECK-NEXT: 6 9 1.00 * * adcq $7, (%rax) +# CHECK-NEXT: 2 2 0.67 adcq %rsi, %rdi +# CHECK-NEXT: 6 9 1.00 * * adcq %rsi, (%rax) +# CHECK-NEXT: 3 7 0.67 * adcq (%rax), %rdi +# CHECK-NEXT: 1 1 0.33 addb $7, %al +# CHECK-NEXT: 1 1 0.33 addb $7, %dil +# CHECK-NEXT: 3 7 1.00 * * addb $7, (%rax) +# CHECK-NEXT: 1 1 0.33 addb %sil, %dil +# CHECK-NEXT: 3 7 1.00 * * addb %sil, (%rax) +# CHECK-NEXT: 2 6 0.50 * addb (%rax), %dil +# CHECK-NEXT: 1 1 0.33 addw $511, %ax +# CHECK-NEXT: 1 1 0.33 addw $511, %di +# CHECK-NEXT: 3 7 1.00 * * addw $511, (%rax) +# CHECK-NEXT: 1 1 0.33 addw $7, %di +# CHECK-NEXT: 3 7 1.00 * * addw $7, (%rax) +# CHECK-NEXT: 1 1 0.33 addw %si, %di +# CHECK-NEXT: 3 7 1.00 * * addw %si, (%rax) +# CHECK-NEXT: 2 6 0.50 * addw (%rax), %di +# CHECK-NEXT: 1 1 0.33 addl $665536, %eax +# CHECK-NEXT: 1 1 0.33 addl $665536, %edi +# CHECK-NEXT: 3 7 1.00 * * addl $665536, (%rax) +# CHECK-NEXT: 1 1 0.33 addl $7, %edi +# CHECK-NEXT: 3 7 1.00 * * addl $7, (%rax) +# CHECK-NEXT: 1 1 0.33 addl %esi, %edi +# CHECK-NEXT: 3 7 1.00 * * addl %esi, (%rax) +# CHECK-NEXT: 2 6 0.50 * addl (%rax), %edi +# CHECK-NEXT: 1 1 0.33 addq $665536, %rax +# CHECK-NEXT: 1 1 0.33 addq $665536, %rdi +# CHECK-NEXT: 3 7 1.00 * * addq $665536, (%rax) +# CHECK-NEXT: 1 1 0.33 addq $7, %rdi +# CHECK-NEXT: 3 7 1.00 * * addq $7, (%rax) +# CHECK-NEXT: 1 1 0.33 addq %rsi, %rdi +# CHECK-NEXT: 3 7 1.00 * * addq %rsi, (%rax) +# CHECK-NEXT: 2 6 0.50 * addq (%rax), %rdi +# CHECK-NEXT: 1 1 0.33 andb $7, %al +# CHECK-NEXT: 1 1 0.33 andb $7, %dil +# CHECK-NEXT: 3 7 1.00 * * andb $7, (%rax) +# CHECK-NEXT: 1 1 0.33 andb %sil, %dil +# CHECK-NEXT: 3 7 1.00 * * andb %sil, (%rax) +# CHECK-NEXT: 2 6 0.50 * andb (%rax), %dil +# CHECK-NEXT: 1 1 0.33 andw $511, %ax +# CHECK-NEXT: 1 1 0.33 andw $511, %di +# CHECK-NEXT: 3 7 1.00 * * andw $511, (%rax) +# CHECK-NEXT: 1 1 0.33 andw $7, %di +# CHECK-NEXT: 3 7 1.00 * * andw $7, (%rax) +# CHECK-NEXT: 1 1 0.33 andw %si, %di +# CHECK-NEXT: 3 7 1.00 * * andw %si, (%rax) +# CHECK-NEXT: 2 6 0.50 * andw (%rax), %di +# CHECK-NEXT: 1 1 0.33 andl $665536, %eax +# CHECK-NEXT: 1 1 0.33 andl $665536, %edi +# CHECK-NEXT: 3 7 1.00 * * andl $665536, (%rax) +# CHECK-NEXT: 1 1 0.33 andl $7, %edi +# CHECK-NEXT: 3 7 1.00 * * andl $7, (%rax) +# CHECK-NEXT: 1 1 0.33 andl %esi, %edi +# CHECK-NEXT: 3 7 1.00 * * andl %esi, (%rax) +# CHECK-NEXT: 2 6 0.50 * andl (%rax), %edi +# CHECK-NEXT: 1 1 0.33 andq $665536, %rax +# CHECK-NEXT: 1 1 0.33 andq $665536, %rdi +# CHECK-NEXT: 3 7 1.00 * * andq $665536, (%rax) +# CHECK-NEXT: 1 1 0.33 andq $7, %rdi +# CHECK-NEXT: 3 7 1.00 * * andq $7, (%rax) +# CHECK-NEXT: 1 1 0.33 andq %rsi, %rdi +# CHECK-NEXT: 3 7 1.00 * * andq %rsi, (%rax) +# CHECK-NEXT: 2 6 0.50 * andq (%rax), %rdi +# CHECK-NEXT: 1 1 0.50 btw %si, %di +# CHECK-NEXT: 1 1 0.50 btcw %si, %di +# CHECK-NEXT: 1 1 0.50 btrw %si, %di +# CHECK-NEXT: 1 1 0.50 btsw %si, %di +# CHECK-NEXT: 6 9 1.00 * btw %si, (%rax) +# CHECK-NEXT: 6 9 1.00 * * btcw %si, (%rax) +# CHECK-NEXT: 6 9 1.00 * * btrw %si, (%rax) +# CHECK-NEXT: 6 9 1.00 * * btsw %si, (%rax) +# CHECK-NEXT: 1 1 0.50 btw $7, %di +# CHECK-NEXT: 1 1 0.50 btcw $7, %di +# CHECK-NEXT: 1 1 0.50 btrw $7, %di +# CHECK-NEXT: 1 1 0.50 btsw $7, %di +# CHECK-NEXT: 2 6 0.50 * btw $7, (%rax) +# CHECK-NEXT: 4 7 1.00 * * btcw $7, (%rax) +# CHECK-NEXT: 4 7 1.00 * * btrw $7, (%rax) +# CHECK-NEXT: 4 7 1.00 * * btsw $7, (%rax) +# CHECK-NEXT: 1 1 0.50 btl %esi, %edi +# CHECK-NEXT: 1 1 0.50 btcl %esi, %edi +# CHECK-NEXT: 1 1 0.50 btrl %esi, %edi +# CHECK-NEXT: 1 1 0.50 btsl %esi, %edi +# CHECK-NEXT: 6 9 1.00 * btl %esi, (%rax) +# CHECK-NEXT: 6 9 1.00 * * btcl %esi, (%rax) +# CHECK-NEXT: 6 9 1.00 * * btrl %esi, (%rax) +# CHECK-NEXT: 6 9 1.00 * * btsl %esi, (%rax) +# CHECK-NEXT: 1 1 0.50 btl $7, %edi +# CHECK-NEXT: 1 1 0.50 btcl $7, %edi +# CHECK-NEXT: 1 1 0.50 btrl $7, %edi +# CHECK-NEXT: 1 1 0.50 btsl $7, %edi +# CHECK-NEXT: 2 6 0.50 * btl $7, (%rax) +# CHECK-NEXT: 4 7 1.00 * * btcl $7, (%rax) +# CHECK-NEXT: 4 7 1.00 * * btrl $7, (%rax) +# CHECK-NEXT: 4 7 1.00 * * btsl $7, (%rax) +# CHECK-NEXT: 1 1 0.50 btq %rsi, %rdi +# CHECK-NEXT: 1 1 0.50 btcq %rsi, %rdi +# CHECK-NEXT: 1 1 0.50 btrq %rsi, %rdi +# CHECK-NEXT: 1 1 0.50 btsq %rsi, %rdi +# CHECK-NEXT: 6 9 1.00 * btq %rsi, (%rax) +# CHECK-NEXT: 6 9 1.00 * * btcq %rsi, (%rax) +# CHECK-NEXT: 6 9 1.00 * * btrq %rsi, (%rax) +# CHECK-NEXT: 6 9 1.00 * * btsq %rsi, (%rax) +# CHECK-NEXT: 1 1 0.50 btq $7, %rdi +# CHECK-NEXT: 1 1 0.50 btcq $7, %rdi +# CHECK-NEXT: 1 1 0.50 btrq $7, %rdi +# CHECK-NEXT: 1 1 0.50 btsq $7, %rdi +# CHECK-NEXT: 2 6 0.50 * btq $7, (%rax) +# CHECK-NEXT: 4 7 1.00 * * btcq $7, (%rax) +# CHECK-NEXT: 4 7 1.00 * * btrq $7, (%rax) +# CHECK-NEXT: 4 7 1.00 * * btsq $7, (%rax) +# CHECK-NEXT: 1 1 0.25 * clc +# CHECK-NEXT: 1 1 0.33 decb %dil +# CHECK-NEXT: 3 7 1.00 * * decb (%rax) +# CHECK-NEXT: 1 1 0.33 decw %di +# CHECK-NEXT: 3 7 1.00 * * decw (%rax) +# CHECK-NEXT: 1 1 0.33 decl %edi +# CHECK-NEXT: 3 7 1.00 * * decl (%rax) +# CHECK-NEXT: 1 1 0.33 decq %rdi +# CHECK-NEXT: 3 7 1.00 * * decq (%rax) +# CHECK-NEXT: 1 25 10.00 * divb %dil +# CHECK-NEXT: 2 30 10.00 * * divb (%rax) +# CHECK-NEXT: 1 25 10.00 * divw %si +# CHECK-NEXT: 2 30 10.00 * * divw (%rax) +# CHECK-NEXT: 1 25 10.00 * divl %edx +# CHECK-NEXT: 2 30 10.00 * * divl (%rax) +# CHECK-NEXT: 1 25 10.00 * divq %rcx +# CHECK-NEXT: 2 30 10.00 * * divq (%rax) +# CHECK-NEXT: 1 25 10.00 * idivb %dil +# CHECK-NEXT: 2 30 10.00 * * idivb (%rax) +# CHECK-NEXT: 1 25 10.00 * idivw %si +# CHECK-NEXT: 2 30 10.00 * * idivw (%rax) +# CHECK-NEXT: 1 25 10.00 * idivl %edx +# CHECK-NEXT: 2 30 10.00 * * idivl (%rax) +# CHECK-NEXT: 1 25 10.00 * idivq %rcx +# CHECK-NEXT: 2 30 10.00 * * idivq (%rax) +# CHECK-NEXT: 1 3 1.00 imulb %dil +# CHECK-NEXT: 2 8 1.00 * imulb (%rax) +# CHECK-NEXT: 4 4 1.33 imulw %di +# CHECK-NEXT: 5 9 1.33 * imulw (%rax) +# CHECK-NEXT: 1 3 1.00 imulw %si, %di +# CHECK-NEXT: 2 8 1.00 * imulw (%rax), %di +# CHECK-NEXT: 2 4 1.00 imulw $511, %si, %di +# CHECK-NEXT: 3 8 1.00 * imulw $511, (%rax), %di +# CHECK-NEXT: 2 4 1.00 imulw $7, %si, %di +# CHECK-NEXT: 3 8 1.00 * imulw $7, (%rax), %di +# CHECK-NEXT: 3 4 1.00 imull %edi +# CHECK-NEXT: 4 9 1.00 * imull (%rax) +# CHECK-NEXT: 1 3 1.00 imull %esi, %edi +# CHECK-NEXT: 2 8 1.00 * imull (%rax), %edi +# CHECK-NEXT: 1 3 1.00 imull $665536, %esi, %edi +# CHECK-NEXT: 2 8 1.00 * imull $665536, (%rax), %edi +# CHECK-NEXT: 1 3 1.00 imull $7, %esi, %edi +# CHECK-NEXT: 2 8 1.00 * imull $7, (%rax), %edi +# CHECK-NEXT: 2 4 1.00 imulq %rdi +# CHECK-NEXT: 3 9 1.00 * imulq (%rax) +# CHECK-NEXT: 1 3 1.00 imulq %rsi, %rdi +# CHECK-NEXT: 2 8 1.00 * imulq (%rax), %rdi +# CHECK-NEXT: 1 3 1.00 imulq $665536, %rsi, %rdi +# CHECK-NEXT: 2 8 1.00 * imulq $665536, (%rax), %rdi +# CHECK-NEXT: 1 3 1.00 imulq $7, %rsi, %rdi +# CHECK-NEXT: 2 8 1.00 * imulq $7, (%rax), %rdi +# CHECK-NEXT: 1 1 0.33 incb %dil +# CHECK-NEXT: 3 7 1.00 * * incb (%rax) +# CHECK-NEXT: 1 1 0.33 incw %di +# CHECK-NEXT: 3 7 1.00 * * incw (%rax) +# CHECK-NEXT: 1 1 0.33 incl %edi +# CHECK-NEXT: 3 7 1.00 * * incl (%rax) +# CHECK-NEXT: 1 1 0.33 incq %rdi +# CHECK-NEXT: 3 7 1.00 * * incq (%rax) +# CHECK-NEXT: 1 3 1.00 mulb %dil +# CHECK-NEXT: 2 8 1.00 * mulb (%rax) +# CHECK-NEXT: 4 4 1.33 mulw %si +# CHECK-NEXT: 5 9 1.33 * mulw (%rax) +# CHECK-NEXT: 3 4 1.00 mull %edx +# CHECK-NEXT: 4 9 1.00 * mull (%rax) +# CHECK-NEXT: 2 4 1.00 mulq %rcx +# CHECK-NEXT: 3 9 1.00 * mulq (%rax) +# CHECK-NEXT: 1 1 0.33 negb %dil +# CHECK-NEXT: 3 7 1.00 * * negb (%r8) +# CHECK-NEXT: 1 1 0.33 negw %si +# CHECK-NEXT: 3 7 1.00 * * negw (%r9) +# CHECK-NEXT: 1 1 0.33 negl %edx +# CHECK-NEXT: 3 7 1.00 * * negl (%rax) +# CHECK-NEXT: 1 1 0.33 negq %rcx +# CHECK-NEXT: 3 7 1.00 * * negq (%r10) +# CHECK-NEXT: 1 1 0.25 nop +# CHECK-NEXT: 1 1 0.25 nopw %di +# CHECK-NEXT: 1 1 0.25 nopw (%rcx) +# CHECK-NEXT: 1 1 0.25 nopl %esi +# CHECK-NEXT: 1 1 0.25 nopl (%r8) +# CHECK-NEXT: 1 1 0.25 nopq %rdx +# CHECK-NEXT: 1 1 0.25 nopq (%r9) +# CHECK-NEXT: 1 1 0.33 notb %dil +# CHECK-NEXT: 3 7 1.00 * * notb (%r8) +# CHECK-NEXT: 1 1 0.33 notw %si +# CHECK-NEXT: 3 7 1.00 * * notw (%r9) +# CHECK-NEXT: 1 1 0.33 notl %edx +# CHECK-NEXT: 3 7 1.00 * * notl (%rax) +# CHECK-NEXT: 1 1 0.33 notq %rcx +# CHECK-NEXT: 3 7 1.00 * * notq (%r10) +# CHECK-NEXT: 1 1 0.33 orb $7, %al +# CHECK-NEXT: 1 1 0.33 orb $7, %dil +# CHECK-NEXT: 3 7 1.00 * * orb $7, (%rax) +# CHECK-NEXT: 1 1 0.33 orb %sil, %dil +# CHECK-NEXT: 3 7 1.00 * * orb %sil, (%rax) +# CHECK-NEXT: 2 6 0.50 * orb (%rax), %dil +# CHECK-NEXT: 1 1 0.33 orw $511, %ax +# CHECK-NEXT: 1 1 0.33 orw $511, %di +# CHECK-NEXT: 3 7 1.00 * * orw $511, (%rax) +# CHECK-NEXT: 1 1 0.33 orw $7, %di +# CHECK-NEXT: 3 7 1.00 * * orw $7, (%rax) +# CHECK-NEXT: 1 1 0.33 orw %si, %di +# CHECK-NEXT: 3 7 1.00 * * orw %si, (%rax) +# CHECK-NEXT: 2 6 0.50 * orw (%rax), %di +# CHECK-NEXT: 1 1 0.33 orl $665536, %eax +# CHECK-NEXT: 1 1 0.33 orl $665536, %edi +# CHECK-NEXT: 3 7 1.00 * * orl $665536, (%rax) +# CHECK-NEXT: 1 1 0.33 orl $7, %edi +# CHECK-NEXT: 3 7 1.00 * * orl $7, (%rax) +# CHECK-NEXT: 1 1 0.33 orl %esi, %edi +# CHECK-NEXT: 3 7 1.00 * * orl %esi, (%rax) +# CHECK-NEXT: 2 6 0.50 * orl (%rax), %edi +# CHECK-NEXT: 1 1 0.33 orq $665536, %rax +# CHECK-NEXT: 1 1 0.33 orq $665536, %rdi +# CHECK-NEXT: 3 7 1.00 * * orq $665536, (%rax) +# CHECK-NEXT: 1 1 0.33 orq $7, %rdi +# CHECK-NEXT: 3 7 1.00 * * orq $7, (%rax) +# CHECK-NEXT: 1 1 0.33 orq %rsi, %rdi +# CHECK-NEXT: 3 7 1.00 * * orq %rsi, (%rax) +# CHECK-NEXT: 2 6 0.50 * orq (%rax), %rdi +# CHECK-NEXT: 1 1 0.50 rclb %dil +# CHECK-NEXT: 1 1 0.50 rcrb %dil +# CHECK-NEXT: 3 6 1.00 * rclb (%rax) +# CHECK-NEXT: 3 6 1.00 * rcrb (%rax) +# CHECK-NEXT: 1 1 0.50 rclb $7, %dil +# CHECK-NEXT: 1 1 0.50 rcrb $7, %dil +# CHECK-NEXT: 3 6 1.00 * rclb $7, (%rax) +# CHECK-NEXT: 3 6 1.00 * rcrb $7, (%rax) +# CHECK-NEXT: 1 1 0.50 rclb %cl, %dil +# CHECK-NEXT: 1 1 0.50 rcrb %cl, %dil +# CHECK-NEXT: 3 6 1.00 * rclb %cl, (%rax) +# CHECK-NEXT: 3 6 1.00 * rcrb %cl, (%rax) +# CHECK-NEXT: 1 1 0.50 rclw %di +# CHECK-NEXT: 1 1 0.50 rcrw %di +# CHECK-NEXT: 3 6 1.00 * rclw (%rax) +# CHECK-NEXT: 3 6 1.00 * rcrw (%rax) +# CHECK-NEXT: 1 1 0.50 rclw $7, %di +# CHECK-NEXT: 1 1 0.50 rcrw $7, %di +# CHECK-NEXT: 3 6 1.00 * rclw $7, (%rax) +# CHECK-NEXT: 3 6 1.00 * rcrw $7, (%rax) +# CHECK-NEXT: 1 1 0.50 rclw %cl, %di +# CHECK-NEXT: 1 1 0.50 rcrw %cl, %di +# CHECK-NEXT: 3 6 1.00 * rclw %cl, (%rax) +# CHECK-NEXT: 3 6 1.00 * rcrw %cl, (%rax) +# CHECK-NEXT: 1 1 0.50 rcll %edi +# CHECK-NEXT: 1 1 0.50 rcrl %edi +# CHECK-NEXT: 3 6 1.00 * rcll (%rax) +# CHECK-NEXT: 3 6 1.00 * rcrl (%rax) +# CHECK-NEXT: 1 1 0.50 rcll $7, %edi +# CHECK-NEXT: 1 1 0.50 rcrl $7, %edi +# CHECK-NEXT: 3 6 1.00 * rcll $7, (%rax) +# CHECK-NEXT: 3 6 1.00 * rcrl $7, (%rax) +# CHECK-NEXT: 1 1 0.50 rcll %cl, %edi +# CHECK-NEXT: 1 1 0.50 rcrl %cl, %edi +# CHECK-NEXT: 3 6 1.00 * rcll %cl, (%rax) +# CHECK-NEXT: 3 6 1.00 * rcrl %cl, (%rax) +# CHECK-NEXT: 1 1 0.50 rclq %rdi +# CHECK-NEXT: 1 1 0.50 rcrq %rdi +# CHECK-NEXT: 3 6 1.00 * rclq (%rax) +# CHECK-NEXT: 3 6 1.00 * rcrq (%rax) +# CHECK-NEXT: 1 1 0.50 rclq $7, %rdi +# CHECK-NEXT: 1 1 0.50 rcrq $7, %rdi +# CHECK-NEXT: 3 6 1.00 * rclq $7, (%rax) +# CHECK-NEXT: 3 6 1.00 * rcrq $7, (%rax) +# CHECK-NEXT: 1 1 0.50 rclq %cl, %rdi +# CHECK-NEXT: 1 1 0.50 rcrq %cl, %rdi +# CHECK-NEXT: 3 6 1.00 * rclq %cl, (%rax) +# CHECK-NEXT: 3 6 1.00 * rcrq %cl, (%rax) +# CHECK-NEXT: 2 2 1.00 rolb %dil +# CHECK-NEXT: 2 2 1.00 rorb %dil +# CHECK-NEXT: 5 8 1.00 * * rolb (%rax) +# CHECK-NEXT: 5 8 1.00 * * rorb (%rax) +# CHECK-NEXT: 2 2 1.00 rolb $7, %dil +# CHECK-NEXT: 2 2 1.00 rorb $7, %dil +# CHECK-NEXT: 5 8 1.00 * * rolb $7, (%rax) +# CHECK-NEXT: 5 8 1.00 * * rorb $7, (%rax) +# CHECK-NEXT: 3 3 1.50 rolb %cl, %dil +# CHECK-NEXT: 3 3 1.50 rorb %cl, %dil +# CHECK-NEXT: 6 9 1.50 * * rolb %cl, (%rax) +# CHECK-NEXT: 6 9 1.50 * * rorb %cl, (%rax) +# CHECK-NEXT: 2 2 1.00 rolw %di +# CHECK-NEXT: 2 2 1.00 rorw %di +# CHECK-NEXT: 5 8 1.00 * * rolw (%rax) +# CHECK-NEXT: 5 8 1.00 * * rorw (%rax) +# CHECK-NEXT: 2 2 1.00 rolw $7, %di +# CHECK-NEXT: 2 2 1.00 rorw $7, %di +# CHECK-NEXT: 5 8 1.00 * * rolw $7, (%rax) +# CHECK-NEXT: 5 8 1.00 * * rorw $7, (%rax) +# CHECK-NEXT: 3 3 1.50 rolw %cl, %di +# CHECK-NEXT: 3 3 1.50 rorw %cl, %di +# CHECK-NEXT: 6 9 1.50 * * rolw %cl, (%rax) +# CHECK-NEXT: 6 9 1.50 * * rorw %cl, (%rax) +# CHECK-NEXT: 2 2 1.00 roll %edi +# CHECK-NEXT: 2 2 1.00 rorl %edi +# CHECK-NEXT: 5 8 1.00 * * roll (%rax) +# CHECK-NEXT: 5 8 1.00 * * rorl (%rax) +# CHECK-NEXT: 2 2 1.00 roll $7, %edi +# CHECK-NEXT: 2 2 1.00 rorl $7, %edi +# CHECK-NEXT: 5 8 1.00 * * roll $7, (%rax) +# CHECK-NEXT: 5 8 1.00 * * rorl $7, (%rax) +# CHECK-NEXT: 3 3 1.50 roll %cl, %edi +# CHECK-NEXT: 3 3 1.50 rorl %cl, %edi +# CHECK-NEXT: 6 9 1.50 * * roll %cl, (%rax) +# CHECK-NEXT: 6 9 1.50 * * rorl %cl, (%rax) +# CHECK-NEXT: 2 2 1.00 rolq %rdi +# CHECK-NEXT: 2 2 1.00 rorq %rdi +# CHECK-NEXT: 5 8 1.00 * * rolq (%rax) +# CHECK-NEXT: 5 8 1.00 * * rorq (%rax) +# CHECK-NEXT: 2 2 1.00 rolq $7, %rdi +# CHECK-NEXT: 2 2 1.00 rorq $7, %rdi +# CHECK-NEXT: 5 8 1.00 * * rolq $7, (%rax) +# CHECK-NEXT: 5 8 1.00 * * rorq $7, (%rax) +# CHECK-NEXT: 3 3 1.50 rolq %cl, %rdi +# CHECK-NEXT: 3 3 1.50 rorq %cl, %rdi +# CHECK-NEXT: 6 9 1.50 * * rolq %cl, (%rax) +# CHECK-NEXT: 6 9 1.50 * * rorq %cl, (%rax) +# CHECK-NEXT: 1 1 0.50 sarb %dil +# CHECK-NEXT: 1 1 0.50 shlb %dil +# CHECK-NEXT: 1 1 0.50 shrb %dil +# CHECK-NEXT: 4 7 1.00 * * sarb (%rax) +# CHECK-NEXT: 4 7 1.00 * * shlb (%rax) +# CHECK-NEXT: 4 7 1.00 * * shrb (%rax) +# CHECK-NEXT: 1 1 0.50 sarb $7, %dil +# CHECK-NEXT: 1 1 0.50 shlb $7, %dil +# CHECK-NEXT: 1 1 0.50 shrb $7, %dil +# CHECK-NEXT: 4 7 1.00 * * sarb $7, (%rax) +# CHECK-NEXT: 4 7 1.00 * * shlb $7, (%rax) +# CHECK-NEXT: 4 7 1.00 * * shrb $7, (%rax) +# CHECK-NEXT: 3 3 1.50 sarb %cl, %dil +# CHECK-NEXT: 3 3 1.50 shlb %cl, %dil +# CHECK-NEXT: 3 3 1.50 shrb %cl, %dil +# CHECK-NEXT: 6 9 1.50 * * sarb %cl, (%rax) +# CHECK-NEXT: 6 9 1.50 * * shlb %cl, (%rax) +# CHECK-NEXT: 6 9 1.50 * * shrb %cl, (%rax) +# CHECK-NEXT: 1 1 0.50 sarw %di +# CHECK-NEXT: 1 1 0.50 shlw %di +# CHECK-NEXT: 1 1 0.50 shrw %di +# CHECK-NEXT: 4 7 1.00 * * sarw (%rax) +# CHECK-NEXT: 4 7 1.00 * * shlw (%rax) +# CHECK-NEXT: 4 7 1.00 * * shrw (%rax) +# CHECK-NEXT: 1 1 0.50 sarw $7, %di +# CHECK-NEXT: 1 1 0.50 shlw $7, %di +# CHECK-NEXT: 1 1 0.50 shrw $7, %di +# CHECK-NEXT: 4 7 1.00 * * sarw $7, (%rax) +# CHECK-NEXT: 4 7 1.00 * * shlw $7, (%rax) +# CHECK-NEXT: 4 7 1.00 * * shrw $7, (%rax) +# CHECK-NEXT: 3 3 1.50 sarw %cl, %di +# CHECK-NEXT: 3 3 1.50 shlw %cl, %di +# CHECK-NEXT: 3 3 1.50 shrw %cl, %di +# CHECK-NEXT: 6 9 1.50 * * sarw %cl, (%rax) +# CHECK-NEXT: 6 9 1.50 * * shlw %cl, (%rax) +# CHECK-NEXT: 6 9 1.50 * * shrw %cl, (%rax) +# CHECK-NEXT: 1 1 0.50 sarl %edi +# CHECK-NEXT: 1 1 0.50 shll %edi +# CHECK-NEXT: 1 1 0.50 shrl %edi +# CHECK-NEXT: 4 7 1.00 * * sarl (%rax) +# CHECK-NEXT: 4 7 1.00 * * shll (%rax) +# CHECK-NEXT: 4 7 1.00 * * shrl (%rax) +# CHECK-NEXT: 1 1 0.50 sarl $7, %edi +# CHECK-NEXT: 1 1 0.50 shll $7, %edi +# CHECK-NEXT: 1 1 0.50 shrl $7, %edi +# CHECK-NEXT: 4 7 1.00 * * sarl $7, (%rax) +# CHECK-NEXT: 4 7 1.00 * * shll $7, (%rax) +# CHECK-NEXT: 4 7 1.00 * * shrl $7, (%rax) +# CHECK-NEXT: 3 3 1.50 sarl %cl, %edi +# CHECK-NEXT: 3 3 1.50 shll %cl, %edi +# CHECK-NEXT: 3 3 1.50 shrl %cl, %edi +# CHECK-NEXT: 6 9 1.50 * * sarl %cl, (%rax) +# CHECK-NEXT: 6 9 1.50 * * shll %cl, (%rax) +# CHECK-NEXT: 6 9 1.50 * * shrl %cl, (%rax) +# CHECK-NEXT: 1 1 0.50 sarq %rdi +# CHECK-NEXT: 1 1 0.50 shlq %rdi +# CHECK-NEXT: 1 1 0.50 shrq %rdi +# CHECK-NEXT: 4 7 1.00 * * sarq (%rax) +# CHECK-NEXT: 4 7 1.00 * * shlq (%rax) +# CHECK-NEXT: 4 7 1.00 * * shrq (%rax) +# CHECK-NEXT: 1 1 0.50 sarq $7, %rdi +# CHECK-NEXT: 1 1 0.50 shlq $7, %rdi +# CHECK-NEXT: 1 1 0.50 shrq $7, %rdi +# CHECK-NEXT: 4 7 1.00 * * sarq $7, (%rax) +# CHECK-NEXT: 4 7 1.00 * * shlq $7, (%rax) +# CHECK-NEXT: 4 7 1.00 * * shrq $7, (%rax) +# CHECK-NEXT: 3 3 1.50 sarq %cl, %rdi +# CHECK-NEXT: 3 3 1.50 shlq %cl, %rdi +# CHECK-NEXT: 3 3 1.50 shrq %cl, %rdi +# CHECK-NEXT: 6 9 1.50 * * sarq %cl, (%rax) +# CHECK-NEXT: 6 9 1.50 * * shlq %cl, (%rax) +# CHECK-NEXT: 6 9 1.50 * * shrq %cl, (%rax) +# CHECK-NEXT: 2 2 0.67 sbbb $7, %al +# CHECK-NEXT: 2 2 0.67 sbbb $7, %dil +# CHECK-NEXT: 6 9 1.00 * * sbbb $7, (%rax) +# CHECK-NEXT: 2 2 0.67 sbbb %sil, %dil +# CHECK-NEXT: 6 9 1.00 * * sbbb %sil, (%rax) +# CHECK-NEXT: 3 7 0.67 * sbbb (%rax), %dil +# CHECK-NEXT: 2 2 0.67 sbbw $511, %ax +# CHECK-NEXT: 2 2 0.67 sbbw $511, %di +# CHECK-NEXT: 6 9 1.00 * * sbbw $511, (%rax) +# CHECK-NEXT: 2 2 0.67 sbbw $7, %di +# CHECK-NEXT: 6 9 1.00 * * sbbw $7, (%rax) +# CHECK-NEXT: 2 2 0.67 sbbw %si, %di +# CHECK-NEXT: 6 9 1.00 * * sbbw %si, (%rax) +# CHECK-NEXT: 3 7 0.67 * sbbw (%rax), %di +# CHECK-NEXT: 2 2 0.67 sbbl $665536, %eax +# CHECK-NEXT: 2 2 0.67 sbbl $665536, %edi +# CHECK-NEXT: 6 9 1.00 * * sbbl $665536, (%rax) +# CHECK-NEXT: 2 2 0.67 sbbl $7, %edi +# CHECK-NEXT: 6 9 1.00 * * sbbl $7, (%rax) +# CHECK-NEXT: 2 2 0.67 sbbl %esi, %edi +# CHECK-NEXT: 6 9 1.00 * * sbbl %esi, (%rax) +# CHECK-NEXT: 3 7 0.67 * sbbl (%rax), %edi +# CHECK-NEXT: 2 2 0.67 sbbq $665536, %rax +# CHECK-NEXT: 2 2 0.67 sbbq $665536, %rdi +# CHECK-NEXT: 6 9 1.00 * * sbbq $665536, (%rax) +# CHECK-NEXT: 2 2 0.67 sbbq $7, %rdi +# CHECK-NEXT: 6 9 1.00 * * sbbq $7, (%rax) +# CHECK-NEXT: 2 2 0.67 sbbq %rsi, %rdi +# CHECK-NEXT: 6 9 1.00 * * sbbq %rsi, (%rax) +# CHECK-NEXT: 3 7 0.67 * sbbq (%rax), %rdi +# CHECK-NEXT: 4 4 1.50 shldw %cl, %si, %di +# CHECK-NEXT: 4 4 1.50 shrdw %cl, %si, %di +# CHECK-NEXT: 7 10 1.50 * * shldw %cl, %si, (%rax) +# CHECK-NEXT: 7 10 1.50 * * shrdw %cl, %si, (%rax) +# CHECK-NEXT: 2 2 0.67 shldw $7, %si, %di +# CHECK-NEXT: 2 2 0.67 shrdw $7, %si, %di +# CHECK-NEXT: 5 8 1.00 * * shldw $7, %si, (%rax) +# CHECK-NEXT: 5 8 1.00 * * shrdw $7, %si, (%rax) +# CHECK-NEXT: 4 4 1.50 shldl %cl, %esi, %edi +# CHECK-NEXT: 4 4 1.50 shrdl %cl, %esi, %edi +# CHECK-NEXT: 7 10 1.50 * * shldl %cl, %esi, (%rax) +# CHECK-NEXT: 7 10 1.50 * * shrdl %cl, %esi, (%rax) +# CHECK-NEXT: 2 2 0.67 shldl $7, %esi, %edi +# CHECK-NEXT: 2 2 0.67 shrdl $7, %esi, %edi +# CHECK-NEXT: 5 8 1.00 * * shldl $7, %esi, (%rax) +# CHECK-NEXT: 5 8 1.00 * * shrdl $7, %esi, (%rax) +# CHECK-NEXT: 4 4 1.50 shldq %cl, %rsi, %rdi +# CHECK-NEXT: 4 4 1.50 shrdq %cl, %rsi, %rdi +# CHECK-NEXT: 7 10 1.50 * * shldq %cl, %rsi, (%rax) +# CHECK-NEXT: 7 10 1.50 * * shrdq %cl, %rsi, (%rax) +# CHECK-NEXT: 2 2 0.67 shldq $7, %rsi, %rdi +# CHECK-NEXT: 2 2 0.67 shrdq $7, %rsi, %rdi +# CHECK-NEXT: 5 8 1.00 * * shldq $7, %rsi, (%rax) +# CHECK-NEXT: 5 8 1.00 * * shrdq $7, %rsi, (%rax) +# CHECK-NEXT: 1 1 0.33 subb $7, %al +# CHECK-NEXT: 1 1 0.33 subb $7, %dil +# CHECK-NEXT: 3 7 1.00 * * subb $7, (%rax) +# CHECK-NEXT: 1 1 0.33 subb %sil, %dil +# CHECK-NEXT: 3 7 1.00 * * subb %sil, (%rax) +# CHECK-NEXT: 2 6 0.50 * subb (%rax), %dil +# CHECK-NEXT: 1 1 0.33 subw $511, %ax +# CHECK-NEXT: 1 1 0.33 subw $511, %di +# CHECK-NEXT: 3 7 1.00 * * subw $511, (%rax) +# CHECK-NEXT: 1 1 0.33 subw $7, %di +# CHECK-NEXT: 3 7 1.00 * * subw $7, (%rax) +# CHECK-NEXT: 1 1 0.33 subw %si, %di +# CHECK-NEXT: 3 7 1.00 * * subw %si, (%rax) +# CHECK-NEXT: 2 6 0.50 * subw (%rax), %di +# CHECK-NEXT: 1 1 0.33 subl $665536, %eax +# CHECK-NEXT: 1 1 0.33 subl $665536, %edi +# CHECK-NEXT: 3 7 1.00 * * subl $665536, (%rax) +# CHECK-NEXT: 1 1 0.33 subl $7, %edi +# CHECK-NEXT: 3 7 1.00 * * subl $7, (%rax) +# CHECK-NEXT: 1 1 0.33 subl %esi, %edi +# CHECK-NEXT: 3 7 1.00 * * subl %esi, (%rax) +# CHECK-NEXT: 2 6 0.50 * subl (%rax), %edi +# CHECK-NEXT: 1 1 0.33 subq $665536, %rax +# CHECK-NEXT: 1 1 0.33 subq $665536, %rdi +# CHECK-NEXT: 3 7 1.00 * * subq $665536, (%rax) +# CHECK-NEXT: 1 1 0.33 subq $7, %rdi +# CHECK-NEXT: 3 7 1.00 * * subq $7, (%rax) +# CHECK-NEXT: 1 1 0.33 subq %rsi, %rdi +# CHECK-NEXT: 3 7 1.00 * * subq %rsi, (%rax) +# CHECK-NEXT: 2 6 0.50 * subq (%rax), %rdi +# CHECK-NEXT: 1 1 0.33 xorb $7, %al +# CHECK-NEXT: 1 1 0.33 xorb $7, %dil +# CHECK-NEXT: 3 7 1.00 * * xorb $7, (%rax) +# CHECK-NEXT: 1 1 0.33 xorb %sil, %dil +# CHECK-NEXT: 3 7 1.00 * * xorb %sil, (%rax) +# CHECK-NEXT: 2 6 0.50 * xorb (%rax), %dil +# CHECK-NEXT: 1 1 0.33 xorw $511, %ax +# CHECK-NEXT: 1 1 0.33 xorw $511, %di +# CHECK-NEXT: 3 7 1.00 * * xorw $511, (%rax) +# CHECK-NEXT: 1 1 0.33 xorw $7, %di +# CHECK-NEXT: 3 7 1.00 * * xorw $7, (%rax) +# CHECK-NEXT: 1 1 0.33 xorw %si, %di +# CHECK-NEXT: 3 7 1.00 * * xorw %si, (%rax) +# CHECK-NEXT: 2 6 0.50 * xorw (%rax), %di +# CHECK-NEXT: 1 1 0.33 xorl $665536, %eax +# CHECK-NEXT: 1 1 0.33 xorl $665536, %edi +# CHECK-NEXT: 3 7 1.00 * * xorl $665536, (%rax) +# CHECK-NEXT: 1 1 0.33 xorl $7, %edi +# CHECK-NEXT: 3 7 1.00 * * xorl $7, (%rax) +# CHECK-NEXT: 1 1 0.33 xorl %esi, %edi +# CHECK-NEXT: 3 7 1.00 * * xorl %esi, (%rax) +# CHECK-NEXT: 2 6 0.50 * xorl (%rax), %edi +# CHECK-NEXT: 1 1 0.33 xorq $665536, %rax +# CHECK-NEXT: 1 1 0.33 xorq $665536, %rdi +# CHECK-NEXT: 3 7 1.00 * * xorq $665536, (%rax) +# CHECK-NEXT: 1 1 0.33 xorq $7, %rdi +# CHECK-NEXT: 3 7 1.00 * * xorq $7, (%rax) +# CHECK-NEXT: 1 1 0.33 xorq %rsi, %rdi +# CHECK-NEXT: 3 7 1.00 * * xorq %rsi, (%rax) +# CHECK-NEXT: 2 6 0.50 * xorq (%rax), %rdi + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: 160.00 - 346.33 141.33 210.00 338.33 238.00 238.00 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - adcb $7, %al +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - adcb $7, %dil +# CHECK-NEXT: - - 1.00 1.00 1.00 1.00 1.00 1.00 adcb $7, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - adcb %sil, %dil +# CHECK-NEXT: - - 1.33 0.33 1.00 1.33 1.00 1.00 adcb %sil, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 adcb (%rax), %dil +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - adcw $511, %ax +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - adcw $511, %di +# CHECK-NEXT: - - 1.00 1.00 1.00 1.00 1.00 1.00 adcw $511, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - adcw $7, %di +# CHECK-NEXT: - - 1.00 1.00 1.00 1.00 1.00 1.00 adcw $7, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - adcw %si, %di +# CHECK-NEXT: - - 1.33 0.33 1.00 1.33 1.00 1.00 adcw %si, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 adcw (%rax), %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - adcl $665536, %eax +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - adcl $665536, %edi +# CHECK-NEXT: - - 1.00 1.00 1.00 1.00 1.00 1.00 adcl $665536, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - adcl $7, %edi +# CHECK-NEXT: - - 1.00 1.00 1.00 1.00 1.00 1.00 adcl $7, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - adcl %esi, %edi +# CHECK-NEXT: - - 1.33 0.33 1.00 1.33 1.00 1.00 adcl %esi, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 adcl (%rax), %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - adcq $665536, %rax +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - adcq $665536, %rdi +# CHECK-NEXT: - - 1.00 1.00 1.00 1.00 1.00 1.00 adcq $665536, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - adcq $7, %rdi +# CHECK-NEXT: - - 1.00 1.00 1.00 1.00 1.00 1.00 adcq $7, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - adcq %rsi, %rdi +# CHECK-NEXT: - - 1.33 0.33 1.00 1.33 1.00 1.00 adcq %rsi, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 adcq (%rax), %rdi +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - addb $7, %al +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - addb $7, %dil +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 addb $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - addb %sil, %dil +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 addb %sil, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 addb (%rax), %dil +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - addw $511, %ax +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - addw $511, %di +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 addw $511, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - addw $7, %di +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 addw $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - addw %si, %di +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 addw %si, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 addw (%rax), %di +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - addl $665536, %eax +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - addl $665536, %edi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 addl $665536, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - addl $7, %edi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 addl $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - addl %esi, %edi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 addl %esi, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 addl (%rax), %edi +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - addq $665536, %rax +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - addq $665536, %rdi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 addq $665536, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - addq $7, %rdi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 addq $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - addq %rsi, %rdi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 addq %rsi, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 addq (%rax), %rdi +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - andb $7, %al +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - andb $7, %dil +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 andb $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - andb %sil, %dil +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 andb %sil, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 andb (%rax), %dil +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - andw $511, %ax +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - andw $511, %di +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 andw $511, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - andw $7, %di +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 andw $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - andw %si, %di +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 andw %si, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 andw (%rax), %di +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - andl $665536, %eax +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - andl $665536, %edi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 andl $665536, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - andl $7, %edi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 andl $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - andl %esi, %edi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 andl %esi, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 andl (%rax), %edi +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - andq $665536, %rax +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - andq $665536, %rdi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 andq $665536, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - andq $7, %rdi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 andq $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - andq %rsi, %rdi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 andq %rsi, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 andq (%rax), %rdi +# CHECK-NEXT: - - 0.50 - - 0.50 - - btw %si, %di +# CHECK-NEXT: - - 0.50 - - 0.50 - - btcw %si, %di +# CHECK-NEXT: - - 0.50 - - 0.50 - - btrw %si, %di +# CHECK-NEXT: - - 0.50 - - 0.50 - - btsw %si, %di +# CHECK-NEXT: - - 0.83 0.33 1.00 1.83 1.00 1.00 btw %si, (%rax) +# CHECK-NEXT: - - 0.83 0.33 1.00 1.83 1.00 1.00 btcw %si, (%rax) +# CHECK-NEXT: - - 0.83 0.33 1.00 1.83 1.00 1.00 btrw %si, (%rax) +# CHECK-NEXT: - - 0.83 0.33 1.00 1.83 1.00 1.00 btsw %si, (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - btw $7, %di +# CHECK-NEXT: - - 0.50 - - 0.50 - - btcw $7, %di +# CHECK-NEXT: - - 0.50 - - 0.50 - - btrw $7, %di +# CHECK-NEXT: - - 0.50 - - 0.50 - - btsw $7, %di +# CHECK-NEXT: - - 0.50 - - 0.50 0.50 0.50 btw $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 btcw $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 btrw $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 btsw $7, (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - btl %esi, %edi +# CHECK-NEXT: - - 0.50 - - 0.50 - - btcl %esi, %edi +# CHECK-NEXT: - - 0.50 - - 0.50 - - btrl %esi, %edi +# CHECK-NEXT: - - 0.50 - - 0.50 - - btsl %esi, %edi +# CHECK-NEXT: - - 0.83 0.33 1.00 1.83 1.00 1.00 btl %esi, (%rax) +# CHECK-NEXT: - - 0.83 0.33 1.00 1.83 1.00 1.00 btcl %esi, (%rax) +# CHECK-NEXT: - - 0.83 0.33 1.00 1.83 1.00 1.00 btrl %esi, (%rax) +# CHECK-NEXT: - - 0.83 0.33 1.00 1.83 1.00 1.00 btsl %esi, (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - btl $7, %edi +# CHECK-NEXT: - - 0.50 - - 0.50 - - btcl $7, %edi +# CHECK-NEXT: - - 0.50 - - 0.50 - - btrl $7, %edi +# CHECK-NEXT: - - 0.50 - - 0.50 - - btsl $7, %edi +# CHECK-NEXT: - - 0.50 - - 0.50 0.50 0.50 btl $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 btcl $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 btrl $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 btsl $7, (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - btq %rsi, %rdi +# CHECK-NEXT: - - 0.50 - - 0.50 - - btcq %rsi, %rdi +# CHECK-NEXT: - - 0.50 - - 0.50 - - btrq %rsi, %rdi +# CHECK-NEXT: - - 0.50 - - 0.50 - - btsq %rsi, %rdi +# CHECK-NEXT: - - 0.83 0.33 1.00 1.83 1.00 1.00 btq %rsi, (%rax) +# CHECK-NEXT: - - 0.83 0.33 1.00 1.83 1.00 1.00 btcq %rsi, (%rax) +# CHECK-NEXT: - - 0.83 0.33 1.00 1.83 1.00 1.00 btrq %rsi, (%rax) +# CHECK-NEXT: - - 0.83 0.33 1.00 1.83 1.00 1.00 btsq %rsi, (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - btq $7, %rdi +# CHECK-NEXT: - - 0.50 - - 0.50 - - btcq $7, %rdi +# CHECK-NEXT: - - 0.50 - - 0.50 - - btrq $7, %rdi +# CHECK-NEXT: - - 0.50 - - 0.50 - - btsq $7, %rdi +# CHECK-NEXT: - - 0.50 - - 0.50 0.50 0.50 btq $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 btcq $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 btrq $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 btsq $7, (%rax) +# CHECK-NEXT: - - - - - - - - clc +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - decb %dil +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 decb (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - decw %di +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 decw (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - decl %edi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 decl (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - decq %rdi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 decq (%rax) +# CHECK-NEXT: 10.00 - 1.00 - - - - - divb %dil +# CHECK-NEXT: 10.00 - 1.00 - - - 0.50 0.50 divb (%rax) +# CHECK-NEXT: 10.00 - 1.00 - - - - - divw %si +# CHECK-NEXT: 10.00 - 1.00 - - - 0.50 0.50 divw (%rax) +# CHECK-NEXT: 10.00 - 1.00 - - - - - divl %edx +# CHECK-NEXT: 10.00 - 1.00 - - - 0.50 0.50 divl (%rax) +# CHECK-NEXT: 10.00 - 1.00 - - - - - divq %rcx +# CHECK-NEXT: 10.00 - 1.00 - - - 0.50 0.50 divq (%rax) +# CHECK-NEXT: 10.00 - 1.00 - - - - - idivb %dil +# CHECK-NEXT: 10.00 - 1.00 - - - 0.50 0.50 idivb (%rax) +# CHECK-NEXT: 10.00 - 1.00 - - - - - idivw %si +# CHECK-NEXT: 10.00 - 1.00 - - - 0.50 0.50 idivw (%rax) +# CHECK-NEXT: 10.00 - 1.00 - - - - - idivl %edx +# CHECK-NEXT: 10.00 - 1.00 - - - 0.50 0.50 idivl (%rax) +# CHECK-NEXT: 10.00 - 1.00 - - - - - idivq %rcx +# CHECK-NEXT: 10.00 - 1.00 - - - 0.50 0.50 idivq (%rax) +# CHECK-NEXT: - - - 1.00 - - - - imulb %dil +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 imulb (%rax) +# CHECK-NEXT: - - 1.17 1.67 - 1.17 - - imulw %di +# CHECK-NEXT: - - 1.17 1.67 - 1.17 0.50 0.50 imulw (%rax) +# CHECK-NEXT: - - - 1.00 - - - - imulw %si, %di +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 imulw (%rax), %di +# CHECK-NEXT: - - 0.33 1.33 - 0.33 - - imulw $511, %si, %di +# CHECK-NEXT: - - 0.33 1.33 - 0.33 0.50 0.50 imulw $511, (%rax), %di +# CHECK-NEXT: - - 0.33 1.33 - 0.33 - - imulw $7, %si, %di +# CHECK-NEXT: - - 0.33 1.33 - 0.33 0.50 0.50 imulw $7, (%rax), %di +# CHECK-NEXT: - - 0.83 1.33 - 0.83 - - imull %edi +# CHECK-NEXT: - - 0.83 1.33 - 0.83 0.50 0.50 imull (%rax) +# CHECK-NEXT: - - - 1.00 - - - - imull %esi, %edi +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 imull (%rax), %edi +# CHECK-NEXT: - - - 1.00 - - - - imull $665536, %esi, %edi +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 imull $665536, (%rax), %edi +# CHECK-NEXT: - - - 1.00 - - - - imull $7, %esi, %edi +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 imull $7, (%rax), %edi +# CHECK-NEXT: - - 1.00 1.00 - - - - imulq %rdi +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 imulq (%rax) +# CHECK-NEXT: - - - 1.00 - - - - imulq %rsi, %rdi +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 imulq (%rax), %rdi +# CHECK-NEXT: - - - 1.00 - - - - imulq $665536, %rsi, %rdi +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 imulq $665536, (%rax), %rdi +# CHECK-NEXT: - - - 1.00 - - - - imulq $7, %rsi, %rdi +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 imulq $7, (%rax), %rdi +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - incb %dil +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 incb (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - incw %di +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 incw (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - incl %edi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 incl (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - incq %rdi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 incq (%rax) +# CHECK-NEXT: - - - 1.00 - - - - mulb %dil +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 mulb (%rax) +# CHECK-NEXT: - - 1.17 1.67 - 1.17 - - mulw %si +# CHECK-NEXT: - - 1.17 1.67 - 1.17 0.50 0.50 mulw (%rax) +# CHECK-NEXT: - - 0.83 1.33 - 0.83 - - mull %edx +# CHECK-NEXT: - - 0.83 1.33 - 0.83 0.50 0.50 mull (%rax) +# CHECK-NEXT: - - 1.00 1.00 - - - - mulq %rcx +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 mulq (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - negb %dil +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 negb (%r8) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - negw %si +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 negw (%r9) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - negl %edx +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 negl (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - negq %rcx +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 negq (%r10) +# CHECK-NEXT: - - - - - - - - nop +# CHECK-NEXT: - - - - - - - - nopw %di +# CHECK-NEXT: - - - - - - - - nopw (%rcx) +# CHECK-NEXT: - - - - - - - - nopl %esi +# CHECK-NEXT: - - - - - - - - nopl (%r8) +# CHECK-NEXT: - - - - - - - - nopq %rdx +# CHECK-NEXT: - - - - - - - - nopq (%r9) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - notb %dil +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 notb (%r8) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - notw %si +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 notw (%r9) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - notl %edx +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 notl (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - notq %rcx +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 notq (%r10) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - orb $7, %al +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - orb $7, %dil +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 orb $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - orb %sil, %dil +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 orb %sil, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 orb (%rax), %dil +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - orw $511, %ax +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - orw $511, %di +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 orw $511, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - orw $7, %di +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 orw $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - orw %si, %di +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 orw %si, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 orw (%rax), %di +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - orl $665536, %eax +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - orl $665536, %edi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 orl $665536, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - orl $7, %edi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 orl $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - orl %esi, %edi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 orl %esi, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 orl (%rax), %edi +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - orq $665536, %rax +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - orq $665536, %rdi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 orq $665536, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - orq $7, %rdi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 orq $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - orq %rsi, %rdi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 orq %rsi, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 orq (%rax), %rdi +# CHECK-NEXT: - - 0.50 - - 0.50 - - rclb %dil +# CHECK-NEXT: - - 0.50 - - 0.50 - - rcrb %dil +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rclb (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rcrb (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - rclb $7, %dil +# CHECK-NEXT: - - 0.50 - - 0.50 - - rcrb $7, %dil +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rclb $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rcrb $7, (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - rclb %cl, %dil +# CHECK-NEXT: - - 0.50 - - 0.50 - - rcrb %cl, %dil +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rclb %cl, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rcrb %cl, (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - rclw %di +# CHECK-NEXT: - - 0.50 - - 0.50 - - rcrw %di +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rclw (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rcrw (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - rclw $7, %di +# CHECK-NEXT: - - 0.50 - - 0.50 - - rcrw $7, %di +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rclw $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rcrw $7, (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - rclw %cl, %di +# CHECK-NEXT: - - 0.50 - - 0.50 - - rcrw %cl, %di +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rclw %cl, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rcrw %cl, (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - rcll %edi +# CHECK-NEXT: - - 0.50 - - 0.50 - - rcrl %edi +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rcll (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rcrl (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - rcll $7, %edi +# CHECK-NEXT: - - 0.50 - - 0.50 - - rcrl $7, %edi +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rcll $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rcrl $7, (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - rcll %cl, %edi +# CHECK-NEXT: - - 0.50 - - 0.50 - - rcrl %cl, %edi +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rcll %cl, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rcrl %cl, (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - rclq %rdi +# CHECK-NEXT: - - 0.50 - - 0.50 - - rcrq %rdi +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rclq (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rcrq (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - rclq $7, %rdi +# CHECK-NEXT: - - 0.50 - - 0.50 - - rcrq $7, %rdi +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rclq $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rcrq $7, (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - rclq %cl, %rdi +# CHECK-NEXT: - - 0.50 - - 0.50 - - rcrq %cl, %rdi +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rclq %cl, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 rcrq %cl, (%rax) +# CHECK-NEXT: - - 1.00 - - 1.00 - - rolb %dil +# CHECK-NEXT: - - 1.00 - - 1.00 - - rorb %dil +# CHECK-NEXT: - - 1.00 - 1.00 1.00 1.00 1.00 rolb (%rax) +# CHECK-NEXT: - - 1.00 - 1.00 1.00 1.00 1.00 rorb (%rax) +# CHECK-NEXT: - - 1.00 - - 1.00 - - rolb $7, %dil +# CHECK-NEXT: - - 1.00 - - 1.00 - - rorb $7, %dil +# CHECK-NEXT: - - 1.00 - 1.00 1.00 1.00 1.00 rolb $7, (%rax) +# CHECK-NEXT: - - 1.00 - 1.00 1.00 1.00 1.00 rorb $7, (%rax) +# CHECK-NEXT: - - 1.50 - - 1.50 - - rolb %cl, %dil +# CHECK-NEXT: - - 1.50 - - 1.50 - - rorb %cl, %dil +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 rolb %cl, (%rax) +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 rorb %cl, (%rax) +# CHECK-NEXT: - - 1.00 - - 1.00 - - rolw %di +# CHECK-NEXT: - - 1.00 - - 1.00 - - rorw %di +# CHECK-NEXT: - - 1.00 - 1.00 1.00 1.00 1.00 rolw (%rax) +# CHECK-NEXT: - - 1.00 - 1.00 1.00 1.00 1.00 rorw (%rax) +# CHECK-NEXT: - - 1.00 - - 1.00 - - rolw $7, %di +# CHECK-NEXT: - - 1.00 - - 1.00 - - rorw $7, %di +# CHECK-NEXT: - - 1.00 - 1.00 1.00 1.00 1.00 rolw $7, (%rax) +# CHECK-NEXT: - - 1.00 - 1.00 1.00 1.00 1.00 rorw $7, (%rax) +# CHECK-NEXT: - - 1.50 - - 1.50 - - rolw %cl, %di +# CHECK-NEXT: - - 1.50 - - 1.50 - - rorw %cl, %di +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 rolw %cl, (%rax) +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 rorw %cl, (%rax) +# CHECK-NEXT: - - 1.00 - - 1.00 - - roll %edi +# CHECK-NEXT: - - 1.00 - - 1.00 - - rorl %edi +# CHECK-NEXT: - - 1.00 - 1.00 1.00 1.00 1.00 roll (%rax) +# CHECK-NEXT: - - 1.00 - 1.00 1.00 1.00 1.00 rorl (%rax) +# CHECK-NEXT: - - 1.00 - - 1.00 - - roll $7, %edi +# CHECK-NEXT: - - 1.00 - - 1.00 - - rorl $7, %edi +# CHECK-NEXT: - - 1.00 - 1.00 1.00 1.00 1.00 roll $7, (%rax) +# CHECK-NEXT: - - 1.00 - 1.00 1.00 1.00 1.00 rorl $7, (%rax) +# CHECK-NEXT: - - 1.50 - - 1.50 - - roll %cl, %edi +# CHECK-NEXT: - - 1.50 - - 1.50 - - rorl %cl, %edi +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 roll %cl, (%rax) +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 rorl %cl, (%rax) +# CHECK-NEXT: - - 1.00 - - 1.00 - - rolq %rdi +# CHECK-NEXT: - - 1.00 - - 1.00 - - rorq %rdi +# CHECK-NEXT: - - 1.00 - 1.00 1.00 1.00 1.00 rolq (%rax) +# CHECK-NEXT: - - 1.00 - 1.00 1.00 1.00 1.00 rorq (%rax) +# CHECK-NEXT: - - 1.00 - - 1.00 - - rolq $7, %rdi +# CHECK-NEXT: - - 1.00 - - 1.00 - - rorq $7, %rdi +# CHECK-NEXT: - - 1.00 - 1.00 1.00 1.00 1.00 rolq $7, (%rax) +# CHECK-NEXT: - - 1.00 - 1.00 1.00 1.00 1.00 rorq $7, (%rax) +# CHECK-NEXT: - - 1.50 - - 1.50 - - rolq %cl, %rdi +# CHECK-NEXT: - - 1.50 - - 1.50 - - rorq %cl, %rdi +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 rolq %cl, (%rax) +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 rorq %cl, (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - sarb %dil +# CHECK-NEXT: - - 0.50 - - 0.50 - - shlb %dil +# CHECK-NEXT: - - 0.50 - - 0.50 - - shrb %dil +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 sarb (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 shlb (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 shrb (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - sarb $7, %dil +# CHECK-NEXT: - - 0.50 - - 0.50 - - shlb $7, %dil +# CHECK-NEXT: - - 0.50 - - 0.50 - - shrb $7, %dil +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 sarb $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 shlb $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 shrb $7, (%rax) +# CHECK-NEXT: - - 1.50 - - 1.50 - - sarb %cl, %dil +# CHECK-NEXT: - - 1.50 - - 1.50 - - shlb %cl, %dil +# CHECK-NEXT: - - 1.50 - - 1.50 - - shrb %cl, %dil +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 sarb %cl, (%rax) +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 shlb %cl, (%rax) +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 shrb %cl, (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - sarw %di +# CHECK-NEXT: - - 0.50 - - 0.50 - - shlw %di +# CHECK-NEXT: - - 0.50 - - 0.50 - - shrw %di +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 sarw (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 shlw (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 shrw (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - sarw $7, %di +# CHECK-NEXT: - - 0.50 - - 0.50 - - shlw $7, %di +# CHECK-NEXT: - - 0.50 - - 0.50 - - shrw $7, %di +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 sarw $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 shlw $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 shrw $7, (%rax) +# CHECK-NEXT: - - 1.50 - - 1.50 - - sarw %cl, %di +# CHECK-NEXT: - - 1.50 - - 1.50 - - shlw %cl, %di +# CHECK-NEXT: - - 1.50 - - 1.50 - - shrw %cl, %di +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 sarw %cl, (%rax) +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 shlw %cl, (%rax) +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 shrw %cl, (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - sarl %edi +# CHECK-NEXT: - - 0.50 - - 0.50 - - shll %edi +# CHECK-NEXT: - - 0.50 - - 0.50 - - shrl %edi +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 sarl (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 shll (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 shrl (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - sarl $7, %edi +# CHECK-NEXT: - - 0.50 - - 0.50 - - shll $7, %edi +# CHECK-NEXT: - - 0.50 - - 0.50 - - shrl $7, %edi +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 sarl $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 shll $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 shrl $7, (%rax) +# CHECK-NEXT: - - 1.50 - - 1.50 - - sarl %cl, %edi +# CHECK-NEXT: - - 1.50 - - 1.50 - - shll %cl, %edi +# CHECK-NEXT: - - 1.50 - - 1.50 - - shrl %cl, %edi +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 sarl %cl, (%rax) +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 shll %cl, (%rax) +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 shrl %cl, (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - sarq %rdi +# CHECK-NEXT: - - 0.50 - - 0.50 - - shlq %rdi +# CHECK-NEXT: - - 0.50 - - 0.50 - - shrq %rdi +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 sarq (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 shlq (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 shrq (%rax) +# CHECK-NEXT: - - 0.50 - - 0.50 - - sarq $7, %rdi +# CHECK-NEXT: - - 0.50 - - 0.50 - - shlq $7, %rdi +# CHECK-NEXT: - - 0.50 - - 0.50 - - shrq $7, %rdi +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 sarq $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 shlq $7, (%rax) +# CHECK-NEXT: - - 0.50 - 1.00 0.50 1.00 1.00 shrq $7, (%rax) +# CHECK-NEXT: - - 1.50 - - 1.50 - - sarq %cl, %rdi +# CHECK-NEXT: - - 1.50 - - 1.50 - - shlq %cl, %rdi +# CHECK-NEXT: - - 1.50 - - 1.50 - - shrq %cl, %rdi +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 sarq %cl, (%rax) +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 shlq %cl, (%rax) +# CHECK-NEXT: - - 1.50 - 1.00 1.50 1.00 1.00 shrq %cl, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - sbbb $7, %al +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - sbbb $7, %dil +# CHECK-NEXT: - - 1.00 1.00 1.00 1.00 1.00 1.00 sbbb $7, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - sbbb %sil, %dil +# CHECK-NEXT: - - 1.33 0.33 1.00 1.33 1.00 1.00 sbbb %sil, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 sbbb (%rax), %dil +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - sbbw $511, %ax +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - sbbw $511, %di +# CHECK-NEXT: - - 1.00 1.00 1.00 1.00 1.00 1.00 sbbw $511, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - sbbw $7, %di +# CHECK-NEXT: - - 1.00 1.00 1.00 1.00 1.00 1.00 sbbw $7, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - sbbw %si, %di +# CHECK-NEXT: - - 1.33 0.33 1.00 1.33 1.00 1.00 sbbw %si, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 sbbw (%rax), %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - sbbl $665536, %eax +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - sbbl $665536, %edi +# CHECK-NEXT: - - 1.00 1.00 1.00 1.00 1.00 1.00 sbbl $665536, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - sbbl $7, %edi +# CHECK-NEXT: - - 1.00 1.00 1.00 1.00 1.00 1.00 sbbl $7, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - sbbl %esi, %edi +# CHECK-NEXT: - - 1.33 0.33 1.00 1.33 1.00 1.00 sbbl %esi, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 sbbl (%rax), %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - sbbq $665536, %rax +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - sbbq $665536, %rdi +# CHECK-NEXT: - - 1.00 1.00 1.00 1.00 1.00 1.00 sbbq $665536, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - sbbq $7, %rdi +# CHECK-NEXT: - - 1.00 1.00 1.00 1.00 1.00 1.00 sbbq $7, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - sbbq %rsi, %rdi +# CHECK-NEXT: - - 1.33 0.33 1.00 1.33 1.00 1.00 sbbq %rsi, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 0.50 0.50 sbbq (%rax), %rdi +# CHECK-NEXT: - - 1.83 0.33 - 1.83 - - shldw %cl, %si, %di +# CHECK-NEXT: - - 1.83 0.33 - 1.83 - - shrdw %cl, %si, %di +# CHECK-NEXT: - - 1.83 0.33 1.00 1.83 1.00 1.00 shldw %cl, %si, (%rax) +# CHECK-NEXT: - - 1.83 0.33 1.00 1.83 1.00 1.00 shrdw %cl, %si, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - shldw $7, %si, %di +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - shrdw $7, %si, %di +# CHECK-NEXT: - - 0.83 0.33 1.00 0.83 1.00 1.00 shldw $7, %si, (%rax) +# CHECK-NEXT: - - 0.83 0.33 1.00 0.83 1.00 1.00 shrdw $7, %si, (%rax) +# CHECK-NEXT: - - 1.83 0.33 - 1.83 - - shldl %cl, %esi, %edi +# CHECK-NEXT: - - 1.83 0.33 - 1.83 - - shrdl %cl, %esi, %edi +# CHECK-NEXT: - - 1.83 0.33 1.00 1.83 1.00 1.00 shldl %cl, %esi, (%rax) +# CHECK-NEXT: - - 1.83 0.33 1.00 1.83 1.00 1.00 shrdl %cl, %esi, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - shldl $7, %esi, %edi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - shrdl $7, %esi, %edi +# CHECK-NEXT: - - 0.83 0.33 1.00 0.83 1.00 1.00 shldl $7, %esi, (%rax) +# CHECK-NEXT: - - 0.83 0.33 1.00 0.83 1.00 1.00 shrdl $7, %esi, (%rax) +# CHECK-NEXT: - - 1.83 0.33 - 1.83 - - shldq %cl, %rsi, %rdi +# CHECK-NEXT: - - 1.83 0.33 - 1.83 - - shrdq %cl, %rsi, %rdi +# CHECK-NEXT: - - 1.83 0.33 1.00 1.83 1.00 1.00 shldq %cl, %rsi, (%rax) +# CHECK-NEXT: - - 1.83 0.33 1.00 1.83 1.00 1.00 shrdq %cl, %rsi, (%rax) +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - shldq $7, %rsi, %rdi +# CHECK-NEXT: - - 0.83 0.33 - 0.83 - - shrdq $7, %rsi, %rdi +# CHECK-NEXT: - - 0.83 0.33 1.00 0.83 1.00 1.00 shldq $7, %rsi, (%rax) +# CHECK-NEXT: - - 0.83 0.33 1.00 0.83 1.00 1.00 shrdq $7, %rsi, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - subb $7, %al +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - subb $7, %dil +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 subb $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - subb %sil, %dil +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 subb %sil, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 subb (%rax), %dil +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - subw $511, %ax +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - subw $511, %di +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 subw $511, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - subw $7, %di +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 subw $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - subw %si, %di +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 subw %si, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 subw (%rax), %di +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - subl $665536, %eax +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - subl $665536, %edi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 subl $665536, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - subl $7, %edi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 subl $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - subl %esi, %edi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 subl %esi, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 subl (%rax), %edi +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - subq $665536, %rax +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - subq $665536, %rdi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 subq $665536, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - subq $7, %rdi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 subq $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - subq %rsi, %rdi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 subq %rsi, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 subq (%rax), %rdi +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - xorb $7, %al +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - xorb $7, %dil +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 xorb $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - xorb %sil, %dil +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 xorb %sil, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 xorb (%rax), %dil +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - xorw $511, %ax +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - xorw $511, %di +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 xorw $511, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - xorw $7, %di +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 xorw $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - xorw %si, %di +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 xorw %si, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 xorw (%rax), %di +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - xorl $665536, %eax +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - xorl $665536, %edi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 xorl $665536, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - xorl $7, %edi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 xorl $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - xorl %esi, %edi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 xorl %esi, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 xorl (%rax), %edi +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - xorq $665536, %rax +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - xorq $665536, %rdi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 xorq $665536, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - xorq $7, %rdi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 xorq $7, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - xorq %rsi, %rdi +# CHECK-NEXT: - - 0.33 0.33 1.00 0.33 1.00 1.00 xorq %rsi, (%rax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 0.50 0.50 xorq (%rax), %rdi diff --git a/test/tools/llvm-mca/X86/Generic/resources-x87.s b/test/tools/llvm-mca/X86/Generic/resources-x87.s new file mode 100644 index 00000000000..c348c2e99ab --- /dev/null +++ b/test/tools/llvm-mca/X86/Generic/resources-x87.s @@ -0,0 +1,521 @@ +# NOTE: Assertions have been autogenerated by utils/update_mca_test_checks.py +# RUN: llvm-mca -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -instruction-tables < %s | FileCheck %s + +f2xm1 + +fabs + +fadd %st(0), %st(1) +fadd %st(2) +fadds (%ecx) +faddl (%ecx) +faddp %st(1) +faddp %st(2) +fiadds (%ecx) +fiaddl (%ecx) + +fbld (%ecx) +fbstp (%eax) + +fchs + +fnclex + +fcmovb %st(1), %st(0) +fcmovbe %st(1), %st(0) +fcmove %st(1), %st(0) +fcmovnb %st(1), %st(0) +fcmovnbe %st(1), %st(0) +fcmovne %st(1), %st(0) +fcmovnu %st(1), %st(0) +fcmovu %st(1), %st(0) + +fcom %st(1) +fcom %st(3) +fcoms (%ecx) +fcoml (%eax) +fcomp %st(1) +fcomp %st(3) +fcomps (%ecx) +fcompl (%eax) +fcompp + +fcomi %st(3) +fcompi %st(3) + +fcos + +fdecstp + +fdiv %st(0), %st(1) +fdiv %st(2) +fdivs (%ecx) +fdivl (%eax) +fdivp %st(1) +fdivp %st(2) +fidivs (%ecx) +fidivl (%eax) + +fdivr %st(0), %st(1) +fdivr %st(2) +fdivrs (%ecx) +fdivrl (%eax) +fdivrp %st(1) +fdivrp %st(2) +fidivrs (%ecx) +fidivrl (%eax) + +ffree %st(0) + +ficoms (%ecx) +ficoml (%eax) +ficomps (%ecx) +ficompl (%eax) + +filds (%edx) +fildl (%ecx) +fildll (%eax) + +fincstp + +fninit + +fists (%edx) +fistl (%ecx) +fistps (%edx) +fistpl (%ecx) +fistpll (%eax) + +fisttps (%edx) +fisttpl (%ecx) +fisttpll (%eax) + +fld %st(0) +flds (%edx) +fldl (%ecx) +fldt (%eax) + +fldcw (%eax) +fldenv (%eax) + +fld1 +fldl2e +fldl2t +fldlg2 +fldln2 +fldpi +fldz + +fmul %st(0), %st(1) +fmul %st(2) +fmuls (%ecx) +fmull (%eax) +fmulp %st(1) +fmulp %st(2) +fimuls (%ecx) +fimull (%eax) + +fnop + +fpatan + +fprem +fprem1 + +fptan + +frndint + +frstor (%eax) + +fnsave (%eax) + +fscale + +fsin + +fsincos + +fsqrt + +fst %st(0) +fsts (%edx) +fstl (%ecx) +fstp %st(0) +fstpl (%edx) +fstpl (%ecx) +fstpt (%eax) + +fnstcw (%eax) +fnstenv (%eax) +fnstsw (%eax) + +frstor (%eax) +fsave (%eax) + +fsub %st(0), %st(1) +fsub %st(2) +fsubs (%ecx) +fsubl (%eax) +fsubp %st(1) +fsubp %st(2) +fisubs (%ecx) +fisubl (%eax) + +fsubr %st(0), %st(1) +fsubr %st(2) +fsubrs (%ecx) +fsubrl (%eax) +fsubrp %st(1) +fsubrp %st(2) +fisubrs (%ecx) +fisubrl (%eax) + +ftst + +fucom %st(1) +fucom %st(3) +fucomp %st(1) +fucomp %st(3) +fucompp + +fucomi %st(3) +fucompi %st(3) + +fwait + +fxam + +fxch %st(1) +fxch %st(3) + +fxrstor (%eax) +fxsave (%eax) + +fxtract + +fyl2x +fyl2xp1 + +# CHECK: Instruction Info: +# CHECK-NEXT: [1]: #uOps +# CHECK-NEXT: [2]: Latency +# CHECK-NEXT: [3]: RThroughput +# CHECK-NEXT: [4]: MayLoad +# CHECK-NEXT: [5]: MayStore +# CHECK-NEXT: [6]: HasSideEffects + +# CHECK: [1] [2] [3] [4] [5] [6] Instructions: +# CHECK-NEXT: 1 100 0.33 * f2xm1 +# CHECK-NEXT: 1 1 1.00 * fabs +# CHECK-NEXT: 1 3 1.00 * fadd %st(0), %st(1) +# CHECK-NEXT: 1 3 1.00 * fadd %st(2) +# CHECK-NEXT: 2 10 1.00 * * fadds (%ecx) +# CHECK-NEXT: 2 10 1.00 * * faddl (%ecx) +# CHECK-NEXT: 1 3 1.00 * faddp %st(1) +# CHECK-NEXT: 1 3 1.00 * faddp %st(2) +# CHECK-NEXT: 3 13 2.00 * * fiadds (%ecx) +# CHECK-NEXT: 3 13 2.00 * * fiaddl (%ecx) +# CHECK-NEXT: 1 100 0.33 * fbld (%ecx) +# CHECK-NEXT: 1 100 0.33 * fbstp (%eax) +# CHECK-NEXT: 1 1 1.00 * fchs +# CHECK-NEXT: 1 100 0.33 * fnclex +# CHECK-NEXT: 3 3 2.00 * fcmovb %st(1), %st(0) +# CHECK-NEXT: 3 3 2.00 * fcmovbe %st(1), %st(0) +# CHECK-NEXT: 3 3 2.00 * fcmove %st(1), %st(0) +# CHECK-NEXT: 3 3 2.00 * fcmovnb %st(1), %st(0) +# CHECK-NEXT: 3 3 2.00 * fcmovnbe %st(1), %st(0) +# CHECK-NEXT: 3 3 2.00 * fcmovne %st(1), %st(0) +# CHECK-NEXT: 3 3 2.00 * fcmovnu %st(1), %st(0) +# CHECK-NEXT: 3 3 2.00 * fcmovu %st(1), %st(0) +# CHECK-NEXT: 1 1 1.00 * fcom %st(1) +# CHECK-NEXT: 1 1 1.00 * fcom %st(3) +# CHECK-NEXT: 2 8 1.00 * fcoms (%ecx) +# CHECK-NEXT: 2 8 1.00 * fcoml (%eax) +# CHECK-NEXT: 1 1 1.00 * fcomp %st(1) +# CHECK-NEXT: 1 1 1.00 * fcomp %st(3) +# CHECK-NEXT: 2 8 1.00 * fcomps (%ecx) +# CHECK-NEXT: 2 8 1.00 * fcompl (%eax) +# CHECK-NEXT: 1 100 0.33 * fcompp +# CHECK-NEXT: 3 3 1.00 * fcomi %st(3) +# CHECK-NEXT: 3 3 1.00 * fcompi %st(3) +# CHECK-NEXT: 1 100 0.33 * fcos +# CHECK-NEXT: 1 1 1.00 * fdecstp +# CHECK-NEXT: 1 14 14.00 * fdiv %st(0), %st(1) +# CHECK-NEXT: 1 14 14.00 * fdiv %st(2) +# CHECK-NEXT: 2 31 1.00 * * fdivs (%ecx) +# CHECK-NEXT: 2 31 1.00 * * fdivl (%eax) +# CHECK-NEXT: 1 14 14.00 * fdivp %st(1) +# CHECK-NEXT: 1 14 14.00 * fdivp %st(2) +# CHECK-NEXT: 3 34 1.00 * * fidivs (%ecx) +# CHECK-NEXT: 3 34 1.00 * * fidivl (%eax) +# CHECK-NEXT: 1 14 14.00 * fdivr %st(0), %st(1) +# CHECK-NEXT: 1 14 14.00 * fdivr %st(2) +# CHECK-NEXT: 2 31 1.00 * * fdivrs (%ecx) +# CHECK-NEXT: 2 31 1.00 * * fdivrl (%eax) +# CHECK-NEXT: 1 14 14.00 * fdivrp %st(1) +# CHECK-NEXT: 1 14 14.00 * fdivrp %st(2) +# CHECK-NEXT: 3 34 1.00 * * fidivrs (%ecx) +# CHECK-NEXT: 3 34 1.00 * * fidivrl (%eax) +# CHECK-NEXT: 1 1 1.00 * ffree %st(0) +# CHECK-NEXT: 3 11 2.00 * ficoms (%ecx) +# CHECK-NEXT: 3 11 2.00 * ficoml (%eax) +# CHECK-NEXT: 3 11 2.00 * ficomps (%ecx) +# CHECK-NEXT: 3 11 2.00 * ficompl (%eax) +# CHECK-NEXT: 2 10 1.00 * * filds (%edx) +# CHECK-NEXT: 2 10 1.00 * * fildl (%ecx) +# CHECK-NEXT: 2 10 1.00 * * fildll (%eax) +# CHECK-NEXT: 1 1 1.00 * fincstp +# CHECK-NEXT: 4 5 1.33 * fninit +# CHECK-NEXT: 4 9 1.00 * * fists (%edx) +# CHECK-NEXT: 4 9 1.00 * * fistl (%ecx) +# CHECK-NEXT: 4 9 1.00 * * fistps (%edx) +# CHECK-NEXT: 4 9 1.00 * * fistpl (%ecx) +# CHECK-NEXT: 4 9 1.00 * * fistpll (%eax) +# CHECK-NEXT: 3 5 1.00 * * fisttps (%edx) +# CHECK-NEXT: 3 5 1.00 * * fisttpl (%ecx) +# CHECK-NEXT: 3 5 1.00 * * fisttpll (%eax) +# CHECK-NEXT: 1 1 1.00 * fld %st(0) +# CHECK-NEXT: 3 9 1.00 * * flds (%edx) +# CHECK-NEXT: 3 9 1.00 * * fldl (%ecx) +# CHECK-NEXT: 3 9 1.00 * * fldt (%eax) +# CHECK-NEXT: 5 8 2.00 * * fldcw (%eax) +# CHECK-NEXT: 1 100 0.33 * fldenv (%eax) +# CHECK-NEXT: 2 1 1.00 * fld1 +# CHECK-NEXT: 2 1 1.00 * fldl2e +# CHECK-NEXT: 2 1 1.00 * fldl2t +# CHECK-NEXT: 2 1 1.00 * fldlg2 +# CHECK-NEXT: 2 1 1.00 * fldln2 +# CHECK-NEXT: 2 1 1.00 * fldpi +# CHECK-NEXT: 1 1 1.00 * fldz +# CHECK-NEXT: 1 5 1.00 * fmul %st(0), %st(1) +# CHECK-NEXT: 1 5 1.00 * fmul %st(2) +# CHECK-NEXT: 2 12 1.00 * * fmuls (%ecx) +# CHECK-NEXT: 2 12 1.00 * * fmull (%eax) +# CHECK-NEXT: 1 5 1.00 * fmulp %st(1) +# CHECK-NEXT: 1 5 1.00 * fmulp %st(2) +# CHECK-NEXT: 3 15 1.00 * * fimuls (%ecx) +# CHECK-NEXT: 3 15 1.00 * * fimull (%eax) +# CHECK-NEXT: 1 1 1.00 * fnop +# CHECK-NEXT: 1 100 0.33 * fpatan +# CHECK-NEXT: 1 100 0.33 * fprem +# CHECK-NEXT: 1 100 0.33 * fprem1 +# CHECK-NEXT: 1 100 0.33 * fptan +# CHECK-NEXT: 1 100 0.33 * frndint +# CHECK-NEXT: 1 100 0.33 * frstor (%eax) +# CHECK-NEXT: 1 100 0.33 * fnsave (%eax) +# CHECK-NEXT: 1 100 0.33 * fscale +# CHECK-NEXT: 1 100 0.33 * fsin +# CHECK-NEXT: 1 100 0.33 * fsincos +# CHECK-NEXT: 1 24 24.00 * fsqrt +# CHECK-NEXT: 1 1 1.00 * fst %st(0) +# CHECK-NEXT: 3 6 1.00 * * fsts (%edx) +# CHECK-NEXT: 3 6 1.00 * * fstl (%ecx) +# CHECK-NEXT: 1 1 1.00 * fstp %st(0) +# CHECK-NEXT: 3 6 1.00 * * fstpl (%edx) +# CHECK-NEXT: 3 6 1.00 * * fstpl (%ecx) +# CHECK-NEXT: 3 6 1.00 * * fstpt (%eax) +# CHECK-NEXT: 4 7 1.00 * * fnstcw (%eax) +# CHECK-NEXT: 1 100 0.33 * fnstenv (%eax) +# CHECK-NEXT: 4 7 1.00 * fnstsw (%eax) +# CHECK-NEXT: 1 100 0.33 * frstor (%eax) +# CHECK-NEXT: 1 100 0.33 * wait +# CHECK-NEXT: 1 100 0.33 * fnsave (%eax) +# CHECK-NEXT: 1 3 1.00 * fsub %st(0), %st(1) +# CHECK-NEXT: 1 3 1.00 * fsub %st(2) +# CHECK-NEXT: 2 10 1.00 * * fsubs (%ecx) +# CHECK-NEXT: 2 10 1.00 * * fsubl (%eax) +# CHECK-NEXT: 1 3 1.00 * fsubp %st(1) +# CHECK-NEXT: 1 3 1.00 * fsubp %st(2) +# CHECK-NEXT: 3 13 2.00 * * fisubs (%ecx) +# CHECK-NEXT: 3 13 2.00 * * fisubl (%eax) +# CHECK-NEXT: 1 3 1.00 * fsubr %st(0), %st(1) +# CHECK-NEXT: 1 3 1.00 * fsubr %st(2) +# CHECK-NEXT: 2 10 1.00 * * fsubrs (%ecx) +# CHECK-NEXT: 2 10 1.00 * * fsubrl (%eax) +# CHECK-NEXT: 1 3 1.00 * fsubrp %st(1) +# CHECK-NEXT: 1 3 1.00 * fsubrp %st(2) +# CHECK-NEXT: 3 13 2.00 * * fisubrs (%ecx) +# CHECK-NEXT: 3 13 2.00 * * fisubrl (%eax) +# CHECK-NEXT: 1 3 1.00 * ftst +# CHECK-NEXT: 1 1 1.00 * fucom %st(1) +# CHECK-NEXT: 1 1 1.00 * fucom %st(3) +# CHECK-NEXT: 1 1 1.00 * fucomp %st(1) +# CHECK-NEXT: 1 1 1.00 * fucomp %st(3) +# CHECK-NEXT: 1 3 1.00 * fucompp +# CHECK-NEXT: 3 3 1.00 * fucomi %st(3) +# CHECK-NEXT: 3 3 1.00 * fucompi %st(3) +# CHECK-NEXT: 1 100 0.33 * wait +# CHECK-NEXT: 1 100 0.33 * fxam +# CHECK-NEXT: 1 1 0.33 * fxch %st(1) +# CHECK-NEXT: 1 1 0.33 * fxch %st(3) +# CHECK-NEXT: 5 5 2.00 * * * fxrstor (%eax) +# CHECK-NEXT: 1 100 0.33 * * * fxsave (%eax) +# CHECK-NEXT: 1 100 0.33 * fxtract +# CHECK-NEXT: 1 100 0.33 * fyl2x +# CHECK-NEXT: 1 100 0.33 * fyl2xp1 + +# CHECK: Resources: +# CHECK-NEXT: [0] - SBDivider +# CHECK-NEXT: [1] - SBFPDivider +# CHECK-NEXT: [2] - SBPort0 +# CHECK-NEXT: [3] - SBPort1 +# CHECK-NEXT: [4] - SBPort4 +# CHECK-NEXT: [5] - SBPort5 +# CHECK-NEXT: [6.0] - SBPort23 +# CHECK-NEXT: [6.1] - SBPort23 + +# CHECK: Resource pressure per iteration: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] +# CHECK-NEXT: - 136.00 52.67 90.67 17.00 54.67 34.00 34.00 + +# CHECK: Resource pressure by instruction: +# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6.0] [6.1] Instructions: +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - f2xm1 +# CHECK-NEXT: - - - - - 1.00 - - fabs +# CHECK-NEXT: - - - 1.00 - - - - fadd %st(0), %st(1) +# CHECK-NEXT: - - - 1.00 - - - - fadd %st(2) +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 fadds (%ecx) +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 faddl (%ecx) +# CHECK-NEXT: - - - 1.00 - - - - faddp %st(1) +# CHECK-NEXT: - - - 1.00 - - - - faddp %st(2) +# CHECK-NEXT: - - - 2.00 - - 0.50 0.50 fiadds (%ecx) +# CHECK-NEXT: - - - 2.00 - - 0.50 0.50 fiaddl (%ecx) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fbld (%ecx) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fbstp (%eax) +# CHECK-NEXT: - - - - - 1.00 - - fchs +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fnclex +# CHECK-NEXT: - - 0.50 - - 2.50 - - fcmovb %st(1), %st(0) +# CHECK-NEXT: - - 0.50 - - 2.50 - - fcmovbe %st(1), %st(0) +# CHECK-NEXT: - - 0.50 - - 2.50 - - fcmove %st(1), %st(0) +# CHECK-NEXT: - - 0.50 - - 2.50 - - fcmovnb %st(1), %st(0) +# CHECK-NEXT: - - 0.50 - - 2.50 - - fcmovnbe %st(1), %st(0) +# CHECK-NEXT: - - 0.50 - - 2.50 - - fcmovne %st(1), %st(0) +# CHECK-NEXT: - - 0.50 - - 2.50 - - fcmovnu %st(1), %st(0) +# CHECK-NEXT: - - 0.50 - - 2.50 - - fcmovu %st(1), %st(0) +# CHECK-NEXT: - - - 1.00 - - - - fcom %st(1) +# CHECK-NEXT: - - - 1.00 - - - - fcom %st(3) +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 fcoms (%ecx) +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 fcoml (%eax) +# CHECK-NEXT: - - - 1.00 - - - - fcomp %st(1) +# CHECK-NEXT: - - - 1.00 - - - - fcomp %st(3) +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 fcomps (%ecx) +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 fcompl (%eax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fcompp +# CHECK-NEXT: - - 1.00 1.00 - 1.00 - - fcomi %st(3) +# CHECK-NEXT: - - 1.00 1.00 - 1.00 - - fcompi %st(3) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fcos +# CHECK-NEXT: - - - - - 1.00 - - fdecstp +# CHECK-NEXT: - 14.00 1.00 - - - - - fdiv %st(0), %st(1) +# CHECK-NEXT: - 14.00 1.00 - - - - - fdiv %st(2) +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 fdivs (%ecx) +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 fdivl (%eax) +# CHECK-NEXT: - 14.00 1.00 - - - - - fdivp %st(1) +# CHECK-NEXT: - 14.00 1.00 - - - - - fdivp %st(2) +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 fidivs (%ecx) +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 fidivl (%eax) +# CHECK-NEXT: - 14.00 1.00 - - - - - fdivr %st(0), %st(1) +# CHECK-NEXT: - 14.00 1.00 - - - - - fdivr %st(2) +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 fdivrs (%ecx) +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 fdivrl (%eax) +# CHECK-NEXT: - 14.00 1.00 - - - - - fdivrp %st(1) +# CHECK-NEXT: - 14.00 1.00 - - - - - fdivrp %st(2) +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 fidivrs (%ecx) +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 fidivrl (%eax) +# CHECK-NEXT: - - - - - 1.00 - - ffree %st(0) +# CHECK-NEXT: - - - 2.00 - - 0.50 0.50 ficoms (%ecx) +# CHECK-NEXT: - - - 2.00 - - 0.50 0.50 ficoml (%eax) +# CHECK-NEXT: - - - 2.00 - - 0.50 0.50 ficomps (%ecx) +# CHECK-NEXT: - - - 2.00 - - 0.50 0.50 ficompl (%eax) +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 filds (%edx) +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 fildl (%ecx) +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 fildll (%eax) +# CHECK-NEXT: - - - - - 1.00 - - fincstp +# CHECK-NEXT: - - 1.00 1.00 - 2.00 - - fninit +# CHECK-NEXT: - - - 1.00 1.00 - 1.00 1.00 fists (%edx) +# CHECK-NEXT: - - - 1.00 1.00 - 1.00 1.00 fistl (%ecx) +# CHECK-NEXT: - - - 1.00 1.00 - 1.00 1.00 fistps (%edx) +# CHECK-NEXT: - - - 1.00 1.00 - 1.00 1.00 fistpl (%ecx) +# CHECK-NEXT: - - - 1.00 1.00 - 1.00 1.00 fistpll (%eax) +# CHECK-NEXT: - - - 1.00 1.00 - 0.50 0.50 fisttps (%edx) +# CHECK-NEXT: - - - 1.00 1.00 - 0.50 0.50 fisttpl (%ecx) +# CHECK-NEXT: - - - 1.00 1.00 - 0.50 0.50 fisttpll (%eax) +# CHECK-NEXT: - - - - - 1.00 - - fld %st(0) +# CHECK-NEXT: - - 0.50 0.50 - 1.00 0.50 0.50 flds (%edx) +# CHECK-NEXT: - - 0.50 0.50 - 1.00 0.50 0.50 fldl (%ecx) +# CHECK-NEXT: - - 0.50 0.50 - 1.00 0.50 0.50 fldt (%eax) +# CHECK-NEXT: - - - - 1.00 2.00 1.00 1.00 fldcw (%eax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fldenv (%eax) +# CHECK-NEXT: - - 1.00 - - 1.00 - - fld1 +# CHECK-NEXT: - - 1.00 1.00 - - - - fldl2e +# CHECK-NEXT: - - 1.00 1.00 - - - - fldl2t +# CHECK-NEXT: - - 1.00 1.00 - - - - fldlg2 +# CHECK-NEXT: - - 1.00 1.00 - - - - fldln2 +# CHECK-NEXT: - - 1.00 1.00 - - - - fldpi +# CHECK-NEXT: - - - - - 1.00 - - fldz +# CHECK-NEXT: - - 1.00 - - - - - fmul %st(0), %st(1) +# CHECK-NEXT: - - 1.00 - - - - - fmul %st(2) +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 fmuls (%ecx) +# CHECK-NEXT: - - 1.00 - - - 0.50 0.50 fmull (%eax) +# CHECK-NEXT: - - 1.00 - - - - - fmulp %st(1) +# CHECK-NEXT: - - 1.00 - - - - - fmulp %st(2) +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 fimuls (%ecx) +# CHECK-NEXT: - - 1.00 1.00 - - 0.50 0.50 fimull (%eax) +# CHECK-NEXT: - - - - - 1.00 - - fnop +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fpatan +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fprem +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fprem1 +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fptan +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - frndint +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - frstor (%eax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fnsave (%eax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fscale +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fsin +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fsincos +# CHECK-NEXT: - 24.00 1.00 - - - - - fsqrt +# CHECK-NEXT: - - - - - 1.00 - - fst %st(0) +# CHECK-NEXT: - - - - 1.00 - 1.00 1.00 fsts (%edx) +# CHECK-NEXT: - - - - 1.00 - 1.00 1.00 fstl (%ecx) +# CHECK-NEXT: - - - - - 1.00 - - fstp %st(0) +# CHECK-NEXT: - - - - 1.00 - 1.00 1.00 fstpl (%edx) +# CHECK-NEXT: - - - - 1.00 - 1.00 1.00 fstpl (%ecx) +# CHECK-NEXT: - - - - 1.00 - 1.00 1.00 fstpt (%eax) +# CHECK-NEXT: - - - - 1.00 1.00 1.00 1.00 fnstcw (%eax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fnstenv (%eax) +# CHECK-NEXT: - - 1.00 - 1.00 - 1.00 1.00 fnstsw (%eax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - frstor (%eax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - wait +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fnsave (%eax) +# CHECK-NEXT: - - - 1.00 - - - - fsub %st(0), %st(1) +# CHECK-NEXT: - - - 1.00 - - - - fsub %st(2) +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 fsubs (%ecx) +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 fsubl (%eax) +# CHECK-NEXT: - - - 1.00 - - - - fsubp %st(1) +# CHECK-NEXT: - - - 1.00 - - - - fsubp %st(2) +# CHECK-NEXT: - - - 2.00 - - 0.50 0.50 fisubs (%ecx) +# CHECK-NEXT: - - - 2.00 - - 0.50 0.50 fisubl (%eax) +# CHECK-NEXT: - - - 1.00 - - - - fsubr %st(0), %st(1) +# CHECK-NEXT: - - - 1.00 - - - - fsubr %st(2) +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 fsubrs (%ecx) +# CHECK-NEXT: - - - 1.00 - - 0.50 0.50 fsubrl (%eax) +# CHECK-NEXT: - - - 1.00 - - - - fsubrp %st(1) +# CHECK-NEXT: - - - 1.00 - - - - fsubrp %st(2) +# CHECK-NEXT: - - - 2.00 - - 0.50 0.50 fisubrs (%ecx) +# CHECK-NEXT: - - - 2.00 - - 0.50 0.50 fisubrl (%eax) +# CHECK-NEXT: - - - 1.00 - - - - ftst +# CHECK-NEXT: - - - 1.00 - - - - fucom %st(1) +# CHECK-NEXT: - - - 1.00 - - - - fucom %st(3) +# CHECK-NEXT: - - - 1.00 - - - - fucomp %st(1) +# CHECK-NEXT: - - - 1.00 - - - - fucomp %st(3) +# CHECK-NEXT: - - - 1.00 - - - - fucompp +# CHECK-NEXT: - - 1.00 1.00 - 1.00 - - fucomi %st(3) +# CHECK-NEXT: - - 1.00 1.00 - 1.00 - - fucompi %st(3) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - wait +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fxam +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fxch %st(1) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fxch %st(3) +# CHECK-NEXT: - - 0.50 0.50 1.00 2.00 0.50 0.50 fxrstor (%eax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fxsave (%eax) +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fxtract +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fyl2x +# CHECK-NEXT: - - 0.33 0.33 - 0.33 - - fyl2xp1 -- 2.11.0