[X86] Converge alignedstore/alignedstore256/alignedstore512 to a single predicate.

author Craig Topper <craig.topper@intel.com>

Sat, 19 Aug 2017 23:21:21 +0000 (23:21 +0000)

committer Craig Topper <craig.topper@intel.com>

Sat, 19 Aug 2017 23:21:21 +0000 (23:21 +0000)
author Craig Topper <craig.topper@intel.com>
Sat, 19 Aug 2017 23:21:21 +0000 (23:21 +0000)
committer Craig Topper <craig.topper@intel.com>
Sat, 19 Aug 2017 23:21:21 +0000 (23:21 +0000)
diff --git a/lib/Target/X86/X86InstrAVX512.td b/lib/Target/X86/X86InstrAVX512.td

index 63d2ff1..8a9f7c9 100644 (file)
--- a/lib/Target/X86/X86InstrAVX512.td
+++ b/lib/Target/X86/X86InstrAVX512.td
@@ -3464,11 +3464,11 @@ multiclass avx512_alignedstore_vl<bits<8> opc, string OpcodeStr,
                                    AVX512VLVectorVTInfo _,  Predicate prd,
                                    string Name> {
    let Predicates = [prd] in
-  defm Z : avx512_store<opc, OpcodeStr, _.info512, alignedstore512,
+  defm Z : avx512_store<opc, OpcodeStr, _.info512, alignedstore,
                          masked_store_aligned512, Name#Z>, EVEX_V512;
  
    let Predicates = [prd, HasVLX] in {
-    defm Z256 : avx512_store<opc, OpcodeStr, _.info256, alignedstore256,
+    defm Z256 : avx512_store<opc, OpcodeStr, _.info256, alignedstore,
                               masked_store_aligned256, Name#Z256>, EVEX_V256;
      defm Z128 : avx512_store<opc, OpcodeStr, _.info128, alignedstore,
                               masked_store_aligned128, Name#Z128>, EVEX_V128;
@@ -3605,9 +3605,9 @@ def : Pat<(v8i32 (vselect (v8i1 VK8WM:$mask), (v8i32 VR256X:$src1),
  
  let Predicates = [HasAVX512] in {
    // 512-bit store.
-  def : Pat<(alignedstore512 (v32i16 VR512:$src), addr:$dst),
+  def : Pat<(alignedstore (v32i16 VR512:$src), addr:$dst),
              (VMOVDQA32Zmr addr:$dst, VR512:$src)>;
-  def : Pat<(alignedstore512 (v64i8 VR512:$src), addr:$dst),
+  def : Pat<(alignedstore (v64i8 VR512:$src), addr:$dst),
              (VMOVDQA32Zmr addr:$dst, VR512:$src)>;
    def : Pat<(store (v32i16 VR512:$src), addr:$dst),
              (VMOVDQU32Zmr addr:$dst, VR512:$src)>;
@@ -3627,9 +3627,9 @@ let Predicates = [HasVLX] in {
              (VMOVDQU32Z128mr addr:$dst, VR128X:$src)>;
  
    // 256-bit store.
-  def : Pat<(alignedstore256 (v16i16 VR256X:$src), addr:$dst),
+  def : Pat<(alignedstore (v16i16 VR256X:$src), addr:$dst),
              (VMOVDQA32Z256mr addr:$dst, VR256X:$src)>;
-  def : Pat<(alignedstore256 (v32i8 VR256X:$src), addr:$dst),
+  def : Pat<(alignedstore (v32i8 VR256X:$src), addr:$dst),
              (VMOVDQA32Z256mr addr:$dst, VR256X:$src)>;
    def : Pat<(store (v16i16 VR256X:$src), addr:$dst),
              (VMOVDQU32Z256mr addr:$dst, VR256X:$src)>;
@@ -3718,23 +3718,23 @@ let Predicates = [HasVLX] in {
  
    // Special patterns for storing subvector extracts of lower 256-bits of 512.
    // Its cheaper to just use VMOVAPS/VMOVUPS instead of VEXTRACTF128mr
-  def : Pat<(alignedstore256 (v4f64 (extract_subvector
-                                     (v8f64 VR512:$src), (iPTR 0))), addr:$dst),
+  def : Pat<(alignedstore (v4f64 (extract_subvector
+                                  (v8f64 VR512:$src), (iPTR 0))), addr:$dst),
       (VMOVAPDZ256mr addr:$dst, (v4f64 (EXTRACT_SUBREG VR512:$src,sub_ymm)))>;
-  def : Pat<(alignedstore256 (v8f32 (extract_subvector
-                                     (v16f32 VR512:$src), (iPTR 0))), addr:$dst),
+  def : Pat<(alignedstore (v8f32 (extract_subvector
+                                  (v16f32 VR512:$src), (iPTR 0))), addr:$dst),
       (VMOVAPSZ256mr addr:$dst, (v8f32 (EXTRACT_SUBREG VR512:$src,sub_ymm)))>;
-  def : Pat<(alignedstore256 (v4i64 (extract_subvector
-                                     (v8i64 VR512:$src), (iPTR 0))), addr:$dst),
+  def : Pat<(alignedstore (v4i64 (extract_subvector
+                                  (v8i64 VR512:$src), (iPTR 0))), addr:$dst),
       (VMOVDQA64Z256mr addr:$dst, (v4i64 (EXTRACT_SUBREG VR512:$src,sub_ymm)))>;
-  def : Pat<(alignedstore256 (v8i32 (extract_subvector
-                                     (v16i32 VR512:$src), (iPTR 0))), addr:$dst),
+  def : Pat<(alignedstore (v8i32 (extract_subvector
+                                  (v16i32 VR512:$src), (iPTR 0))), addr:$dst),
       (VMOVDQA32Z256mr addr:$dst, (v8i32 (EXTRACT_SUBREG VR512:$src,sub_ymm)))>;
-  def : Pat<(alignedstore256 (v16i16 (extract_subvector
-                                      (v32i16 VR512:$src), (iPTR 0))), addr:$dst),
+  def : Pat<(alignedstore (v16i16 (extract_subvector
+                                   (v32i16 VR512:$src), (iPTR 0))), addr:$dst),
       (VMOVDQA32Z256mr addr:$dst, (v16i16 (EXTRACT_SUBREG VR512:$src,sub_ymm)))>;
-  def : Pat<(alignedstore256 (v32i8 (extract_subvector
-                                     (v64i8 VR512:$src), (iPTR 0))), addr:$dst),
+  def : Pat<(alignedstore (v32i8 (extract_subvector
+                                  (v64i8 VR512:$src), (iPTR 0))), addr:$dst),
       (VMOVDQA32Z256mr addr:$dst, (v32i8 (EXTRACT_SUBREG VR512:$src,sub_ymm)))>;
  
    def : Pat<(store (v4f64 (extract_subvector
diff --git a/lib/Target/X86/X86InstrFragmentsSIMD.td b/lib/Target/X86/X86InstrFragmentsSIMD.td

index 7bb6d92..7f7a1a1 100644 (file)
--- a/lib/Target/X86/X86InstrFragmentsSIMD.td
+++ b/lib/Target/X86/X86InstrFragmentsSIMD.td
@@ -682,22 +682,11 @@ def extloadv2f32 : PatFrag<(ops node:$ptr), (v2f64 (extloadvf32 node:$ptr))>;
  def extloadv4f32 : PatFrag<(ops node:$ptr), (v4f64 (extloadvf32 node:$ptr))>;
  def extloadv8f32 : PatFrag<(ops node:$ptr), (v8f64 (extloadvf32 node:$ptr))>;
  
-// Like 'store', but always requires 128-bit vector alignment.
+// Like 'store', but always requires vector size alignment.
  def alignedstore : PatFrag<(ops node:$val, node:$ptr),
                             (store node:$val, node:$ptr), [{
-  return cast<StoreSDNode>(N)->getAlignment() >= 16;
-}]>;
-
-// Like 'store', but always requires 256-bit vector alignment.
-def alignedstore256 : PatFrag<(ops node:$val, node:$ptr),
-                              (store node:$val, node:$ptr), [{
-  return cast<StoreSDNode>(N)->getAlignment() >= 32;
-}]>;
-
-// Like 'store', but always requires 512-bit vector alignment.
-def alignedstore512 : PatFrag<(ops node:$val, node:$ptr),
-                              (store node:$val, node:$ptr), [{
-  return cast<StoreSDNode>(N)->getAlignment() >= 64;
+  StoreSDNode *St = cast<StoreSDNode>(N);
+  return St->getAlignment() >= St->getMemoryVT().getStoreSize();
  }]>;
  
  // Like 'load', but always requires 128-bit vector alignment.
diff --git a/lib/Target/X86/X86InstrSSE.td b/lib/Target/X86/X86InstrSSE.td

index f5bc312..88a7a5b 100644 (file)
--- a/lib/Target/X86/X86InstrSSE.td
+++ b/lib/Target/X86/X86InstrSSE.td
@@ -842,11 +842,11 @@ def VMOVUPDmr : VPDI<0x11, MRMDestMem, (outs), (ins f128mem:$dst, VR128:$src),
                     IIC_SSE_MOVU_P_MR>, VEX, VEX_WIG;
  def VMOVAPSYmr : VPSI<0x29, MRMDestMem, (outs), (ins f256mem:$dst, VR256:$src),
                     "movaps\t{$src, $dst|$dst, $src}",
-                   [(alignedstore256 (v8f32 VR256:$src), addr:$dst)],
+                   [(alignedstore (v8f32 VR256:$src), addr:$dst)],
                     IIC_SSE_MOVA_P_MR>, VEX, VEX_L, VEX_WIG;
  def VMOVAPDYmr : VPDI<0x29, MRMDestMem, (outs), (ins f256mem:$dst, VR256:$src),
                     "movapd\t{$src, $dst|$dst, $src}",
-                   [(alignedstore256 (v4f64 VR256:$src), addr:$dst)],
+                   [(alignedstore (v4f64 VR256:$src), addr:$dst)],
                     IIC_SSE_MOVA_P_MR>, VEX, VEX_L, VEX_WIG;
  def VMOVUPSYmr : VPSI<0x11, MRMDestMem, (outs), (ins f256mem:$dst, VR256:$src),
                     "movups\t{$src, $dst|$dst, $src}",
@@ -966,13 +966,13 @@ let Predicates = [HasAVX, NoVLX] in {
              (VMOVAPSYrm addr:$src)>;
    def : Pat<(loadv4i64 addr:$src),
              (VMOVUPSYrm addr:$src)>;
-  def : Pat<(alignedstore256 (v4i64 VR256:$src), addr:$dst),
+  def : Pat<(alignedstore (v4i64 VR256:$src), addr:$dst),
              (VMOVAPSYmr addr:$dst, VR256:$src)>;
-  def : Pat<(alignedstore256 (v8i32 VR256:$src), addr:$dst),
+  def : Pat<(alignedstore (v8i32 VR256:$src), addr:$dst),
              (VMOVAPSYmr addr:$dst, VR256:$src)>;
-  def : Pat<(alignedstore256 (v16i16 VR256:$src), addr:$dst),
+  def : Pat<(alignedstore (v16i16 VR256:$src), addr:$dst),
              (VMOVAPSYmr addr:$dst, VR256:$src)>;
-  def : Pat<(alignedstore256 (v32i8 VR256:$src), addr:$dst),
+  def : Pat<(alignedstore (v32i8 VR256:$src), addr:$dst),
              (VMOVAPSYmr addr:$dst, VR256:$src)>;
    def : Pat<(store (v4i64 VR256:$src), addr:$dst),
              (VMOVUPSYmr addr:$dst, VR256:$src)>;
author	Craig Topper <craig.topper@intel.com>
	Sat, 19 Aug 2017 23:21:21 +0000 (23:21 +0000)
committer	Craig Topper <craig.topper@intel.com>
	Sat, 19 Aug 2017 23:21:21 +0000 (23:21 +0000)
lib/Target/X86/X86InstrAVX512.td		patch \| blob \| history
lib/Target/X86/X86InstrFragmentsSIMD.td		patch \| blob \| history
lib/Target/X86/X86InstrSSE.td		patch \| blob \| history