OSDN Git Service

[NVPTX] Add lowering of i128 numbers as struct fields
authorArtem Belevich <tra@google.com>
Sat, 1 Dec 2018 00:21:52 +0000 (00:21 +0000)
committerArtem Belevich <tra@google.com>
Sat, 1 Dec 2018 00:21:52 +0000 (00:21 +0000)
Addition to D34555 - override VTs computation with ComputePTXValueVTs
for struct fields.

Author: Denys Zariaiev<denys.zariaiev@gmail.com>

Differential Revision: https://reviews.llvm.org/D55144

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@348057 91177308-0d34-0410-b5e6-96231b3b80d8

lib/Target/NVPTX/NVPTXISelLowering.cpp
test/CodeGen/NVPTX/i128-struct.ll [new file with mode: 0644]

index c352b9b..eceb4fc 100644 (file)
@@ -180,6 +180,18 @@ static void ComputePTXValueVTs(const TargetLowering &TLI, const DataLayout &DL,
     return;
   }
 
+  // Given a struct type, recursively traverse the elements with custom ComputePTXValueVTs.
+  if (StructType *STy = dyn_cast<StructType>(Ty)) {
+    auto const *SL = DL.getStructLayout(STy);
+    auto ElementNum = 0;
+    for(auto *EI : STy->elements()) {
+      ComputePTXValueVTs(TLI, DL, EI, ValueVTs, Offsets,
+                         StartingOffset + SL->getElementOffset(ElementNum));
+      ++ElementNum;
+    }
+    return;
+  }
+
   ComputeValueVTs(TLI, DL, Ty, TempVTs, &TempOffsets, StartingOffset);
   for (unsigned i = 0, e = TempVTs.size(); i != e; ++i) {
     EVT VT = TempVTs[i];
diff --git a/test/CodeGen/NVPTX/i128-struct.ll b/test/CodeGen/NVPTX/i128-struct.ll
new file mode 100644 (file)
index 0000000..c619be4
--- /dev/null
@@ -0,0 +1,13 @@
+; RUN: llc < %s -O0 -march=nvptx64 -mcpu=sm_20 | FileCheck %s
+
+; CHECK-LABEL: .visible .func (.param .align 16 .b8 func_retval0[32]) foo(
+define { i128, i128 } @foo(i64 %a, i32 %b) {
+  %1 = sext i64 %a to i128
+  %2 = sext i32 %b to i128
+  %3 = insertvalue { i128, i128 } undef, i128 %1, 0
+  %4 = insertvalue { i128, i128 } %3, i128 %2, 1
+
+  ; CHECK: st.param.v2.b64 [func_retval0+0],  {%[[REG1:rd[0-9]+]], %[[REG2:rd[0-9]+]]};
+  ; CHECK: st.param.v2.b64 [func_retval0+16], {%[[REG3:rd[0-9]+]], %[[REG4:rd[0-9]+]]};
+  ret { i128, i128 } %4
+}