AMDGPU: Fix crash with invariant markers

author Matt Arsenault <Matthew.Arsenault@amd.com>

Fri, 22 Jan 2016 19:47:54 +0000 (19:47 +0000)

committer Matt Arsenault <Matthew.Arsenault@amd.com>

Fri, 22 Jan 2016 19:47:54 +0000 (19:47 +0000)
author Matt Arsenault <Matthew.Arsenault@amd.com>
Fri, 22 Jan 2016 19:47:54 +0000 (19:47 +0000)
committer Matt Arsenault <Matthew.Arsenault@amd.com>
Fri, 22 Jan 2016 19:47:54 +0000 (19:47 +0000)
diff --git a/lib/Target/AMDGPU/AMDGPUPromoteAlloca.cpp b/lib/Target/AMDGPU/AMDGPUPromoteAlloca.cpp

index 393cb79..165a114 100644 (file)
--- a/lib/Target/AMDGPU/AMDGPUPromoteAlloca.cpp
+++ b/lib/Target/AMDGPU/AMDGPUPromoteAlloca.cpp
@@ -412,6 +412,14 @@ void AMDGPUPromoteAlloca::visitAlloca(AllocaInst &I) {
        Intr->eraseFromParent();
        continue;
      }
+    case Intrinsic::invariant_start:
+    case Intrinsic::invariant_end:
+    case Intrinsic::invariant_group_barrier:
+      Intr->eraseFromParent();
+      // FIXME: I think the invariant marker should still theoretically apply,
+      // but the intrinsics need to be changed to accept pointers with any
+      // address space.
+      continue;
      default:
        Intr->dump();
        llvm_unreachable("Don't know how to promote alloca intrinsic use.");
diff --git a/test/CodeGen/AMDGPU/promote-alloca-invariant-markers.ll b/test/CodeGen/AMDGPU/promote-alloca-invariant-markers.ll

new file mode 100644 (file)

index 0000000..6a9ec31
--- /dev/null
+++ b/test/CodeGen/AMDGPU/promote-alloca-invariant-markers.ll
@@ -0,0 +1,25 @@
+; RUN: llc -march=amdgcn -mattr=+promote-alloca -verify-machineinstrs < %s | FileCheck -check-prefix=GCN %s
+
+declare {}* @llvm.invariant.start(i64, i8* nocapture) #0
+declare void @llvm.invariant.end({}*, i64, i8* nocapture) #0
+declare i8* @llvm.invariant.group.barrier(i8*) #1
+
+; GCN-LABEL: {{^}}use_invariant_promotable_lds:
+; GCN: buffer_load_dword
+; GCN: ds_write_b32
+define void @use_invariant_promotable_lds(i32 addrspace(1)* %arg) #2 {
+bb:
+  %tmp = alloca i32, align 4
+  %tmp1 = bitcast i32* %tmp to i8*
+  %tmp2 = getelementptr inbounds i32, i32 addrspace(1)* %arg, i64 1
+  %tmp3 = load i32, i32 addrspace(1)* %tmp2
+  store i32 %tmp3, i32* %tmp
+  %tmp4 = call {}* @llvm.invariant.start(i64 4, i8* %tmp1) #0
+  call void @llvm.invariant.end({}* %tmp4, i64 4, i8* %tmp1) #0
+  %tmp5 = call i8* @llvm.invariant.group.barrier(i8* %tmp1) #1
+  ret void
+}
+
+attributes #0 = { argmemonly nounwind }
+attributes #1 = { nounwind readnone }
+attributes #2 = { nounwind }
author	Matt Arsenault <Matthew.Arsenault@amd.com>
	Fri, 22 Jan 2016 19:47:54 +0000 (19:47 +0000)
committer	Matt Arsenault <Matthew.Arsenault@amd.com>
	Fri, 22 Jan 2016 19:47:54 +0000 (19:47 +0000)
lib/Target/AMDGPU/AMDGPUPromoteAlloca.cpp		patch \| blob \| history
test/CodeGen/AMDGPU/promote-alloca-invariant-markers.ll	[new file with mode: 0644]	patch \| blob