Merge remote-tracking branch 'jekstrand/wip/i965-uniforms' into vulkan

[android-x86/external-mesa.git] / src / mesa / drivers / dri / i965 / brw_vec4.cpp
diff --git a/src/mesa/drivers/dri/i965/brw_vec4.cpp b/src/mesa/drivers/dri/i965/brw_vec4.cpp

index 1304e23..358a710 100644 (file)
--- a/src/mesa/drivers/dri/i965/brw_vec4.cpp
+++ b/src/mesa/drivers/dri/i965/brw_vec4.cpp
@@ -155,6 +155,10 @@ vec4_instruction::is_send_from_grf()
     case SHADER_OPCODE_TYPED_ATOMIC:
     case SHADER_OPCODE_TYPED_SURFACE_READ:
     case SHADER_OPCODE_TYPED_SURFACE_WRITE:
+   case VEC4_OPCODE_URB_READ:
+   case TCS_OPCODE_URB_WRITE:
+   case TCS_OPCODE_RELEASE_INPUT:
+   case SHADER_OPCODE_BARRIER:
        return true;
     default:
        return false;
@@ -184,7 +188,10 @@ bool
  vec4_instruction::has_source_and_destination_hazard() const
  {
     switch (opcode) {
-   /* Most opcodes in the vec4 world use MRFs. */
+   case TCS_OPCODE_SET_INPUT_URB_OFFSETS:
+   case TCS_OPCODE_SET_OUTPUT_URB_OFFSETS:
+   case TES_OPCODE_ADD_INDIRECT_URB_OFFSET:
+      return true;
     default:
        return false;
     }
@@ -204,6 +211,7 @@ vec4_instruction::regs_read(unsigned arg) const
     case SHADER_OPCODE_TYPED_ATOMIC:
     case SHADER_OPCODE_TYPED_SURFACE_READ:
     case SHADER_OPCODE_TYPED_SURFACE_WRITE:
+   case TCS_OPCODE_URB_WRITE:
        return arg == 0 ? mlen : 1;
  
     case VS_OPCODE_PULL_CONSTANT_LOAD_GEN7:
@@ -268,6 +276,7 @@ vec4_visitor::implied_mrf_writes(vec4_instruction *inst)
     case SHADER_OPCODE_POW:
        return 2;
     case VS_OPCODE_URB_WRITE:
+   case TCS_OPCODE_THREAD_END:
        return 1;
     case VS_OPCODE_PULL_CONSTANT_LOAD:
        return 2;
@@ -281,6 +290,8 @@ vec4_visitor::implied_mrf_writes(vec4_instruction *inst)
        return 0;
     case GS_OPCODE_FF_SYNC:
        return 1;
+   case TCS_OPCODE_URB_WRITE:
+      return 0;
     case SHADER_OPCODE_SHADER_TIME_ADD:
        return 0;
     case SHADER_OPCODE_TEX:
@@ -1549,7 +1560,7 @@ int
  vec4_vs_visitor::setup_attributes(int payload_reg)
  {
     int nr_attributes;
-   int attribute_map[VERT_ATTRIB_MAX + 1];
+   int attribute_map[VERT_ATTRIB_MAX + 2];
     memset(attribute_map, 0, sizeof(attribute_map));
  
     nr_attributes = 0;
@@ -1560,12 +1571,19 @@ vec4_vs_visitor::setup_attributes(int payload_reg)
        }
     }
  
+   if (vs_prog_data->uses_drawid) {
+      attribute_map[VERT_ATTRIB_MAX + 1] = payload_reg + nr_attributes;
+      nr_attributes++;
+   }
+
     /* VertexID is stored by the VF as the last vertex element, but we
      * don't represent it with a flag in inputs_read, so we call it
      * VERT_ATTRIB_MAX.
      */
-   if (vs_prog_data->uses_vertexid || vs_prog_data->uses_instanceid) {
+   if (vs_prog_data->uses_vertexid || vs_prog_data->uses_instanceid ||
+       vs_prog_data->uses_basevertex || vs_prog_data->uses_baseinstance) {
        attribute_map[VERT_ATTRIB_MAX] = payload_reg + nr_attributes;
+      nr_attributes++;
     }
  
     lower_attributes_to_hw_regs(attribute_map, false /* interleaved */);
@@ -1758,9 +1776,22 @@ vec4_visitor::convert_to_hw_regs()
           case ATTR:
              unreachable("not reached");
           }
+
           src = reg;
        }
  
+      if (inst->is_3src()) {
+         /* 3-src instructions with scalar sources support arbitrary subnr,
+          * but don't actually use swizzles.  Convert swizzle into subnr.
+          */
+         for (int i = 0; i < 3; i++) {
+            if (inst->src[i].vstride == BRW_VERTICAL_STRIDE_0) {
+               assert(brw_is_single_value_swizzle(inst->src[i].swizzle));
+               inst->src[i].subnr += 4 * BRW_GET_SWZ(inst->src[i].swizzle, 0);
+            }
+         }
+      }
+
        dst_reg &dst = inst->dst;
        struct brw_reg reg;
  
@@ -1963,11 +1994,18 @@ brw_compile_vs(const struct brw_compiler *compiler, void *log_data,
      * incoming vertex attribute.  So, add an extra slot.
      */
     if (shader->info.system_values_read &
-       (BITFIELD64_BIT(SYSTEM_VALUE_VERTEX_ID_ZERO_BASE) |
+       (BITFIELD64_BIT(SYSTEM_VALUE_BASE_VERTEX) |
+        BITFIELD64_BIT(SYSTEM_VALUE_BASE_INSTANCE) |
+        BITFIELD64_BIT(SYSTEM_VALUE_VERTEX_ID_ZERO_BASE) |
          BITFIELD64_BIT(SYSTEM_VALUE_INSTANCE_ID))) {
        nr_attributes++;
     }
  
+   /* gl_DrawID has its very own vec4 */
+   if (shader->info.system_values_read & BITFIELD64_BIT(SYSTEM_VALUE_DRAW_ID)) {
+      nr_attributes++;
+   }
+
     /* The 3DSTATE_VS documentation lists the lower bound on "Vertex URB Entry
      * Read Length" as 1 in vec4 mode, and 0 in SIMD8 mode.  Empirically, in
      * vec4 mode, the hardware appears to wedge unless we read something.
@@ -2006,7 +2044,7 @@ brw_compile_vs(const struct brw_compiler *compiler, void *log_data,
  
        fs_generator g(compiler, log_data, mem_ctx, (void *) key,
                       &prog_data->base.base, v.promoted_constants,
-                     v.runtime_check_aads_emit, "VS");
+                     v.runtime_check_aads_emit, MESA_SHADER_VERTEX);
        if (INTEL_DEBUG & DEBUG_VS) {
           const char *debug_name =
              ralloc_asprintf(mem_ctx, "%s vertex shader %s",