OSDN Git Service

r600: use ieee version of rsq
authorRoland Scheidegger <sroland@vmware.com>
Thu, 9 Nov 2017 18:50:41 +0000 (19:50 +0100)
committerRoland Scheidegger <sroland@vmware.com>
Wed, 15 Nov 2017 02:13:46 +0000 (03:13 +0100)
Both r600 and evergreen used the clamped version, whereas cayman used the
ieee one. I don't think there's a valid reason for this discrepancy, so let's
switch to the ieee version for r600 and evergreen too, since we generally
want to stick to ieee arithmetic.
With this, behavior for both rcp and rsq should now be the same for all of
r600, eg, cm, all using ieee versions (albeit note rsq retains the abs
behavior for everybody, which may not be a good idea ultimately).

Reviewed-by: Dave Airlie <airlied@redhat.com>
src/gallium/drivers/r600/r600_shader.c

index 547eeba..b1a164e 100644 (file)
@@ -4865,11 +4865,7 @@ static int tgsi_rsq(struct r600_shader_ctx *ctx)
 
        memset(&alu, 0, sizeof(struct r600_bytecode_alu));
 
-       /* XXX:
-        * For state trackers other than OpenGL, we'll want to use
-        * _RECIPSQRT_IEEE instead.
-        */
-       alu.op = ALU_OP1_RECIPSQRT_CLAMPED;
+       alu.op = ALU_OP1_RECIPSQRT_IEEE;
 
        for (i = 0; i < inst->Instruction.NumSrcRegs; i++) {
                r600_bytecode_src(&alu.src[i], &ctx->src[i], 0);