OSDN Git Service

glsl: calculate number of operands in an expression once
[android-x86/external-mesa.git] / src / compiler / glsl / ir.cpp
1 /*
2  * Copyright © 2010 Intel Corporation
3  *
4  * Permission is hereby granted, free of charge, to any person obtaining a
5  * copy of this software and associated documentation files (the "Software"),
6  * to deal in the Software without restriction, including without limitation
7  * the rights to use, copy, modify, merge, publish, distribute, sublicense,
8  * and/or sell copies of the Software, and to permit persons to whom the
9  * Software is furnished to do so, subject to the following conditions:
10  *
11  * The above copyright notice and this permission notice (including the next
12  * paragraph) shall be included in all copies or substantial portions of the
13  * Software.
14  *
15  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
16  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
17  * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL
18  * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
19  * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING
20  * FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER
21  * DEALINGS IN THE SOFTWARE.
22  */
23 #include <string.h>
24 #include "main/core.h" /* for MAX2 */
25 #include "ir.h"
26 #include "compiler/glsl_types.h"
27 #include "glsl_parser_extras.h"
28
29
30 ir_rvalue::ir_rvalue(enum ir_node_type t)
31    : ir_instruction(t)
32 {
33    this->type = glsl_type::error_type;
34 }
35
36 bool ir_rvalue::is_zero() const
37 {
38    return false;
39 }
40
41 bool ir_rvalue::is_one() const
42 {
43    return false;
44 }
45
46 bool ir_rvalue::is_negative_one() const
47 {
48    return false;
49 }
50
51 /**
52  * Modify the swizzle make to move one component to another
53  *
54  * \param m    IR swizzle to be modified
55  * \param from Component in the RHS that is to be swizzled
56  * \param to   Desired swizzle location of \c from
57  */
58 static void
59 update_rhs_swizzle(ir_swizzle_mask &m, unsigned from, unsigned to)
60 {
61    switch (to) {
62    case 0: m.x = from; break;
63    case 1: m.y = from; break;
64    case 2: m.z = from; break;
65    case 3: m.w = from; break;
66    default: assert(!"Should not get here.");
67    }
68 }
69
70 void
71 ir_assignment::set_lhs(ir_rvalue *lhs)
72 {
73    void *mem_ctx = this;
74    bool swizzled = false;
75
76    while (lhs != NULL) {
77       ir_swizzle *swiz = lhs->as_swizzle();
78
79       if (swiz == NULL)
80          break;
81
82       unsigned write_mask = 0;
83       ir_swizzle_mask rhs_swiz = { 0, 0, 0, 0, 0, 0 };
84
85       for (unsigned i = 0; i < swiz->mask.num_components; i++) {
86          unsigned c = 0;
87
88          switch (i) {
89          case 0: c = swiz->mask.x; break;
90          case 1: c = swiz->mask.y; break;
91          case 2: c = swiz->mask.z; break;
92          case 3: c = swiz->mask.w; break;
93          default: assert(!"Should not get here.");
94          }
95
96          write_mask |= (((this->write_mask >> i) & 1) << c);
97          update_rhs_swizzle(rhs_swiz, i, c);
98          rhs_swiz.num_components = swiz->val->type->vector_elements;
99       }
100
101       this->write_mask = write_mask;
102       lhs = swiz->val;
103
104       this->rhs = new(mem_ctx) ir_swizzle(this->rhs, rhs_swiz);
105       swizzled = true;
106    }
107
108    if (swizzled) {
109       /* Now, RHS channels line up with the LHS writemask.  Collapse it
110        * to just the channels that will be written.
111        */
112       ir_swizzle_mask rhs_swiz = { 0, 0, 0, 0, 0, 0 };
113       int rhs_chan = 0;
114       for (int i = 0; i < 4; i++) {
115          if (write_mask & (1 << i))
116             update_rhs_swizzle(rhs_swiz, i, rhs_chan++);
117       }
118       rhs_swiz.num_components = rhs_chan;
119       this->rhs = new(mem_ctx) ir_swizzle(this->rhs, rhs_swiz);
120    }
121
122    assert((lhs == NULL) || lhs->as_dereference());
123
124    this->lhs = (ir_dereference *) lhs;
125 }
126
127 ir_variable *
128 ir_assignment::whole_variable_written()
129 {
130    ir_variable *v = this->lhs->whole_variable_referenced();
131
132    if (v == NULL)
133       return NULL;
134
135    if (v->type->is_scalar())
136       return v;
137
138    if (v->type->is_vector()) {
139       const unsigned mask = (1U << v->type->vector_elements) - 1;
140
141       if (mask != this->write_mask)
142          return NULL;
143    }
144
145    /* Either all the vector components are assigned or the variable is some
146     * composite type (and the whole thing is assigned.
147     */
148    return v;
149 }
150
151 ir_assignment::ir_assignment(ir_dereference *lhs, ir_rvalue *rhs,
152                              ir_rvalue *condition, unsigned write_mask)
153    : ir_instruction(ir_type_assignment)
154 {
155    this->condition = condition;
156    this->rhs = rhs;
157    this->lhs = lhs;
158    this->write_mask = write_mask;
159
160    if (lhs->type->is_scalar() || lhs->type->is_vector()) {
161       int lhs_components = 0;
162       for (int i = 0; i < 4; i++) {
163          if (write_mask & (1 << i))
164             lhs_components++;
165       }
166
167       assert(lhs_components == this->rhs->type->vector_elements);
168    }
169 }
170
171 ir_assignment::ir_assignment(ir_rvalue *lhs, ir_rvalue *rhs,
172                              ir_rvalue *condition)
173    : ir_instruction(ir_type_assignment)
174 {
175    this->condition = condition;
176    this->rhs = rhs;
177
178    /* If the RHS is a vector type, assume that all components of the vector
179     * type are being written to the LHS.  The write mask comes from the RHS
180     * because we can have a case where the LHS is a vec4 and the RHS is a
181     * vec3.  In that case, the assignment is:
182     *
183     *     (assign (...) (xyz) (var_ref lhs) (var_ref rhs))
184     */
185    if (rhs->type->is_vector())
186       this->write_mask = (1U << rhs->type->vector_elements) - 1;
187    else if (rhs->type->is_scalar())
188       this->write_mask = 1;
189    else
190       this->write_mask = 0;
191
192    this->set_lhs(lhs);
193 }
194
195 ir_expression::ir_expression(int op, const struct glsl_type *type,
196                              ir_rvalue *op0, ir_rvalue *op1,
197                              ir_rvalue *op2, ir_rvalue *op3)
198    : ir_rvalue(ir_type_expression)
199 {
200    this->type = type;
201    this->operation = ir_expression_operation(op);
202    this->operands[0] = op0;
203    this->operands[1] = op1;
204    this->operands[2] = op2;
205    this->operands[3] = op3;
206    init_num_operands();
207
208 #ifndef NDEBUG
209    for (unsigned i = num_operands; i < 4; i++) {
210       assert(this->operands[i] == NULL);
211    }
212
213    for (unsigned i = 0; i < num_operands; i++) {
214       assert(this->operands[i] != NULL);
215    }
216 #endif
217 }
218
219 ir_expression::ir_expression(int op, ir_rvalue *op0)
220    : ir_rvalue(ir_type_expression)
221 {
222    this->operation = ir_expression_operation(op);
223    this->operands[0] = op0;
224    this->operands[1] = NULL;
225    this->operands[2] = NULL;
226    this->operands[3] = NULL;
227
228    assert(op <= ir_last_unop);
229    init_num_operands();
230    assert(num_operands == 1);
231    assert(this->operands[0]);
232
233    switch (this->operation) {
234    case ir_unop_bit_not:
235    case ir_unop_logic_not:
236    case ir_unop_neg:
237    case ir_unop_abs:
238    case ir_unop_sign:
239    case ir_unop_rcp:
240    case ir_unop_rsq:
241    case ir_unop_sqrt:
242    case ir_unop_exp:
243    case ir_unop_log:
244    case ir_unop_exp2:
245    case ir_unop_log2:
246    case ir_unop_trunc:
247    case ir_unop_ceil:
248    case ir_unop_floor:
249    case ir_unop_fract:
250    case ir_unop_round_even:
251    case ir_unop_sin:
252    case ir_unop_cos:
253    case ir_unop_dFdx:
254    case ir_unop_dFdx_coarse:
255    case ir_unop_dFdx_fine:
256    case ir_unop_dFdy:
257    case ir_unop_dFdy_coarse:
258    case ir_unop_dFdy_fine:
259    case ir_unop_bitfield_reverse:
260    case ir_unop_interpolate_at_centroid:
261    case ir_unop_saturate:
262       this->type = op0->type;
263       break;
264
265    case ir_unop_f2i:
266    case ir_unop_b2i:
267    case ir_unop_u2i:
268    case ir_unop_d2i:
269    case ir_unop_bitcast_f2i:
270    case ir_unop_bit_count:
271    case ir_unop_find_msb:
272    case ir_unop_find_lsb:
273    case ir_unop_subroutine_to_int:
274    case ir_unop_i642i:
275    case ir_unop_u642i:
276       this->type = glsl_type::get_instance(GLSL_TYPE_INT,
277                                            op0->type->vector_elements, 1);
278       break;
279
280    case ir_unop_b2f:
281    case ir_unop_i2f:
282    case ir_unop_u2f:
283    case ir_unop_d2f:
284    case ir_unop_bitcast_i2f:
285    case ir_unop_bitcast_u2f:
286    case ir_unop_i642f:
287    case ir_unop_u642f:
288       this->type = glsl_type::get_instance(GLSL_TYPE_FLOAT,
289                                            op0->type->vector_elements, 1);
290       break;
291
292    case ir_unop_f2b:
293    case ir_unop_i2b:
294    case ir_unop_d2b:
295    case ir_unop_i642b:
296       this->type = glsl_type::get_instance(GLSL_TYPE_BOOL,
297                                            op0->type->vector_elements, 1);
298       break;
299
300    case ir_unop_f2d:
301    case ir_unop_i2d:
302    case ir_unop_u2d:
303    case ir_unop_i642d:
304    case ir_unop_u642d:
305       this->type = glsl_type::get_instance(GLSL_TYPE_DOUBLE,
306                                            op0->type->vector_elements, 1);
307       break;
308
309    case ir_unop_i2u:
310    case ir_unop_f2u:
311    case ir_unop_d2u:
312    case ir_unop_bitcast_f2u:
313    case ir_unop_i642u:
314    case ir_unop_u642u:
315       this->type = glsl_type::get_instance(GLSL_TYPE_UINT,
316                                            op0->type->vector_elements, 1);
317       break;
318
319    case ir_unop_i2i64:
320    case ir_unop_u2i64:
321    case ir_unop_b2i64:
322    case ir_unop_f2i64:
323    case ir_unop_d2i64:
324    case ir_unop_u642i64:
325       this->type = glsl_type::get_instance(GLSL_TYPE_INT64,
326                                            op0->type->vector_elements, 1);
327       break;
328
329    case ir_unop_i2u64:
330    case ir_unop_u2u64:
331    case ir_unop_f2u64:
332    case ir_unop_d2u64:
333    case ir_unop_i642u64:
334       this->type = glsl_type::get_instance(GLSL_TYPE_UINT64,
335                                            op0->type->vector_elements, 1);
336       break;
337    case ir_unop_noise:
338       this->type = glsl_type::float_type;
339       break;
340
341    case ir_unop_unpack_double_2x32:
342    case ir_unop_unpack_uint_2x32:
343       this->type = glsl_type::uvec2_type;
344       break;
345
346    case ir_unop_unpack_int_2x32:
347       this->type = glsl_type::ivec2_type;
348       break;
349
350    case ir_unop_pack_snorm_2x16:
351    case ir_unop_pack_snorm_4x8:
352    case ir_unop_pack_unorm_2x16:
353    case ir_unop_pack_unorm_4x8:
354    case ir_unop_pack_half_2x16:
355       this->type = glsl_type::uint_type;
356       break;
357
358    case ir_unop_pack_double_2x32:
359       this->type = glsl_type::double_type;
360       break;
361
362    case ir_unop_pack_int_2x32:
363       this->type = glsl_type::int64_t_type;
364       break;
365
366    case ir_unop_pack_uint_2x32:
367       this->type = glsl_type::uint64_t_type;
368       break;
369
370    case ir_unop_unpack_snorm_2x16:
371    case ir_unop_unpack_unorm_2x16:
372    case ir_unop_unpack_half_2x16:
373       this->type = glsl_type::vec2_type;
374       break;
375
376    case ir_unop_unpack_snorm_4x8:
377    case ir_unop_unpack_unorm_4x8:
378       this->type = glsl_type::vec4_type;
379       break;
380
381    case ir_unop_unpack_sampler_2x32:
382    case ir_unop_unpack_image_2x32:
383       this->type = glsl_type::uvec2_type;
384       break;
385
386    case ir_unop_pack_sampler_2x32:
387    case ir_unop_pack_image_2x32:
388       this->type = op0->type;
389       break;
390
391    case ir_unop_frexp_sig:
392       this->type = op0->type;
393       break;
394    case ir_unop_frexp_exp:
395       this->type = glsl_type::get_instance(GLSL_TYPE_INT,
396                                            op0->type->vector_elements, 1);
397       break;
398
399    case ir_unop_get_buffer_size:
400    case ir_unop_ssbo_unsized_array_length:
401       this->type = glsl_type::int_type;
402       break;
403
404    case ir_unop_bitcast_i642d:
405    case ir_unop_bitcast_u642d:
406       this->type = glsl_type::get_instance(GLSL_TYPE_DOUBLE,
407                                            op0->type->vector_elements, 1);
408       break;
409
410    case ir_unop_bitcast_d2i64:
411       this->type = glsl_type::get_instance(GLSL_TYPE_INT64,
412                                            op0->type->vector_elements, 1);
413       break;
414    case ir_unop_bitcast_d2u64:
415       this->type = glsl_type::get_instance(GLSL_TYPE_UINT64,
416                                            op0->type->vector_elements, 1);
417       break;
418
419    default:
420       assert(!"not reached: missing automatic type setup for ir_expression");
421       this->type = op0->type;
422       break;
423    }
424 }
425
426 ir_expression::ir_expression(int op, ir_rvalue *op0, ir_rvalue *op1)
427    : ir_rvalue(ir_type_expression)
428 {
429    this->operation = ir_expression_operation(op);
430    this->operands[0] = op0;
431    this->operands[1] = op1;
432    this->operands[2] = NULL;
433    this->operands[3] = NULL;
434
435    assert(op > ir_last_unop);
436    init_num_operands();
437    assert(num_operands == 2);
438    for (unsigned i = 0; i < num_operands; i++) {
439       assert(this->operands[i] != NULL);
440    }
441
442    switch (this->operation) {
443    case ir_binop_all_equal:
444    case ir_binop_any_nequal:
445       this->type = glsl_type::bool_type;
446       break;
447
448    case ir_binop_add:
449    case ir_binop_sub:
450    case ir_binop_min:
451    case ir_binop_max:
452    case ir_binop_pow:
453    case ir_binop_mul:
454    case ir_binop_div:
455    case ir_binop_mod:
456       if (op0->type->is_scalar()) {
457          this->type = op1->type;
458       } else if (op1->type->is_scalar()) {
459          this->type = op0->type;
460       } else {
461          if (this->operation == ir_binop_mul) {
462             this->type = glsl_type::get_mul_type(op0->type, op1->type);
463          } else {
464             assert(op0->type == op1->type);
465             this->type = op0->type;
466          }
467       }
468       break;
469
470    case ir_binop_logic_and:
471    case ir_binop_logic_xor:
472    case ir_binop_logic_or:
473    case ir_binop_bit_and:
474    case ir_binop_bit_xor:
475    case ir_binop_bit_or:
476        assert(!op0->type->is_matrix());
477        assert(!op1->type->is_matrix());
478       if (op0->type->is_scalar()) {
479          this->type = op1->type;
480       } else if (op1->type->is_scalar()) {
481          this->type = op0->type;
482       } else {
483           assert(op0->type->vector_elements == op1->type->vector_elements);
484           this->type = op0->type;
485       }
486       break;
487
488    case ir_binop_equal:
489    case ir_binop_nequal:
490    case ir_binop_lequal:
491    case ir_binop_gequal:
492    case ir_binop_less:
493    case ir_binop_greater:
494       assert(op0->type == op1->type);
495       this->type = glsl_type::get_instance(GLSL_TYPE_BOOL,
496                                            op0->type->vector_elements, 1);
497       break;
498
499    case ir_binop_dot:
500       this->type = op0->type->get_base_type();
501       break;
502
503    case ir_binop_imul_high:
504    case ir_binop_carry:
505    case ir_binop_borrow:
506    case ir_binop_lshift:
507    case ir_binop_rshift:
508    case ir_binop_ldexp:
509    case ir_binop_interpolate_at_offset:
510    case ir_binop_interpolate_at_sample:
511       this->type = op0->type;
512       break;
513
514    case ir_binop_vector_extract:
515       this->type = op0->type->get_scalar_type();
516       break;
517
518    default:
519       assert(!"not reached: missing automatic type setup for ir_expression");
520       this->type = glsl_type::float_type;
521    }
522 }
523
524 ir_expression::ir_expression(int op, ir_rvalue *op0, ir_rvalue *op1,
525                              ir_rvalue *op2)
526    : ir_rvalue(ir_type_expression)
527 {
528    this->operation = ir_expression_operation(op);
529    this->operands[0] = op0;
530    this->operands[1] = op1;
531    this->operands[2] = op2;
532    this->operands[3] = NULL;
533
534    assert(op > ir_last_binop && op <= ir_last_triop);
535    init_num_operands();
536    assert(num_operands == 3);
537    for (unsigned i = 0; i < num_operands; i++) {
538       assert(this->operands[i] != NULL);
539    }
540
541    switch (this->operation) {
542    case ir_triop_fma:
543    case ir_triop_lrp:
544    case ir_triop_bitfield_extract:
545    case ir_triop_vector_insert:
546       this->type = op0->type;
547       break;
548
549    case ir_triop_csel:
550       this->type = op1->type;
551       break;
552
553    default:
554       assert(!"not reached: missing automatic type setup for ir_expression");
555       this->type = glsl_type::float_type;
556    }
557 }
558
559 unsigned int
560 ir_expression::get_num_operands(ir_expression_operation op)
561 {
562    assert(op <= ir_last_opcode);
563
564    if (op <= ir_last_unop)
565       return 1;
566
567    if (op <= ir_last_binop)
568       return 2;
569
570    if (op <= ir_last_triop)
571       return 3;
572
573    if (op <= ir_last_quadop)
574       return 4;
575
576    assert(false);
577    return 0;
578 }
579
580 #include "ir_expression_operation_strings.h"
581
582 const char*
583 depth_layout_string(ir_depth_layout layout)
584 {
585    switch(layout) {
586    case ir_depth_layout_none:      return "";
587    case ir_depth_layout_any:       return "depth_any";
588    case ir_depth_layout_greater:   return "depth_greater";
589    case ir_depth_layout_less:      return "depth_less";
590    case ir_depth_layout_unchanged: return "depth_unchanged";
591
592    default:
593       assert(0);
594       return "";
595    }
596 }
597
598 ir_expression_operation
599 ir_expression::get_operator(const char *str)
600 {
601    for (int op = 0; op <= int(ir_last_opcode); op++) {
602       if (strcmp(str, ir_expression_operation_strings[op]) == 0)
603          return (ir_expression_operation) op;
604    }
605    return (ir_expression_operation) -1;
606 }
607
608 ir_variable *
609 ir_expression::variable_referenced() const
610 {
611    switch (operation) {
612       case ir_binop_vector_extract:
613       case ir_triop_vector_insert:
614          /* We get these for things like a[0] where a is a vector type. In these
615           * cases we want variable_referenced() to return the actual vector
616           * variable this is wrapping.
617           */
618          return operands[0]->variable_referenced();
619       default:
620          return ir_rvalue::variable_referenced();
621    }
622 }
623
624 ir_constant::ir_constant()
625    : ir_rvalue(ir_type_constant)
626 {
627    this->array_elements = NULL;
628 }
629
630 ir_constant::ir_constant(const struct glsl_type *type,
631                          const ir_constant_data *data)
632    : ir_rvalue(ir_type_constant)
633 {
634    this->array_elements = NULL;
635
636    assert((type->base_type >= GLSL_TYPE_UINT)
637           && (type->base_type <= GLSL_TYPE_IMAGE));
638
639    this->type = type;
640    memcpy(& this->value, data, sizeof(this->value));
641 }
642
643 ir_constant::ir_constant(float f, unsigned vector_elements)
644    : ir_rvalue(ir_type_constant)
645 {
646    assert(vector_elements <= 4);
647    this->type = glsl_type::get_instance(GLSL_TYPE_FLOAT, vector_elements, 1);
648    for (unsigned i = 0; i < vector_elements; i++) {
649       this->value.f[i] = f;
650    }
651    for (unsigned i = vector_elements; i < 16; i++)  {
652       this->value.f[i] = 0;
653    }
654 }
655
656 ir_constant::ir_constant(double d, unsigned vector_elements)
657    : ir_rvalue(ir_type_constant)
658 {
659    assert(vector_elements <= 4);
660    this->type = glsl_type::get_instance(GLSL_TYPE_DOUBLE, vector_elements, 1);
661    for (unsigned i = 0; i < vector_elements; i++) {
662       this->value.d[i] = d;
663    }
664    for (unsigned i = vector_elements; i < 16; i++)  {
665       this->value.d[i] = 0.0;
666    }
667 }
668
669 ir_constant::ir_constant(unsigned int u, unsigned vector_elements)
670    : ir_rvalue(ir_type_constant)
671 {
672    assert(vector_elements <= 4);
673    this->type = glsl_type::get_instance(GLSL_TYPE_UINT, vector_elements, 1);
674    for (unsigned i = 0; i < vector_elements; i++) {
675       this->value.u[i] = u;
676    }
677    for (unsigned i = vector_elements; i < 16; i++) {
678       this->value.u[i] = 0;
679    }
680 }
681
682 ir_constant::ir_constant(int integer, unsigned vector_elements)
683    : ir_rvalue(ir_type_constant)
684 {
685    assert(vector_elements <= 4);
686    this->type = glsl_type::get_instance(GLSL_TYPE_INT, vector_elements, 1);
687    for (unsigned i = 0; i < vector_elements; i++) {
688       this->value.i[i] = integer;
689    }
690    for (unsigned i = vector_elements; i < 16; i++) {
691       this->value.i[i] = 0;
692    }
693 }
694
695 ir_constant::ir_constant(uint64_t u64, unsigned vector_elements)
696    : ir_rvalue(ir_type_constant)
697 {
698    assert(vector_elements <= 4);
699    this->type = glsl_type::get_instance(GLSL_TYPE_UINT64, vector_elements, 1);
700    for (unsigned i = 0; i < vector_elements; i++) {
701       this->value.u64[i] = u64;
702    }
703    for (unsigned i = vector_elements; i < 16; i++) {
704       this->value.u64[i] = 0;
705    }
706 }
707
708 ir_constant::ir_constant(int64_t int64, unsigned vector_elements)
709    : ir_rvalue(ir_type_constant)
710 {
711    assert(vector_elements <= 4);
712    this->type = glsl_type::get_instance(GLSL_TYPE_INT64, vector_elements, 1);
713    for (unsigned i = 0; i < vector_elements; i++) {
714       this->value.i64[i] = int64;
715    }
716    for (unsigned i = vector_elements; i < 16; i++) {
717       this->value.i64[i] = 0;
718    }
719 }
720
721 ir_constant::ir_constant(bool b, unsigned vector_elements)
722    : ir_rvalue(ir_type_constant)
723 {
724    assert(vector_elements <= 4);
725    this->type = glsl_type::get_instance(GLSL_TYPE_BOOL, vector_elements, 1);
726    for (unsigned i = 0; i < vector_elements; i++) {
727       this->value.b[i] = b;
728    }
729    for (unsigned i = vector_elements; i < 16; i++) {
730       this->value.b[i] = false;
731    }
732 }
733
734 ir_constant::ir_constant(const ir_constant *c, unsigned i)
735    : ir_rvalue(ir_type_constant)
736 {
737    this->array_elements = NULL;
738    this->type = c->type->get_base_type();
739
740    switch (this->type->base_type) {
741    case GLSL_TYPE_UINT:  this->value.u[0] = c->value.u[i]; break;
742    case GLSL_TYPE_INT:   this->value.i[0] = c->value.i[i]; break;
743    case GLSL_TYPE_FLOAT: this->value.f[0] = c->value.f[i]; break;
744    case GLSL_TYPE_BOOL:  this->value.b[0] = c->value.b[i]; break;
745    case GLSL_TYPE_DOUBLE: this->value.d[0] = c->value.d[i]; break;
746    default:              assert(!"Should not get here."); break;
747    }
748 }
749
750 ir_constant::ir_constant(const struct glsl_type *type, exec_list *value_list)
751    : ir_rvalue(ir_type_constant)
752 {
753    this->array_elements = NULL;
754    this->type = type;
755
756    assert(type->is_scalar() || type->is_vector() || type->is_matrix()
757           || type->is_record() || type->is_array());
758
759    if (type->is_array()) {
760       this->array_elements = ralloc_array(this, ir_constant *, type->length);
761       unsigned i = 0;
762       foreach_in_list(ir_constant, value, value_list) {
763          assert(value->as_constant() != NULL);
764
765          this->array_elements[i++] = value;
766       }
767       return;
768    }
769
770    /* If the constant is a record, the types of each of the entries in
771     * value_list must be a 1-for-1 match with the structure components.  Each
772     * entry must also be a constant.  Just move the nodes from the value_list
773     * to the list in the ir_constant.
774     */
775    /* FINISHME: Should there be some type checking and / or assertions here? */
776    /* FINISHME: Should the new constant take ownership of the nodes from
777     * FINISHME: value_list, or should it make copies?
778     */
779    if (type->is_record()) {
780       value_list->move_nodes_to(& this->components);
781       return;
782    }
783
784    for (unsigned i = 0; i < 16; i++) {
785       this->value.u[i] = 0;
786    }
787
788    ir_constant *value = (ir_constant *) (value_list->get_head_raw());
789
790    /* Constructors with exactly one scalar argument are special for vectors
791     * and matrices.  For vectors, the scalar value is replicated to fill all
792     * the components.  For matrices, the scalar fills the components of the
793     * diagonal while the rest is filled with 0.
794     */
795    if (value->type->is_scalar() && value->next->is_tail_sentinel()) {
796       if (type->is_matrix()) {
797          /* Matrix - fill diagonal (rest is already set to 0) */
798          assert(type->is_float() || type->is_double());
799          for (unsigned i = 0; i < type->matrix_columns; i++) {
800             if (type->is_float())
801                this->value.f[i * type->vector_elements + i] =
802                   value->value.f[0];
803             else
804                this->value.d[i * type->vector_elements + i] =
805                   value->value.d[0];
806          }
807       } else {
808          /* Vector or scalar - fill all components */
809          switch (type->base_type) {
810          case GLSL_TYPE_UINT:
811          case GLSL_TYPE_INT:
812             for (unsigned i = 0; i < type->components(); i++)
813                this->value.u[i] = value->value.u[0];
814             break;
815          case GLSL_TYPE_FLOAT:
816             for (unsigned i = 0; i < type->components(); i++)
817                this->value.f[i] = value->value.f[0];
818             break;
819          case GLSL_TYPE_DOUBLE:
820             for (unsigned i = 0; i < type->components(); i++)
821                this->value.d[i] = value->value.d[0];
822             break;
823          case GLSL_TYPE_UINT64:
824          case GLSL_TYPE_INT64:
825             for (unsigned i = 0; i < type->components(); i++)
826                this->value.u64[i] = value->value.u64[0];
827             break;
828          case GLSL_TYPE_BOOL:
829             for (unsigned i = 0; i < type->components(); i++)
830                this->value.b[i] = value->value.b[0];
831             break;
832          default:
833             assert(!"Should not get here.");
834             break;
835          }
836       }
837       return;
838    }
839
840    if (type->is_matrix() && value->type->is_matrix()) {
841       assert(value->next->is_tail_sentinel());
842
843       /* From section 5.4.2 of the GLSL 1.20 spec:
844        * "If a matrix is constructed from a matrix, then each component
845        *  (column i, row j) in the result that has a corresponding component
846        *  (column i, row j) in the argument will be initialized from there."
847        */
848       unsigned cols = MIN2(type->matrix_columns, value->type->matrix_columns);
849       unsigned rows = MIN2(type->vector_elements, value->type->vector_elements);
850       for (unsigned i = 0; i < cols; i++) {
851          for (unsigned j = 0; j < rows; j++) {
852             const unsigned src = i * value->type->vector_elements + j;
853             const unsigned dst = i * type->vector_elements + j;
854             this->value.f[dst] = value->value.f[src];
855          }
856       }
857
858       /* "All other components will be initialized to the identity matrix." */
859       for (unsigned i = cols; i < type->matrix_columns; i++)
860          this->value.f[i * type->vector_elements + i] = 1.0;
861
862       return;
863    }
864
865    /* Use each component from each entry in the value_list to initialize one
866     * component of the constant being constructed.
867     */
868    unsigned i = 0;
869    for (;;) {
870       assert(value->as_constant() != NULL);
871       assert(!value->is_tail_sentinel());
872
873       for (unsigned j = 0; j < value->type->components(); j++) {
874          switch (type->base_type) {
875          case GLSL_TYPE_UINT:
876             this->value.u[i] = value->get_uint_component(j);
877             break;
878          case GLSL_TYPE_INT:
879             this->value.i[i] = value->get_int_component(j);
880             break;
881          case GLSL_TYPE_FLOAT:
882             this->value.f[i] = value->get_float_component(j);
883             break;
884          case GLSL_TYPE_BOOL:
885             this->value.b[i] = value->get_bool_component(j);
886             break;
887          case GLSL_TYPE_DOUBLE:
888             this->value.d[i] = value->get_double_component(j);
889             break;
890          case GLSL_TYPE_UINT64:
891             this->value.u64[i] = value->get_uint64_component(j);
892             break;
893          case GLSL_TYPE_INT64:
894             this->value.i64[i] = value->get_int64_component(j);
895             break;
896          default:
897             /* FINISHME: What to do?  Exceptions are not the answer.
898              */
899             break;
900          }
901
902          i++;
903          if (i >= type->components())
904             break;
905       }
906
907       if (i >= type->components())
908          break; /* avoid downcasting a list sentinel */
909       value = (ir_constant *) value->next;
910    }
911 }
912
913 ir_constant *
914 ir_constant::zero(void *mem_ctx, const glsl_type *type)
915 {
916    assert(type->is_scalar() || type->is_vector() || type->is_matrix()
917           || type->is_record() || type->is_array());
918
919    ir_constant *c = new(mem_ctx) ir_constant;
920    c->type = type;
921    memset(&c->value, 0, sizeof(c->value));
922
923    if (type->is_array()) {
924       c->array_elements = ralloc_array(c, ir_constant *, type->length);
925
926       for (unsigned i = 0; i < type->length; i++)
927          c->array_elements[i] = ir_constant::zero(c, type->fields.array);
928    }
929
930    if (type->is_record()) {
931       for (unsigned i = 0; i < type->length; i++) {
932          ir_constant *comp = ir_constant::zero(mem_ctx, type->fields.structure[i].type);
933          c->components.push_tail(comp);
934       }
935    }
936
937    return c;
938 }
939
940 bool
941 ir_constant::get_bool_component(unsigned i) const
942 {
943    switch (this->type->base_type) {
944    case GLSL_TYPE_UINT:  return this->value.u[i] != 0;
945    case GLSL_TYPE_INT:   return this->value.i[i] != 0;
946    case GLSL_TYPE_FLOAT: return ((int)this->value.f[i]) != 0;
947    case GLSL_TYPE_BOOL:  return this->value.b[i];
948    case GLSL_TYPE_DOUBLE: return this->value.d[i] != 0.0;
949    case GLSL_TYPE_UINT64: return this->value.u64[i] != 0;
950    case GLSL_TYPE_INT64:  return this->value.i64[i] != 0;
951    default:              assert(!"Should not get here."); break;
952    }
953
954    /* Must return something to make the compiler happy.  This is clearly an
955     * error case.
956     */
957    return false;
958 }
959
960 float
961 ir_constant::get_float_component(unsigned i) const
962 {
963    switch (this->type->base_type) {
964    case GLSL_TYPE_UINT:  return (float) this->value.u[i];
965    case GLSL_TYPE_INT:   return (float) this->value.i[i];
966    case GLSL_TYPE_FLOAT: return this->value.f[i];
967    case GLSL_TYPE_BOOL:  return this->value.b[i] ? 1.0f : 0.0f;
968    case GLSL_TYPE_DOUBLE: return (float) this->value.d[i];
969    case GLSL_TYPE_UINT64: return (float) this->value.u64[i];
970    case GLSL_TYPE_INT64:  return (float) this->value.i64[i];
971    default:              assert(!"Should not get here."); break;
972    }
973
974    /* Must return something to make the compiler happy.  This is clearly an
975     * error case.
976     */
977    return 0.0;
978 }
979
980 double
981 ir_constant::get_double_component(unsigned i) const
982 {
983    switch (this->type->base_type) {
984    case GLSL_TYPE_UINT:  return (double) this->value.u[i];
985    case GLSL_TYPE_INT:   return (double) this->value.i[i];
986    case GLSL_TYPE_FLOAT: return (double) this->value.f[i];
987    case GLSL_TYPE_BOOL:  return this->value.b[i] ? 1.0 : 0.0;
988    case GLSL_TYPE_DOUBLE: return this->value.d[i];
989    case GLSL_TYPE_UINT64: return (double) this->value.u64[i];
990    case GLSL_TYPE_INT64:  return (double) this->value.i64[i];
991    default:              assert(!"Should not get here."); break;
992    }
993
994    /* Must return something to make the compiler happy.  This is clearly an
995     * error case.
996     */
997    return 0.0;
998 }
999
1000 int
1001 ir_constant::get_int_component(unsigned i) const
1002 {
1003    switch (this->type->base_type) {
1004    case GLSL_TYPE_UINT:  return this->value.u[i];
1005    case GLSL_TYPE_INT:   return this->value.i[i];
1006    case GLSL_TYPE_FLOAT: return (int) this->value.f[i];
1007    case GLSL_TYPE_BOOL:  return this->value.b[i] ? 1 : 0;
1008    case GLSL_TYPE_DOUBLE: return (int) this->value.d[i];
1009    case GLSL_TYPE_UINT64: return (int) this->value.u64[i];
1010    case GLSL_TYPE_INT64:  return (int) this->value.i64[i];
1011    default:              assert(!"Should not get here."); break;
1012    }
1013
1014    /* Must return something to make the compiler happy.  This is clearly an
1015     * error case.
1016     */
1017    return 0;
1018 }
1019
1020 unsigned
1021 ir_constant::get_uint_component(unsigned i) const
1022 {
1023    switch (this->type->base_type) {
1024    case GLSL_TYPE_UINT:  return this->value.u[i];
1025    case GLSL_TYPE_INT:   return this->value.i[i];
1026    case GLSL_TYPE_FLOAT: return (unsigned) this->value.f[i];
1027    case GLSL_TYPE_BOOL:  return this->value.b[i] ? 1 : 0;
1028    case GLSL_TYPE_DOUBLE: return (unsigned) this->value.d[i];
1029    case GLSL_TYPE_UINT64: return (unsigned) this->value.u64[i];
1030    case GLSL_TYPE_INT64:  return (unsigned) this->value.i64[i];
1031    default:              assert(!"Should not get here."); break;
1032    }
1033
1034    /* Must return something to make the compiler happy.  This is clearly an
1035     * error case.
1036     */
1037    return 0;
1038 }
1039
1040 int64_t
1041 ir_constant::get_int64_component(unsigned i) const
1042 {
1043    switch (this->type->base_type) {
1044    case GLSL_TYPE_UINT:  return this->value.u[i];
1045    case GLSL_TYPE_INT:   return this->value.i[i];
1046    case GLSL_TYPE_FLOAT: return (int64_t) this->value.f[i];
1047    case GLSL_TYPE_BOOL:  return this->value.b[i] ? 1 : 0;
1048    case GLSL_TYPE_DOUBLE: return (int64_t) this->value.d[i];
1049    case GLSL_TYPE_UINT64: return (int64_t) this->value.u64[i];
1050    case GLSL_TYPE_INT64:  return this->value.i64[i];
1051    default:              assert(!"Should not get here."); break;
1052    }
1053
1054    /* Must return something to make the compiler happy.  This is clearly an
1055     * error case.
1056     */
1057    return 0;
1058 }
1059
1060 uint64_t
1061 ir_constant::get_uint64_component(unsigned i) const
1062 {
1063    switch (this->type->base_type) {
1064    case GLSL_TYPE_UINT:  return this->value.u[i];
1065    case GLSL_TYPE_INT:   return this->value.i[i];
1066    case GLSL_TYPE_FLOAT: return (uint64_t) this->value.f[i];
1067    case GLSL_TYPE_BOOL:  return this->value.b[i] ? 1 : 0;
1068    case GLSL_TYPE_DOUBLE: return (uint64_t) this->value.d[i];
1069    case GLSL_TYPE_UINT64: return this->value.u64[i];
1070    case GLSL_TYPE_INT64:  return (uint64_t) this->value.i64[i];
1071    default:              assert(!"Should not get here."); break;
1072    }
1073
1074    /* Must return something to make the compiler happy.  This is clearly an
1075     * error case.
1076     */
1077    return 0;
1078 }
1079
1080 ir_constant *
1081 ir_constant::get_array_element(unsigned i) const
1082 {
1083    assert(this->type->is_array());
1084
1085    /* From page 35 (page 41 of the PDF) of the GLSL 1.20 spec:
1086     *
1087     *     "Behavior is undefined if a shader subscripts an array with an index
1088     *     less than 0 or greater than or equal to the size the array was
1089     *     declared with."
1090     *
1091     * Most out-of-bounds accesses are removed before things could get this far.
1092     * There are cases where non-constant array index values can get constant
1093     * folded.
1094     */
1095    if (int(i) < 0)
1096       i = 0;
1097    else if (i >= this->type->length)
1098       i = this->type->length - 1;
1099
1100    return array_elements[i];
1101 }
1102
1103 ir_constant *
1104 ir_constant::get_record_field(const char *name)
1105 {
1106    int idx = this->type->field_index(name);
1107
1108    if (idx < 0)
1109       return NULL;
1110
1111    if (this->components.is_empty())
1112       return NULL;
1113
1114    exec_node *node = this->components.get_head_raw();
1115    for (int i = 0; i < idx; i++) {
1116       node = node->next;
1117
1118       /* If the end of the list is encountered before the element matching the
1119        * requested field is found, return NULL.
1120        */
1121       if (node->is_tail_sentinel())
1122          return NULL;
1123    }
1124
1125    return (ir_constant *) node;
1126 }
1127
1128 void
1129 ir_constant::copy_offset(ir_constant *src, int offset)
1130 {
1131    switch (this->type->base_type) {
1132    case GLSL_TYPE_UINT:
1133    case GLSL_TYPE_INT:
1134    case GLSL_TYPE_FLOAT:
1135    case GLSL_TYPE_DOUBLE:
1136    case GLSL_TYPE_UINT64:
1137    case GLSL_TYPE_INT64:
1138    case GLSL_TYPE_BOOL: {
1139       unsigned int size = src->type->components();
1140       assert (size <= this->type->components() - offset);
1141       for (unsigned int i=0; i<size; i++) {
1142          switch (this->type->base_type) {
1143          case GLSL_TYPE_UINT:
1144             value.u[i+offset] = src->get_uint_component(i);
1145             break;
1146          case GLSL_TYPE_INT:
1147             value.i[i+offset] = src->get_int_component(i);
1148             break;
1149          case GLSL_TYPE_FLOAT:
1150             value.f[i+offset] = src->get_float_component(i);
1151             break;
1152          case GLSL_TYPE_BOOL:
1153             value.b[i+offset] = src->get_bool_component(i);
1154             break;
1155          case GLSL_TYPE_DOUBLE:
1156             value.d[i+offset] = src->get_double_component(i);
1157             break;
1158          case GLSL_TYPE_UINT64:
1159             value.u64[i+offset] = src->get_uint64_component(i);
1160             break;
1161          case GLSL_TYPE_INT64:
1162             value.i64[i+offset] = src->get_int64_component(i);
1163             break;
1164          default: // Shut up the compiler
1165             break;
1166          }
1167       }
1168       break;
1169    }
1170
1171    case GLSL_TYPE_STRUCT: {
1172       assert (src->type == this->type);
1173       this->components.make_empty();
1174       foreach_in_list(ir_constant, orig, &src->components) {
1175          this->components.push_tail(orig->clone(this, NULL));
1176       }
1177       break;
1178    }
1179
1180    case GLSL_TYPE_ARRAY: {
1181       assert (src->type == this->type);
1182       for (unsigned i = 0; i < this->type->length; i++) {
1183          this->array_elements[i] = src->array_elements[i]->clone(this, NULL);
1184       }
1185       break;
1186    }
1187
1188    default:
1189       assert(!"Should not get here.");
1190       break;
1191    }
1192 }
1193
1194 void
1195 ir_constant::copy_masked_offset(ir_constant *src, int offset, unsigned int mask)
1196 {
1197    assert (!type->is_array() && !type->is_record());
1198
1199    if (!type->is_vector() && !type->is_matrix()) {
1200       offset = 0;
1201       mask = 1;
1202    }
1203
1204    int id = 0;
1205    for (int i=0; i<4; i++) {
1206       if (mask & (1 << i)) {
1207          switch (this->type->base_type) {
1208          case GLSL_TYPE_UINT:
1209             value.u[i+offset] = src->get_uint_component(id++);
1210             break;
1211          case GLSL_TYPE_INT:
1212             value.i[i+offset] = src->get_int_component(id++);
1213             break;
1214          case GLSL_TYPE_FLOAT:
1215             value.f[i+offset] = src->get_float_component(id++);
1216             break;
1217          case GLSL_TYPE_BOOL:
1218             value.b[i+offset] = src->get_bool_component(id++);
1219             break;
1220          case GLSL_TYPE_DOUBLE:
1221             value.d[i+offset] = src->get_double_component(id++);
1222             break;
1223          case GLSL_TYPE_UINT64:
1224             value.u64[i+offset] = src->get_uint64_component(id++);
1225             break;
1226          case GLSL_TYPE_INT64:
1227             value.i64[i+offset] = src->get_int64_component(id++);
1228             break;
1229          default:
1230             assert(!"Should not get here.");
1231             return;
1232          }
1233       }
1234    }
1235 }
1236
1237 bool
1238 ir_constant::has_value(const ir_constant *c) const
1239 {
1240    if (this->type != c->type)
1241       return false;
1242
1243    if (this->type->is_array()) {
1244       for (unsigned i = 0; i < this->type->length; i++) {
1245          if (!this->array_elements[i]->has_value(c->array_elements[i]))
1246             return false;
1247       }
1248       return true;
1249    }
1250
1251    if (this->type->is_record()) {
1252       const exec_node *a_node = this->components.get_head_raw();
1253       const exec_node *b_node = c->components.get_head_raw();
1254
1255       while (!a_node->is_tail_sentinel()) {
1256          assert(!b_node->is_tail_sentinel());
1257
1258          const ir_constant *const a_field = (ir_constant *) a_node;
1259          const ir_constant *const b_field = (ir_constant *) b_node;
1260
1261          if (!a_field->has_value(b_field))
1262             return false;
1263
1264          a_node = a_node->next;
1265          b_node = b_node->next;
1266       }
1267
1268       return true;
1269    }
1270
1271    for (unsigned i = 0; i < this->type->components(); i++) {
1272       switch (this->type->base_type) {
1273       case GLSL_TYPE_UINT:
1274          if (this->value.u[i] != c->value.u[i])
1275             return false;
1276          break;
1277       case GLSL_TYPE_INT:
1278          if (this->value.i[i] != c->value.i[i])
1279             return false;
1280          break;
1281       case GLSL_TYPE_FLOAT:
1282          if (this->value.f[i] != c->value.f[i])
1283             return false;
1284          break;
1285       case GLSL_TYPE_BOOL:
1286          if (this->value.b[i] != c->value.b[i])
1287             return false;
1288          break;
1289       case GLSL_TYPE_DOUBLE:
1290          if (this->value.d[i] != c->value.d[i])
1291             return false;
1292          break;
1293       case GLSL_TYPE_UINT64:
1294          if (this->value.u64[i] != c->value.u64[i])
1295             return false;
1296          break;
1297       case GLSL_TYPE_INT64:
1298          if (this->value.i64[i] != c->value.i64[i])
1299             return false;
1300          break;
1301       default:
1302          assert(!"Should not get here.");
1303          return false;
1304       }
1305    }
1306
1307    return true;
1308 }
1309
1310 bool
1311 ir_constant::is_value(float f, int i) const
1312 {
1313    if (!this->type->is_scalar() && !this->type->is_vector())
1314       return false;
1315
1316    /* Only accept boolean values for 0/1. */
1317    if (int(bool(i)) != i && this->type->is_boolean())
1318       return false;
1319
1320    for (unsigned c = 0; c < this->type->vector_elements; c++) {
1321       switch (this->type->base_type) {
1322       case GLSL_TYPE_FLOAT:
1323          if (this->value.f[c] != f)
1324             return false;
1325          break;
1326       case GLSL_TYPE_INT:
1327          if (this->value.i[c] != i)
1328             return false;
1329          break;
1330       case GLSL_TYPE_UINT:
1331          if (this->value.u[c] != unsigned(i))
1332             return false;
1333          break;
1334       case GLSL_TYPE_BOOL:
1335          if (this->value.b[c] != bool(i))
1336             return false;
1337          break;
1338       case GLSL_TYPE_DOUBLE:
1339          if (this->value.d[c] != double(f))
1340             return false;
1341          break;
1342       case GLSL_TYPE_UINT64:
1343          if (this->value.u64[c] != uint64_t(i))
1344             return false;
1345          break;
1346       case GLSL_TYPE_INT64:
1347          if (this->value.i64[c] != i)
1348             return false;
1349          break;
1350       default:
1351          /* The only other base types are structures, arrays, and samplers.
1352           * Samplers cannot be constants, and the others should have been
1353           * filtered out above.
1354           */
1355          assert(!"Should not get here.");
1356          return false;
1357       }
1358    }
1359
1360    return true;
1361 }
1362
1363 bool
1364 ir_constant::is_zero() const
1365 {
1366    return is_value(0.0, 0);
1367 }
1368
1369 bool
1370 ir_constant::is_one() const
1371 {
1372    return is_value(1.0, 1);
1373 }
1374
1375 bool
1376 ir_constant::is_negative_one() const
1377 {
1378    return is_value(-1.0, -1);
1379 }
1380
1381 bool
1382 ir_constant::is_uint16_constant() const
1383 {
1384    if (!type->is_integer())
1385       return false;
1386
1387    return value.u[0] < (1 << 16);
1388 }
1389
1390 ir_loop::ir_loop()
1391    : ir_instruction(ir_type_loop)
1392 {
1393 }
1394
1395
1396 ir_dereference_variable::ir_dereference_variable(ir_variable *var)
1397    : ir_dereference(ir_type_dereference_variable)
1398 {
1399    assert(var != NULL);
1400
1401    this->var = var;
1402    this->type = var->type;
1403 }
1404
1405
1406 ir_dereference_array::ir_dereference_array(ir_rvalue *value,
1407                                            ir_rvalue *array_index)
1408    : ir_dereference(ir_type_dereference_array)
1409 {
1410    this->array_index = array_index;
1411    this->set_array(value);
1412 }
1413
1414
1415 ir_dereference_array::ir_dereference_array(ir_variable *var,
1416                                            ir_rvalue *array_index)
1417    : ir_dereference(ir_type_dereference_array)
1418 {
1419    void *ctx = ralloc_parent(var);
1420
1421    this->array_index = array_index;
1422    this->set_array(new(ctx) ir_dereference_variable(var));
1423 }
1424
1425
1426 void
1427 ir_dereference_array::set_array(ir_rvalue *value)
1428 {
1429    assert(value != NULL);
1430
1431    this->array = value;
1432
1433    const glsl_type *const vt = this->array->type;
1434
1435    if (vt->is_array()) {
1436       type = vt->fields.array;
1437    } else if (vt->is_matrix()) {
1438       type = vt->column_type();
1439    } else if (vt->is_vector()) {
1440       type = vt->get_base_type();
1441    }
1442 }
1443
1444
1445 ir_dereference_record::ir_dereference_record(ir_rvalue *value,
1446                                              const char *field)
1447    : ir_dereference(ir_type_dereference_record)
1448 {
1449    assert(value != NULL);
1450
1451    this->record = value;
1452    this->field = ralloc_strdup(this, field);
1453    this->type = this->record->type->field_type(field);
1454 }
1455
1456
1457 ir_dereference_record::ir_dereference_record(ir_variable *var,
1458                                              const char *field)
1459    : ir_dereference(ir_type_dereference_record)
1460 {
1461    void *ctx = ralloc_parent(var);
1462
1463    this->record = new(ctx) ir_dereference_variable(var);
1464    this->field = ralloc_strdup(this, field);
1465    this->type = this->record->type->field_type(field);
1466 }
1467
1468 bool
1469 ir_dereference::is_lvalue(const struct _mesa_glsl_parse_state *state) const
1470 {
1471    ir_variable *var = this->variable_referenced();
1472
1473    /* Every l-value derference chain eventually ends in a variable.
1474     */
1475    if ((var == NULL) || var->data.read_only)
1476       return false;
1477
1478    /* From section 4.1.7 of the ARB_bindless_texture spec:
1479     *
1480     * "Samplers can be used as l-values, so can be assigned into and used as
1481     *  "out" and "inout" function parameters."
1482     *
1483     * From section 4.1.X of the ARB_bindless_texture spec:
1484     *
1485     * "Images can be used as l-values, so can be assigned into and used as
1486     *  "out" and "inout" function parameters."
1487     */
1488    if ((!state || state->has_bindless()) &&
1489        (this->type->contains_sampler() || this->type->contains_image()))
1490       return true;
1491
1492    /* From section 4.1.7 of the GLSL 4.40 spec:
1493     *
1494     *   "Opaque variables cannot be treated as l-values; hence cannot
1495     *    be used as out or inout function parameters, nor can they be
1496     *    assigned into."
1497     */
1498    if (this->type->contains_opaque())
1499       return false;
1500
1501    return true;
1502 }
1503
1504
1505 static const char * const tex_opcode_strs[] = { "tex", "txb", "txl", "txd", "txf", "txf_ms", "txs", "lod", "tg4", "query_levels", "texture_samples", "samples_identical" };
1506
1507 const char *ir_texture::opcode_string()
1508 {
1509    assert((unsigned int) op < ARRAY_SIZE(tex_opcode_strs));
1510    return tex_opcode_strs[op];
1511 }
1512
1513 ir_texture_opcode
1514 ir_texture::get_opcode(const char *str)
1515 {
1516    const int count = sizeof(tex_opcode_strs) / sizeof(tex_opcode_strs[0]);
1517    for (int op = 0; op < count; op++) {
1518       if (strcmp(str, tex_opcode_strs[op]) == 0)
1519          return (ir_texture_opcode) op;
1520    }
1521    return (ir_texture_opcode) -1;
1522 }
1523
1524
1525 void
1526 ir_texture::set_sampler(ir_dereference *sampler, const glsl_type *type)
1527 {
1528    assert(sampler != NULL);
1529    assert(type != NULL);
1530    this->sampler = sampler;
1531    this->type = type;
1532
1533    if (this->op == ir_txs || this->op == ir_query_levels ||
1534        this->op == ir_texture_samples) {
1535       assert(type->base_type == GLSL_TYPE_INT);
1536    } else if (this->op == ir_lod) {
1537       assert(type->vector_elements == 2);
1538       assert(type->is_float());
1539    } else if (this->op == ir_samples_identical) {
1540       assert(type == glsl_type::bool_type);
1541       assert(sampler->type->is_sampler());
1542       assert(sampler->type->sampler_dimensionality == GLSL_SAMPLER_DIM_MS);
1543    } else {
1544       assert(sampler->type->sampled_type == (int) type->base_type);
1545       if (sampler->type->sampler_shadow)
1546          assert(type->vector_elements == 4 || type->vector_elements == 1);
1547       else
1548          assert(type->vector_elements == 4);
1549    }
1550 }
1551
1552
1553 void
1554 ir_swizzle::init_mask(const unsigned *comp, unsigned count)
1555 {
1556    assert((count >= 1) && (count <= 4));
1557
1558    memset(&this->mask, 0, sizeof(this->mask));
1559    this->mask.num_components = count;
1560
1561    unsigned dup_mask = 0;
1562    switch (count) {
1563    case 4:
1564       assert(comp[3] <= 3);
1565       dup_mask |= (1U << comp[3])
1566          & ((1U << comp[0]) | (1U << comp[1]) | (1U << comp[2]));
1567       this->mask.w = comp[3];
1568
1569    case 3:
1570       assert(comp[2] <= 3);
1571       dup_mask |= (1U << comp[2])
1572          & ((1U << comp[0]) | (1U << comp[1]));
1573       this->mask.z = comp[2];
1574
1575    case 2:
1576       assert(comp[1] <= 3);
1577       dup_mask |= (1U << comp[1])
1578          & ((1U << comp[0]));
1579       this->mask.y = comp[1];
1580
1581    case 1:
1582       assert(comp[0] <= 3);
1583       this->mask.x = comp[0];
1584    }
1585
1586    this->mask.has_duplicates = dup_mask != 0;
1587
1588    /* Based on the number of elements in the swizzle and the base type
1589     * (i.e., float, int, unsigned, or bool) of the vector being swizzled,
1590     * generate the type of the resulting value.
1591     */
1592    type = glsl_type::get_instance(val->type->base_type, mask.num_components, 1);
1593 }
1594
1595 ir_swizzle::ir_swizzle(ir_rvalue *val, unsigned x, unsigned y, unsigned z,
1596                        unsigned w, unsigned count)
1597    : ir_rvalue(ir_type_swizzle), val(val)
1598 {
1599    const unsigned components[4] = { x, y, z, w };
1600    this->init_mask(components, count);
1601 }
1602
1603 ir_swizzle::ir_swizzle(ir_rvalue *val, const unsigned *comp,
1604                        unsigned count)
1605    : ir_rvalue(ir_type_swizzle), val(val)
1606 {
1607    this->init_mask(comp, count);
1608 }
1609
1610 ir_swizzle::ir_swizzle(ir_rvalue *val, ir_swizzle_mask mask)
1611    : ir_rvalue(ir_type_swizzle), val(val), mask(mask)
1612 {
1613    this->type = glsl_type::get_instance(val->type->base_type,
1614                                         mask.num_components, 1);
1615 }
1616
1617 #define X 1
1618 #define R 5
1619 #define S 9
1620 #define I 13
1621
1622 ir_swizzle *
1623 ir_swizzle::create(ir_rvalue *val, const char *str, unsigned vector_length)
1624 {
1625    void *ctx = ralloc_parent(val);
1626
1627    /* For each possible swizzle character, this table encodes the value in
1628     * \c idx_map that represents the 0th element of the vector.  For invalid
1629     * swizzle characters (e.g., 'k'), a special value is used that will allow
1630     * detection of errors.
1631     */
1632    static const unsigned char base_idx[26] = {
1633    /* a  b  c  d  e  f  g  h  i  j  k  l  m */
1634       R, R, I, I, I, I, R, I, I, I, I, I, I,
1635    /* n  o  p  q  r  s  t  u  v  w  x  y  z */
1636       I, I, S, S, R, S, S, I, I, X, X, X, X
1637    };
1638
1639    /* Each valid swizzle character has an entry in the previous table.  This
1640     * table encodes the base index encoded in the previous table plus the actual
1641     * index of the swizzle character.  When processing swizzles, the first
1642     * character in the string is indexed in the previous table.  Each character
1643     * in the string is indexed in this table, and the value found there has the
1644     * value form the first table subtracted.  The result must be on the range
1645     * [0,3].
1646     *
1647     * For example, the string "wzyx" will get X from the first table.  Each of
1648     * the charcaters will get X+3, X+2, X+1, and X+0 from this table.  After
1649     * subtraction, the swizzle values are { 3, 2, 1, 0 }.
1650     *
1651     * The string "wzrg" will get X from the first table.  Each of the characters
1652     * will get X+3, X+2, R+0, and R+1 from this table.  After subtraction, the
1653     * swizzle values are { 3, 2, 4, 5 }.  Since 4 and 5 are outside the range
1654     * [0,3], the error is detected.
1655     */
1656    static const unsigned char idx_map[26] = {
1657    /* a    b    c    d    e    f    g    h    i    j    k    l    m */
1658       R+3, R+2, 0,   0,   0,   0,   R+1, 0,   0,   0,   0,   0,   0,
1659    /* n    o    p    q    r    s    t    u    v    w    x    y    z */
1660       0,   0,   S+2, S+3, R+0, S+0, S+1, 0,   0,   X+3, X+0, X+1, X+2
1661    };
1662
1663    int swiz_idx[4] = { 0, 0, 0, 0 };
1664    unsigned i;
1665
1666
1667    /* Validate the first character in the swizzle string and look up the base
1668     * index value as described above.
1669     */
1670    if ((str[0] < 'a') || (str[0] > 'z'))
1671       return NULL;
1672
1673    const unsigned base = base_idx[str[0] - 'a'];
1674
1675
1676    for (i = 0; (i < 4) && (str[i] != '\0'); i++) {
1677       /* Validate the next character, and, as described above, convert it to a
1678        * swizzle index.
1679        */
1680       if ((str[i] < 'a') || (str[i] > 'z'))
1681          return NULL;
1682
1683       swiz_idx[i] = idx_map[str[i] - 'a'] - base;
1684       if ((swiz_idx[i] < 0) || (swiz_idx[i] >= (int) vector_length))
1685          return NULL;
1686    }
1687
1688    if (str[i] != '\0')
1689          return NULL;
1690
1691    return new(ctx) ir_swizzle(val, swiz_idx[0], swiz_idx[1], swiz_idx[2],
1692                               swiz_idx[3], i);
1693 }
1694
1695 #undef X
1696 #undef R
1697 #undef S
1698 #undef I
1699
1700 ir_variable *
1701 ir_swizzle::variable_referenced() const
1702 {
1703    return this->val->variable_referenced();
1704 }
1705
1706
1707 bool ir_variable::temporaries_allocate_names = false;
1708
1709 const char ir_variable::tmp_name[] = "compiler_temp";
1710
1711 ir_variable::ir_variable(const struct glsl_type *type, const char *name,
1712                          ir_variable_mode mode)
1713    : ir_instruction(ir_type_variable)
1714 {
1715    this->type = type;
1716
1717    if (mode == ir_var_temporary && !ir_variable::temporaries_allocate_names)
1718       name = NULL;
1719
1720    /* The ir_variable clone method may call this constructor with name set to
1721     * tmp_name.
1722     */
1723    assert(name != NULL
1724           || mode == ir_var_temporary
1725           || mode == ir_var_function_in
1726           || mode == ir_var_function_out
1727           || mode == ir_var_function_inout);
1728    assert(name != ir_variable::tmp_name
1729           || mode == ir_var_temporary);
1730    if (mode == ir_var_temporary
1731        && (name == NULL || name == ir_variable::tmp_name)) {
1732       this->name = ir_variable::tmp_name;
1733    } else if (name == NULL ||
1734               strlen(name) < ARRAY_SIZE(this->name_storage)) {
1735       strcpy(this->name_storage, name ? name : "");
1736       this->name = this->name_storage;
1737    } else {
1738       this->name = ralloc_strdup(this, name);
1739    }
1740
1741    this->u.max_ifc_array_access = NULL;
1742
1743    this->data.explicit_location = false;
1744    this->data.has_initializer = false;
1745    this->data.location = -1;
1746    this->data.location_frac = 0;
1747    this->data.binding = 0;
1748    this->data.warn_extension_index = 0;
1749    this->constant_value = NULL;
1750    this->constant_initializer = NULL;
1751    this->data.origin_upper_left = false;
1752    this->data.pixel_center_integer = false;
1753    this->data.depth_layout = ir_depth_layout_none;
1754    this->data.used = false;
1755    this->data.always_active_io = false;
1756    this->data.read_only = false;
1757    this->data.centroid = false;
1758    this->data.sample = false;
1759    this->data.patch = false;
1760    this->data.invariant = false;
1761    this->data.how_declared = ir_var_declared_normally;
1762    this->data.mode = mode;
1763    this->data.interpolation = INTERP_MODE_NONE;
1764    this->data.max_array_access = -1;
1765    this->data.offset = 0;
1766    this->data.precision = GLSL_PRECISION_NONE;
1767    this->data.memory_read_only = false;
1768    this->data.memory_write_only = false;
1769    this->data.memory_coherent = false;
1770    this->data.memory_volatile = false;
1771    this->data.memory_restrict = false;
1772    this->data.from_ssbo_unsized_array = false;
1773    this->data.fb_fetch_output = false;
1774    this->data.bindless = false;
1775    this->data.bound = false;
1776
1777    if (type != NULL) {
1778       if (type->is_interface())
1779          this->init_interface_type(type);
1780       else if (type->without_array()->is_interface())
1781          this->init_interface_type(type->without_array());
1782    }
1783 }
1784
1785
1786 const char *
1787 interpolation_string(unsigned interpolation)
1788 {
1789    switch (interpolation) {
1790    case INTERP_MODE_NONE:          return "no";
1791    case INTERP_MODE_SMOOTH:        return "smooth";
1792    case INTERP_MODE_FLAT:          return "flat";
1793    case INTERP_MODE_NOPERSPECTIVE: return "noperspective";
1794    }
1795
1796    assert(!"Should not get here.");
1797    return "";
1798 }
1799
1800 const char *const ir_variable::warn_extension_table[] = {
1801    "",
1802    "GL_ARB_shader_stencil_export",
1803    "GL_AMD_shader_stencil_export",
1804 };
1805
1806 void
1807 ir_variable::enable_extension_warning(const char *extension)
1808 {
1809    for (unsigned i = 0; i < ARRAY_SIZE(warn_extension_table); i++) {
1810       if (strcmp(warn_extension_table[i], extension) == 0) {
1811          this->data.warn_extension_index = i;
1812          return;
1813       }
1814    }
1815
1816    assert(!"Should not get here.");
1817    this->data.warn_extension_index = 0;
1818 }
1819
1820 const char *
1821 ir_variable::get_extension_warning() const
1822 {
1823    return this->data.warn_extension_index == 0
1824       ? NULL : warn_extension_table[this->data.warn_extension_index];
1825 }
1826
1827 ir_function_signature::ir_function_signature(const glsl_type *return_type,
1828                                              builtin_available_predicate b)
1829    : ir_instruction(ir_type_function_signature),
1830      return_type(return_type), is_defined(false),
1831      intrinsic_id(ir_intrinsic_invalid), builtin_avail(b), _function(NULL)
1832 {
1833    this->origin = NULL;
1834 }
1835
1836
1837 bool
1838 ir_function_signature::is_builtin() const
1839 {
1840    return builtin_avail != NULL;
1841 }
1842
1843
1844 bool
1845 ir_function_signature::is_builtin_available(const _mesa_glsl_parse_state *state) const
1846 {
1847    /* We can't call the predicate without a state pointer, so just say that
1848     * the signature is available.  At compile time, we need the filtering,
1849     * but also receive a valid state pointer.  At link time, we're resolving
1850     * imported built-in prototypes to their definitions, which will always
1851     * be an exact match.  So we can skip the filtering.
1852     */
1853    if (state == NULL)
1854       return true;
1855
1856    assert(builtin_avail != NULL);
1857    return builtin_avail(state);
1858 }
1859
1860
1861 static bool
1862 modes_match(unsigned a, unsigned b)
1863 {
1864    if (a == b)
1865       return true;
1866
1867    /* Accept "in" vs. "const in" */
1868    if ((a == ir_var_const_in && b == ir_var_function_in) ||
1869        (b == ir_var_const_in && a == ir_var_function_in))
1870       return true;
1871
1872    return false;
1873 }
1874
1875
1876 const char *
1877 ir_function_signature::qualifiers_match(exec_list *params)
1878 {
1879    /* check that the qualifiers match. */
1880    foreach_two_lists(a_node, &this->parameters, b_node, params) {
1881       ir_variable *a = (ir_variable *) a_node;
1882       ir_variable *b = (ir_variable *) b_node;
1883
1884       if (a->data.read_only != b->data.read_only ||
1885           !modes_match(a->data.mode, b->data.mode) ||
1886           a->data.interpolation != b->data.interpolation ||
1887           a->data.centroid != b->data.centroid ||
1888           a->data.sample != b->data.sample ||
1889           a->data.patch != b->data.patch ||
1890           a->data.memory_read_only != b->data.memory_read_only ||
1891           a->data.memory_write_only != b->data.memory_write_only ||
1892           a->data.memory_coherent != b->data.memory_coherent ||
1893           a->data.memory_volatile != b->data.memory_volatile ||
1894           a->data.memory_restrict != b->data.memory_restrict) {
1895
1896          /* parameter a's qualifiers don't match */
1897          return a->name;
1898       }
1899    }
1900    return NULL;
1901 }
1902
1903
1904 void
1905 ir_function_signature::replace_parameters(exec_list *new_params)
1906 {
1907    /* Destroy all of the previous parameter information.  If the previous
1908     * parameter information comes from the function prototype, it may either
1909     * specify incorrect parameter names or not have names at all.
1910     */
1911    new_params->move_nodes_to(&parameters);
1912 }
1913
1914
1915 ir_function::ir_function(const char *name)
1916    : ir_instruction(ir_type_function)
1917 {
1918    this->subroutine_index = -1;
1919    this->name = ralloc_strdup(this, name);
1920 }
1921
1922
1923 bool
1924 ir_function::has_user_signature()
1925 {
1926    foreach_in_list(ir_function_signature, sig, &this->signatures) {
1927       if (!sig->is_builtin())
1928          return true;
1929    }
1930    return false;
1931 }
1932
1933
1934 ir_rvalue *
1935 ir_rvalue::error_value(void *mem_ctx)
1936 {
1937    ir_rvalue *v = new(mem_ctx) ir_rvalue(ir_type_unset);
1938
1939    v->type = glsl_type::error_type;
1940    return v;
1941 }
1942
1943
1944 void
1945 visit_exec_list(exec_list *list, ir_visitor *visitor)
1946 {
1947    foreach_in_list_safe(ir_instruction, node, list) {
1948       node->accept(visitor);
1949    }
1950 }
1951
1952
1953 static void
1954 steal_memory(ir_instruction *ir, void *new_ctx)
1955 {
1956    ir_variable *var = ir->as_variable();
1957    ir_function *fn = ir->as_function();
1958    ir_constant *constant = ir->as_constant();
1959    if (var != NULL && var->constant_value != NULL)
1960       steal_memory(var->constant_value, ir);
1961
1962    if (var != NULL && var->constant_initializer != NULL)
1963       steal_memory(var->constant_initializer, ir);
1964
1965    if (fn != NULL && fn->subroutine_types)
1966       ralloc_steal(new_ctx, fn->subroutine_types);
1967
1968    /* The components of aggregate constants are not visited by the normal
1969     * visitor, so steal their values by hand.
1970     */
1971    if (constant != NULL) {
1972       if (constant->type->is_record()) {
1973          foreach_in_list(ir_constant, field, &constant->components) {
1974             steal_memory(field, ir);
1975          }
1976       } else if (constant->type->is_array()) {
1977          for (unsigned int i = 0; i < constant->type->length; i++) {
1978             steal_memory(constant->array_elements[i], ir);
1979          }
1980       }
1981    }
1982
1983    ralloc_steal(new_ctx, ir);
1984 }
1985
1986
1987 void
1988 reparent_ir(exec_list *list, void *mem_ctx)
1989 {
1990    foreach_in_list(ir_instruction, node, list) {
1991       visit_tree(node, steal_memory, mem_ctx);
1992    }
1993 }
1994
1995
1996 static ir_rvalue *
1997 try_min_one(ir_rvalue *ir)
1998 {
1999    ir_expression *expr = ir->as_expression();
2000
2001    if (!expr || expr->operation != ir_binop_min)
2002       return NULL;
2003
2004    if (expr->operands[0]->is_one())
2005       return expr->operands[1];
2006
2007    if (expr->operands[1]->is_one())
2008       return expr->operands[0];
2009
2010    return NULL;
2011 }
2012
2013 static ir_rvalue *
2014 try_max_zero(ir_rvalue *ir)
2015 {
2016    ir_expression *expr = ir->as_expression();
2017
2018    if (!expr || expr->operation != ir_binop_max)
2019       return NULL;
2020
2021    if (expr->operands[0]->is_zero())
2022       return expr->operands[1];
2023
2024    if (expr->operands[1]->is_zero())
2025       return expr->operands[0];
2026
2027    return NULL;
2028 }
2029
2030 ir_rvalue *
2031 ir_rvalue::as_rvalue_to_saturate()
2032 {
2033    ir_expression *expr = this->as_expression();
2034
2035    if (!expr)
2036       return NULL;
2037
2038    ir_rvalue *max_zero = try_max_zero(expr);
2039    if (max_zero) {
2040       return try_min_one(max_zero);
2041    } else {
2042       ir_rvalue *min_one = try_min_one(expr);
2043       if (min_one) {
2044          return try_max_zero(min_one);
2045       }
2046    }
2047
2048    return NULL;
2049 }
2050
2051
2052 unsigned
2053 vertices_per_prim(GLenum prim)
2054 {
2055    switch (prim) {
2056    case GL_POINTS:
2057       return 1;
2058    case GL_LINES:
2059       return 2;
2060    case GL_TRIANGLES:
2061       return 3;
2062    case GL_LINES_ADJACENCY:
2063       return 4;
2064    case GL_TRIANGLES_ADJACENCY:
2065       return 6;
2066    default:
2067       assert(!"Bad primitive");
2068       return 3;
2069    }
2070 }
2071
2072 /**
2073  * Generate a string describing the mode of a variable
2074  */
2075 const char *
2076 mode_string(const ir_variable *var)
2077 {
2078    switch (var->data.mode) {
2079    case ir_var_auto:
2080       return (var->data.read_only) ? "global constant" : "global variable";
2081
2082    case ir_var_uniform:
2083       return "uniform";
2084
2085    case ir_var_shader_storage:
2086       return "buffer";
2087
2088    case ir_var_shader_in:
2089       return "shader input";
2090
2091    case ir_var_shader_out:
2092       return "shader output";
2093
2094    case ir_var_function_in:
2095    case ir_var_const_in:
2096       return "function input";
2097
2098    case ir_var_function_out:
2099       return "function output";
2100
2101    case ir_var_function_inout:
2102       return "function inout";
2103
2104    case ir_var_system_value:
2105       return "shader input";
2106
2107    case ir_var_temporary:
2108       return "compiler temporary";
2109
2110    case ir_var_mode_count:
2111       break;
2112    }
2113
2114    assert(!"Should not get here.");
2115    return "invalid variable";
2116 }