OSDN Git Service

intel: Track known prime buffers for re-use
[android-x86/external-libdrm.git] / intel / intel_bufmgr_gem.c
1 /**************************************************************************
2  *
3  * Copyright © 2007 Red Hat Inc.
4  * Copyright © 2007-2012 Intel Corporation
5  * Copyright 2006 Tungsten Graphics, Inc., Bismarck, ND., USA
6  * All Rights Reserved.
7  *
8  * Permission is hereby granted, free of charge, to any person obtaining a
9  * copy of this software and associated documentation files (the
10  * "Software"), to deal in the Software without restriction, including
11  * without limitation the rights to use, copy, modify, merge, publish,
12  * distribute, sub license, and/or sell copies of the Software, and to
13  * permit persons to whom the Software is furnished to do so, subject to
14  * the following conditions:
15  *
16  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
17  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
18  * FITNESS FOR A PARTICULAR PURPOSE AND NON-INFRINGEMENT. IN NO EVENT SHALL
19  * THE COPYRIGHT HOLDERS, AUTHORS AND/OR ITS SUPPLIERS BE LIABLE FOR ANY CLAIM,
20  * DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR
21  * OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE
22  * USE OR OTHER DEALINGS IN THE SOFTWARE.
23  *
24  * The above copyright notice and this permission notice (including the
25  * next paragraph) shall be included in all copies or substantial portions
26  * of the Software.
27  *
28  *
29  **************************************************************************/
30 /*
31  * Authors: Thomas Hellström <thomas-at-tungstengraphics-dot-com>
32  *          Keith Whitwell <keithw-at-tungstengraphics-dot-com>
33  *          Eric Anholt <eric@anholt.net>
34  *          Dave Airlie <airlied@linux.ie>
35  */
36
37 #ifdef HAVE_CONFIG_H
38 #include "config.h"
39 #endif
40
41 #include <xf86drm.h>
42 #include <xf86atomic.h>
43 #include <fcntl.h>
44 #include <stdio.h>
45 #include <stdlib.h>
46 #include <string.h>
47 #include <unistd.h>
48 #include <assert.h>
49 #include <pthread.h>
50 #include <sys/ioctl.h>
51 #include <sys/mman.h>
52 #include <sys/stat.h>
53 #include <sys/types.h>
54 #include <stdbool.h>
55
56 #include "errno.h"
57 #ifndef ETIME
58 #define ETIME ETIMEDOUT
59 #endif
60 #include "libdrm_lists.h"
61 #include "intel_bufmgr.h"
62 #include "intel_bufmgr_priv.h"
63 #include "intel_chipset.h"
64 #include "intel_aub.h"
65 #include "string.h"
66
67 #include "i915_drm.h"
68
69 #ifdef HAVE_VALGRIND
70 #include <valgrind.h>
71 #include <memcheck.h>
72 #define VG(x) x
73 #else
74 #define VG(x)
75 #endif
76
77 #define VG_CLEAR(s) VG(memset(&s, 0, sizeof(s)))
78
79 #define DBG(...) do {                                   \
80         if (bufmgr_gem->bufmgr.debug)                   \
81                 fprintf(stderr, __VA_ARGS__);           \
82 } while (0)
83
84 #define ARRAY_SIZE(x) (sizeof(x) / sizeof((x)[0]))
85
86 typedef struct _drm_intel_bo_gem drm_intel_bo_gem;
87
88 struct drm_intel_gem_bo_bucket {
89         drmMMListHead head;
90         unsigned long size;
91 };
92
93 typedef struct _drm_intel_bufmgr_gem {
94         drm_intel_bufmgr bufmgr;
95
96         int fd;
97
98         int max_relocs;
99
100         pthread_mutex_t lock;
101
102         struct drm_i915_gem_exec_object *exec_objects;
103         struct drm_i915_gem_exec_object2 *exec2_objects;
104         drm_intel_bo **exec_bos;
105         int exec_size;
106         int exec_count;
107
108         /** Array of lists of cached gem objects of power-of-two sizes */
109         struct drm_intel_gem_bo_bucket cache_bucket[14 * 4];
110         int num_buckets;
111         time_t time;
112
113         drmMMListHead named;
114         drmMMListHead vma_cache;
115         int vma_count, vma_open, vma_max;
116
117         uint64_t gtt_size;
118         int available_fences;
119         int pci_device;
120         int gen;
121         unsigned int has_bsd : 1;
122         unsigned int has_blt : 1;
123         unsigned int has_relaxed_fencing : 1;
124         unsigned int has_llc : 1;
125         unsigned int has_wait_timeout : 1;
126         unsigned int bo_reuse : 1;
127         unsigned int no_exec : 1;
128         unsigned int has_vebox : 1;
129         bool fenced_relocs;
130
131         char *aub_filename;
132         FILE *aub_file;
133         uint32_t aub_offset;
134 } drm_intel_bufmgr_gem;
135
136 #define DRM_INTEL_RELOC_FENCE (1<<0)
137
138 typedef struct _drm_intel_reloc_target_info {
139         drm_intel_bo *bo;
140         int flags;
141 } drm_intel_reloc_target;
142
143 struct _drm_intel_bo_gem {
144         drm_intel_bo bo;
145
146         atomic_t refcount;
147         uint32_t gem_handle;
148         const char *name;
149
150         /**
151          * Kenel-assigned global name for this object
152          *
153          * List contains both flink named and prime fd'd objects
154          */
155         unsigned int global_name;
156         drmMMListHead name_list;
157
158         /**
159          * Index of the buffer within the validation list while preparing a
160          * batchbuffer execution.
161          */
162         int validate_index;
163
164         /**
165          * Current tiling mode
166          */
167         uint32_t tiling_mode;
168         uint32_t swizzle_mode;
169         unsigned long stride;
170
171         time_t free_time;
172
173         /** Array passed to the DRM containing relocation information. */
174         struct drm_i915_gem_relocation_entry *relocs;
175         /**
176          * Array of info structs corresponding to relocs[i].target_handle etc
177          */
178         drm_intel_reloc_target *reloc_target_info;
179         /** Number of entries in relocs */
180         int reloc_count;
181         /** Mapped address for the buffer, saved across map/unmap cycles */
182         void *mem_virtual;
183         /** GTT virtual address for the buffer, saved across map/unmap cycles */
184         void *gtt_virtual;
185         int map_count;
186         drmMMListHead vma_list;
187
188         /** BO cache list */
189         drmMMListHead head;
190
191         /**
192          * Boolean of whether this BO and its children have been included in
193          * the current drm_intel_bufmgr_check_aperture_space() total.
194          */
195         bool included_in_check_aperture;
196
197         /**
198          * Boolean of whether this buffer has been used as a relocation
199          * target and had its size accounted for, and thus can't have any
200          * further relocations added to it.
201          */
202         bool used_as_reloc_target;
203
204         /**
205          * Boolean of whether we have encountered an error whilst building the relocation tree.
206          */
207         bool has_error;
208
209         /**
210          * Boolean of whether this buffer can be re-used
211          */
212         bool reusable;
213
214         /**
215          * Size in bytes of this buffer and its relocation descendents.
216          *
217          * Used to avoid costly tree walking in
218          * drm_intel_bufmgr_check_aperture in the common case.
219          */
220         int reloc_tree_size;
221
222         /**
223          * Number of potential fence registers required by this buffer and its
224          * relocations.
225          */
226         int reloc_tree_fences;
227
228         /** Flags that we may need to do the SW_FINSIH ioctl on unmap. */
229         bool mapped_cpu_write;
230
231         uint32_t aub_offset;
232
233         drm_intel_aub_annotation *aub_annotations;
234         unsigned aub_annotation_count;
235 };
236
237 static unsigned int
238 drm_intel_gem_estimate_batch_space(drm_intel_bo ** bo_array, int count);
239
240 static unsigned int
241 drm_intel_gem_compute_batch_space(drm_intel_bo ** bo_array, int count);
242
243 static int
244 drm_intel_gem_bo_get_tiling(drm_intel_bo *bo, uint32_t * tiling_mode,
245                             uint32_t * swizzle_mode);
246
247 static int
248 drm_intel_gem_bo_set_tiling_internal(drm_intel_bo *bo,
249                                      uint32_t tiling_mode,
250                                      uint32_t stride);
251
252 static void drm_intel_gem_bo_unreference_locked_timed(drm_intel_bo *bo,
253                                                       time_t time);
254
255 static void drm_intel_gem_bo_unreference(drm_intel_bo *bo);
256
257 static void drm_intel_gem_bo_free(drm_intel_bo *bo);
258
259 static unsigned long
260 drm_intel_gem_bo_tile_size(drm_intel_bufmgr_gem *bufmgr_gem, unsigned long size,
261                            uint32_t *tiling_mode)
262 {
263         unsigned long min_size, max_size;
264         unsigned long i;
265
266         if (*tiling_mode == I915_TILING_NONE)
267                 return size;
268
269         /* 965+ just need multiples of page size for tiling */
270         if (bufmgr_gem->gen >= 4)
271                 return ROUND_UP_TO(size, 4096);
272
273         /* Older chips need powers of two, of at least 512k or 1M */
274         if (bufmgr_gem->gen == 3) {
275                 min_size = 1024*1024;
276                 max_size = 128*1024*1024;
277         } else {
278                 min_size = 512*1024;
279                 max_size = 64*1024*1024;
280         }
281
282         if (size > max_size) {
283                 *tiling_mode = I915_TILING_NONE;
284                 return size;
285         }
286
287         /* Do we need to allocate every page for the fence? */
288         if (bufmgr_gem->has_relaxed_fencing)
289                 return ROUND_UP_TO(size, 4096);
290
291         for (i = min_size; i < size; i <<= 1)
292                 ;
293
294         return i;
295 }
296
297 /*
298  * Round a given pitch up to the minimum required for X tiling on a
299  * given chip.  We use 512 as the minimum to allow for a later tiling
300  * change.
301  */
302 static unsigned long
303 drm_intel_gem_bo_tile_pitch(drm_intel_bufmgr_gem *bufmgr_gem,
304                             unsigned long pitch, uint32_t *tiling_mode)
305 {
306         unsigned long tile_width;
307         unsigned long i;
308
309         /* If untiled, then just align it so that we can do rendering
310          * to it with the 3D engine.
311          */
312         if (*tiling_mode == I915_TILING_NONE)
313                 return ALIGN(pitch, 64);
314
315         if (*tiling_mode == I915_TILING_X
316                         || (IS_915(bufmgr_gem->pci_device)
317                             && *tiling_mode == I915_TILING_Y))
318                 tile_width = 512;
319         else
320                 tile_width = 128;
321
322         /* 965 is flexible */
323         if (bufmgr_gem->gen >= 4)
324                 return ROUND_UP_TO(pitch, tile_width);
325
326         /* The older hardware has a maximum pitch of 8192 with tiled
327          * surfaces, so fallback to untiled if it's too large.
328          */
329         if (pitch > 8192) {
330                 *tiling_mode = I915_TILING_NONE;
331                 return ALIGN(pitch, 64);
332         }
333
334         /* Pre-965 needs power of two tile width */
335         for (i = tile_width; i < pitch; i <<= 1)
336                 ;
337
338         return i;
339 }
340
341 static struct drm_intel_gem_bo_bucket *
342 drm_intel_gem_bo_bucket_for_size(drm_intel_bufmgr_gem *bufmgr_gem,
343                                  unsigned long size)
344 {
345         int i;
346
347         for (i = 0; i < bufmgr_gem->num_buckets; i++) {
348                 struct drm_intel_gem_bo_bucket *bucket =
349                     &bufmgr_gem->cache_bucket[i];
350                 if (bucket->size >= size) {
351                         return bucket;
352                 }
353         }
354
355         return NULL;
356 }
357
358 static void
359 drm_intel_gem_dump_validation_list(drm_intel_bufmgr_gem *bufmgr_gem)
360 {
361         int i, j;
362
363         for (i = 0; i < bufmgr_gem->exec_count; i++) {
364                 drm_intel_bo *bo = bufmgr_gem->exec_bos[i];
365                 drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
366
367                 if (bo_gem->relocs == NULL) {
368                         DBG("%2d: %d (%s)\n", i, bo_gem->gem_handle,
369                             bo_gem->name);
370                         continue;
371                 }
372
373                 for (j = 0; j < bo_gem->reloc_count; j++) {
374                         drm_intel_bo *target_bo = bo_gem->reloc_target_info[j].bo;
375                         drm_intel_bo_gem *target_gem =
376                             (drm_intel_bo_gem *) target_bo;
377
378                         DBG("%2d: %d (%s)@0x%08llx -> "
379                             "%d (%s)@0x%08lx + 0x%08x\n",
380                             i,
381                             bo_gem->gem_handle, bo_gem->name,
382                             (unsigned long long)bo_gem->relocs[j].offset,
383                             target_gem->gem_handle,
384                             target_gem->name,
385                             target_bo->offset,
386                             bo_gem->relocs[j].delta);
387                 }
388         }
389 }
390
391 static inline void
392 drm_intel_gem_bo_reference(drm_intel_bo *bo)
393 {
394         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
395
396         atomic_inc(&bo_gem->refcount);
397 }
398
399 /**
400  * Adds the given buffer to the list of buffers to be validated (moved into the
401  * appropriate memory type) with the next batch submission.
402  *
403  * If a buffer is validated multiple times in a batch submission, it ends up
404  * with the intersection of the memory type flags and the union of the
405  * access flags.
406  */
407 static void
408 drm_intel_add_validate_buffer(drm_intel_bo *bo)
409 {
410         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
411         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
412         int index;
413
414         if (bo_gem->validate_index != -1)
415                 return;
416
417         /* Extend the array of validation entries as necessary. */
418         if (bufmgr_gem->exec_count == bufmgr_gem->exec_size) {
419                 int new_size = bufmgr_gem->exec_size * 2;
420
421                 if (new_size == 0)
422                         new_size = 5;
423
424                 bufmgr_gem->exec_objects =
425                     realloc(bufmgr_gem->exec_objects,
426                             sizeof(*bufmgr_gem->exec_objects) * new_size);
427                 bufmgr_gem->exec_bos =
428                     realloc(bufmgr_gem->exec_bos,
429                             sizeof(*bufmgr_gem->exec_bos) * new_size);
430                 bufmgr_gem->exec_size = new_size;
431         }
432
433         index = bufmgr_gem->exec_count;
434         bo_gem->validate_index = index;
435         /* Fill in array entry */
436         bufmgr_gem->exec_objects[index].handle = bo_gem->gem_handle;
437         bufmgr_gem->exec_objects[index].relocation_count = bo_gem->reloc_count;
438         bufmgr_gem->exec_objects[index].relocs_ptr = (uintptr_t) bo_gem->relocs;
439         bufmgr_gem->exec_objects[index].alignment = 0;
440         bufmgr_gem->exec_objects[index].offset = 0;
441         bufmgr_gem->exec_bos[index] = bo;
442         bufmgr_gem->exec_count++;
443 }
444
445 static void
446 drm_intel_add_validate_buffer2(drm_intel_bo *bo, int need_fence)
447 {
448         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *)bo->bufmgr;
449         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *)bo;
450         int index;
451
452         if (bo_gem->validate_index != -1) {
453                 if (need_fence)
454                         bufmgr_gem->exec2_objects[bo_gem->validate_index].flags |=
455                                 EXEC_OBJECT_NEEDS_FENCE;
456                 return;
457         }
458
459         /* Extend the array of validation entries as necessary. */
460         if (bufmgr_gem->exec_count == bufmgr_gem->exec_size) {
461                 int new_size = bufmgr_gem->exec_size * 2;
462
463                 if (new_size == 0)
464                         new_size = 5;
465
466                 bufmgr_gem->exec2_objects =
467                         realloc(bufmgr_gem->exec2_objects,
468                                 sizeof(*bufmgr_gem->exec2_objects) * new_size);
469                 bufmgr_gem->exec_bos =
470                         realloc(bufmgr_gem->exec_bos,
471                                 sizeof(*bufmgr_gem->exec_bos) * new_size);
472                 bufmgr_gem->exec_size = new_size;
473         }
474
475         index = bufmgr_gem->exec_count;
476         bo_gem->validate_index = index;
477         /* Fill in array entry */
478         bufmgr_gem->exec2_objects[index].handle = bo_gem->gem_handle;
479         bufmgr_gem->exec2_objects[index].relocation_count = bo_gem->reloc_count;
480         bufmgr_gem->exec2_objects[index].relocs_ptr = (uintptr_t)bo_gem->relocs;
481         bufmgr_gem->exec2_objects[index].alignment = 0;
482         bufmgr_gem->exec2_objects[index].offset = 0;
483         bufmgr_gem->exec_bos[index] = bo;
484         bufmgr_gem->exec2_objects[index].flags = 0;
485         bufmgr_gem->exec2_objects[index].rsvd1 = 0;
486         bufmgr_gem->exec2_objects[index].rsvd2 = 0;
487         if (need_fence) {
488                 bufmgr_gem->exec2_objects[index].flags |=
489                         EXEC_OBJECT_NEEDS_FENCE;
490         }
491         bufmgr_gem->exec_count++;
492 }
493
494 #define RELOC_BUF_SIZE(x) ((I915_RELOC_HEADER + x * I915_RELOC0_STRIDE) * \
495         sizeof(uint32_t))
496
497 static void
498 drm_intel_bo_gem_set_in_aperture_size(drm_intel_bufmgr_gem *bufmgr_gem,
499                                       drm_intel_bo_gem *bo_gem)
500 {
501         int size;
502
503         assert(!bo_gem->used_as_reloc_target);
504
505         /* The older chipsets are far-less flexible in terms of tiling,
506          * and require tiled buffer to be size aligned in the aperture.
507          * This means that in the worst possible case we will need a hole
508          * twice as large as the object in order for it to fit into the
509          * aperture. Optimal packing is for wimps.
510          */
511         size = bo_gem->bo.size;
512         if (bufmgr_gem->gen < 4 && bo_gem->tiling_mode != I915_TILING_NONE) {
513                 int min_size;
514
515                 if (bufmgr_gem->has_relaxed_fencing) {
516                         if (bufmgr_gem->gen == 3)
517                                 min_size = 1024*1024;
518                         else
519                                 min_size = 512*1024;
520
521                         while (min_size < size)
522                                 min_size *= 2;
523                 } else
524                         min_size = size;
525
526                 /* Account for worst-case alignment. */
527                 size = 2 * min_size;
528         }
529
530         bo_gem->reloc_tree_size = size;
531 }
532
533 static int
534 drm_intel_setup_reloc_list(drm_intel_bo *bo)
535 {
536         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
537         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
538         unsigned int max_relocs = bufmgr_gem->max_relocs;
539
540         if (bo->size / 4 < max_relocs)
541                 max_relocs = bo->size / 4;
542
543         bo_gem->relocs = malloc(max_relocs *
544                                 sizeof(struct drm_i915_gem_relocation_entry));
545         bo_gem->reloc_target_info = malloc(max_relocs *
546                                            sizeof(drm_intel_reloc_target));
547         if (bo_gem->relocs == NULL || bo_gem->reloc_target_info == NULL) {
548                 bo_gem->has_error = true;
549
550                 free (bo_gem->relocs);
551                 bo_gem->relocs = NULL;
552
553                 free (bo_gem->reloc_target_info);
554                 bo_gem->reloc_target_info = NULL;
555
556                 return 1;
557         }
558
559         return 0;
560 }
561
562 static int
563 drm_intel_gem_bo_busy(drm_intel_bo *bo)
564 {
565         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
566         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
567         struct drm_i915_gem_busy busy;
568         int ret;
569
570         VG_CLEAR(busy);
571         busy.handle = bo_gem->gem_handle;
572
573         ret = drmIoctl(bufmgr_gem->fd, DRM_IOCTL_I915_GEM_BUSY, &busy);
574
575         return (ret == 0 && busy.busy);
576 }
577
578 static int
579 drm_intel_gem_bo_madvise_internal(drm_intel_bufmgr_gem *bufmgr_gem,
580                                   drm_intel_bo_gem *bo_gem, int state)
581 {
582         struct drm_i915_gem_madvise madv;
583
584         VG_CLEAR(madv);
585         madv.handle = bo_gem->gem_handle;
586         madv.madv = state;
587         madv.retained = 1;
588         drmIoctl(bufmgr_gem->fd, DRM_IOCTL_I915_GEM_MADVISE, &madv);
589
590         return madv.retained;
591 }
592
593 static int
594 drm_intel_gem_bo_madvise(drm_intel_bo *bo, int madv)
595 {
596         return drm_intel_gem_bo_madvise_internal
597                 ((drm_intel_bufmgr_gem *) bo->bufmgr,
598                  (drm_intel_bo_gem *) bo,
599                  madv);
600 }
601
602 /* drop the oldest entries that have been purged by the kernel */
603 static void
604 drm_intel_gem_bo_cache_purge_bucket(drm_intel_bufmgr_gem *bufmgr_gem,
605                                     struct drm_intel_gem_bo_bucket *bucket)
606 {
607         while (!DRMLISTEMPTY(&bucket->head)) {
608                 drm_intel_bo_gem *bo_gem;
609
610                 bo_gem = DRMLISTENTRY(drm_intel_bo_gem,
611                                       bucket->head.next, head);
612                 if (drm_intel_gem_bo_madvise_internal
613                     (bufmgr_gem, bo_gem, I915_MADV_DONTNEED))
614                         break;
615
616                 DRMLISTDEL(&bo_gem->head);
617                 drm_intel_gem_bo_free(&bo_gem->bo);
618         }
619 }
620
621 static drm_intel_bo *
622 drm_intel_gem_bo_alloc_internal(drm_intel_bufmgr *bufmgr,
623                                 const char *name,
624                                 unsigned long size,
625                                 unsigned long flags,
626                                 uint32_t tiling_mode,
627                                 unsigned long stride)
628 {
629         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bufmgr;
630         drm_intel_bo_gem *bo_gem;
631         unsigned int page_size = getpagesize();
632         int ret;
633         struct drm_intel_gem_bo_bucket *bucket;
634         bool alloc_from_cache;
635         unsigned long bo_size;
636         bool for_render = false;
637
638         if (flags & BO_ALLOC_FOR_RENDER)
639                 for_render = true;
640
641         /* Round the allocated size up to a power of two number of pages. */
642         bucket = drm_intel_gem_bo_bucket_for_size(bufmgr_gem, size);
643
644         /* If we don't have caching at this size, don't actually round the
645          * allocation up.
646          */
647         if (bucket == NULL) {
648                 bo_size = size;
649                 if (bo_size < page_size)
650                         bo_size = page_size;
651         } else {
652                 bo_size = bucket->size;
653         }
654
655         pthread_mutex_lock(&bufmgr_gem->lock);
656         /* Get a buffer out of the cache if available */
657 retry:
658         alloc_from_cache = false;
659         if (bucket != NULL && !DRMLISTEMPTY(&bucket->head)) {
660                 if (for_render) {
661                         /* Allocate new render-target BOs from the tail (MRU)
662                          * of the list, as it will likely be hot in the GPU
663                          * cache and in the aperture for us.
664                          */
665                         bo_gem = DRMLISTENTRY(drm_intel_bo_gem,
666                                               bucket->head.prev, head);
667                         DRMLISTDEL(&bo_gem->head);
668                         alloc_from_cache = true;
669                 } else {
670                         /* For non-render-target BOs (where we're probably
671                          * going to map it first thing in order to fill it
672                          * with data), check if the last BO in the cache is
673                          * unbusy, and only reuse in that case. Otherwise,
674                          * allocating a new buffer is probably faster than
675                          * waiting for the GPU to finish.
676                          */
677                         bo_gem = DRMLISTENTRY(drm_intel_bo_gem,
678                                               bucket->head.next, head);
679                         if (!drm_intel_gem_bo_busy(&bo_gem->bo)) {
680                                 alloc_from_cache = true;
681                                 DRMLISTDEL(&bo_gem->head);
682                         }
683                 }
684
685                 if (alloc_from_cache) {
686                         if (!drm_intel_gem_bo_madvise_internal
687                             (bufmgr_gem, bo_gem, I915_MADV_WILLNEED)) {
688                                 drm_intel_gem_bo_free(&bo_gem->bo);
689                                 drm_intel_gem_bo_cache_purge_bucket(bufmgr_gem,
690                                                                     bucket);
691                                 goto retry;
692                         }
693
694                         if (drm_intel_gem_bo_set_tiling_internal(&bo_gem->bo,
695                                                                  tiling_mode,
696                                                                  stride)) {
697                                 drm_intel_gem_bo_free(&bo_gem->bo);
698                                 goto retry;
699                         }
700                 }
701         }
702         pthread_mutex_unlock(&bufmgr_gem->lock);
703
704         if (!alloc_from_cache) {
705                 struct drm_i915_gem_create create;
706
707                 bo_gem = calloc(1, sizeof(*bo_gem));
708                 if (!bo_gem)
709                         return NULL;
710
711                 bo_gem->bo.size = bo_size;
712
713                 VG_CLEAR(create);
714                 create.size = bo_size;
715
716                 ret = drmIoctl(bufmgr_gem->fd,
717                                DRM_IOCTL_I915_GEM_CREATE,
718                                &create);
719                 bo_gem->gem_handle = create.handle;
720                 bo_gem->bo.handle = bo_gem->gem_handle;
721                 if (ret != 0) {
722                         free(bo_gem);
723                         return NULL;
724                 }
725                 bo_gem->bo.bufmgr = bufmgr;
726
727                 bo_gem->tiling_mode = I915_TILING_NONE;
728                 bo_gem->swizzle_mode = I915_BIT_6_SWIZZLE_NONE;
729                 bo_gem->stride = 0;
730
731                 if (drm_intel_gem_bo_set_tiling_internal(&bo_gem->bo,
732                                                          tiling_mode,
733                                                          stride)) {
734                     drm_intel_gem_bo_free(&bo_gem->bo);
735                     return NULL;
736                 }
737
738                 DRMINITLISTHEAD(&bo_gem->name_list);
739                 DRMINITLISTHEAD(&bo_gem->vma_list);
740         }
741
742         bo_gem->name = name;
743         atomic_set(&bo_gem->refcount, 1);
744         bo_gem->validate_index = -1;
745         bo_gem->reloc_tree_fences = 0;
746         bo_gem->used_as_reloc_target = false;
747         bo_gem->has_error = false;
748         bo_gem->reusable = true;
749         bo_gem->aub_annotations = NULL;
750         bo_gem->aub_annotation_count = 0;
751
752         drm_intel_bo_gem_set_in_aperture_size(bufmgr_gem, bo_gem);
753
754         DBG("bo_create: buf %d (%s) %ldb\n",
755             bo_gem->gem_handle, bo_gem->name, size);
756
757         return &bo_gem->bo;
758 }
759
760 static drm_intel_bo *
761 drm_intel_gem_bo_alloc_for_render(drm_intel_bufmgr *bufmgr,
762                                   const char *name,
763                                   unsigned long size,
764                                   unsigned int alignment)
765 {
766         return drm_intel_gem_bo_alloc_internal(bufmgr, name, size,
767                                                BO_ALLOC_FOR_RENDER,
768                                                I915_TILING_NONE, 0);
769 }
770
771 static drm_intel_bo *
772 drm_intel_gem_bo_alloc(drm_intel_bufmgr *bufmgr,
773                        const char *name,
774                        unsigned long size,
775                        unsigned int alignment)
776 {
777         return drm_intel_gem_bo_alloc_internal(bufmgr, name, size, 0,
778                                                I915_TILING_NONE, 0);
779 }
780
781 static drm_intel_bo *
782 drm_intel_gem_bo_alloc_tiled(drm_intel_bufmgr *bufmgr, const char *name,
783                              int x, int y, int cpp, uint32_t *tiling_mode,
784                              unsigned long *pitch, unsigned long flags)
785 {
786         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *)bufmgr;
787         unsigned long size, stride;
788         uint32_t tiling;
789
790         do {
791                 unsigned long aligned_y, height_alignment;
792
793                 tiling = *tiling_mode;
794
795                 /* If we're tiled, our allocations are in 8 or 32-row blocks,
796                  * so failure to align our height means that we won't allocate
797                  * enough pages.
798                  *
799                  * If we're untiled, we still have to align to 2 rows high
800                  * because the data port accesses 2x2 blocks even if the
801                  * bottom row isn't to be rendered, so failure to align means
802                  * we could walk off the end of the GTT and fault.  This is
803                  * documented on 965, and may be the case on older chipsets
804                  * too so we try to be careful.
805                  */
806                 aligned_y = y;
807                 height_alignment = 2;
808
809                 if ((bufmgr_gem->gen == 2) && tiling != I915_TILING_NONE)
810                         height_alignment = 16;
811                 else if (tiling == I915_TILING_X
812                         || (IS_915(bufmgr_gem->pci_device)
813                             && tiling == I915_TILING_Y))
814                         height_alignment = 8;
815                 else if (tiling == I915_TILING_Y)
816                         height_alignment = 32;
817                 aligned_y = ALIGN(y, height_alignment);
818
819                 stride = x * cpp;
820                 stride = drm_intel_gem_bo_tile_pitch(bufmgr_gem, stride, tiling_mode);
821                 size = stride * aligned_y;
822                 size = drm_intel_gem_bo_tile_size(bufmgr_gem, size, tiling_mode);
823         } while (*tiling_mode != tiling);
824         *pitch = stride;
825
826         if (tiling == I915_TILING_NONE)
827                 stride = 0;
828
829         return drm_intel_gem_bo_alloc_internal(bufmgr, name, size, flags,
830                                                tiling, stride);
831 }
832
833 /**
834  * Returns a drm_intel_bo wrapping the given buffer object handle.
835  *
836  * This can be used when one application needs to pass a buffer object
837  * to another.
838  */
839 drm_intel_bo *
840 drm_intel_bo_gem_create_from_name(drm_intel_bufmgr *bufmgr,
841                                   const char *name,
842                                   unsigned int handle)
843 {
844         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bufmgr;
845         drm_intel_bo_gem *bo_gem;
846         int ret;
847         struct drm_gem_open open_arg;
848         struct drm_i915_gem_get_tiling get_tiling;
849         drmMMListHead *list;
850
851         /* At the moment most applications only have a few named bo.
852          * For instance, in a DRI client only the render buffers passed
853          * between X and the client are named. And since X returns the
854          * alternating names for the front/back buffer a linear search
855          * provides a sufficiently fast match.
856          */
857         for (list = bufmgr_gem->named.next;
858              list != &bufmgr_gem->named;
859              list = list->next) {
860                 bo_gem = DRMLISTENTRY(drm_intel_bo_gem, list, name_list);
861                 if (bo_gem->global_name == handle) {
862                         drm_intel_gem_bo_reference(&bo_gem->bo);
863                         return &bo_gem->bo;
864                 }
865         }
866
867         VG_CLEAR(open_arg);
868         open_arg.name = handle;
869         ret = drmIoctl(bufmgr_gem->fd,
870                        DRM_IOCTL_GEM_OPEN,
871                        &open_arg);
872         if (ret != 0) {
873                 DBG("Couldn't reference %s handle 0x%08x: %s\n",
874                     name, handle, strerror(errno));
875                 return NULL;
876         }
877         /* Now see if someone has used a prime handle to get this
878          * object from the kernel before by looking through the list
879          * again for a matching gem_handle
880          */
881         for (list = bufmgr_gem->named.next;
882              list != &bufmgr_gem->named;
883              list = list->next) {
884                 bo_gem = DRMLISTENTRY(drm_intel_bo_gem, list, name_list);
885                 if (bo_gem->gem_handle == open_arg.handle) {
886                         drm_intel_gem_bo_reference(&bo_gem->bo);
887                         return &bo_gem->bo;
888                 }
889         }
890
891         bo_gem = calloc(1, sizeof(*bo_gem));
892         if (!bo_gem)
893                 return NULL;
894
895         bo_gem->bo.size = open_arg.size;
896         bo_gem->bo.offset = 0;
897         bo_gem->bo.virtual = NULL;
898         bo_gem->bo.bufmgr = bufmgr;
899         bo_gem->name = name;
900         atomic_set(&bo_gem->refcount, 1);
901         bo_gem->validate_index = -1;
902         bo_gem->gem_handle = open_arg.handle;
903         bo_gem->bo.handle = open_arg.handle;
904         bo_gem->global_name = handle;
905         bo_gem->reusable = false;
906
907         VG_CLEAR(get_tiling);
908         get_tiling.handle = bo_gem->gem_handle;
909         ret = drmIoctl(bufmgr_gem->fd,
910                        DRM_IOCTL_I915_GEM_GET_TILING,
911                        &get_tiling);
912         if (ret != 0) {
913                 drm_intel_gem_bo_unreference(&bo_gem->bo);
914                 return NULL;
915         }
916         bo_gem->tiling_mode = get_tiling.tiling_mode;
917         bo_gem->swizzle_mode = get_tiling.swizzle_mode;
918         /* XXX stride is unknown */
919         drm_intel_bo_gem_set_in_aperture_size(bufmgr_gem, bo_gem);
920
921         DRMINITLISTHEAD(&bo_gem->vma_list);
922         DRMLISTADDTAIL(&bo_gem->name_list, &bufmgr_gem->named);
923         DBG("bo_create_from_handle: %d (%s)\n", handle, bo_gem->name);
924
925         return &bo_gem->bo;
926 }
927
928 static void
929 drm_intel_gem_bo_free(drm_intel_bo *bo)
930 {
931         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
932         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
933         struct drm_gem_close close;
934         int ret;
935
936         DRMLISTDEL(&bo_gem->vma_list);
937         if (bo_gem->mem_virtual) {
938                 VG(VALGRIND_FREELIKE_BLOCK(bo_gem->mem_virtual, 0));
939                 munmap(bo_gem->mem_virtual, bo_gem->bo.size);
940                 bufmgr_gem->vma_count--;
941         }
942         if (bo_gem->gtt_virtual) {
943                 munmap(bo_gem->gtt_virtual, bo_gem->bo.size);
944                 bufmgr_gem->vma_count--;
945         }
946
947         /* Close this object */
948         VG_CLEAR(close);
949         close.handle = bo_gem->gem_handle;
950         ret = drmIoctl(bufmgr_gem->fd, DRM_IOCTL_GEM_CLOSE, &close);
951         if (ret != 0) {
952                 DBG("DRM_IOCTL_GEM_CLOSE %d failed (%s): %s\n",
953                     bo_gem->gem_handle, bo_gem->name, strerror(errno));
954         }
955         free(bo_gem->aub_annotations);
956         free(bo);
957 }
958
959 static void
960 drm_intel_gem_bo_mark_mmaps_incoherent(drm_intel_bo *bo)
961 {
962 #if HAVE_VALGRIND
963         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
964
965         if (bo_gem->mem_virtual)
966                 VALGRIND_MAKE_MEM_NOACCESS(bo_gem->mem_virtual, bo->size);
967
968         if (bo_gem->gtt_virtual)
969                 VALGRIND_MAKE_MEM_NOACCESS(bo_gem->gtt_virtual, bo->size);
970 #endif
971 }
972
973 /** Frees all cached buffers significantly older than @time. */
974 static void
975 drm_intel_gem_cleanup_bo_cache(drm_intel_bufmgr_gem *bufmgr_gem, time_t time)
976 {
977         int i;
978
979         if (bufmgr_gem->time == time)
980                 return;
981
982         for (i = 0; i < bufmgr_gem->num_buckets; i++) {
983                 struct drm_intel_gem_bo_bucket *bucket =
984                     &bufmgr_gem->cache_bucket[i];
985
986                 while (!DRMLISTEMPTY(&bucket->head)) {
987                         drm_intel_bo_gem *bo_gem;
988
989                         bo_gem = DRMLISTENTRY(drm_intel_bo_gem,
990                                               bucket->head.next, head);
991                         if (time - bo_gem->free_time <= 1)
992                                 break;
993
994                         DRMLISTDEL(&bo_gem->head);
995
996                         drm_intel_gem_bo_free(&bo_gem->bo);
997                 }
998         }
999
1000         bufmgr_gem->time = time;
1001 }
1002
1003 static void drm_intel_gem_bo_purge_vma_cache(drm_intel_bufmgr_gem *bufmgr_gem)
1004 {
1005         int limit;
1006
1007         DBG("%s: cached=%d, open=%d, limit=%d\n", __FUNCTION__,
1008             bufmgr_gem->vma_count, bufmgr_gem->vma_open, bufmgr_gem->vma_max);
1009
1010         if (bufmgr_gem->vma_max < 0)
1011                 return;
1012
1013         /* We may need to evict a few entries in order to create new mmaps */
1014         limit = bufmgr_gem->vma_max - 2*bufmgr_gem->vma_open;
1015         if (limit < 0)
1016                 limit = 0;
1017
1018         while (bufmgr_gem->vma_count > limit) {
1019                 drm_intel_bo_gem *bo_gem;
1020
1021                 bo_gem = DRMLISTENTRY(drm_intel_bo_gem,
1022                                       bufmgr_gem->vma_cache.next,
1023                                       vma_list);
1024                 assert(bo_gem->map_count == 0);
1025                 DRMLISTDELINIT(&bo_gem->vma_list);
1026
1027                 if (bo_gem->mem_virtual) {
1028                         munmap(bo_gem->mem_virtual, bo_gem->bo.size);
1029                         bo_gem->mem_virtual = NULL;
1030                         bufmgr_gem->vma_count--;
1031                 }
1032                 if (bo_gem->gtt_virtual) {
1033                         munmap(bo_gem->gtt_virtual, bo_gem->bo.size);
1034                         bo_gem->gtt_virtual = NULL;
1035                         bufmgr_gem->vma_count--;
1036                 }
1037         }
1038 }
1039
1040 static void drm_intel_gem_bo_close_vma(drm_intel_bufmgr_gem *bufmgr_gem,
1041                                        drm_intel_bo_gem *bo_gem)
1042 {
1043         bufmgr_gem->vma_open--;
1044         DRMLISTADDTAIL(&bo_gem->vma_list, &bufmgr_gem->vma_cache);
1045         if (bo_gem->mem_virtual)
1046                 bufmgr_gem->vma_count++;
1047         if (bo_gem->gtt_virtual)
1048                 bufmgr_gem->vma_count++;
1049         drm_intel_gem_bo_purge_vma_cache(bufmgr_gem);
1050 }
1051
1052 static void drm_intel_gem_bo_open_vma(drm_intel_bufmgr_gem *bufmgr_gem,
1053                                       drm_intel_bo_gem *bo_gem)
1054 {
1055         bufmgr_gem->vma_open++;
1056         DRMLISTDEL(&bo_gem->vma_list);
1057         if (bo_gem->mem_virtual)
1058                 bufmgr_gem->vma_count--;
1059         if (bo_gem->gtt_virtual)
1060                 bufmgr_gem->vma_count--;
1061         drm_intel_gem_bo_purge_vma_cache(bufmgr_gem);
1062 }
1063
1064 static void
1065 drm_intel_gem_bo_unreference_final(drm_intel_bo *bo, time_t time)
1066 {
1067         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
1068         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1069         struct drm_intel_gem_bo_bucket *bucket;
1070         int i;
1071
1072         /* Unreference all the target buffers */
1073         for (i = 0; i < bo_gem->reloc_count; i++) {
1074                 if (bo_gem->reloc_target_info[i].bo != bo) {
1075                         drm_intel_gem_bo_unreference_locked_timed(bo_gem->
1076                                                                   reloc_target_info[i].bo,
1077                                                                   time);
1078                 }
1079         }
1080         bo_gem->reloc_count = 0;
1081         bo_gem->used_as_reloc_target = false;
1082
1083         DBG("bo_unreference final: %d (%s)\n",
1084             bo_gem->gem_handle, bo_gem->name);
1085
1086         /* release memory associated with this object */
1087         if (bo_gem->reloc_target_info) {
1088                 free(bo_gem->reloc_target_info);
1089                 bo_gem->reloc_target_info = NULL;
1090         }
1091         if (bo_gem->relocs) {
1092                 free(bo_gem->relocs);
1093                 bo_gem->relocs = NULL;
1094         }
1095
1096         /* Clear any left-over mappings */
1097         if (bo_gem->map_count) {
1098                 DBG("bo freed with non-zero map-count %d\n", bo_gem->map_count);
1099                 bo_gem->map_count = 0;
1100                 drm_intel_gem_bo_close_vma(bufmgr_gem, bo_gem);
1101                 drm_intel_gem_bo_mark_mmaps_incoherent(bo);
1102         }
1103
1104         DRMLISTDEL(&bo_gem->name_list);
1105
1106         bucket = drm_intel_gem_bo_bucket_for_size(bufmgr_gem, bo->size);
1107         /* Put the buffer into our internal cache for reuse if we can. */
1108         if (bufmgr_gem->bo_reuse && bo_gem->reusable && bucket != NULL &&
1109             drm_intel_gem_bo_madvise_internal(bufmgr_gem, bo_gem,
1110                                               I915_MADV_DONTNEED)) {
1111                 bo_gem->free_time = time;
1112
1113                 bo_gem->name = NULL;
1114                 bo_gem->validate_index = -1;
1115
1116                 DRMLISTADDTAIL(&bo_gem->head, &bucket->head);
1117         } else {
1118                 drm_intel_gem_bo_free(bo);
1119         }
1120 }
1121
1122 static void drm_intel_gem_bo_unreference_locked_timed(drm_intel_bo *bo,
1123                                                       time_t time)
1124 {
1125         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1126
1127         assert(atomic_read(&bo_gem->refcount) > 0);
1128         if (atomic_dec_and_test(&bo_gem->refcount))
1129                 drm_intel_gem_bo_unreference_final(bo, time);
1130 }
1131
1132 static void drm_intel_gem_bo_unreference(drm_intel_bo *bo)
1133 {
1134         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1135
1136         assert(atomic_read(&bo_gem->refcount) > 0);
1137         if (atomic_dec_and_test(&bo_gem->refcount)) {
1138                 drm_intel_bufmgr_gem *bufmgr_gem =
1139                     (drm_intel_bufmgr_gem *) bo->bufmgr;
1140                 struct timespec time;
1141
1142                 clock_gettime(CLOCK_MONOTONIC, &time);
1143
1144                 pthread_mutex_lock(&bufmgr_gem->lock);
1145                 drm_intel_gem_bo_unreference_final(bo, time.tv_sec);
1146                 drm_intel_gem_cleanup_bo_cache(bufmgr_gem, time.tv_sec);
1147                 pthread_mutex_unlock(&bufmgr_gem->lock);
1148         }
1149 }
1150
1151 static int drm_intel_gem_bo_map(drm_intel_bo *bo, int write_enable)
1152 {
1153         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
1154         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1155         struct drm_i915_gem_set_domain set_domain;
1156         int ret;
1157
1158         pthread_mutex_lock(&bufmgr_gem->lock);
1159
1160         if (bo_gem->map_count++ == 0)
1161                 drm_intel_gem_bo_open_vma(bufmgr_gem, bo_gem);
1162
1163         if (!bo_gem->mem_virtual) {
1164                 struct drm_i915_gem_mmap mmap_arg;
1165
1166                 DBG("bo_map: %d (%s), map_count=%d\n",
1167                     bo_gem->gem_handle, bo_gem->name, bo_gem->map_count);
1168
1169                 VG_CLEAR(mmap_arg);
1170                 mmap_arg.handle = bo_gem->gem_handle;
1171                 mmap_arg.offset = 0;
1172                 mmap_arg.size = bo->size;
1173                 ret = drmIoctl(bufmgr_gem->fd,
1174                                DRM_IOCTL_I915_GEM_MMAP,
1175                                &mmap_arg);
1176                 if (ret != 0) {
1177                         ret = -errno;
1178                         DBG("%s:%d: Error mapping buffer %d (%s): %s .\n",
1179                             __FILE__, __LINE__, bo_gem->gem_handle,
1180                             bo_gem->name, strerror(errno));
1181                         if (--bo_gem->map_count == 0)
1182                                 drm_intel_gem_bo_close_vma(bufmgr_gem, bo_gem);
1183                         pthread_mutex_unlock(&bufmgr_gem->lock);
1184                         return ret;
1185                 }
1186                 VG(VALGRIND_MALLOCLIKE_BLOCK(mmap_arg.addr_ptr, mmap_arg.size, 0, 1));
1187                 bo_gem->mem_virtual = (void *)(uintptr_t) mmap_arg.addr_ptr;
1188         }
1189         DBG("bo_map: %d (%s) -> %p\n", bo_gem->gem_handle, bo_gem->name,
1190             bo_gem->mem_virtual);
1191         bo->virtual = bo_gem->mem_virtual;
1192
1193         VG_CLEAR(set_domain);
1194         set_domain.handle = bo_gem->gem_handle;
1195         set_domain.read_domains = I915_GEM_DOMAIN_CPU;
1196         if (write_enable)
1197                 set_domain.write_domain = I915_GEM_DOMAIN_CPU;
1198         else
1199                 set_domain.write_domain = 0;
1200         ret = drmIoctl(bufmgr_gem->fd,
1201                        DRM_IOCTL_I915_GEM_SET_DOMAIN,
1202                        &set_domain);
1203         if (ret != 0) {
1204                 DBG("%s:%d: Error setting to CPU domain %d: %s\n",
1205                     __FILE__, __LINE__, bo_gem->gem_handle,
1206                     strerror(errno));
1207         }
1208
1209         if (write_enable)
1210                 bo_gem->mapped_cpu_write = true;
1211
1212         drm_intel_gem_bo_mark_mmaps_incoherent(bo);
1213         VG(VALGRIND_MAKE_MEM_DEFINED(bo_gem->mem_virtual, bo->size));
1214         pthread_mutex_unlock(&bufmgr_gem->lock);
1215
1216         return 0;
1217 }
1218
1219 static int
1220 map_gtt(drm_intel_bo *bo)
1221 {
1222         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
1223         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1224         int ret;
1225
1226         if (bo_gem->map_count++ == 0)
1227                 drm_intel_gem_bo_open_vma(bufmgr_gem, bo_gem);
1228
1229         /* Get a mapping of the buffer if we haven't before. */
1230         if (bo_gem->gtt_virtual == NULL) {
1231                 struct drm_i915_gem_mmap_gtt mmap_arg;
1232
1233                 DBG("bo_map_gtt: mmap %d (%s), map_count=%d\n",
1234                     bo_gem->gem_handle, bo_gem->name, bo_gem->map_count);
1235
1236                 VG_CLEAR(mmap_arg);
1237                 mmap_arg.handle = bo_gem->gem_handle;
1238
1239                 /* Get the fake offset back... */
1240                 ret = drmIoctl(bufmgr_gem->fd,
1241                                DRM_IOCTL_I915_GEM_MMAP_GTT,
1242                                &mmap_arg);
1243                 if (ret != 0) {
1244                         ret = -errno;
1245                         DBG("%s:%d: Error preparing buffer map %d (%s): %s .\n",
1246                             __FILE__, __LINE__,
1247                             bo_gem->gem_handle, bo_gem->name,
1248                             strerror(errno));
1249                         if (--bo_gem->map_count == 0)
1250                                 drm_intel_gem_bo_close_vma(bufmgr_gem, bo_gem);
1251                         return ret;
1252                 }
1253
1254                 /* and mmap it */
1255                 bo_gem->gtt_virtual = mmap(0, bo->size, PROT_READ | PROT_WRITE,
1256                                            MAP_SHARED, bufmgr_gem->fd,
1257                                            mmap_arg.offset);
1258                 if (bo_gem->gtt_virtual == MAP_FAILED) {
1259                         bo_gem->gtt_virtual = NULL;
1260                         ret = -errno;
1261                         DBG("%s:%d: Error mapping buffer %d (%s): %s .\n",
1262                             __FILE__, __LINE__,
1263                             bo_gem->gem_handle, bo_gem->name,
1264                             strerror(errno));
1265                         if (--bo_gem->map_count == 0)
1266                                 drm_intel_gem_bo_close_vma(bufmgr_gem, bo_gem);
1267                         return ret;
1268                 }
1269         }
1270
1271         bo->virtual = bo_gem->gtt_virtual;
1272
1273         DBG("bo_map_gtt: %d (%s) -> %p\n", bo_gem->gem_handle, bo_gem->name,
1274             bo_gem->gtt_virtual);
1275
1276         return 0;
1277 }
1278
1279 int drm_intel_gem_bo_map_gtt(drm_intel_bo *bo)
1280 {
1281         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
1282         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1283         struct drm_i915_gem_set_domain set_domain;
1284         int ret;
1285
1286         pthread_mutex_lock(&bufmgr_gem->lock);
1287
1288         ret = map_gtt(bo);
1289         if (ret) {
1290                 pthread_mutex_unlock(&bufmgr_gem->lock);
1291                 return ret;
1292         }
1293
1294         /* Now move it to the GTT domain so that the GPU and CPU
1295          * caches are flushed and the GPU isn't actively using the
1296          * buffer.
1297          *
1298          * The pagefault handler does this domain change for us when
1299          * it has unbound the BO from the GTT, but it's up to us to
1300          * tell it when we're about to use things if we had done
1301          * rendering and it still happens to be bound to the GTT.
1302          */
1303         VG_CLEAR(set_domain);
1304         set_domain.handle = bo_gem->gem_handle;
1305         set_domain.read_domains = I915_GEM_DOMAIN_GTT;
1306         set_domain.write_domain = I915_GEM_DOMAIN_GTT;
1307         ret = drmIoctl(bufmgr_gem->fd,
1308                        DRM_IOCTL_I915_GEM_SET_DOMAIN,
1309                        &set_domain);
1310         if (ret != 0) {
1311                 DBG("%s:%d: Error setting domain %d: %s\n",
1312                     __FILE__, __LINE__, bo_gem->gem_handle,
1313                     strerror(errno));
1314         }
1315
1316         drm_intel_gem_bo_mark_mmaps_incoherent(bo);
1317         VG(VALGRIND_MAKE_MEM_DEFINED(bo_gem->gtt_virtual, bo->size));
1318         pthread_mutex_unlock(&bufmgr_gem->lock);
1319
1320         return 0;
1321 }
1322
1323 /**
1324  * Performs a mapping of the buffer object like the normal GTT
1325  * mapping, but avoids waiting for the GPU to be done reading from or
1326  * rendering to the buffer.
1327  *
1328  * This is used in the implementation of GL_ARB_map_buffer_range: The
1329  * user asks to create a buffer, then does a mapping, fills some
1330  * space, runs a drawing command, then asks to map it again without
1331  * synchronizing because it guarantees that it won't write over the
1332  * data that the GPU is busy using (or, more specifically, that if it
1333  * does write over the data, it acknowledges that rendering is
1334  * undefined).
1335  */
1336
1337 int drm_intel_gem_bo_map_unsynchronized(drm_intel_bo *bo)
1338 {
1339         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
1340         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1341         int ret;
1342
1343         /* If the CPU cache isn't coherent with the GTT, then use a
1344          * regular synchronized mapping.  The problem is that we don't
1345          * track where the buffer was last used on the CPU side in
1346          * terms of drm_intel_bo_map vs drm_intel_gem_bo_map_gtt, so
1347          * we would potentially corrupt the buffer even when the user
1348          * does reasonable things.
1349          */
1350         if (!bufmgr_gem->has_llc)
1351                 return drm_intel_gem_bo_map_gtt(bo);
1352
1353         pthread_mutex_lock(&bufmgr_gem->lock);
1354
1355         ret = map_gtt(bo);
1356         if (ret == 0) {
1357                 drm_intel_gem_bo_mark_mmaps_incoherent(bo);
1358                 VG(VALGRIND_MAKE_MEM_DEFINED(bo_gem->gtt_virtual, bo->size));
1359         }
1360
1361         pthread_mutex_unlock(&bufmgr_gem->lock);
1362
1363         return ret;
1364 }
1365
1366 static int drm_intel_gem_bo_unmap(drm_intel_bo *bo)
1367 {
1368         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
1369         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1370         int ret = 0;
1371
1372         if (bo == NULL)
1373                 return 0;
1374
1375         pthread_mutex_lock(&bufmgr_gem->lock);
1376
1377         if (bo_gem->map_count <= 0) {
1378                 DBG("attempted to unmap an unmapped bo\n");
1379                 pthread_mutex_unlock(&bufmgr_gem->lock);
1380                 /* Preserve the old behaviour of just treating this as a
1381                  * no-op rather than reporting the error.
1382                  */
1383                 return 0;
1384         }
1385
1386         if (bo_gem->mapped_cpu_write) {
1387                 struct drm_i915_gem_sw_finish sw_finish;
1388
1389                 /* Cause a flush to happen if the buffer's pinned for
1390                  * scanout, so the results show up in a timely manner.
1391                  * Unlike GTT set domains, this only does work if the
1392                  * buffer should be scanout-related.
1393                  */
1394                 VG_CLEAR(sw_finish);
1395                 sw_finish.handle = bo_gem->gem_handle;
1396                 ret = drmIoctl(bufmgr_gem->fd,
1397                                DRM_IOCTL_I915_GEM_SW_FINISH,
1398                                &sw_finish);
1399                 ret = ret == -1 ? -errno : 0;
1400
1401                 bo_gem->mapped_cpu_write = false;
1402         }
1403
1404         /* We need to unmap after every innovation as we cannot track
1405          * an open vma for every bo as that will exhaasut the system
1406          * limits and cause later failures.
1407          */
1408         if (--bo_gem->map_count == 0) {
1409                 drm_intel_gem_bo_close_vma(bufmgr_gem, bo_gem);
1410                 drm_intel_gem_bo_mark_mmaps_incoherent(bo);
1411                 bo->virtual = NULL;
1412         }
1413         pthread_mutex_unlock(&bufmgr_gem->lock);
1414
1415         return ret;
1416 }
1417
1418 int drm_intel_gem_bo_unmap_gtt(drm_intel_bo *bo)
1419 {
1420         return drm_intel_gem_bo_unmap(bo);
1421 }
1422
1423 static int
1424 drm_intel_gem_bo_subdata(drm_intel_bo *bo, unsigned long offset,
1425                          unsigned long size, const void *data)
1426 {
1427         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
1428         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1429         struct drm_i915_gem_pwrite pwrite;
1430         int ret;
1431
1432         VG_CLEAR(pwrite);
1433         pwrite.handle = bo_gem->gem_handle;
1434         pwrite.offset = offset;
1435         pwrite.size = size;
1436         pwrite.data_ptr = (uint64_t) (uintptr_t) data;
1437         ret = drmIoctl(bufmgr_gem->fd,
1438                        DRM_IOCTL_I915_GEM_PWRITE,
1439                        &pwrite);
1440         if (ret != 0) {
1441                 ret = -errno;
1442                 DBG("%s:%d: Error writing data to buffer %d: (%d %d) %s .\n",
1443                     __FILE__, __LINE__, bo_gem->gem_handle, (int)offset,
1444                     (int)size, strerror(errno));
1445         }
1446
1447         return ret;
1448 }
1449
1450 static int
1451 drm_intel_gem_get_pipe_from_crtc_id(drm_intel_bufmgr *bufmgr, int crtc_id)
1452 {
1453         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bufmgr;
1454         struct drm_i915_get_pipe_from_crtc_id get_pipe_from_crtc_id;
1455         int ret;
1456
1457         VG_CLEAR(get_pipe_from_crtc_id);
1458         get_pipe_from_crtc_id.crtc_id = crtc_id;
1459         ret = drmIoctl(bufmgr_gem->fd,
1460                        DRM_IOCTL_I915_GET_PIPE_FROM_CRTC_ID,
1461                        &get_pipe_from_crtc_id);
1462         if (ret != 0) {
1463                 /* We return -1 here to signal that we don't
1464                  * know which pipe is associated with this crtc.
1465                  * This lets the caller know that this information
1466                  * isn't available; using the wrong pipe for
1467                  * vblank waiting can cause the chipset to lock up
1468                  */
1469                 return -1;
1470         }
1471
1472         return get_pipe_from_crtc_id.pipe;
1473 }
1474
1475 static int
1476 drm_intel_gem_bo_get_subdata(drm_intel_bo *bo, unsigned long offset,
1477                              unsigned long size, void *data)
1478 {
1479         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
1480         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1481         struct drm_i915_gem_pread pread;
1482         int ret;
1483
1484         VG_CLEAR(pread);
1485         pread.handle = bo_gem->gem_handle;
1486         pread.offset = offset;
1487         pread.size = size;
1488         pread.data_ptr = (uint64_t) (uintptr_t) data;
1489         ret = drmIoctl(bufmgr_gem->fd,
1490                        DRM_IOCTL_I915_GEM_PREAD,
1491                        &pread);
1492         if (ret != 0) {
1493                 ret = -errno;
1494                 DBG("%s:%d: Error reading data from buffer %d: (%d %d) %s .\n",
1495                     __FILE__, __LINE__, bo_gem->gem_handle, (int)offset,
1496                     (int)size, strerror(errno));
1497         }
1498
1499         return ret;
1500 }
1501
1502 /** Waits for all GPU rendering with the object to have completed. */
1503 static void
1504 drm_intel_gem_bo_wait_rendering(drm_intel_bo *bo)
1505 {
1506         drm_intel_gem_bo_start_gtt_access(bo, 1);
1507 }
1508
1509 /**
1510  * Waits on a BO for the given amount of time.
1511  *
1512  * @bo: buffer object to wait for
1513  * @timeout_ns: amount of time to wait in nanoseconds.
1514  *   If value is less than 0, an infinite wait will occur.
1515  *
1516  * Returns 0 if the wait was successful ie. the last batch referencing the
1517  * object has completed within the allotted time. Otherwise some negative return
1518  * value describes the error. Of particular interest is -ETIME when the wait has
1519  * failed to yield the desired result.
1520  *
1521  * Similar to drm_intel_gem_bo_wait_rendering except a timeout parameter allows
1522  * the operation to give up after a certain amount of time. Another subtle
1523  * difference is the internal locking semantics are different (this variant does
1524  * not hold the lock for the duration of the wait). This makes the wait subject
1525  * to a larger userspace race window.
1526  *
1527  * The implementation shall wait until the object is no longer actively
1528  * referenced within a batch buffer at the time of the call. The wait will
1529  * not guarantee that the buffer is re-issued via another thread, or an flinked
1530  * handle. Userspace must make sure this race does not occur if such precision
1531  * is important.
1532  */
1533 int drm_intel_gem_bo_wait(drm_intel_bo *bo, int64_t timeout_ns)
1534 {
1535         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
1536         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1537         struct drm_i915_gem_wait wait;
1538         int ret;
1539
1540         if (!bufmgr_gem->has_wait_timeout) {
1541                 DBG("%s:%d: Timed wait is not supported. Falling back to "
1542                     "infinite wait\n", __FILE__, __LINE__);
1543                 if (timeout_ns) {
1544                         drm_intel_gem_bo_wait_rendering(bo);
1545                         return 0;
1546                 } else {
1547                         return drm_intel_gem_bo_busy(bo) ? -ETIME : 0;
1548                 }
1549         }
1550
1551         wait.bo_handle = bo_gem->gem_handle;
1552         wait.timeout_ns = timeout_ns;
1553         wait.flags = 0;
1554         ret = drmIoctl(bufmgr_gem->fd, DRM_IOCTL_I915_GEM_WAIT, &wait);
1555         if (ret == -1)
1556                 return -errno;
1557
1558         return ret;
1559 }
1560
1561 /**
1562  * Sets the object to the GTT read and possibly write domain, used by the X
1563  * 2D driver in the absence of kernel support to do drm_intel_gem_bo_map_gtt().
1564  *
1565  * In combination with drm_intel_gem_bo_pin() and manual fence management, we
1566  * can do tiled pixmaps this way.
1567  */
1568 void
1569 drm_intel_gem_bo_start_gtt_access(drm_intel_bo *bo, int write_enable)
1570 {
1571         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
1572         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1573         struct drm_i915_gem_set_domain set_domain;
1574         int ret;
1575
1576         VG_CLEAR(set_domain);
1577         set_domain.handle = bo_gem->gem_handle;
1578         set_domain.read_domains = I915_GEM_DOMAIN_GTT;
1579         set_domain.write_domain = write_enable ? I915_GEM_DOMAIN_GTT : 0;
1580         ret = drmIoctl(bufmgr_gem->fd,
1581                        DRM_IOCTL_I915_GEM_SET_DOMAIN,
1582                        &set_domain);
1583         if (ret != 0) {
1584                 DBG("%s:%d: Error setting memory domains %d (%08x %08x): %s .\n",
1585                     __FILE__, __LINE__, bo_gem->gem_handle,
1586                     set_domain.read_domains, set_domain.write_domain,
1587                     strerror(errno));
1588         }
1589 }
1590
1591 static void
1592 drm_intel_bufmgr_gem_destroy(drm_intel_bufmgr *bufmgr)
1593 {
1594         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bufmgr;
1595         int i;
1596
1597         free(bufmgr_gem->exec2_objects);
1598         free(bufmgr_gem->exec_objects);
1599         free(bufmgr_gem->exec_bos);
1600         free(bufmgr_gem->aub_filename);
1601
1602         pthread_mutex_destroy(&bufmgr_gem->lock);
1603
1604         /* Free any cached buffer objects we were going to reuse */
1605         for (i = 0; i < bufmgr_gem->num_buckets; i++) {
1606                 struct drm_intel_gem_bo_bucket *bucket =
1607                     &bufmgr_gem->cache_bucket[i];
1608                 drm_intel_bo_gem *bo_gem;
1609
1610                 while (!DRMLISTEMPTY(&bucket->head)) {
1611                         bo_gem = DRMLISTENTRY(drm_intel_bo_gem,
1612                                               bucket->head.next, head);
1613                         DRMLISTDEL(&bo_gem->head);
1614
1615                         drm_intel_gem_bo_free(&bo_gem->bo);
1616                 }
1617         }
1618
1619         free(bufmgr);
1620 }
1621
1622 /**
1623  * Adds the target buffer to the validation list and adds the relocation
1624  * to the reloc_buffer's relocation list.
1625  *
1626  * The relocation entry at the given offset must already contain the
1627  * precomputed relocation value, because the kernel will optimize out
1628  * the relocation entry write when the buffer hasn't moved from the
1629  * last known offset in target_bo.
1630  */
1631 static int
1632 do_bo_emit_reloc(drm_intel_bo *bo, uint32_t offset,
1633                  drm_intel_bo *target_bo, uint32_t target_offset,
1634                  uint32_t read_domains, uint32_t write_domain,
1635                  bool need_fence)
1636 {
1637         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
1638         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1639         drm_intel_bo_gem *target_bo_gem = (drm_intel_bo_gem *) target_bo;
1640         bool fenced_command;
1641
1642         if (bo_gem->has_error)
1643                 return -ENOMEM;
1644
1645         if (target_bo_gem->has_error) {
1646                 bo_gem->has_error = true;
1647                 return -ENOMEM;
1648         }
1649
1650         /* We never use HW fences for rendering on 965+ */
1651         if (bufmgr_gem->gen >= 4)
1652                 need_fence = false;
1653
1654         fenced_command = need_fence;
1655         if (target_bo_gem->tiling_mode == I915_TILING_NONE)
1656                 need_fence = false;
1657
1658         /* Create a new relocation list if needed */
1659         if (bo_gem->relocs == NULL && drm_intel_setup_reloc_list(bo))
1660                 return -ENOMEM;
1661
1662         /* Check overflow */
1663         assert(bo_gem->reloc_count < bufmgr_gem->max_relocs);
1664
1665         /* Check args */
1666         assert(offset <= bo->size - 4);
1667         assert((write_domain & (write_domain - 1)) == 0);
1668
1669         /* Make sure that we're not adding a reloc to something whose size has
1670          * already been accounted for.
1671          */
1672         assert(!bo_gem->used_as_reloc_target);
1673         if (target_bo_gem != bo_gem) {
1674                 target_bo_gem->used_as_reloc_target = true;
1675                 bo_gem->reloc_tree_size += target_bo_gem->reloc_tree_size;
1676         }
1677         /* An object needing a fence is a tiled buffer, so it won't have
1678          * relocs to other buffers.
1679          */
1680         if (need_fence)
1681                 target_bo_gem->reloc_tree_fences = 1;
1682         bo_gem->reloc_tree_fences += target_bo_gem->reloc_tree_fences;
1683
1684         bo_gem->relocs[bo_gem->reloc_count].offset = offset;
1685         bo_gem->relocs[bo_gem->reloc_count].delta = target_offset;
1686         bo_gem->relocs[bo_gem->reloc_count].target_handle =
1687             target_bo_gem->gem_handle;
1688         bo_gem->relocs[bo_gem->reloc_count].read_domains = read_domains;
1689         bo_gem->relocs[bo_gem->reloc_count].write_domain = write_domain;
1690         bo_gem->relocs[bo_gem->reloc_count].presumed_offset = target_bo->offset;
1691
1692         bo_gem->reloc_target_info[bo_gem->reloc_count].bo = target_bo;
1693         if (target_bo != bo)
1694                 drm_intel_gem_bo_reference(target_bo);
1695         if (fenced_command)
1696                 bo_gem->reloc_target_info[bo_gem->reloc_count].flags =
1697                         DRM_INTEL_RELOC_FENCE;
1698         else
1699                 bo_gem->reloc_target_info[bo_gem->reloc_count].flags = 0;
1700
1701         bo_gem->reloc_count++;
1702
1703         return 0;
1704 }
1705
1706 static int
1707 drm_intel_gem_bo_emit_reloc(drm_intel_bo *bo, uint32_t offset,
1708                             drm_intel_bo *target_bo, uint32_t target_offset,
1709                             uint32_t read_domains, uint32_t write_domain)
1710 {
1711         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *)bo->bufmgr;
1712
1713         return do_bo_emit_reloc(bo, offset, target_bo, target_offset,
1714                                 read_domains, write_domain,
1715                                 !bufmgr_gem->fenced_relocs);
1716 }
1717
1718 static int
1719 drm_intel_gem_bo_emit_reloc_fence(drm_intel_bo *bo, uint32_t offset,
1720                                   drm_intel_bo *target_bo,
1721                                   uint32_t target_offset,
1722                                   uint32_t read_domains, uint32_t write_domain)
1723 {
1724         return do_bo_emit_reloc(bo, offset, target_bo, target_offset,
1725                                 read_domains, write_domain, true);
1726 }
1727
1728 int
1729 drm_intel_gem_bo_get_reloc_count(drm_intel_bo *bo)
1730 {
1731         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1732
1733         return bo_gem->reloc_count;
1734 }
1735
1736 /**
1737  * Removes existing relocation entries in the BO after "start".
1738  *
1739  * This allows a user to avoid a two-step process for state setup with
1740  * counting up all the buffer objects and doing a
1741  * drm_intel_bufmgr_check_aperture_space() before emitting any of the
1742  * relocations for the state setup.  Instead, save the state of the
1743  * batchbuffer including drm_intel_gem_get_reloc_count(), emit all the
1744  * state, and then check if it still fits in the aperture.
1745  *
1746  * Any further drm_intel_bufmgr_check_aperture_space() queries
1747  * involving this buffer in the tree are undefined after this call.
1748  */
1749 void
1750 drm_intel_gem_bo_clear_relocs(drm_intel_bo *bo, int start)
1751 {
1752         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1753         int i;
1754         struct timespec time;
1755
1756         clock_gettime(CLOCK_MONOTONIC, &time);
1757
1758         assert(bo_gem->reloc_count >= start);
1759         /* Unreference the cleared target buffers */
1760         for (i = start; i < bo_gem->reloc_count; i++) {
1761                 drm_intel_bo_gem *target_bo_gem = (drm_intel_bo_gem *) bo_gem->reloc_target_info[i].bo;
1762                 if (&target_bo_gem->bo != bo) {
1763                         bo_gem->reloc_tree_fences -= target_bo_gem->reloc_tree_fences;
1764                         drm_intel_gem_bo_unreference_locked_timed(&target_bo_gem->bo,
1765                                                                   time.tv_sec);
1766                 }
1767         }
1768         bo_gem->reloc_count = start;
1769 }
1770
1771 /**
1772  * Walk the tree of relocations rooted at BO and accumulate the list of
1773  * validations to be performed and update the relocation buffers with
1774  * index values into the validation list.
1775  */
1776 static void
1777 drm_intel_gem_bo_process_reloc(drm_intel_bo *bo)
1778 {
1779         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1780         int i;
1781
1782         if (bo_gem->relocs == NULL)
1783                 return;
1784
1785         for (i = 0; i < bo_gem->reloc_count; i++) {
1786                 drm_intel_bo *target_bo = bo_gem->reloc_target_info[i].bo;
1787
1788                 if (target_bo == bo)
1789                         continue;
1790
1791                 drm_intel_gem_bo_mark_mmaps_incoherent(bo);
1792
1793                 /* Continue walking the tree depth-first. */
1794                 drm_intel_gem_bo_process_reloc(target_bo);
1795
1796                 /* Add the target to the validate list */
1797                 drm_intel_add_validate_buffer(target_bo);
1798         }
1799 }
1800
1801 static void
1802 drm_intel_gem_bo_process_reloc2(drm_intel_bo *bo)
1803 {
1804         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *)bo;
1805         int i;
1806
1807         if (bo_gem->relocs == NULL)
1808                 return;
1809
1810         for (i = 0; i < bo_gem->reloc_count; i++) {
1811                 drm_intel_bo *target_bo = bo_gem->reloc_target_info[i].bo;
1812                 int need_fence;
1813
1814                 if (target_bo == bo)
1815                         continue;
1816
1817                 drm_intel_gem_bo_mark_mmaps_incoherent(bo);
1818
1819                 /* Continue walking the tree depth-first. */
1820                 drm_intel_gem_bo_process_reloc2(target_bo);
1821
1822                 need_fence = (bo_gem->reloc_target_info[i].flags &
1823                               DRM_INTEL_RELOC_FENCE);
1824
1825                 /* Add the target to the validate list */
1826                 drm_intel_add_validate_buffer2(target_bo, need_fence);
1827         }
1828 }
1829
1830
1831 static void
1832 drm_intel_update_buffer_offsets(drm_intel_bufmgr_gem *bufmgr_gem)
1833 {
1834         int i;
1835
1836         for (i = 0; i < bufmgr_gem->exec_count; i++) {
1837                 drm_intel_bo *bo = bufmgr_gem->exec_bos[i];
1838                 drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1839
1840                 /* Update the buffer offset */
1841                 if (bufmgr_gem->exec_objects[i].offset != bo->offset) {
1842                         DBG("BO %d (%s) migrated: 0x%08lx -> 0x%08llx\n",
1843                             bo_gem->gem_handle, bo_gem->name, bo->offset,
1844                             (unsigned long long)bufmgr_gem->exec_objects[i].
1845                             offset);
1846                         bo->offset = bufmgr_gem->exec_objects[i].offset;
1847                 }
1848         }
1849 }
1850
1851 static void
1852 drm_intel_update_buffer_offsets2 (drm_intel_bufmgr_gem *bufmgr_gem)
1853 {
1854         int i;
1855
1856         for (i = 0; i < bufmgr_gem->exec_count; i++) {
1857                 drm_intel_bo *bo = bufmgr_gem->exec_bos[i];
1858                 drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *)bo;
1859
1860                 /* Update the buffer offset */
1861                 if (bufmgr_gem->exec2_objects[i].offset != bo->offset) {
1862                         DBG("BO %d (%s) migrated: 0x%08lx -> 0x%08llx\n",
1863                             bo_gem->gem_handle, bo_gem->name, bo->offset,
1864                             (unsigned long long)bufmgr_gem->exec2_objects[i].offset);
1865                         bo->offset = bufmgr_gem->exec2_objects[i].offset;
1866                 }
1867         }
1868 }
1869
1870 static void
1871 aub_out(drm_intel_bufmgr_gem *bufmgr_gem, uint32_t data)
1872 {
1873         fwrite(&data, 1, 4, bufmgr_gem->aub_file);
1874 }
1875
1876 static void
1877 aub_out_data(drm_intel_bufmgr_gem *bufmgr_gem, void *data, size_t size)
1878 {
1879         fwrite(data, 1, size, bufmgr_gem->aub_file);
1880 }
1881
1882 static void
1883 aub_write_bo_data(drm_intel_bo *bo, uint32_t offset, uint32_t size)
1884 {
1885         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
1886         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1887         uint32_t *data;
1888         unsigned int i;
1889
1890         data = malloc(bo->size);
1891         drm_intel_bo_get_subdata(bo, offset, size, data);
1892
1893         /* Easy mode: write out bo with no relocations */
1894         if (!bo_gem->reloc_count) {
1895                 aub_out_data(bufmgr_gem, data, size);
1896                 free(data);
1897                 return;
1898         }
1899
1900         /* Otherwise, handle the relocations while writing. */
1901         for (i = 0; i < size / 4; i++) {
1902                 int r;
1903                 for (r = 0; r < bo_gem->reloc_count; r++) {
1904                         struct drm_i915_gem_relocation_entry *reloc;
1905                         drm_intel_reloc_target *info;
1906
1907                         reloc = &bo_gem->relocs[r];
1908                         info = &bo_gem->reloc_target_info[r];
1909
1910                         if (reloc->offset == offset + i * 4) {
1911                                 drm_intel_bo_gem *target_gem;
1912                                 uint32_t val;
1913
1914                                 target_gem = (drm_intel_bo_gem *)info->bo;
1915
1916                                 val = reloc->delta;
1917                                 val += target_gem->aub_offset;
1918
1919                                 aub_out(bufmgr_gem, val);
1920                                 data[i] = val;
1921                                 break;
1922                         }
1923                 }
1924                 if (r == bo_gem->reloc_count) {
1925                         /* no relocation, just the data */
1926                         aub_out(bufmgr_gem, data[i]);
1927                 }
1928         }
1929
1930         free(data);
1931 }
1932
1933 static void
1934 aub_bo_get_address(drm_intel_bo *bo)
1935 {
1936         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
1937         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1938
1939         /* Give the object a graphics address in the AUB file.  We
1940          * don't just use the GEM object address because we do AUB
1941          * dumping before execution -- we want to successfully log
1942          * when the hardware might hang, and we might even want to aub
1943          * capture for a driver trying to execute on a different
1944          * generation of hardware by disabling the actual kernel exec
1945          * call.
1946          */
1947         bo_gem->aub_offset = bufmgr_gem->aub_offset;
1948         bufmgr_gem->aub_offset += bo->size;
1949         /* XXX: Handle aperture overflow. */
1950         assert(bufmgr_gem->aub_offset < 256 * 1024 * 1024);
1951 }
1952
1953 static void
1954 aub_write_trace_block(drm_intel_bo *bo, uint32_t type, uint32_t subtype,
1955                       uint32_t offset, uint32_t size)
1956 {
1957         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
1958         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
1959
1960         aub_out(bufmgr_gem,
1961                 CMD_AUB_TRACE_HEADER_BLOCK |
1962                 ((bufmgr_gem->gen >= 8 ? 6 : 5) - 2));
1963         aub_out(bufmgr_gem,
1964                 AUB_TRACE_MEMTYPE_GTT | type | AUB_TRACE_OP_DATA_WRITE);
1965         aub_out(bufmgr_gem, subtype);
1966         aub_out(bufmgr_gem, bo_gem->aub_offset + offset);
1967         aub_out(bufmgr_gem, size);
1968         if (bufmgr_gem->gen >= 8)
1969                 aub_out(bufmgr_gem, 0);
1970         aub_write_bo_data(bo, offset, size);
1971 }
1972
1973 /**
1974  * Break up large objects into multiple writes.  Otherwise a 128kb VBO
1975  * would overflow the 16 bits of size field in the packet header and
1976  * everything goes badly after that.
1977  */
1978 static void
1979 aub_write_large_trace_block(drm_intel_bo *bo, uint32_t type, uint32_t subtype,
1980                             uint32_t offset, uint32_t size)
1981 {
1982         uint32_t block_size;
1983         uint32_t sub_offset;
1984
1985         for (sub_offset = 0; sub_offset < size; sub_offset += block_size) {
1986                 block_size = size - sub_offset;
1987
1988                 if (block_size > 8 * 4096)
1989                         block_size = 8 * 4096;
1990
1991                 aub_write_trace_block(bo, type, subtype, offset + sub_offset,
1992                                       block_size);
1993         }
1994 }
1995
1996 static void
1997 aub_write_bo(drm_intel_bo *bo)
1998 {
1999         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
2000         uint32_t offset = 0;
2001         unsigned i;
2002
2003         aub_bo_get_address(bo);
2004
2005         /* Write out each annotated section separately. */
2006         for (i = 0; i < bo_gem->aub_annotation_count; ++i) {
2007                 drm_intel_aub_annotation *annotation =
2008                         &bo_gem->aub_annotations[i];
2009                 uint32_t ending_offset = annotation->ending_offset;
2010                 if (ending_offset > bo->size)
2011                         ending_offset = bo->size;
2012                 if (ending_offset > offset) {
2013                         aub_write_large_trace_block(bo, annotation->type,
2014                                                     annotation->subtype,
2015                                                     offset,
2016                                                     ending_offset - offset);
2017                         offset = ending_offset;
2018                 }
2019         }
2020
2021         /* Write out any remaining unannotated data */
2022         if (offset < bo->size) {
2023                 aub_write_large_trace_block(bo, AUB_TRACE_TYPE_NOTYPE, 0,
2024                                             offset, bo->size - offset);
2025         }
2026 }
2027
2028 /*
2029  * Make a ringbuffer on fly and dump it
2030  */
2031 static void
2032 aub_build_dump_ringbuffer(drm_intel_bufmgr_gem *bufmgr_gem,
2033                           uint32_t batch_buffer, int ring_flag)
2034 {
2035         uint32_t ringbuffer[4096];
2036         int ring = AUB_TRACE_TYPE_RING_PRB0; /* The default ring */
2037         int ring_count = 0;
2038
2039         if (ring_flag == I915_EXEC_BSD)
2040                 ring = AUB_TRACE_TYPE_RING_PRB1;
2041         else if (ring_flag == I915_EXEC_BLT)
2042                 ring = AUB_TRACE_TYPE_RING_PRB2;
2043
2044         /* Make a ring buffer to execute our batchbuffer. */
2045         memset(ringbuffer, 0, sizeof(ringbuffer));
2046         if (bufmgr_gem->gen >= 8) {
2047                 ringbuffer[ring_count++] = AUB_MI_BATCH_BUFFER_START | (3 - 2);
2048                 ringbuffer[ring_count++] = batch_buffer;
2049                 ringbuffer[ring_count++] = 0;
2050         } else {
2051                 ringbuffer[ring_count++] = AUB_MI_BATCH_BUFFER_START;
2052                 ringbuffer[ring_count++] = batch_buffer;
2053         }
2054
2055         /* Write out the ring.  This appears to trigger execution of
2056          * the ring in the simulator.
2057          */
2058         aub_out(bufmgr_gem,
2059                 CMD_AUB_TRACE_HEADER_BLOCK |
2060                 ((bufmgr_gem->gen >= 8 ? 6 : 5) - 2));
2061         aub_out(bufmgr_gem,
2062                 AUB_TRACE_MEMTYPE_GTT | ring | AUB_TRACE_OP_COMMAND_WRITE);
2063         aub_out(bufmgr_gem, 0); /* general/surface subtype */
2064         aub_out(bufmgr_gem, bufmgr_gem->aub_offset);
2065         aub_out(bufmgr_gem, ring_count * 4);
2066         if (bufmgr_gem->gen >= 8)
2067                 aub_out(bufmgr_gem, 0);
2068
2069         /* FIXME: Need some flush operations here? */
2070         aub_out_data(bufmgr_gem, ringbuffer, ring_count * 4);
2071
2072         /* Update offset pointer */
2073         bufmgr_gem->aub_offset += 4096;
2074 }
2075
2076 void
2077 drm_intel_gem_bo_aub_dump_bmp(drm_intel_bo *bo,
2078                               int x1, int y1, int width, int height,
2079                               enum aub_dump_bmp_format format,
2080                               int pitch, int offset)
2081 {
2082         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
2083         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *)bo;
2084         uint32_t cpp;
2085
2086         switch (format) {
2087         case AUB_DUMP_BMP_FORMAT_8BIT:
2088                 cpp = 1;
2089                 break;
2090         case AUB_DUMP_BMP_FORMAT_ARGB_4444:
2091                 cpp = 2;
2092                 break;
2093         case AUB_DUMP_BMP_FORMAT_ARGB_0888:
2094         case AUB_DUMP_BMP_FORMAT_ARGB_8888:
2095                 cpp = 4;
2096                 break;
2097         default:
2098                 printf("Unknown AUB dump format %d\n", format);
2099                 return;
2100         }
2101
2102         if (!bufmgr_gem->aub_file)
2103                 return;
2104
2105         aub_out(bufmgr_gem, CMD_AUB_DUMP_BMP | 4);
2106         aub_out(bufmgr_gem, (y1 << 16) | x1);
2107         aub_out(bufmgr_gem,
2108                 (format << 24) |
2109                 (cpp << 19) |
2110                 pitch / 4);
2111         aub_out(bufmgr_gem, (height << 16) | width);
2112         aub_out(bufmgr_gem, bo_gem->aub_offset + offset);
2113         aub_out(bufmgr_gem,
2114                 ((bo_gem->tiling_mode != I915_TILING_NONE) ? (1 << 2) : 0) |
2115                 ((bo_gem->tiling_mode == I915_TILING_Y) ? (1 << 3) : 0));
2116 }
2117
2118 static void
2119 aub_exec(drm_intel_bo *bo, int ring_flag, int used)
2120 {
2121         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
2122         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
2123         int i;
2124         bool batch_buffer_needs_annotations;
2125
2126         if (!bufmgr_gem->aub_file)
2127                 return;
2128
2129         /* If batch buffer is not annotated, annotate it the best we
2130          * can.
2131          */
2132         batch_buffer_needs_annotations = bo_gem->aub_annotation_count == 0;
2133         if (batch_buffer_needs_annotations) {
2134                 drm_intel_aub_annotation annotations[2] = {
2135                         { AUB_TRACE_TYPE_BATCH, 0, used },
2136                         { AUB_TRACE_TYPE_NOTYPE, 0, bo->size }
2137                 };
2138                 drm_intel_bufmgr_gem_set_aub_annotations(bo, annotations, 2);
2139         }
2140
2141         /* Write out all buffers to AUB memory */
2142         for (i = 0; i < bufmgr_gem->exec_count; i++) {
2143                 aub_write_bo(bufmgr_gem->exec_bos[i]);
2144         }
2145
2146         /* Remove any annotations we added */
2147         if (batch_buffer_needs_annotations)
2148                 drm_intel_bufmgr_gem_set_aub_annotations(bo, NULL, 0);
2149
2150         /* Dump ring buffer */
2151         aub_build_dump_ringbuffer(bufmgr_gem, bo_gem->aub_offset, ring_flag);
2152
2153         fflush(bufmgr_gem->aub_file);
2154
2155         /*
2156          * One frame has been dumped. So reset the aub_offset for the next frame.
2157          *
2158          * FIXME: Can we do this?
2159          */
2160         bufmgr_gem->aub_offset = 0x10000;
2161 }
2162
2163 static int
2164 drm_intel_gem_bo_exec(drm_intel_bo *bo, int used,
2165                       drm_clip_rect_t * cliprects, int num_cliprects, int DR4)
2166 {
2167         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
2168         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
2169         struct drm_i915_gem_execbuffer execbuf;
2170         int ret, i;
2171
2172         if (bo_gem->has_error)
2173                 return -ENOMEM;
2174
2175         pthread_mutex_lock(&bufmgr_gem->lock);
2176         /* Update indices and set up the validate list. */
2177         drm_intel_gem_bo_process_reloc(bo);
2178
2179         /* Add the batch buffer to the validation list.  There are no
2180          * relocations pointing to it.
2181          */
2182         drm_intel_add_validate_buffer(bo);
2183
2184         VG_CLEAR(execbuf);
2185         execbuf.buffers_ptr = (uintptr_t) bufmgr_gem->exec_objects;
2186         execbuf.buffer_count = bufmgr_gem->exec_count;
2187         execbuf.batch_start_offset = 0;
2188         execbuf.batch_len = used;
2189         execbuf.cliprects_ptr = (uintptr_t) cliprects;
2190         execbuf.num_cliprects = num_cliprects;
2191         execbuf.DR1 = 0;
2192         execbuf.DR4 = DR4;
2193
2194         ret = drmIoctl(bufmgr_gem->fd,
2195                        DRM_IOCTL_I915_GEM_EXECBUFFER,
2196                        &execbuf);
2197         if (ret != 0) {
2198                 ret = -errno;
2199                 if (errno == ENOSPC) {
2200                         DBG("Execbuffer fails to pin. "
2201                             "Estimate: %u. Actual: %u. Available: %u\n",
2202                             drm_intel_gem_estimate_batch_space(bufmgr_gem->exec_bos,
2203                                                                bufmgr_gem->
2204                                                                exec_count),
2205                             drm_intel_gem_compute_batch_space(bufmgr_gem->exec_bos,
2206                                                               bufmgr_gem->
2207                                                               exec_count),
2208                             (unsigned int)bufmgr_gem->gtt_size);
2209                 }
2210         }
2211         drm_intel_update_buffer_offsets(bufmgr_gem);
2212
2213         if (bufmgr_gem->bufmgr.debug)
2214                 drm_intel_gem_dump_validation_list(bufmgr_gem);
2215
2216         for (i = 0; i < bufmgr_gem->exec_count; i++) {
2217                 drm_intel_bo *bo = bufmgr_gem->exec_bos[i];
2218                 drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
2219
2220                 /* Disconnect the buffer from the validate list */
2221                 bo_gem->validate_index = -1;
2222                 bufmgr_gem->exec_bos[i] = NULL;
2223         }
2224         bufmgr_gem->exec_count = 0;
2225         pthread_mutex_unlock(&bufmgr_gem->lock);
2226
2227         return ret;
2228 }
2229
2230 static int
2231 do_exec2(drm_intel_bo *bo, int used, drm_intel_context *ctx,
2232          drm_clip_rect_t *cliprects, int num_cliprects, int DR4,
2233          unsigned int flags)
2234 {
2235         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *)bo->bufmgr;
2236         struct drm_i915_gem_execbuffer2 execbuf;
2237         int ret = 0;
2238         int i;
2239
2240         switch (flags & 0x7) {
2241         default:
2242                 return -EINVAL;
2243         case I915_EXEC_BLT:
2244                 if (!bufmgr_gem->has_blt)
2245                         return -EINVAL;
2246                 break;
2247         case I915_EXEC_BSD:
2248                 if (!bufmgr_gem->has_bsd)
2249                         return -EINVAL;
2250                 break;
2251         case I915_EXEC_VEBOX:
2252                 if (!bufmgr_gem->has_vebox)
2253                         return -EINVAL;
2254                 break;
2255         case I915_EXEC_RENDER:
2256         case I915_EXEC_DEFAULT:
2257                 break;
2258         }
2259
2260         pthread_mutex_lock(&bufmgr_gem->lock);
2261         /* Update indices and set up the validate list. */
2262         drm_intel_gem_bo_process_reloc2(bo);
2263
2264         /* Add the batch buffer to the validation list.  There are no relocations
2265          * pointing to it.
2266          */
2267         drm_intel_add_validate_buffer2(bo, 0);
2268
2269         VG_CLEAR(execbuf);
2270         execbuf.buffers_ptr = (uintptr_t)bufmgr_gem->exec2_objects;
2271         execbuf.buffer_count = bufmgr_gem->exec_count;
2272         execbuf.batch_start_offset = 0;
2273         execbuf.batch_len = used;
2274         execbuf.cliprects_ptr = (uintptr_t)cliprects;
2275         execbuf.num_cliprects = num_cliprects;
2276         execbuf.DR1 = 0;
2277         execbuf.DR4 = DR4;
2278         execbuf.flags = flags;
2279         if (ctx == NULL)
2280                 i915_execbuffer2_set_context_id(execbuf, 0);
2281         else
2282                 i915_execbuffer2_set_context_id(execbuf, ctx->ctx_id);
2283         execbuf.rsvd2 = 0;
2284
2285         aub_exec(bo, flags, used);
2286
2287         if (bufmgr_gem->no_exec)
2288                 goto skip_execution;
2289
2290         ret = drmIoctl(bufmgr_gem->fd,
2291                        DRM_IOCTL_I915_GEM_EXECBUFFER2,
2292                        &execbuf);
2293         if (ret != 0) {
2294                 ret = -errno;
2295                 if (ret == -ENOSPC) {
2296                         DBG("Execbuffer fails to pin. "
2297                             "Estimate: %u. Actual: %u. Available: %u\n",
2298                             drm_intel_gem_estimate_batch_space(bufmgr_gem->exec_bos,
2299                                                                bufmgr_gem->exec_count),
2300                             drm_intel_gem_compute_batch_space(bufmgr_gem->exec_bos,
2301                                                               bufmgr_gem->exec_count),
2302                             (unsigned int) bufmgr_gem->gtt_size);
2303                 }
2304         }
2305         drm_intel_update_buffer_offsets2(bufmgr_gem);
2306
2307 skip_execution:
2308         if (bufmgr_gem->bufmgr.debug)
2309                 drm_intel_gem_dump_validation_list(bufmgr_gem);
2310
2311         for (i = 0; i < bufmgr_gem->exec_count; i++) {
2312                 drm_intel_bo *bo = bufmgr_gem->exec_bos[i];
2313                 drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *)bo;
2314
2315                 /* Disconnect the buffer from the validate list */
2316                 bo_gem->validate_index = -1;
2317                 bufmgr_gem->exec_bos[i] = NULL;
2318         }
2319         bufmgr_gem->exec_count = 0;
2320         pthread_mutex_unlock(&bufmgr_gem->lock);
2321
2322         return ret;
2323 }
2324
2325 static int
2326 drm_intel_gem_bo_exec2(drm_intel_bo *bo, int used,
2327                        drm_clip_rect_t *cliprects, int num_cliprects,
2328                        int DR4)
2329 {
2330         return do_exec2(bo, used, NULL, cliprects, num_cliprects, DR4,
2331                         I915_EXEC_RENDER);
2332 }
2333
2334 static int
2335 drm_intel_gem_bo_mrb_exec2(drm_intel_bo *bo, int used,
2336                         drm_clip_rect_t *cliprects, int num_cliprects, int DR4,
2337                         unsigned int flags)
2338 {
2339         return do_exec2(bo, used, NULL, cliprects, num_cliprects, DR4,
2340                         flags);
2341 }
2342
2343 int
2344 drm_intel_gem_bo_context_exec(drm_intel_bo *bo, drm_intel_context *ctx,
2345                               int used, unsigned int flags)
2346 {
2347         return do_exec2(bo, used, ctx, NULL, 0, 0, flags);
2348 }
2349
2350 static int
2351 drm_intel_gem_bo_pin(drm_intel_bo *bo, uint32_t alignment)
2352 {
2353         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
2354         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
2355         struct drm_i915_gem_pin pin;
2356         int ret;
2357
2358         VG_CLEAR(pin);
2359         pin.handle = bo_gem->gem_handle;
2360         pin.alignment = alignment;
2361
2362         ret = drmIoctl(bufmgr_gem->fd,
2363                        DRM_IOCTL_I915_GEM_PIN,
2364                        &pin);
2365         if (ret != 0)
2366                 return -errno;
2367
2368         bo->offset = pin.offset;
2369         return 0;
2370 }
2371
2372 static int
2373 drm_intel_gem_bo_unpin(drm_intel_bo *bo)
2374 {
2375         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
2376         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
2377         struct drm_i915_gem_unpin unpin;
2378         int ret;
2379
2380         VG_CLEAR(unpin);
2381         unpin.handle = bo_gem->gem_handle;
2382
2383         ret = drmIoctl(bufmgr_gem->fd, DRM_IOCTL_I915_GEM_UNPIN, &unpin);
2384         if (ret != 0)
2385                 return -errno;
2386
2387         return 0;
2388 }
2389
2390 static int
2391 drm_intel_gem_bo_set_tiling_internal(drm_intel_bo *bo,
2392                                      uint32_t tiling_mode,
2393                                      uint32_t stride)
2394 {
2395         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
2396         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
2397         struct drm_i915_gem_set_tiling set_tiling;
2398         int ret;
2399
2400         if (bo_gem->global_name == 0 &&
2401             tiling_mode == bo_gem->tiling_mode &&
2402             stride == bo_gem->stride)
2403                 return 0;
2404
2405         memset(&set_tiling, 0, sizeof(set_tiling));
2406         do {
2407                 /* set_tiling is slightly broken and overwrites the
2408                  * input on the error path, so we have to open code
2409                  * rmIoctl.
2410                  */
2411                 set_tiling.handle = bo_gem->gem_handle;
2412                 set_tiling.tiling_mode = tiling_mode;
2413                 set_tiling.stride = stride;
2414
2415                 ret = ioctl(bufmgr_gem->fd,
2416                             DRM_IOCTL_I915_GEM_SET_TILING,
2417                             &set_tiling);
2418         } while (ret == -1 && (errno == EINTR || errno == EAGAIN));
2419         if (ret == -1)
2420                 return -errno;
2421
2422         bo_gem->tiling_mode = set_tiling.tiling_mode;
2423         bo_gem->swizzle_mode = set_tiling.swizzle_mode;
2424         bo_gem->stride = set_tiling.stride;
2425         return 0;
2426 }
2427
2428 static int
2429 drm_intel_gem_bo_set_tiling(drm_intel_bo *bo, uint32_t * tiling_mode,
2430                             uint32_t stride)
2431 {
2432         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
2433         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
2434         int ret;
2435
2436         /* Linear buffers have no stride. By ensuring that we only ever use
2437          * stride 0 with linear buffers, we simplify our code.
2438          */
2439         if (*tiling_mode == I915_TILING_NONE)
2440                 stride = 0;
2441
2442         ret = drm_intel_gem_bo_set_tiling_internal(bo, *tiling_mode, stride);
2443         if (ret == 0)
2444                 drm_intel_bo_gem_set_in_aperture_size(bufmgr_gem, bo_gem);
2445
2446         *tiling_mode = bo_gem->tiling_mode;
2447         return ret;
2448 }
2449
2450 static int
2451 drm_intel_gem_bo_get_tiling(drm_intel_bo *bo, uint32_t * tiling_mode,
2452                             uint32_t * swizzle_mode)
2453 {
2454         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
2455
2456         *tiling_mode = bo_gem->tiling_mode;
2457         *swizzle_mode = bo_gem->swizzle_mode;
2458         return 0;
2459 }
2460
2461 drm_intel_bo *
2462 drm_intel_bo_gem_create_from_prime(drm_intel_bufmgr *bufmgr, int prime_fd, int size)
2463 {
2464         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bufmgr;
2465         int ret;
2466         uint32_t handle;
2467         drm_intel_bo_gem *bo_gem;
2468         struct drm_i915_gem_get_tiling get_tiling;
2469         drmMMListHead *list;
2470
2471         ret = drmPrimeFDToHandle(bufmgr_gem->fd, prime_fd, &handle);
2472
2473         /*
2474          * See if the kernel has already returned this buffer to us. Just as
2475          * for named buffers, we must not create two bo's pointing at the same
2476          * kernel object
2477          */
2478         for (list = bufmgr_gem->named.next;
2479              list != &bufmgr_gem->named;
2480              list = list->next) {
2481                 bo_gem = DRMLISTENTRY(drm_intel_bo_gem, list, name_list);
2482                 if (bo_gem->gem_handle == handle) {
2483                         drm_intel_gem_bo_reference(&bo_gem->bo);
2484                         return &bo_gem->bo;
2485                 }
2486         }
2487
2488         if (ret) {
2489           fprintf(stderr,"ret is %d %d\n", ret, errno);
2490                 return NULL;
2491         }
2492
2493         bo_gem = calloc(1, sizeof(*bo_gem));
2494         if (!bo_gem)
2495                 return NULL;
2496
2497         /* Determine size of bo.  The fd-to-handle ioctl really should
2498          * return the size, but it doesn't.  If we have kernel 3.12 or
2499          * later, we can lseek on the prime fd to get the size.  Older
2500          * kernels will just fail, in which case we fall back to the
2501          * provided (estimated or guess size). */
2502         ret = lseek(prime_fd, 0, SEEK_END);
2503         if (ret != -1)
2504                 bo_gem->bo.size = ret;
2505         else
2506                 bo_gem->bo.size = size;
2507
2508         bo_gem->bo.handle = handle;
2509         bo_gem->bo.bufmgr = bufmgr;
2510
2511         bo_gem->gem_handle = handle;
2512
2513         atomic_set(&bo_gem->refcount, 1);
2514
2515         bo_gem->name = "prime";
2516         bo_gem->validate_index = -1;
2517         bo_gem->reloc_tree_fences = 0;
2518         bo_gem->used_as_reloc_target = false;
2519         bo_gem->has_error = false;
2520         bo_gem->reusable = false;
2521
2522         DRMINITLISTHEAD(&bo_gem->vma_list);
2523         DRMLISTADDTAIL(&bo_gem->name_list, &bufmgr_gem->named);
2524
2525         VG_CLEAR(get_tiling);
2526         get_tiling.handle = bo_gem->gem_handle;
2527         ret = drmIoctl(bufmgr_gem->fd,
2528                        DRM_IOCTL_I915_GEM_GET_TILING,
2529                        &get_tiling);
2530         if (ret != 0) {
2531                 drm_intel_gem_bo_unreference(&bo_gem->bo);
2532                 return NULL;
2533         }
2534         bo_gem->tiling_mode = get_tiling.tiling_mode;
2535         bo_gem->swizzle_mode = get_tiling.swizzle_mode;
2536         /* XXX stride is unknown */
2537         drm_intel_bo_gem_set_in_aperture_size(bufmgr_gem, bo_gem);
2538
2539         return &bo_gem->bo;
2540 }
2541
2542 int
2543 drm_intel_bo_gem_export_to_prime(drm_intel_bo *bo, int *prime_fd)
2544 {
2545         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
2546         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
2547
2548         if (DRMLISTEMPTY(&bo_gem->name_list))
2549                 DRMLISTADDTAIL(&bo_gem->name_list, &bufmgr_gem->named);
2550
2551         if (drmPrimeHandleToFD(bufmgr_gem->fd, bo_gem->gem_handle,
2552                                DRM_CLOEXEC, prime_fd) != 0)
2553                 return -errno;
2554
2555         bo_gem->reusable = false;
2556
2557         return 0;
2558 }
2559
2560 static int
2561 drm_intel_gem_bo_flink(drm_intel_bo *bo, uint32_t * name)
2562 {
2563         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bo->bufmgr;
2564         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
2565         int ret;
2566
2567         if (!bo_gem->global_name) {
2568                 struct drm_gem_flink flink;
2569
2570                 VG_CLEAR(flink);
2571                 flink.handle = bo_gem->gem_handle;
2572
2573                 ret = drmIoctl(bufmgr_gem->fd, DRM_IOCTL_GEM_FLINK, &flink);
2574                 if (ret != 0)
2575                         return -errno;
2576
2577                 bo_gem->global_name = flink.name;
2578                 bo_gem->reusable = false;
2579
2580                 if (DRMLISTEMPTY(&bo_gem->name_list))
2581                         DRMLISTADDTAIL(&bo_gem->name_list, &bufmgr_gem->named);
2582         }
2583
2584         *name = bo_gem->global_name;
2585         return 0;
2586 }
2587
2588 /**
2589  * Enables unlimited caching of buffer objects for reuse.
2590  *
2591  * This is potentially very memory expensive, as the cache at each bucket
2592  * size is only bounded by how many buffers of that size we've managed to have
2593  * in flight at once.
2594  */
2595 void
2596 drm_intel_bufmgr_gem_enable_reuse(drm_intel_bufmgr *bufmgr)
2597 {
2598         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *) bufmgr;
2599
2600         bufmgr_gem->bo_reuse = true;
2601 }
2602
2603 /**
2604  * Enable use of fenced reloc type.
2605  *
2606  * New code should enable this to avoid unnecessary fence register
2607  * allocation.  If this option is not enabled, all relocs will have fence
2608  * register allocated.
2609  */
2610 void
2611 drm_intel_bufmgr_gem_enable_fenced_relocs(drm_intel_bufmgr *bufmgr)
2612 {
2613         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *)bufmgr;
2614
2615         if (bufmgr_gem->bufmgr.bo_exec == drm_intel_gem_bo_exec2)
2616                 bufmgr_gem->fenced_relocs = true;
2617 }
2618
2619 /**
2620  * Return the additional aperture space required by the tree of buffer objects
2621  * rooted at bo.
2622  */
2623 static int
2624 drm_intel_gem_bo_get_aperture_space(drm_intel_bo *bo)
2625 {
2626         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
2627         int i;
2628         int total = 0;
2629
2630         if (bo == NULL || bo_gem->included_in_check_aperture)
2631                 return 0;
2632
2633         total += bo->size;
2634         bo_gem->included_in_check_aperture = true;
2635
2636         for (i = 0; i < bo_gem->reloc_count; i++)
2637                 total +=
2638                     drm_intel_gem_bo_get_aperture_space(bo_gem->
2639                                                         reloc_target_info[i].bo);
2640
2641         return total;
2642 }
2643
2644 /**
2645  * Count the number of buffers in this list that need a fence reg
2646  *
2647  * If the count is greater than the number of available regs, we'll have
2648  * to ask the caller to resubmit a batch with fewer tiled buffers.
2649  *
2650  * This function over-counts if the same buffer is used multiple times.
2651  */
2652 static unsigned int
2653 drm_intel_gem_total_fences(drm_intel_bo ** bo_array, int count)
2654 {
2655         int i;
2656         unsigned int total = 0;
2657
2658         for (i = 0; i < count; i++) {
2659                 drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo_array[i];
2660
2661                 if (bo_gem == NULL)
2662                         continue;
2663
2664                 total += bo_gem->reloc_tree_fences;
2665         }
2666         return total;
2667 }
2668
2669 /**
2670  * Clear the flag set by drm_intel_gem_bo_get_aperture_space() so we're ready
2671  * for the next drm_intel_bufmgr_check_aperture_space() call.
2672  */
2673 static void
2674 drm_intel_gem_bo_clear_aperture_space_flag(drm_intel_bo *bo)
2675 {
2676         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
2677         int i;
2678
2679         if (bo == NULL || !bo_gem->included_in_check_aperture)
2680                 return;
2681
2682         bo_gem->included_in_check_aperture = false;
2683
2684         for (i = 0; i < bo_gem->reloc_count; i++)
2685                 drm_intel_gem_bo_clear_aperture_space_flag(bo_gem->
2686                                                            reloc_target_info[i].bo);
2687 }
2688
2689 /**
2690  * Return a conservative estimate for the amount of aperture required
2691  * for a collection of buffers. This may double-count some buffers.
2692  */
2693 static unsigned int
2694 drm_intel_gem_estimate_batch_space(drm_intel_bo **bo_array, int count)
2695 {
2696         int i;
2697         unsigned int total = 0;
2698
2699         for (i = 0; i < count; i++) {
2700                 drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo_array[i];
2701                 if (bo_gem != NULL)
2702                         total += bo_gem->reloc_tree_size;
2703         }
2704         return total;
2705 }
2706
2707 /**
2708  * Return the amount of aperture needed for a collection of buffers.
2709  * This avoids double counting any buffers, at the cost of looking
2710  * at every buffer in the set.
2711  */
2712 static unsigned int
2713 drm_intel_gem_compute_batch_space(drm_intel_bo **bo_array, int count)
2714 {
2715         int i;
2716         unsigned int total = 0;
2717
2718         for (i = 0; i < count; i++) {
2719                 total += drm_intel_gem_bo_get_aperture_space(bo_array[i]);
2720                 /* For the first buffer object in the array, we get an
2721                  * accurate count back for its reloc_tree size (since nothing
2722                  * had been flagged as being counted yet).  We can save that
2723                  * value out as a more conservative reloc_tree_size that
2724                  * avoids double-counting target buffers.  Since the first
2725                  * buffer happens to usually be the batch buffer in our
2726                  * callers, this can pull us back from doing the tree
2727                  * walk on every new batch emit.
2728                  */
2729                 if (i == 0) {
2730                         drm_intel_bo_gem *bo_gem =
2731                             (drm_intel_bo_gem *) bo_array[i];
2732                         bo_gem->reloc_tree_size = total;
2733                 }
2734         }
2735
2736         for (i = 0; i < count; i++)
2737                 drm_intel_gem_bo_clear_aperture_space_flag(bo_array[i]);
2738         return total;
2739 }
2740
2741 /**
2742  * Return -1 if the batchbuffer should be flushed before attempting to
2743  * emit rendering referencing the buffers pointed to by bo_array.
2744  *
2745  * This is required because if we try to emit a batchbuffer with relocations
2746  * to a tree of buffers that won't simultaneously fit in the aperture,
2747  * the rendering will return an error at a point where the software is not
2748  * prepared to recover from it.
2749  *
2750  * However, we also want to emit the batchbuffer significantly before we reach
2751  * the limit, as a series of batchbuffers each of which references buffers
2752  * covering almost all of the aperture means that at each emit we end up
2753  * waiting to evict a buffer from the last rendering, and we get synchronous
2754  * performance.  By emitting smaller batchbuffers, we eat some CPU overhead to
2755  * get better parallelism.
2756  */
2757 static int
2758 drm_intel_gem_check_aperture_space(drm_intel_bo **bo_array, int count)
2759 {
2760         drm_intel_bufmgr_gem *bufmgr_gem =
2761             (drm_intel_bufmgr_gem *) bo_array[0]->bufmgr;
2762         unsigned int total = 0;
2763         unsigned int threshold = bufmgr_gem->gtt_size * 3 / 4;
2764         int total_fences;
2765
2766         /* Check for fence reg constraints if necessary */
2767         if (bufmgr_gem->available_fences) {
2768                 total_fences = drm_intel_gem_total_fences(bo_array, count);
2769                 if (total_fences > bufmgr_gem->available_fences)
2770                         return -ENOSPC;
2771         }
2772
2773         total = drm_intel_gem_estimate_batch_space(bo_array, count);
2774
2775         if (total > threshold)
2776                 total = drm_intel_gem_compute_batch_space(bo_array, count);
2777
2778         if (total > threshold) {
2779                 DBG("check_space: overflowed available aperture, "
2780                     "%dkb vs %dkb\n",
2781                     total / 1024, (int)bufmgr_gem->gtt_size / 1024);
2782                 return -ENOSPC;
2783         } else {
2784                 DBG("drm_check_space: total %dkb vs bufgr %dkb\n", total / 1024,
2785                     (int)bufmgr_gem->gtt_size / 1024);
2786                 return 0;
2787         }
2788 }
2789
2790 /*
2791  * Disable buffer reuse for objects which are shared with the kernel
2792  * as scanout buffers
2793  */
2794 static int
2795 drm_intel_gem_bo_disable_reuse(drm_intel_bo *bo)
2796 {
2797         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
2798
2799         bo_gem->reusable = false;
2800         return 0;
2801 }
2802
2803 static int
2804 drm_intel_gem_bo_is_reusable(drm_intel_bo *bo)
2805 {
2806         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
2807
2808         return bo_gem->reusable;
2809 }
2810
2811 static int
2812 _drm_intel_gem_bo_references(drm_intel_bo *bo, drm_intel_bo *target_bo)
2813 {
2814         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
2815         int i;
2816
2817         for (i = 0; i < bo_gem->reloc_count; i++) {
2818                 if (bo_gem->reloc_target_info[i].bo == target_bo)
2819                         return 1;
2820                 if (bo == bo_gem->reloc_target_info[i].bo)
2821                         continue;
2822                 if (_drm_intel_gem_bo_references(bo_gem->reloc_target_info[i].bo,
2823                                                 target_bo))
2824                         return 1;
2825         }
2826
2827         return 0;
2828 }
2829
2830 /** Return true if target_bo is referenced by bo's relocation tree. */
2831 static int
2832 drm_intel_gem_bo_references(drm_intel_bo *bo, drm_intel_bo *target_bo)
2833 {
2834         drm_intel_bo_gem *target_bo_gem = (drm_intel_bo_gem *) target_bo;
2835
2836         if (bo == NULL || target_bo == NULL)
2837                 return 0;
2838         if (target_bo_gem->used_as_reloc_target)
2839                 return _drm_intel_gem_bo_references(bo, target_bo);
2840         return 0;
2841 }
2842
2843 static void
2844 add_bucket(drm_intel_bufmgr_gem *bufmgr_gem, int size)
2845 {
2846         unsigned int i = bufmgr_gem->num_buckets;
2847
2848         assert(i < ARRAY_SIZE(bufmgr_gem->cache_bucket));
2849
2850         DRMINITLISTHEAD(&bufmgr_gem->cache_bucket[i].head);
2851         bufmgr_gem->cache_bucket[i].size = size;
2852         bufmgr_gem->num_buckets++;
2853 }
2854
2855 static void
2856 init_cache_buckets(drm_intel_bufmgr_gem *bufmgr_gem)
2857 {
2858         unsigned long size, cache_max_size = 64 * 1024 * 1024;
2859
2860         /* OK, so power of two buckets was too wasteful of memory.
2861          * Give 3 other sizes between each power of two, to hopefully
2862          * cover things accurately enough.  (The alternative is
2863          * probably to just go for exact matching of sizes, and assume
2864          * that for things like composited window resize the tiled
2865          * width/height alignment and rounding of sizes to pages will
2866          * get us useful cache hit rates anyway)
2867          */
2868         add_bucket(bufmgr_gem, 4096);
2869         add_bucket(bufmgr_gem, 4096 * 2);
2870         add_bucket(bufmgr_gem, 4096 * 3);
2871
2872         /* Initialize the linked lists for BO reuse cache. */
2873         for (size = 4 * 4096; size <= cache_max_size; size *= 2) {
2874                 add_bucket(bufmgr_gem, size);
2875
2876                 add_bucket(bufmgr_gem, size + size * 1 / 4);
2877                 add_bucket(bufmgr_gem, size + size * 2 / 4);
2878                 add_bucket(bufmgr_gem, size + size * 3 / 4);
2879         }
2880 }
2881
2882 void
2883 drm_intel_bufmgr_gem_set_vma_cache_size(drm_intel_bufmgr *bufmgr, int limit)
2884 {
2885         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *)bufmgr;
2886
2887         bufmgr_gem->vma_max = limit;
2888
2889         drm_intel_gem_bo_purge_vma_cache(bufmgr_gem);
2890 }
2891
2892 /**
2893  * Get the PCI ID for the device.  This can be overridden by setting the
2894  * INTEL_DEVID_OVERRIDE environment variable to the desired ID.
2895  */
2896 static int
2897 get_pci_device_id(drm_intel_bufmgr_gem *bufmgr_gem)
2898 {
2899         char *devid_override;
2900         int devid;
2901         int ret;
2902         drm_i915_getparam_t gp;
2903
2904         if (geteuid() == getuid()) {
2905                 devid_override = getenv("INTEL_DEVID_OVERRIDE");
2906                 if (devid_override) {
2907                         bufmgr_gem->no_exec = true;
2908                         return strtod(devid_override, NULL);
2909                 }
2910         }
2911
2912         VG_CLEAR(devid);
2913         VG_CLEAR(gp);
2914         gp.param = I915_PARAM_CHIPSET_ID;
2915         gp.value = &devid;
2916         ret = drmIoctl(bufmgr_gem->fd, DRM_IOCTL_I915_GETPARAM, &gp);
2917         if (ret) {
2918                 fprintf(stderr, "get chip id failed: %d [%d]\n", ret, errno);
2919                 fprintf(stderr, "param: %d, val: %d\n", gp.param, *gp.value);
2920         }
2921         return devid;
2922 }
2923
2924 int
2925 drm_intel_bufmgr_gem_get_devid(drm_intel_bufmgr *bufmgr)
2926 {
2927         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *)bufmgr;
2928
2929         return bufmgr_gem->pci_device;
2930 }
2931
2932 /**
2933  * Sets the AUB filename.
2934  *
2935  * This function has to be called before drm_intel_bufmgr_gem_set_aub_dump()
2936  * for it to have any effect.
2937  */
2938 void
2939 drm_intel_bufmgr_gem_set_aub_filename(drm_intel_bufmgr *bufmgr,
2940                                       const char *filename)
2941 {
2942         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *)bufmgr;
2943
2944         free(bufmgr_gem->aub_filename);
2945         if (filename)
2946                 bufmgr_gem->aub_filename = strdup(filename);
2947 }
2948
2949 /**
2950  * Sets up AUB dumping.
2951  *
2952  * This is a trace file format that can be used with the simulator.
2953  * Packets are emitted in a format somewhat like GPU command packets.
2954  * You can set up a GTT and upload your objects into the referenced
2955  * space, then send off batchbuffers and get BMPs out the other end.
2956  */
2957 void
2958 drm_intel_bufmgr_gem_set_aub_dump(drm_intel_bufmgr *bufmgr, int enable)
2959 {
2960         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *)bufmgr;
2961         int entry = 0x200003;
2962         int i;
2963         int gtt_size = 0x10000;
2964         const char *filename;
2965
2966         if (!enable) {
2967                 if (bufmgr_gem->aub_file) {
2968                         fclose(bufmgr_gem->aub_file);
2969                         bufmgr_gem->aub_file = NULL;
2970                 }
2971                 return;
2972         }
2973
2974         if (geteuid() != getuid())
2975                 return;
2976
2977         if (bufmgr_gem->aub_filename)
2978                 filename = bufmgr_gem->aub_filename;
2979         else
2980                 filename = "intel.aub";
2981         bufmgr_gem->aub_file = fopen(filename, "w+");
2982         if (!bufmgr_gem->aub_file)
2983                 return;
2984
2985         /* Start allocating objects from just after the GTT. */
2986         bufmgr_gem->aub_offset = gtt_size;
2987
2988         /* Start with a (required) version packet. */
2989         aub_out(bufmgr_gem, CMD_AUB_HEADER | (13 - 2));
2990         aub_out(bufmgr_gem,
2991                 (4 << AUB_HEADER_MAJOR_SHIFT) |
2992                 (0 << AUB_HEADER_MINOR_SHIFT));
2993         for (i = 0; i < 8; i++) {
2994                 aub_out(bufmgr_gem, 0); /* app name */
2995         }
2996         aub_out(bufmgr_gem, 0); /* timestamp */
2997         aub_out(bufmgr_gem, 0); /* timestamp */
2998         aub_out(bufmgr_gem, 0); /* comment len */
2999
3000         /* Set up the GTT. The max we can handle is 256M */
3001         aub_out(bufmgr_gem, CMD_AUB_TRACE_HEADER_BLOCK | ((bufmgr_gem->gen >= 8 ? 6 : 5) - 2));
3002         aub_out(bufmgr_gem, AUB_TRACE_MEMTYPE_NONLOCAL | 0 | AUB_TRACE_OP_DATA_WRITE);
3003         aub_out(bufmgr_gem, 0); /* subtype */
3004         aub_out(bufmgr_gem, 0); /* offset */
3005         aub_out(bufmgr_gem, gtt_size); /* size */
3006         if (bufmgr_gem->gen >= 8)
3007                 aub_out(bufmgr_gem, 0);
3008         for (i = 0x000; i < gtt_size; i += 4, entry += 0x1000) {
3009                 aub_out(bufmgr_gem, entry);
3010         }
3011 }
3012
3013 drm_intel_context *
3014 drm_intel_gem_context_create(drm_intel_bufmgr *bufmgr)
3015 {
3016         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *)bufmgr;
3017         struct drm_i915_gem_context_create create;
3018         drm_intel_context *context = NULL;
3019         int ret;
3020
3021         VG_CLEAR(create);
3022         ret = drmIoctl(bufmgr_gem->fd, DRM_IOCTL_I915_GEM_CONTEXT_CREATE, &create);
3023         if (ret != 0) {
3024                 DBG("DRM_IOCTL_I915_GEM_CONTEXT_CREATE failed: %s\n",
3025                     strerror(errno));
3026                 return NULL;
3027         }
3028
3029         context = calloc(1, sizeof(*context));
3030         context->ctx_id = create.ctx_id;
3031         context->bufmgr = bufmgr;
3032
3033         return context;
3034 }
3035
3036 void
3037 drm_intel_gem_context_destroy(drm_intel_context *ctx)
3038 {
3039         drm_intel_bufmgr_gem *bufmgr_gem;
3040         struct drm_i915_gem_context_destroy destroy;
3041         int ret;
3042
3043         if (ctx == NULL)
3044                 return;
3045
3046         VG_CLEAR(destroy);
3047
3048         bufmgr_gem = (drm_intel_bufmgr_gem *)ctx->bufmgr;
3049         destroy.ctx_id = ctx->ctx_id;
3050         ret = drmIoctl(bufmgr_gem->fd, DRM_IOCTL_I915_GEM_CONTEXT_DESTROY,
3051                        &destroy);
3052         if (ret != 0)
3053                 fprintf(stderr, "DRM_IOCTL_I915_GEM_CONTEXT_DESTROY failed: %s\n",
3054                         strerror(errno));
3055
3056         free(ctx);
3057 }
3058
3059 int
3060 drm_intel_get_reset_stats(drm_intel_context *ctx,
3061                           uint32_t *reset_count,
3062                           uint32_t *active,
3063                           uint32_t *pending)
3064 {
3065         drm_intel_bufmgr_gem *bufmgr_gem;
3066         struct drm_i915_reset_stats stats;
3067         int ret;
3068
3069         if (ctx == NULL)
3070                 return -EINVAL;
3071
3072         memset(&stats, 0, sizeof(stats));
3073
3074         bufmgr_gem = (drm_intel_bufmgr_gem *)ctx->bufmgr;
3075         stats.ctx_id = ctx->ctx_id;
3076         ret = drmIoctl(bufmgr_gem->fd,
3077                        DRM_IOCTL_I915_GET_RESET_STATS,
3078                        &stats);
3079         if (ret == 0) {
3080                 if (reset_count != NULL)
3081                         *reset_count = stats.reset_count;
3082
3083                 if (active != NULL)
3084                         *active = stats.batch_active;
3085
3086                 if (pending != NULL)
3087                         *pending = stats.batch_pending;
3088         }
3089
3090         return ret;
3091 }
3092
3093 int
3094 drm_intel_reg_read(drm_intel_bufmgr *bufmgr,
3095                    uint32_t offset,
3096                    uint64_t *result)
3097 {
3098         drm_intel_bufmgr_gem *bufmgr_gem = (drm_intel_bufmgr_gem *)bufmgr;
3099         struct drm_i915_reg_read reg_read;
3100         int ret;
3101
3102         VG_CLEAR(reg_read);
3103         reg_read.offset = offset;
3104
3105         ret = drmIoctl(bufmgr_gem->fd, DRM_IOCTL_I915_REG_READ, &reg_read);
3106
3107         *result = reg_read.val;
3108         return ret;
3109 }
3110
3111
3112 /**
3113  * Annotate the given bo for use in aub dumping.
3114  *
3115  * \param annotations is an array of drm_intel_aub_annotation objects
3116  * describing the type of data in various sections of the bo.  Each
3117  * element of the array specifies the type and subtype of a section of
3118  * the bo, and the past-the-end offset of that section.  The elements
3119  * of \c annotations must be sorted so that ending_offset is
3120  * increasing.
3121  *
3122  * \param count is the number of elements in the \c annotations array.
3123  * If \c count is zero, then \c annotations will not be dereferenced.
3124  *
3125  * Annotations are copied into a private data structure, so caller may
3126  * re-use the memory pointed to by \c annotations after the call
3127  * returns.
3128  *
3129  * Annotations are stored for the lifetime of the bo; to reset to the
3130  * default state (no annotations), call this function with a \c count
3131  * of zero.
3132  */
3133 void
3134 drm_intel_bufmgr_gem_set_aub_annotations(drm_intel_bo *bo,
3135                                          drm_intel_aub_annotation *annotations,
3136                                          unsigned count)
3137 {
3138         drm_intel_bo_gem *bo_gem = (drm_intel_bo_gem *) bo;
3139         unsigned size = sizeof(*annotations) * count;
3140         drm_intel_aub_annotation *new_annotations =
3141                 count > 0 ? realloc(bo_gem->aub_annotations, size) : NULL;
3142         if (new_annotations == NULL) {
3143                 free(bo_gem->aub_annotations);
3144                 bo_gem->aub_annotations = NULL;
3145                 bo_gem->aub_annotation_count = 0;
3146                 return;
3147         }
3148         memcpy(new_annotations, annotations, size);
3149         bo_gem->aub_annotations = new_annotations;
3150         bo_gem->aub_annotation_count = count;
3151 }
3152
3153 /**
3154  * Initializes the GEM buffer manager, which uses the kernel to allocate, map,
3155  * and manage map buffer objections.
3156  *
3157  * \param fd File descriptor of the opened DRM device.
3158  */
3159 drm_intel_bufmgr *
3160 drm_intel_bufmgr_gem_init(int fd, int batch_size)
3161 {
3162         drm_intel_bufmgr_gem *bufmgr_gem;
3163         struct drm_i915_gem_get_aperture aperture;
3164         drm_i915_getparam_t gp;
3165         int ret, tmp;
3166         bool exec2 = false;
3167
3168         bufmgr_gem = calloc(1, sizeof(*bufmgr_gem));
3169         if (bufmgr_gem == NULL)
3170                 return NULL;
3171
3172         bufmgr_gem->fd = fd;
3173
3174         if (pthread_mutex_init(&bufmgr_gem->lock, NULL) != 0) {
3175                 free(bufmgr_gem);
3176                 return NULL;
3177         }
3178
3179         ret = drmIoctl(bufmgr_gem->fd,
3180                        DRM_IOCTL_I915_GEM_GET_APERTURE,
3181                        &aperture);
3182
3183         if (ret == 0)
3184                 bufmgr_gem->gtt_size = aperture.aper_available_size;
3185         else {
3186                 fprintf(stderr, "DRM_IOCTL_I915_GEM_APERTURE failed: %s\n",
3187                         strerror(errno));
3188                 bufmgr_gem->gtt_size = 128 * 1024 * 1024;
3189                 fprintf(stderr, "Assuming %dkB available aperture size.\n"
3190                         "May lead to reduced performance or incorrect "
3191                         "rendering.\n",
3192                         (int)bufmgr_gem->gtt_size / 1024);
3193         }
3194
3195         bufmgr_gem->pci_device = get_pci_device_id(bufmgr_gem);
3196
3197         if (IS_GEN2(bufmgr_gem->pci_device))
3198                 bufmgr_gem->gen = 2;
3199         else if (IS_GEN3(bufmgr_gem->pci_device))
3200                 bufmgr_gem->gen = 3;
3201         else if (IS_GEN4(bufmgr_gem->pci_device))
3202                 bufmgr_gem->gen = 4;
3203         else if (IS_GEN5(bufmgr_gem->pci_device))
3204                 bufmgr_gem->gen = 5;
3205         else if (IS_GEN6(bufmgr_gem->pci_device))
3206                 bufmgr_gem->gen = 6;
3207         else if (IS_GEN7(bufmgr_gem->pci_device))
3208                 bufmgr_gem->gen = 7;
3209         else if (IS_GEN8(bufmgr_gem->pci_device))
3210                 bufmgr_gem->gen = 8;
3211         else {
3212                 free(bufmgr_gem);
3213                 return NULL;
3214         }
3215
3216         if (IS_GEN3(bufmgr_gem->pci_device) &&
3217             bufmgr_gem->gtt_size > 256*1024*1024) {
3218                 /* The unmappable part of gtt on gen 3 (i.e. above 256MB) can't
3219                  * be used for tiled blits. To simplify the accounting, just
3220                  * substract the unmappable part (fixed to 256MB on all known
3221                  * gen3 devices) if the kernel advertises it. */
3222                 bufmgr_gem->gtt_size -= 256*1024*1024;
3223         }
3224
3225         VG_CLEAR(gp);
3226         gp.value = &tmp;
3227
3228         gp.param = I915_PARAM_HAS_EXECBUF2;
3229         ret = drmIoctl(bufmgr_gem->fd, DRM_IOCTL_I915_GETPARAM, &gp);
3230         if (!ret)
3231                 exec2 = true;
3232
3233         gp.param = I915_PARAM_HAS_BSD;
3234         ret = drmIoctl(bufmgr_gem->fd, DRM_IOCTL_I915_GETPARAM, &gp);
3235         bufmgr_gem->has_bsd = ret == 0;
3236
3237         gp.param = I915_PARAM_HAS_BLT;
3238         ret = drmIoctl(bufmgr_gem->fd, DRM_IOCTL_I915_GETPARAM, &gp);
3239         bufmgr_gem->has_blt = ret == 0;
3240
3241         gp.param = I915_PARAM_HAS_RELAXED_FENCING;
3242         ret = drmIoctl(bufmgr_gem->fd, DRM_IOCTL_I915_GETPARAM, &gp);
3243         bufmgr_gem->has_relaxed_fencing = ret == 0;
3244
3245         gp.param = I915_PARAM_HAS_WAIT_TIMEOUT;
3246         ret = drmIoctl(bufmgr_gem->fd, DRM_IOCTL_I915_GETPARAM, &gp);
3247         bufmgr_gem->has_wait_timeout = ret == 0;
3248
3249         gp.param = I915_PARAM_HAS_LLC;
3250         ret = drmIoctl(bufmgr_gem->fd, DRM_IOCTL_I915_GETPARAM, &gp);
3251         if (ret != 0) {
3252                 /* Kernel does not supports HAS_LLC query, fallback to GPU
3253                  * generation detection and assume that we have LLC on GEN6/7
3254                  */
3255                 bufmgr_gem->has_llc = (IS_GEN6(bufmgr_gem->pci_device) |
3256                                 IS_GEN7(bufmgr_gem->pci_device));
3257         } else
3258                 bufmgr_gem->has_llc = *gp.value;
3259
3260         gp.param = I915_PARAM_HAS_VEBOX;
3261         ret = drmIoctl(bufmgr_gem->fd, DRM_IOCTL_I915_GETPARAM, &gp);
3262         bufmgr_gem->has_vebox = (ret == 0) & (*gp.value > 0);
3263
3264         if (bufmgr_gem->gen < 4) {
3265                 gp.param = I915_PARAM_NUM_FENCES_AVAIL;
3266                 gp.value = &bufmgr_gem->available_fences;
3267                 ret = drmIoctl(bufmgr_gem->fd, DRM_IOCTL_I915_GETPARAM, &gp);
3268                 if (ret) {
3269                         fprintf(stderr, "get fences failed: %d [%d]\n", ret,
3270                                 errno);
3271                         fprintf(stderr, "param: %d, val: %d\n", gp.param,
3272                                 *gp.value);
3273                         bufmgr_gem->available_fences = 0;
3274                 } else {
3275                         /* XXX The kernel reports the total number of fences,
3276                          * including any that may be pinned.
3277                          *
3278                          * We presume that there will be at least one pinned
3279                          * fence for the scanout buffer, but there may be more
3280                          * than one scanout and the user may be manually
3281                          * pinning buffers. Let's move to execbuffer2 and
3282                          * thereby forget the insanity of using fences...
3283                          */
3284                         bufmgr_gem->available_fences -= 2;
3285                         if (bufmgr_gem->available_fences < 0)
3286                                 bufmgr_gem->available_fences = 0;
3287                 }
3288         }
3289
3290         /* Let's go with one relocation per every 2 dwords (but round down a bit
3291          * since a power of two will mean an extra page allocation for the reloc
3292          * buffer).
3293          *
3294          * Every 4 was too few for the blender benchmark.
3295          */
3296         bufmgr_gem->max_relocs = batch_size / sizeof(uint32_t) / 2 - 2;
3297
3298         bufmgr_gem->bufmgr.bo_alloc = drm_intel_gem_bo_alloc;
3299         bufmgr_gem->bufmgr.bo_alloc_for_render =
3300             drm_intel_gem_bo_alloc_for_render;
3301         bufmgr_gem->bufmgr.bo_alloc_tiled = drm_intel_gem_bo_alloc_tiled;
3302         bufmgr_gem->bufmgr.bo_reference = drm_intel_gem_bo_reference;
3303         bufmgr_gem->bufmgr.bo_unreference = drm_intel_gem_bo_unreference;
3304         bufmgr_gem->bufmgr.bo_map = drm_intel_gem_bo_map;
3305         bufmgr_gem->bufmgr.bo_unmap = drm_intel_gem_bo_unmap;
3306         bufmgr_gem->bufmgr.bo_subdata = drm_intel_gem_bo_subdata;
3307         bufmgr_gem->bufmgr.bo_get_subdata = drm_intel_gem_bo_get_subdata;
3308         bufmgr_gem->bufmgr.bo_wait_rendering = drm_intel_gem_bo_wait_rendering;
3309         bufmgr_gem->bufmgr.bo_emit_reloc = drm_intel_gem_bo_emit_reloc;
3310         bufmgr_gem->bufmgr.bo_emit_reloc_fence = drm_intel_gem_bo_emit_reloc_fence;
3311         bufmgr_gem->bufmgr.bo_pin = drm_intel_gem_bo_pin;
3312         bufmgr_gem->bufmgr.bo_unpin = drm_intel_gem_bo_unpin;
3313         bufmgr_gem->bufmgr.bo_get_tiling = drm_intel_gem_bo_get_tiling;
3314         bufmgr_gem->bufmgr.bo_set_tiling = drm_intel_gem_bo_set_tiling;
3315         bufmgr_gem->bufmgr.bo_flink = drm_intel_gem_bo_flink;
3316         /* Use the new one if available */
3317         if (exec2) {
3318                 bufmgr_gem->bufmgr.bo_exec = drm_intel_gem_bo_exec2;
3319                 bufmgr_gem->bufmgr.bo_mrb_exec = drm_intel_gem_bo_mrb_exec2;
3320         } else
3321                 bufmgr_gem->bufmgr.bo_exec = drm_intel_gem_bo_exec;
3322         bufmgr_gem->bufmgr.bo_busy = drm_intel_gem_bo_busy;
3323         bufmgr_gem->bufmgr.bo_madvise = drm_intel_gem_bo_madvise;
3324         bufmgr_gem->bufmgr.destroy = drm_intel_bufmgr_gem_destroy;
3325         bufmgr_gem->bufmgr.debug = 0;
3326         bufmgr_gem->bufmgr.check_aperture_space =
3327             drm_intel_gem_check_aperture_space;
3328         bufmgr_gem->bufmgr.bo_disable_reuse = drm_intel_gem_bo_disable_reuse;
3329         bufmgr_gem->bufmgr.bo_is_reusable = drm_intel_gem_bo_is_reusable;
3330         bufmgr_gem->bufmgr.get_pipe_from_crtc_id =
3331             drm_intel_gem_get_pipe_from_crtc_id;
3332         bufmgr_gem->bufmgr.bo_references = drm_intel_gem_bo_references;
3333
3334         DRMINITLISTHEAD(&bufmgr_gem->named);
3335         init_cache_buckets(bufmgr_gem);
3336
3337         DRMINITLISTHEAD(&bufmgr_gem->vma_cache);
3338         bufmgr_gem->vma_max = -1; /* unlimited by default */
3339
3340         return &bufmgr_gem->bufmgr;
3341 }