OSDN Git Service

[intel] Report buffer size when allocating with INTEL_DEBUG=bufmgr and TTM.
[android-x86/external-mesa.git] / src / mesa / drivers / dri / intel / intel_bufmgr_ttm.c
index 32d9886..5b339ea 100644 (file)
@@ -1,10 +1,10 @@
 /**************************************************************************
- * 
+ *
  * Copyright © 2007 Red Hat Inc.
  * Copyright © 2007 Intel Corporation
  * Copyright 2006 Tungsten Graphics, Inc., Bismarck, ND., USA
  * All Rights Reserved.
- * 
+ *
  * Permission is hereby granted, free of charge, to any person obtaining a
  * copy of this software and associated documentation files (the
  * "Software"), to deal in the Software without restriction, including
  * distribute, sub license, and/or sell copies of the Software, and to
  * permit persons to whom the Software is furnished to do so, subject to
  * the following conditions:
- * 
+ *
  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
  * FITNESS FOR A PARTICULAR PURPOSE AND NON-INFRINGEMENT. IN NO EVENT SHALL
  * THE COPYRIGHT HOLDERS, AUTHORS AND/OR ITS SUPPLIERS BE LIABLE FOR ANY CLAIM,
- * DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR 
- * OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE 
+ * DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR
+ * OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE
  * USE OR OTHER DEALINGS IN THE SOFTWARE.
  *
  * The above copyright notice and this permission notice (including the
  * next paragraph) shall be included in all copies or substantial portions
  * of the Software.
- * 
- * 
+ *
+ *
  **************************************************************************/
 /*
  * Authors: Thomas Hellström <thomas-at-tungstengraphics-dot-com>
 
 #include "intel_bufmgr_ttm.h"
 
-#define BUFMGR_DEBUG 0
+#define DBG(...) do {                                  \
+   if (bufmgr_ttm->bufmgr.debug)                       \
+      _mesa_printf(__VA_ARGS__);                       \
+} while (0)
 
-struct intel_reloc_info
-{
-   GLuint type;
-   GLuint reloc;
-   GLuint delta;                /* not needed? */
-   GLuint index;
-   drm_handle_t handle;
-};
-
-struct intel_bo_node
-{
-    drmMMListHead head;
-    drmBO *buf;
-    struct drm_i915_op_arg bo_arg;
-    unsigned long arg0;
-    unsigned long arg1;
-    void (*destroy)(void *);
-    void *priv;
-};
-
-struct intel_bo_reloc_list
-{
-    drmMMListHead head;
-    drmBO buf;
-    uint32_t *relocs;
-};
-
-struct intel_bo_reloc_node
-{
-    drmMMListHead head;
-    drm_handle_t handle;
-    uint32_t nr_reloc_types;
-    struct intel_bo_reloc_list type_list;
-};
+/*
+ * These bits are always specified in each validation
+ * request. Other bits are not supported at this point
+ * as it would require a bit of investigation to figure
+ * out what mask value should be used.
+ */
+#define INTEL_BO_MASK  (DRM_BO_MASK_MEM | \
+                       DRM_BO_FLAG_READ | \
+                       DRM_BO_FLAG_WRITE | \
+                       DRM_BO_FLAG_EXE)
 
+/* Buffer validation list */
 struct intel_bo_list {
     unsigned numCurrent;
     drmMMListHead list;
-    void (*destroy)(void *node);
 };
 
 typedef struct _dri_bufmgr_ttm {
-   dri_bufmgr bufmgr;
+    dri_bufmgr bufmgr;
 
-   int fd;
-   _glthread_Mutex mutex;
-   unsigned int fence_type;
-   unsigned int fence_type_flush;
+    int fd;
+    unsigned int fence_type;
+    unsigned int fence_type_flush;
 
-   uint32_t max_relocs;
-   /** ttm relocation list */
-   struct intel_bo_list list;
-   struct intel_bo_list reloc_list;
+    uint32_t max_relocs;
+    struct intel_bo_list list; /* list of buffers to be validated */
 
+    drmBO *cached_reloc_buf;
+    uint32_t *cached_reloc_buf_data;
 } dri_bufmgr_ttm;
 
+/**
+ * Private information associated with a relocation that isn't already stored
+ * in the relocation buffer to be passed to the kernel.
+ */
+struct dri_ttm_reloc {
+    dri_bo *target_buf;
+    uint64_t validate_flags;
+};
+
 typedef struct _dri_bo_ttm {
-   dri_bo bo;
+    dri_bo bo;
+
+    int refcount;
+    drmBO drm_bo;
+    const char *name;
+
+    uint64_t last_flags;
 
-   int refcount;               /* Protected by bufmgr->mutex */
-   drmBO drm_bo;
-   const char *name;
+    /**
+     * Index of the buffer within the validation list while preparing a
+     * batchbuffer execution.
+     */
+    int validate_index;
+
+    /** DRM buffer object containing relocation list */
+    drmBO *reloc_buf;
+    uint32_t *reloc_buf_data;
+    struct dri_ttm_reloc *relocs;
 } dri_bo_ttm;
 
 typedef struct _dri_fence_ttm
 {
-   dri_fence fence;
+    dri_fence fence;
 
-   int refcount;               /* Protected by bufmgr->mutex */
-   const char *name;
-   drmFence drm_fence;
+    int refcount;
+    const char *name;
+    drmFence drm_fence;
 } dri_fence_ttm;
 
+/* Validation list node */
+struct intel_bo_node
+{
+    drmMMListHead head;
+    dri_bo *bo;
+    struct drm_i915_op_arg bo_arg;
+    uint64_t flags;
+};
 
-static void intel_bo_free_list(struct intel_bo_list *list)
+static void
+intel_init_validate_list(struct intel_bo_list *list)
 {
-    struct intel_bo_node *node;
+    DRMINITLISTHEAD(&list->list);
+    list->numCurrent = 0;
+}
+
+/**
+ * Empties the validation list and clears the relocations 
+ */
+static void
+intel_free_validate_list(dri_bufmgr_ttm *bufmgr_ttm)
+{
+    struct intel_bo_list *list = &bufmgr_ttm->list;
     drmMMListHead *l;
 
-    l = list->list.next;
-    while(l != &list->list) {
+    for (l = list->list.next; l != &list->list; l = list->list.next) {
+        struct intel_bo_node *node =
+          DRMLISTENTRY(struct intel_bo_node, l, head);
+
        DRMLISTDEL(l);
-       node = DRMLISTENTRY(struct intel_bo_node, l, head);
-       list->destroy(node);
-       l = list->list.next;
+
+       dri_bo_unreference(node->bo);
+
+       drmFree(node);
        list->numCurrent--;
     }
 }
 
-static void generic_destroy(void *nodep)
+static void dri_ttm_dump_validation_list(dri_bufmgr_ttm *bufmgr_ttm)
 {
-    free(nodep);
-}
+    struct intel_bo_list *list = &bufmgr_ttm->list;
+    drmMMListHead *l;
+    int i = 0;
 
-static int intel_create_bo_list(int numTarget, struct intel_bo_list *list, void (*destroy)(void *))
-{
-    DRMINITLISTHEAD(&list->list);
-    list->numCurrent = 0;
-    if (destroy)
-        list->destroy = destroy;
-    else
-        list->destroy = generic_destroy;
-    return 0;
+    for (l = list->list.next; l != &list->list; l = l->next) {
+       int j;
+        struct intel_bo_node *node =
+           DRMLISTENTRY(struct intel_bo_node, l, head);
+       dri_bo_ttm *bo_ttm = (dri_bo_ttm *)node->bo;
+
+       if (bo_ttm->reloc_buf_data != NULL) {
+           for (j = 0; j < (bo_ttm->reloc_buf_data[0] & 0xffff); j++) {
+               uint32_t *reloc_entry = bo_ttm->reloc_buf_data +
+                   I915_RELOC_HEADER +
+                   j * I915_RELOC0_STRIDE;
+
+               DBG("%2d: %s@0x%08x -> %d + 0x%08x\n",
+                   i, bo_ttm->name,
+                   reloc_entry[0], reloc_entry[2], reloc_entry[1]);
+           }
+       } else {
+           DBG("%2d: %s\n", i, bo_ttm->name);
+       }
+       i++;
+    }
 }
 
-
 static struct drm_i915_op_arg *
-intel_setup_validate_list(int fd, struct intel_bo_list *list, struct intel_bo_list *reloc_list, GLuint *count_p)
+intel_setup_validate_list(dri_bufmgr_ttm *bufmgr_ttm, GLuint *count_p)
 {
-    struct intel_bo_node *node;
-    struct intel_bo_reloc_node *rl_node;
-    drmMMListHead *l, *rl;
-    struct drm_i915_op_arg *arg, *first;
-    struct drm_bo_op_req *req;
+    struct intel_bo_list *list = &bufmgr_ttm->list;
+    drmMMListHead *l;
+    struct drm_i915_op_arg *first;
     uint64_t *prevNext = NULL;
     GLuint count = 0;
 
     first = NULL;
 
     for (l = list->list.next; l != &list->list; l = l->next) {
-        node = DRMLISTENTRY(struct intel_bo_node, l, head);
-
-        arg = &node->bo_arg;
-        req = &arg->d.req;
+        struct intel_bo_node *node =
+           DRMLISTENTRY(struct intel_bo_node, l, head);
+       dri_bo_ttm *ttm_buf = (dri_bo_ttm *)node->bo;
+       struct drm_i915_op_arg *arg = &node->bo_arg;
+       struct drm_bo_op_req *req = &arg->d.req;
 
         if (!first)
             first = arg;
@@ -183,21 +216,22 @@ intel_setup_validate_list(int fd, struct intel_bo_list *list, struct intel_bo_li
 
        memset(arg, 0, sizeof(*arg));
        prevNext = &arg->next;
-       req->bo_req.handle = node->buf->handle;
+       req->bo_req.handle = ttm_buf->drm_bo.handle;
        req->op = drm_bo_validate;
-       req->bo_req.flags = node->arg0;
+       req->bo_req.flags = node->flags;
        req->bo_req.hint = 0;
-       req->bo_req.mask = node->arg1;
+#ifdef DRM_BO_HINT_PRESUMED_OFFSET
+       req->bo_req.hint |= DRM_BO_HINT_PRESUMED_OFFSET;
+       req->bo_req.presumed_offset = node->bo->offset;
+#endif
+       req->bo_req.mask = INTEL_BO_MASK;
        req->bo_req.fence_class = 0; /* Backwards compat. */
-       arg->reloc_handle = 0;
 
-       for (rl = reloc_list->list.next; rl != &reloc_list->list; rl = rl->next) {
-           rl_node = DRMLISTENTRY(struct intel_bo_reloc_node, rl, head);
+       if (ttm_buf->reloc_buf != NULL)
+           arg->reloc_handle = ttm_buf->reloc_buf->handle;
+       else
+           arg->reloc_handle = 0;
 
-           if (rl_node->handle == node->buf->handle) {
-               arg->reloc_handle = rl_node->type_list.buf.handle;
-           }
-       }
        count++;
     }
 
@@ -208,261 +242,202 @@ intel_setup_validate_list(int fd, struct intel_bo_list *list, struct intel_bo_li
     return first;
 }
 
-static void intel_free_validate_list(int fd, struct intel_bo_list *list)
-{
-    struct intel_bo_node *node;
-    drmMMListHead *l;
-
-    for (l = list->list.next; l != &list->list; l = l->next) {
-        node = DRMLISTENTRY(struct intel_bo_node, l, head);    
-
-       if (node->destroy)
-           (*node->destroy)(node->priv);
-
-    }
-}
-
-static void intel_free_reloc_list(int fd, struct intel_bo_list *reloc_list)
-{
-    struct intel_bo_reloc_node *reloc_node;
-    drmMMListHead *rl, *tmp;
-
-    for (rl = reloc_list->list.next, tmp = rl->next; rl != &reloc_list->list; rl = tmp, tmp = rl->next) {
-       reloc_node = DRMLISTENTRY(struct intel_bo_reloc_node, rl, head);
-
-       DRMLISTDEL(rl);
-
-       if (reloc_node->nr_reloc_types > 1) {
-           
-           /* TODO */
-       }
-
-       drmBOUnmap(fd, &reloc_node->type_list.buf);
-       drmBOUnreference(fd, &reloc_node->type_list.buf);
-       free(reloc_node);
-    }
-}
-
-static int intel_add_validate_buffer(struct intel_bo_list *list, dri_bo *buf, unsigned flags,
-                                    unsigned mask, int *itemLoc, void (*destroy_cb)(void *))
-{
-    struct intel_bo_node *node, *cur;
+/**
+ * Adds the given buffer to the list of buffers to be validated (moved into the
+ * appropriate memory type) with the next batch submission.
+ *
+ * If a buffer is validated multiple times in a batch submission, it ends up
+ * with the intersection of the memory type flags and the union of the
+ * access flags.
+ */
+static struct intel_bo_node *
+intel_add_validate_buffer(dri_bo *buf,
+                         uint64_t flags)
+{
+    dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)buf->bufmgr;
+    struct intel_bo_list *list = &bufmgr_ttm->list;
+    struct intel_bo_node *cur;
+    dri_bo_ttm *ttm_buf = (dri_bo_ttm *)buf;
     drmMMListHead *l;
     int count = 0;
     int ret = 0;
-    drmBO *buf_bo = &((dri_bo_ttm *)buf)->drm_bo;
     cur = NULL;
 
+    /* Find the buffer in the validation list if it's already there. */
     for (l = list->list.next; l != &list->list; l = l->next) {
-       node = DRMLISTENTRY(struct intel_bo_node, l, head);
-       if (node->buf->handle == buf_bo->handle) {
+       struct intel_bo_node *node =
+           DRMLISTENTRY(struct intel_bo_node, l, head);
+
+       if (((dri_bo_ttm *)node->bo)->drm_bo.handle == ttm_buf->drm_bo.handle) {
            cur = node;
            break;
        }
        count++;
     }
-    
+
     if (!cur) {
        cur = drmMalloc(sizeof(*cur));
        if (!cur) {
-           return -ENOMEM;
+           return NULL;
        }
-       cur->buf = buf_bo;
-       cur->priv = buf;
-       cur->arg0 = flags;
-       cur->arg1 = mask;
-       cur->destroy = destroy_cb;
+       cur->bo = buf;
+       dri_bo_reference(buf);
+       cur->flags = flags;
        ret = 1;
 
        DRMLISTADDTAIL(&cur->head, &list->list);
-
     } else {
-       unsigned memMask = (cur->arg1 | mask) & DRM_BO_MASK_MEM;
-       unsigned memFlags = cur->arg0 & flags & memMask;
-       
-       if (!memFlags) {
-           return -EINVAL;
+       uint64_t memFlags = cur->flags & flags & DRM_BO_MASK_MEM;
+       uint64_t modeFlags = (cur->flags | flags) & ~DRM_BO_MASK_MEM;
+
+       if (memFlags == 0) {
+           fprintf(stderr,
+                   "%s: No shared memory types between "
+                   "0x%16llx and 0x%16llx\n",
+                   __FUNCTION__, cur->flags, flags);
+           return NULL;
        }
-       if (mask & cur->arg1 & ~DRM_BO_MASK_MEM  & (cur->arg0 ^ flags)) {
-           return -EINVAL;
+       if (flags & ~INTEL_BO_MASK) {
+           fprintf(stderr,
+                   "%s: Flags bits 0x%16llx are not supposed to be used in a relocation\n",
+                   __FUNCTION__, flags & ~INTEL_BO_MASK);
+           return NULL;
        }
-       cur->arg1 |= mask;
-       cur->arg0 = memFlags | ((cur->arg0 | flags) & 
-                               cur->arg1 & ~DRM_BO_MASK_MEM);
+       cur->flags = memFlags | modeFlags;
     }
-    *itemLoc = count;
-    return ret;
-}
 
+    ttm_buf->validate_index = count;
 
-#define RELOC_BUF_SIZE(x) ((I915_RELOC_HEADER + x * I915_RELOC0_STRIDE) * sizeof(uint32_t))
-
-static int intel_create_new_reloc_type_list(int fd, struct intel_bo_reloc_list *cur_type, int max_relocs)
-{
-    int ret;
-    
-    /* should allocate a drmBO here */
-    ret = drmBOCreate(fd, RELOC_BUF_SIZE(max_relocs), 0,
-                     NULL,
-                     DRM_BO_FLAG_MEM_LOCAL | DRM_BO_FLAG_READ | DRM_BO_FLAG_WRITE | DRM_BO_FLAG_MAPPABLE | DRM_BO_FLAG_CACHED,
-                     0, &cur_type->buf);
-    if (ret)
-       return ret;
-    
-    ret = drmBOMap(fd, &cur_type->buf, DRM_BO_FLAG_READ | DRM_BO_FLAG_WRITE, 0, (void **)&cur_type->relocs);
-    if (ret)
-       return ret;
-    return 0;
+    return cur;
 }
 
 
-static int intel_add_validate_reloc(int fd, struct intel_bo_list *reloc_list, struct intel_reloc_info *reloc_info, uint32_t max_relocs)
-{
-    struct intel_bo_reloc_node *rl_node, *cur;
-    drmMMListHead *rl, *l;
-    int ret = 0;
-    uint32_t *reloc_start;
-    int num_relocs;
-    struct intel_bo_reloc_list *cur_type;
-
-    cur = NULL;
+#define RELOC_BUF_SIZE(x) ((I915_RELOC_HEADER + x * I915_RELOC0_STRIDE) * \
+       sizeof(uint32_t))
 
-    for (rl = reloc_list->list.next; rl != &reloc_list->list; rl = rl->next) {
-       rl_node = DRMLISTENTRY(struct intel_bo_reloc_node, rl, head);
-       if (rl_node->handle == reloc_info->handle) {
-           cur = rl_node;
-           break;
-       }
-    }
-
-    if (!cur) {
-
-       cur = malloc(sizeof(*cur));
-       if (!cur)
-           return -ENOMEM;
+static int
+intel_setup_reloc_list(dri_bo *bo)
+{
+    dri_bo_ttm *bo_ttm = (dri_bo_ttm *)bo;
+    dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)bo->bufmgr;
+    int ret;
 
-       cur->nr_reloc_types = 1;
-       cur->handle = reloc_info->handle;
-       cur_type = &cur->type_list;
+    /* If the buffer exists, then it was just created, or it was reintialized
+     * at the last intel_free_validate_list().
+     */
+    if (bo_ttm->reloc_buf != NULL)
+       return 0;
 
-       DRMINITLISTHEAD(&cur->type_list.head);
-       ret = intel_create_new_reloc_type_list(fd, cur_type, max_relocs);
-       if (ret) {
-           return -1;
-       }
-       DRMLISTADDTAIL(&cur->head, &reloc_list->list);
+    bo_ttm->relocs = malloc(sizeof(struct dri_ttm_reloc) *
+                           bufmgr_ttm->max_relocs);
 
-       cur_type->relocs[0] = 0 | (reloc_info->type << 16);
-       cur_type->relocs[1] = 0; // next reloc buffer handle is 0
+    if (bufmgr_ttm->cached_reloc_buf != NULL) {
+       bo_ttm->reloc_buf = bufmgr_ttm->cached_reloc_buf;
+       bo_ttm->reloc_buf_data = bufmgr_ttm->cached_reloc_buf_data;
 
+       bufmgr_ttm->cached_reloc_buf = NULL;
+       bufmgr_ttm->cached_reloc_buf_data = NULL;
     } else {
-       int found = 0;
-       if ((cur->type_list.relocs[0] >> 16) == reloc_info->type) {
-               cur_type = &cur->type_list;
-               found = 1;
-       } else {
-           for (l = cur->type_list.head.next; l != &cur->type_list.head; l = l->next) {
-               cur_type = DRMLISTENTRY(struct intel_bo_reloc_list, l, head);
-               if (((cur_type->relocs[0] >> 16) & 0xffff) == reloc_info->type)
-                   found = 1;
-               break;
-           }
-        }
-       
-       /* didn't find the relocation type */
-       if (!found) {
-           cur_type = malloc(sizeof(*cur_type));
-           if (!cur_type) {
-               return -ENOMEM;
-           }
-           
-           ret = intel_create_new_reloc_type_list(fd, cur_type, max_relocs);
-           DRMLISTADDTAIL(&cur_type->head, &cur->type_list.head);
-
-           cur_type->relocs[0] = (reloc_info->type << 16);
-           cur_type->relocs[1] = 0;
-
-           cur->nr_reloc_types++;
-       }
+       bo_ttm->reloc_buf = malloc(sizeof(bo_ttm->drm_bo));
+       ret = drmBOCreate(bufmgr_ttm->fd,
+                        RELOC_BUF_SIZE(bufmgr_ttm->max_relocs), 0,
+                        NULL,
+                        DRM_BO_FLAG_MEM_LOCAL |
+                        DRM_BO_FLAG_READ |
+                        DRM_BO_FLAG_WRITE |
+                        DRM_BO_FLAG_MAPPABLE |
+                        DRM_BO_FLAG_CACHED,
+                        0, bo_ttm->reloc_buf);
+       if (ret) {
+         fprintf(stderr, "Failed to create relocation BO: %s\n",
+                 strerror(-ret));
+         return ret;
+       }
+
+       ret = drmBOMap(bufmgr_ttm->fd, bo_ttm->reloc_buf,
+                     DRM_BO_FLAG_READ | DRM_BO_FLAG_WRITE,
+                     0, (void **)&bo_ttm->reloc_buf_data);
+       if (ret) {
+         fprintf(stderr, "Failed to map relocation BO: %s\n",
+                 strerror(-ret));
+         return ret;
+       }
     }
 
-    reloc_start = cur_type->relocs;
+    /* Initialize the relocation list with the header:
+     * DWORD 0: relocation type, relocation count
+     * DWORD 1: handle to next relocation list (currently none)
+     * DWORD 2: unused
+     * DWORD 3: unused
+     */
+    bo_ttm->reloc_buf_data[0] = I915_RELOC_TYPE_0 << 16;
+    bo_ttm->reloc_buf_data[1] = 0;
+    bo_ttm->reloc_buf_data[2] = 0;
+    bo_ttm->reloc_buf_data[3] = 0;
 
-    num_relocs = (reloc_start[0] & 0xffff);
-
-    reloc_start[num_relocs*I915_RELOC0_STRIDE + I915_RELOC_HEADER] = reloc_info->reloc;
-    reloc_start[num_relocs*I915_RELOC0_STRIDE + I915_RELOC_HEADER+1] = reloc_info->delta;
-    reloc_start[num_relocs*I915_RELOC0_STRIDE + I915_RELOC_HEADER+2] = reloc_info->index;
-    reloc_start[0]++;
-    if (((reloc_start[0] & 0xffff)) > (max_relocs)) {
-       return -ENOMEM;
-    }
     return 0;
 }
 
-
 #if 0
 int
 driFenceSignaled(DriFenceObject * fence, unsigned type)
 {
-   int signaled;
-   int ret;
+    int signaled;
+    int ret;
 
-   if (fence == NULL)
-      return GL_TRUE;
+    if (fence == NULL)
+       return GL_TRUE;
 
-   _glthread_LOCK_MUTEX(fence->mutex);
-   ret = drmFenceSignaled(bufmgr_ttm->fd, &fence->fence, type, &signaled);
-   _glthread_UNLOCK_MUTEX(fence->mutex);
-   BM_CKFATAL(ret);
-   return signaled;
+    ret = drmFenceSignaled(bufmgr_ttm->fd, &fence->fence, type, &signaled);
+    BM_CKFATAL(ret);
+    return signaled;
 }
 #endif
 
 static dri_bo *
 dri_ttm_alloc(dri_bufmgr *bufmgr, const char *name,
              unsigned long size, unsigned int alignment,
-             unsigned int location_mask)
+             uint64_t location_mask)
 {
-   dri_bufmgr_ttm *ttm_bufmgr;
-   dri_bo_ttm *ttm_buf;
-   unsigned int pageSize = getpagesize();
-   int ret;
-   unsigned int flags, hint;
-
-   ttm_bufmgr = (dri_bufmgr_ttm *)bufmgr;
-
-   ttm_buf = malloc(sizeof(*ttm_buf));
-   if (!ttm_buf)
-      return NULL;
-
-   /* The mask argument doesn't do anything for us that we want other than
-    * determine which pool (TTM or local) the buffer is allocated into, so just
-    * pass all of the allocation class flags.
-    */
-   flags = location_mask | DRM_BO_FLAG_READ | DRM_BO_FLAG_WRITE |
-      DRM_BO_FLAG_EXE;
-   /* No hints we want to use. */
-   hint = 0;
-
-   ret = drmBOCreate(ttm_bufmgr->fd, size, alignment / pageSize,
-                    NULL, flags, hint, &ttm_buf->drm_bo);
-   if (ret != 0) {
-      free(ttm_buf);
-      return NULL;
-   }
-   ttm_buf->bo.size = ttm_buf->drm_bo.size;
-   ttm_buf->bo.offset = ttm_buf->drm_bo.offset;
-   ttm_buf->bo.virtual = NULL;
-   ttm_buf->bo.bufmgr = bufmgr;
-   ttm_buf->name = name;
-   ttm_buf->refcount = 1;
-
-#if BUFMGR_DEBUG
-   fprintf(stderr, "bo_create: %p (%s)\n", &ttm_buf->bo, ttm_buf->name);
-#endif
-
-   return &ttm_buf->bo;
+    dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)bufmgr;
+    dri_bo_ttm *ttm_buf;
+    unsigned int pageSize = getpagesize();
+    int ret;
+    unsigned int flags, hint;
+
+    ttm_buf = malloc(sizeof(*ttm_buf));
+    if (!ttm_buf)
+       return NULL;
+
+    /* The mask argument doesn't do anything for us that we want other than
+     * determine which pool (TTM or local) the buffer is allocated into, so
+     * just pass all of the allocation class flags.
+     */
+    flags = location_mask | DRM_BO_FLAG_READ | DRM_BO_FLAG_WRITE |
+       DRM_BO_FLAG_EXE;
+    /* No hints we want to use. */
+    hint = 0;
+
+    ret = drmBOCreate(bufmgr_ttm->fd, size, alignment / pageSize,
+                     NULL, flags, hint, &ttm_buf->drm_bo);
+    if (ret != 0) {
+       free(ttm_buf);
+       return NULL;
+    }
+    ttm_buf->bo.size = ttm_buf->drm_bo.size;
+    ttm_buf->bo.offset = ttm_buf->drm_bo.offset;
+    ttm_buf->bo.virtual = NULL;
+    ttm_buf->bo.bufmgr = bufmgr;
+    ttm_buf->name = name;
+    ttm_buf->refcount = 1;
+    ttm_buf->reloc_buf = NULL;
+    ttm_buf->reloc_buf_data = NULL;
+    ttm_buf->relocs = NULL;
+    ttm_buf->last_flags = ttm_buf->drm_bo.flags;
+
+    DBG("bo_create: %p (%s) %db\n", &ttm_buf->bo, ttm_buf->name, size);
+
+    return &ttm_buf->bo;
 }
 
 /* Our TTM backend doesn't allow creation of static buffers, as that requires
@@ -472,12 +447,13 @@ dri_ttm_alloc(dri_bufmgr *bufmgr, const char *name,
 static dri_bo *
 dri_ttm_alloc_static(dri_bufmgr *bufmgr, const char *name,
                     unsigned long offset, unsigned long size, void *virtual,
-                    unsigned int location_mask)
+                    uint64_t location_mask)
 {
-   return NULL;
+    return NULL;
 }
 
-/** Returns a dri_bo wrapping the given buffer object handle.
+/**
+ * Returns a dri_bo wrapping the given buffer object handle.
  *
  * This can be used when one application needs to pass a buffer object
  * to another.
@@ -486,121 +462,135 @@ dri_bo *
 intel_ttm_bo_create_from_handle(dri_bufmgr *bufmgr, const char *name,
                              unsigned int handle)
 {
-   dri_bufmgr_ttm *ttm_bufmgr;
-   dri_bo_ttm *ttm_buf;
-   int ret;
-
-   ttm_bufmgr = (dri_bufmgr_ttm *)bufmgr;
-
-   ttm_buf = malloc(sizeof(*ttm_buf));
-   if (!ttm_buf)
-      return NULL;
-
-   ret = drmBOReference(ttm_bufmgr->fd, handle, &ttm_buf->drm_bo);
-   if (ret != 0) {
-      free(ttm_buf);
-      return NULL;
-   }
-   ttm_buf->bo.size = ttm_buf->drm_bo.size;
-   ttm_buf->bo.offset = ttm_buf->drm_bo.offset;
-   ttm_buf->bo.virtual = NULL;
-   ttm_buf->bo.bufmgr = bufmgr;
-   ttm_buf->name = name;
-   ttm_buf->refcount = 1;
-
-#if BUFMGR_DEBUG
-   fprintf(stderr, "bo_create_from_handle: %p %08x (%s)\n", &ttm_buf->bo, handle,
-          ttm_buf->name);
-#endif
+    dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)bufmgr;
+    dri_bo_ttm *ttm_buf;
+    int ret;
+
+    ttm_buf = malloc(sizeof(*ttm_buf));
+    if (!ttm_buf)
+       return NULL;
 
-   return &ttm_buf->bo;
+    ret = drmBOReference(bufmgr_ttm->fd, handle, &ttm_buf->drm_bo);
+    if (ret != 0) {
+       fprintf(stderr, "Couldn't reference %s handle 0x%08x: %s\n",
+              name, handle, strerror(-ret));
+       free(ttm_buf);
+       return NULL;
+    }
+    ttm_buf->bo.size = ttm_buf->drm_bo.size;
+    ttm_buf->bo.offset = ttm_buf->drm_bo.offset;
+    ttm_buf->bo.virtual = NULL;
+    ttm_buf->bo.bufmgr = bufmgr;
+    ttm_buf->name = name;
+    ttm_buf->refcount = 1;
+    ttm_buf->reloc_buf = NULL;
+    ttm_buf->reloc_buf_data = NULL;
+    ttm_buf->relocs = NULL;
+    ttm_buf->last_flags = ttm_buf->drm_bo.flags;
+
+    DBG("bo_create_from_handle: %p %08x (%s)\n",
+       &ttm_buf->bo, handle, ttm_buf->name);
+
+    return &ttm_buf->bo;
 }
 
 static void
 dri_ttm_bo_reference(dri_bo *buf)
 {
-   dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)buf->bufmgr;
-   dri_bo_ttm *ttm_buf = (dri_bo_ttm *)buf;
+    dri_bo_ttm *ttm_buf = (dri_bo_ttm *)buf;
 
-   _glthread_LOCK_MUTEX(bufmgr_ttm->mutex);
-   ttm_buf->refcount++;
-   _glthread_UNLOCK_MUTEX(bufmgr_ttm->mutex);
+    ttm_buf->refcount++;
 }
 
 static void
 dri_ttm_bo_unreference(dri_bo *buf)
 {
-   dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)buf->bufmgr;
-   dri_bo_ttm *ttm_buf = (dri_bo_ttm *)buf;
-
-   if (!buf)
-      return;
-
-   _glthread_LOCK_MUTEX(bufmgr_ttm->mutex);
-   if (--ttm_buf->refcount == 0) {
-      int ret;
-
-      ret = drmBOUnreference(bufmgr_ttm->fd, &ttm_buf->drm_bo);
-      if (ret != 0) {
-        fprintf(stderr, "drmBOUnreference failed (%s): %s\n", ttm_buf->name,
-                strerror(-ret));
-      }
-#if BUFMGR_DEBUG
-      fprintf(stderr, "bo_unreference final: %p (%s)\n",
-             &ttm_buf->bo, ttm_buf->name);
-#endif
-      _glthread_UNLOCK_MUTEX(bufmgr_ttm->mutex);
-      free(buf);
-      return;
-   }
-   _glthread_UNLOCK_MUTEX(bufmgr_ttm->mutex);
+    dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)buf->bufmgr;
+    dri_bo_ttm *ttm_buf = (dri_bo_ttm *)buf;
+
+    if (!buf)
+       return;
+
+    if (--ttm_buf->refcount == 0) {
+       int ret;
+
+       if (ttm_buf->reloc_buf) {
+           int i;
+
+           /* Unreference all the target buffers */
+           for (i = 0; i < (ttm_buf->reloc_buf_data[0] & 0xffff); i++)
+                dri_bo_unreference(ttm_buf->relocs[i].target_buf);
+           free(ttm_buf->relocs);
+
+           if (bufmgr_ttm->cached_reloc_buf == NULL) {
+              /* Cache a single relocation buffer allocation to avoid
+               * repeated create/map/unmap/destroy for batchbuffer
+               * relocations.
+               */
+              bufmgr_ttm->cached_reloc_buf = ttm_buf->reloc_buf;
+              bufmgr_ttm->cached_reloc_buf_data = ttm_buf->reloc_buf_data;
+           } else {
+              /* Free the kernel BO containing relocation entries */
+              drmBOUnmap(bufmgr_ttm->fd, ttm_buf->reloc_buf);
+              drmBOUnreference(bufmgr_ttm->fd, ttm_buf->reloc_buf);
+              free(ttm_buf->reloc_buf);
+           }
+       }
+
+       ret = drmBOUnreference(bufmgr_ttm->fd, &ttm_buf->drm_bo);
+       if (ret != 0) {
+           fprintf(stderr, "drmBOUnreference failed (%s): %s\n",
+                   ttm_buf->name, strerror(-ret));
+       }
+       DBG("bo_unreference final: %p (%s)\n", &ttm_buf->bo, ttm_buf->name);
+
+       free(buf);
+       return;
+    }
 }
 
 static int
 dri_ttm_bo_map(dri_bo *buf, GLboolean write_enable)
 {
-   dri_bufmgr_ttm *bufmgr_ttm;
-   dri_bo_ttm *ttm_buf = (dri_bo_ttm *)buf;
-   unsigned int flags;
+    dri_bufmgr_ttm *bufmgr_ttm;
+    dri_bo_ttm *ttm_buf = (dri_bo_ttm *)buf;
+    unsigned int flags;
 
-   bufmgr_ttm = (dri_bufmgr_ttm *)buf->bufmgr;
+    bufmgr_ttm = (dri_bufmgr_ttm *)buf->bufmgr;
 
-   flags = DRM_BO_FLAG_READ;
-   if (write_enable)
-       flags |= DRM_BO_FLAG_WRITE;
+    flags = DRM_BO_FLAG_READ;
+    if (write_enable)
+       flags |= DRM_BO_FLAG_WRITE;
 
-   assert(buf->virtual == NULL);
+    assert(buf->virtual == NULL);
 
-#if BUFMGR_DEBUG
-   fprintf(stderr, "bo_map: %p (%s)\n", &ttm_buf->bo, ttm_buf->name);
-#endif
+    DBG("bo_map: %p (%s)\n", &ttm_buf->bo, ttm_buf->name);
 
-   return drmBOMap(bufmgr_ttm->fd, &ttm_buf->drm_bo, flags, 0, &buf->virtual);
+    return drmBOMap(bufmgr_ttm->fd, &ttm_buf->drm_bo, flags, 0, &buf->virtual);
 }
 
 static int
 dri_ttm_bo_unmap(dri_bo *buf)
 {
-   dri_bufmgr_ttm *bufmgr_ttm;
-   dri_bo_ttm *ttm_buf = (dri_bo_ttm *)buf;
+    dri_bufmgr_ttm *bufmgr_ttm;
+    dri_bo_ttm *ttm_buf = (dri_bo_ttm *)buf;
 
-   if (buf == NULL)
-      return 0;
+    if (buf == NULL)
+       return 0;
 
-   bufmgr_ttm = (dri_bufmgr_ttm *)buf->bufmgr;
+    bufmgr_ttm = (dri_bufmgr_ttm *)buf->bufmgr;
 
-   assert(buf->virtual != NULL);
+    assert(buf->virtual != NULL);
 
-   buf->virtual = NULL;
+    buf->virtual = NULL;
 
-#if BUFMGR_DEBUG
-   fprintf(stderr, "bo_unmap: %p (%s)\n", &ttm_buf->bo, ttm_buf->name);
-#endif
+    DBG("bo_unmap: %p (%s)\n", &ttm_buf->bo, ttm_buf->name);
 
-   return drmBOUnmap(bufmgr_ttm->fd, &ttm_buf->drm_bo);
+    return drmBOUnmap(bufmgr_ttm->fd, &ttm_buf->drm_bo);
 }
 
-/* Returns a dri_bo wrapping the given buffer object handle.
+/**
+ * Returns a dri_bo wrapping the given buffer object handle.
  *
  * This can be used when one application needs to pass a buffer object
  * to another.
@@ -609,183 +599,269 @@ dri_fence *
 intel_ttm_fence_create_from_arg(dri_bufmgr *bufmgr, const char *name,
                                drm_fence_arg_t *arg)
 {
-   dri_bufmgr_ttm *ttm_bufmgr;
-   dri_fence_ttm *ttm_fence;
+    dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)bufmgr;
+    dri_fence_ttm *ttm_fence;
 
-   ttm_bufmgr = (dri_bufmgr_ttm *)bufmgr;
+    ttm_fence = malloc(sizeof(*ttm_fence));
+    if (!ttm_fence)
+       return NULL;
 
-   ttm_fence = malloc(sizeof(*ttm_fence));
-   if (!ttm_fence)
-      return NULL;
+    ttm_fence->drm_fence.handle = arg->handle;
+    ttm_fence->drm_fence.fence_class = arg->fence_class;
+    ttm_fence->drm_fence.type = arg->type;
+    ttm_fence->drm_fence.flags = arg->flags;
+    ttm_fence->drm_fence.signaled = 0;
+    ttm_fence->drm_fence.sequence = arg->sequence;
 
-   ttm_fence->drm_fence.handle = arg->handle;
-   ttm_fence->drm_fence.fence_class = arg->fence_class;
-   ttm_fence->drm_fence.type = arg->type;
-   ttm_fence->drm_fence.flags = arg->flags;
-   ttm_fence->drm_fence.signaled = 0;
-   ttm_fence->drm_fence.sequence = arg->sequence;
+    ttm_fence->fence.bufmgr = bufmgr;
+    ttm_fence->name = name;
+    ttm_fence->refcount = 1;
 
-   ttm_fence->fence.bufmgr = bufmgr;
-   ttm_fence->name = name;
-   ttm_fence->refcount = 1;
+    DBG("fence_create_from_handle: %p (%s)\n",
+       &ttm_fence->fence, ttm_fence->name);
 
-#if BUFMGR_DEBUG
-   fprintf(stderr, "fence_create_from_handle: %p (%s)\n", &ttm_fence->fence,
-          ttm_fence->name);
-#endif
-
-   return &ttm_fence->fence;
+    return &ttm_fence->fence;
 }
 
 
 static void
 dri_ttm_fence_reference(dri_fence *fence)
 {
-   dri_fence_ttm *fence_ttm = (dri_fence_ttm *)fence;
-   dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)fence->bufmgr;
-
-   _glthread_LOCK_MUTEX(bufmgr_ttm->mutex);
-   ++fence_ttm->refcount;
-   _glthread_UNLOCK_MUTEX(bufmgr_ttm->mutex);
-#if BUFMGR_DEBUG
-   fprintf(stderr, "fence_reference: %p (%s)\n", &fence_ttm->fence,
-          fence_ttm->name);
-#endif
+    dri_fence_ttm *fence_ttm = (dri_fence_ttm *)fence;
+    dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)fence->bufmgr;
+
+    ++fence_ttm->refcount;
+    DBG("fence_reference: %p (%s)\n", &fence_ttm->fence, fence_ttm->name);
 }
 
 static void
 dri_ttm_fence_unreference(dri_fence *fence)
 {
-   dri_fence_ttm *fence_ttm = (dri_fence_ttm *)fence;
-   dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)fence->bufmgr;
+    dri_fence_ttm *fence_ttm = (dri_fence_ttm *)fence;
+    dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)fence->bufmgr;
 
-   if (!fence)
-      return;
+    if (!fence)
+       return;
 
-#if BUFMGR_DEBUG
-   fprintf(stderr, "fence_unreference: %p (%s)\n", &fence_ttm->fence,
-          fence_ttm->name);
-#endif
-   _glthread_LOCK_MUTEX(bufmgr_ttm->mutex);
-   if (--fence_ttm->refcount == 0) {
-      int ret;
-
-      ret = drmFenceUnreference(bufmgr_ttm->fd, &fence_ttm->drm_fence);
-      if (ret != 0) {
-        fprintf(stderr, "drmFenceUnreference failed (%s): %s\n",
-                fence_ttm->name, strerror(-ret));
-      }
-
-      _glthread_UNLOCK_MUTEX(bufmgr_ttm->mutex);
-      free(fence);
-      return;
-   }
-   _glthread_UNLOCK_MUTEX(bufmgr_ttm->mutex);
+    DBG("fence_unreference: %p (%s)\n", &fence_ttm->fence, fence_ttm->name);
+
+    if (--fence_ttm->refcount == 0) {
+       int ret;
+
+       ret = drmFenceUnreference(bufmgr_ttm->fd, &fence_ttm->drm_fence);
+       if (ret != 0) {
+           fprintf(stderr, "drmFenceUnreference failed (%s): %s\n",
+                   fence_ttm->name, strerror(-ret));
+       }
+
+       free(fence);
+       return;
+    }
 }
 
 static void
 dri_ttm_fence_wait(dri_fence *fence)
 {
-   dri_fence_ttm *fence_ttm = (dri_fence_ttm *)fence;
-   dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)fence->bufmgr;
-   int ret;
-
-   _glthread_LOCK_MUTEX(bufmgr_ttm->mutex);
-   ret = drmFenceWait(bufmgr_ttm->fd, 0, &fence_ttm->drm_fence, 0);
-   _glthread_UNLOCK_MUTEX(bufmgr_ttm->mutex);
-   if (ret != 0) {
-      _mesa_printf("%s:%d: Error %d waiting for fence %s.\n",
-                  __FILE__, __LINE__, ret, fence_ttm->name);
-      abort();
-   }
-
-#if BUFMGR_DEBUG
-   fprintf(stderr, "fence_wait: %p (%s)\n", &fence_ttm->fence,
-          fence_ttm->name);
-#endif
+    dri_fence_ttm *fence_ttm = (dri_fence_ttm *)fence;
+    dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)fence->bufmgr;
+    int ret;
+
+    ret = drmFenceWait(bufmgr_ttm->fd, DRM_FENCE_FLAG_WAIT_LAZY, &fence_ttm->drm_fence, 0);
+    if (ret != 0) {
+       _mesa_printf("%s:%d: Error %d waiting for fence %s.\n",
+                    __FILE__, __LINE__, ret, fence_ttm->name);
+       abort();
+    }
+
+    DBG("fence_wait: %p (%s)\n", &fence_ttm->fence, fence_ttm->name);
 }
 
 static void
 dri_bufmgr_ttm_destroy(dri_bufmgr *bufmgr)
 {
-   dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)bufmgr;
+    dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)bufmgr;
 
-   intel_bo_free_list(&bufmgr_ttm->list);
-   intel_bo_free_list(&bufmgr_ttm->reloc_list);
+    if (bufmgr_ttm->cached_reloc_buf) {
+       /* Free the cached kernel BO containing relocation entries */
+       drmBOUnmap(bufmgr_ttm->fd, bufmgr_ttm->cached_reloc_buf);
+       drmBOUnreference(bufmgr_ttm->fd, bufmgr_ttm->cached_reloc_buf);
+       free(bufmgr_ttm->cached_reloc_buf);
+    }
 
-   _glthread_DESTROY_MUTEX(bufmgr_ttm->mutex);
-   free(bufmgr);
-}
+    intel_free_validate_list(bufmgr_ttm);
 
+    free(bufmgr);
+}
 
-static void intel_dribo_destroy_callback(void *priv)
+/**
+ * Adds the target buffer to the validation list and adds the relocation
+ * to the reloc_buffer's relocation list.
+ *
+ * The relocation entry at the given offset must already contain the
+ * precomputed relocation value, because the kernel will optimize out
+ * the relocation entry write when the buffer hasn't moved from the
+ * last known offset in target_buf.
+ */
+static void
+dri_ttm_emit_reloc(dri_bo *reloc_buf, uint64_t flags, GLuint delta,
+                  GLuint offset, dri_bo *target_buf)
 {
-   dri_bo *dribo = priv;
-   
-   if (dribo) {
-     dri_bo_unreference(dribo);
-   }
+    dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)reloc_buf->bufmgr;
+    dri_bo_ttm *reloc_buf_ttm = (dri_bo_ttm *)reloc_buf;
+    int num_relocs;
+    uint32_t *this_reloc;
+
+    intel_setup_reloc_list(reloc_buf);
+
+    num_relocs = (reloc_buf_ttm->reloc_buf_data[0] & 0xffff);
+
+    /* Check overflow */
+    assert((reloc_buf_ttm->reloc_buf_data[0] & 0xffff) <
+          bufmgr_ttm->max_relocs);
+
+    this_reloc = reloc_buf_ttm->reloc_buf_data + I915_RELOC_HEADER +
+       num_relocs * I915_RELOC0_STRIDE;
+
+    this_reloc[0] = offset;
+    this_reloc[1] = delta;
+    this_reloc[2] = -1; /* To be filled in at exec time */
+    this_reloc[3] = 0;
+
+    reloc_buf_ttm->relocs[num_relocs].validate_flags = flags;
+    reloc_buf_ttm->relocs[num_relocs].target_buf = target_buf;
+    dri_bo_reference(target_buf);
+
+    reloc_buf_ttm->reloc_buf_data[0]++; /* Increment relocation count */
+    /* Check wraparound */
+    assert((reloc_buf_ttm->reloc_buf_data[0] & 0xffff) != 0);
 }
 
+/**
+ * Walk the tree of relocations rooted at BO and accumulate the list of
+ * validations to be performed and update the relocation buffers with
+ * index values into the validation list.
+ */
 static void
-dri_ttm_emit_reloc(dri_bo *batch_buf, GLuint flags, GLuint delta, GLuint offset,
-                   dri_bo *relocatee)
+dri_ttm_bo_process_reloc(dri_bo *bo)
 {
-   dri_bo_ttm *ttm_buf = (dri_bo_ttm *)batch_buf;
-   dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)batch_buf->bufmgr;
-   int newItem;
-   struct intel_reloc_info reloc;
-   int mask;
-   int ret;
-
-   mask = DRM_BO_MASK_MEM;
-   mask |= flags & (DRM_BO_FLAG_READ | DRM_BO_FLAG_WRITE | DRM_BO_FLAG_EXE);
-
-   ret = intel_add_validate_buffer(&bufmgr_ttm->list, relocatee, flags, mask, &newItem, intel_dribo_destroy_callback);
-   if (ret < 0)
-     return;
-
-   if (ret == 1) {
-      dri_bo_reference(relocatee);
-   }
-
-   reloc.type = I915_RELOC_TYPE_0;
-   reloc.reloc = offset;
-   reloc.delta = delta;
-   reloc.index = newItem;
-   reloc.handle = ttm_buf->drm_bo.handle;
-
-   intel_add_validate_reloc(bufmgr_ttm->fd, &bufmgr_ttm->reloc_list, &reloc, bufmgr_ttm->max_relocs);
-   return;
-}
+    dri_bo_ttm *bo_ttm = (dri_bo_ttm *)bo;
+    unsigned int nr_relocs;
+    int i;
+
+    if (bo_ttm->reloc_buf_data == NULL)
+       return;
 
+    nr_relocs = bo_ttm->reloc_buf_data[0] & 0xffff;
+
+    for (i = 0; i < nr_relocs; i++) {
+       struct dri_ttm_reloc *r = &bo_ttm->relocs[i];
+       dri_bo_ttm *target_ttm = (dri_bo_ttm *)r->target_buf;
+       uint32_t *reloc_entry;
+
+       /* Continue walking the tree depth-first. */
+       dri_ttm_bo_process_reloc(r->target_buf);
+
+       /* Add the target to the validate list */
+       intel_add_validate_buffer(r->target_buf, r->validate_flags);
+
+       /* Update the index of the target in the relocation entry */
+       reloc_entry = bo_ttm->reloc_buf_data + I915_RELOC_HEADER +
+           i * I915_RELOC0_STRIDE;
+       reloc_entry[2] = target_ttm->validate_index;
+    }
+}
 
 static void *
 dri_ttm_process_reloc(dri_bo *batch_buf, GLuint *count)
 {
-   dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)batch_buf->bufmgr;
-   void *ptr;
-   int itemLoc;
+    dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)batch_buf->bufmgr;
+    void *ptr;
 
-   dri_bo_unmap(batch_buf);
+    /* Update indices and set up the validate list. */
+    dri_ttm_bo_process_reloc(batch_buf);
+
+    /* Add the batch buffer to the validation list.  There are no relocations
+     * pointing to it.
+     */
+    intel_add_validate_buffer(batch_buf,
+                             DRM_BO_FLAG_MEM_TT | DRM_BO_FLAG_EXE);
+
+    ptr = intel_setup_validate_list(bufmgr_ttm, count);
+
+    return ptr;
+}
+
+static const char *
+intel_get_flags_mem_type_string(uint64_t flags)
+{
+    switch (flags & DRM_BO_MASK_MEM) {
+    case DRM_BO_FLAG_MEM_LOCAL: return "local";
+    case DRM_BO_FLAG_MEM_TT: return "ttm";
+    case DRM_BO_FLAG_MEM_VRAM: return "vram";
+    case DRM_BO_FLAG_MEM_PRIV0: return "priv0";
+    case DRM_BO_FLAG_MEM_PRIV1: return "priv1";
+    case DRM_BO_FLAG_MEM_PRIV2: return "priv2";
+    case DRM_BO_FLAG_MEM_PRIV3: return "priv3";
+    case DRM_BO_FLAG_MEM_PRIV4: return "priv4";
+    default: return NULL;
+    }
+}
 
-   intel_add_validate_buffer(&bufmgr_ttm->list, batch_buf, DRM_BO_FLAG_MEM_TT | DRM_BO_FLAG_EXE,
-                            DRM_BO_MASK_MEM | DRM_BO_FLAG_EXE, &itemLoc, NULL);
+static const char *
+intel_get_flags_caching_string(uint64_t flags)
+{
+    switch (flags & (DRM_BO_FLAG_CACHED | DRM_BO_FLAG_CACHED_MAPPED)) {
+    case 0: return "UU";
+    case DRM_BO_FLAG_CACHED: return "CU";
+    case DRM_BO_FLAG_CACHED_MAPPED: return "UC";
+    case DRM_BO_FLAG_CACHED | DRM_BO_FLAG_CACHED_MAPPED: return "CC";
+    default: return NULL;
+    }
+}
 
-   ptr = intel_setup_validate_list(bufmgr_ttm->fd, &bufmgr_ttm->list, &bufmgr_ttm->reloc_list, count);
+static void
+intel_update_buffer_offsets (dri_bufmgr_ttm *bufmgr_ttm)
+{
+    struct intel_bo_list *list = &bufmgr_ttm->list;
+    drmMMListHead *l;
 
-   return ptr;
+    for (l = list->list.next; l != &list->list; l = l->next) {
+        struct intel_bo_node *node =
+           DRMLISTENTRY(struct intel_bo_node, l, head);
+       struct drm_i915_op_arg *arg = &node->bo_arg;
+       struct drm_bo_arg_rep *rep = &arg->d.rep;
+       dri_bo *bo = node->bo;
+       dri_bo_ttm *bo_ttm = (dri_bo_ttm *)bo;
+
+       if (rep->bo_info.flags != bo_ttm->last_flags) {
+           DBG("BO %s migrated: %s/%s -> %s/%s\n",
+               bo_ttm->name,
+               intel_get_flags_mem_type_string(bo_ttm->last_flags),
+               intel_get_flags_caching_string(bo_ttm->last_flags),
+               intel_get_flags_mem_type_string(rep->bo_info.flags),
+               intel_get_flags_caching_string(rep->bo_info.flags));
+
+           bo_ttm->last_flags = rep->bo_info.flags;
+       }
+       if (rep->bo_info.offset != bo->offset) {
+           DBG("BO %s migrated: 0x%08x -> 0x%08x\n",
+               bo_ttm->name, bo->offset, rep->bo_info.offset);
+           bo->offset = rep->bo_info.offset;
+       }
+    }
 }
 
 static void
 dri_ttm_post_submit(dri_bo *batch_buf, dri_fence **last_fence)
 {
-   dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)batch_buf->bufmgr;
+    dri_bufmgr_ttm *bufmgr_ttm = (dri_bufmgr_ttm *)batch_buf->bufmgr;
+
+    intel_update_buffer_offsets (bufmgr_ttm);
 
-   intel_free_validate_list(bufmgr_ttm->fd, &bufmgr_ttm->list);
-   intel_free_reloc_list(bufmgr_ttm->fd, &bufmgr_ttm->reloc_list);
+    if (bufmgr_ttm->bufmgr.debug)
+       dri_ttm_dump_validation_list(bufmgr_ttm);
 
-   intel_bo_free_list(&bufmgr_ttm->list);
+    intel_free_validate_list(bufmgr_ttm);
 }
 
 /**
@@ -801,33 +877,35 @@ dri_bufmgr *
 intel_bufmgr_ttm_init(int fd, unsigned int fence_type,
                      unsigned int fence_type_flush, int batch_size)
 {
-   dri_bufmgr_ttm *bufmgr_ttm;
-
-   bufmgr_ttm = malloc(sizeof(*bufmgr_ttm));
-   bufmgr_ttm->fd = fd;
-   bufmgr_ttm->fence_type = fence_type;
-   bufmgr_ttm->fence_type_flush = fence_type_flush;
-   _glthread_INIT_MUTEX(bufmgr_ttm->mutex);
-
-   /* lets go with one relocation per every four dwords - purely heuristic */
-   bufmgr_ttm->max_relocs = batch_size / sizeof(uint32_t) / 4;
-
-   intel_create_bo_list(10, &bufmgr_ttm->list, NULL);
-   intel_create_bo_list(1, &bufmgr_ttm->reloc_list, NULL);
-
-   bufmgr_ttm->bufmgr.bo_alloc = dri_ttm_alloc;
-   bufmgr_ttm->bufmgr.bo_alloc_static = dri_ttm_alloc_static;
-   bufmgr_ttm->bufmgr.bo_reference = dri_ttm_bo_reference;
-   bufmgr_ttm->bufmgr.bo_unreference = dri_ttm_bo_unreference;
-   bufmgr_ttm->bufmgr.bo_map = dri_ttm_bo_map;
-   bufmgr_ttm->bufmgr.bo_unmap = dri_ttm_bo_unmap;
-   bufmgr_ttm->bufmgr.fence_reference = dri_ttm_fence_reference;
-   bufmgr_ttm->bufmgr.fence_unreference = dri_ttm_fence_unreference;
-   bufmgr_ttm->bufmgr.fence_wait = dri_ttm_fence_wait;
-   bufmgr_ttm->bufmgr.destroy = dri_bufmgr_ttm_destroy;
-   bufmgr_ttm->bufmgr.emit_reloc = dri_ttm_emit_reloc;
-   bufmgr_ttm->bufmgr.process_relocs = dri_ttm_process_reloc;
-   bufmgr_ttm->bufmgr.post_submit = dri_ttm_post_submit;
-   return &bufmgr_ttm->bufmgr;
+    dri_bufmgr_ttm *bufmgr_ttm;
+
+    bufmgr_ttm = malloc(sizeof(*bufmgr_ttm));
+    bufmgr_ttm->fd = fd;
+    bufmgr_ttm->fence_type = fence_type;
+    bufmgr_ttm->fence_type_flush = fence_type_flush;
+    bufmgr_ttm->cached_reloc_buf = NULL;
+    bufmgr_ttm->cached_reloc_buf_data = NULL;
+
+    /* lets go with one relocation per every four dwords - purely heuristic */
+    bufmgr_ttm->max_relocs = batch_size / sizeof(uint32_t) / 4;
+
+    intel_init_validate_list(&bufmgr_ttm->list);
+
+    bufmgr_ttm->bufmgr.bo_alloc = dri_ttm_alloc;
+    bufmgr_ttm->bufmgr.bo_alloc_static = dri_ttm_alloc_static;
+    bufmgr_ttm->bufmgr.bo_reference = dri_ttm_bo_reference;
+    bufmgr_ttm->bufmgr.bo_unreference = dri_ttm_bo_unreference;
+    bufmgr_ttm->bufmgr.bo_map = dri_ttm_bo_map;
+    bufmgr_ttm->bufmgr.bo_unmap = dri_ttm_bo_unmap;
+    bufmgr_ttm->bufmgr.fence_reference = dri_ttm_fence_reference;
+    bufmgr_ttm->bufmgr.fence_unreference = dri_ttm_fence_unreference;
+    bufmgr_ttm->bufmgr.fence_wait = dri_ttm_fence_wait;
+    bufmgr_ttm->bufmgr.destroy = dri_bufmgr_ttm_destroy;
+    bufmgr_ttm->bufmgr.emit_reloc = dri_ttm_emit_reloc;
+    bufmgr_ttm->bufmgr.process_relocs = dri_ttm_process_reloc;
+    bufmgr_ttm->bufmgr.post_submit = dri_ttm_post_submit;
+    bufmgr_ttm->bufmgr.debug = GL_FALSE;
+
+    return &bufmgr_ttm->bufmgr;
 }