OSDN Git Service

amdgpu: add a function to create amdgpu bo internally (v4)
[android-x86/external-libdrm.git] / freedreno / msm / msm_drm.h
1 /*
2  * Copyright (C) 2013 Red Hat
3  * Author: Rob Clark <robdclark@gmail.com>
4  *
5  * Permission is hereby granted, free of charge, to any person obtaining a
6  * copy of this software and associated documentation files (the "Software"),
7  * to deal in the Software without restriction, including without limitation
8  * the rights to use, copy, modify, merge, publish, distribute, sublicense,
9  * and/or sell copies of the Software, and to permit persons to whom the
10  * Software is furnished to do so, subject to the following conditions:
11  *
12  * The above copyright notice and this permission notice (including the next
13  * paragraph) shall be included in all copies or substantial portions of the
14  * Software.
15  *
16  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
17  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
18  * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL
19  * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
20  * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
21  * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
22  * SOFTWARE.
23  */
24
25 #ifndef __MSM_DRM_H__
26 #define __MSM_DRM_H__
27
28 #include <stddef.h>
29 #include "drm.h"
30
31 #if defined(__cplusplus)
32 extern "C" {
33 #endif
34
35 /* Please note that modifications to all structs defined here are
36  * subject to backwards-compatibility constraints:
37  *  1) Do not use pointers, use __u64 instead for 32 bit / 64 bit
38  *     user/kernel compatibility
39  *  2) Keep fields aligned to their size
40  *  3) Because of how drm_ioctl() works, we can add new fields at
41  *     the end of an ioctl if some care is taken: drm_ioctl() will
42  *     zero out the new fields at the tail of the ioctl, so a zero
43  *     value should have a backwards compatible meaning.  And for
44  *     output params, userspace won't see the newly added output
45  *     fields.. so that has to be somehow ok.
46  */
47
48 #define MSM_PIPE_NONE        0x00
49 #define MSM_PIPE_2D0         0x01
50 #define MSM_PIPE_2D1         0x02
51 #define MSM_PIPE_3D0         0x10
52
53 /* The pipe-id just uses the lower bits, so can be OR'd with flags in
54  * the upper 16 bits (which could be extended further, if needed, maybe
55  * we extend/overload the pipe-id some day to deal with multiple rings,
56  * but even then I don't think we need the full lower 16 bits).
57  */
58 #define MSM_PIPE_ID_MASK     0xffff
59 #define MSM_PIPE_ID(x)       ((x) & MSM_PIPE_ID_MASK)
60 #define MSM_PIPE_FLAGS(x)    ((x) & ~MSM_PIPE_ID_MASK)
61
62 /* timeouts are specified in clock-monotonic absolute times (to simplify
63  * restarting interrupted ioctls).  The following struct is logically the
64  * same as 'struct timespec' but 32/64b ABI safe.
65  */
66 struct drm_msm_timespec {
67         __s64 tv_sec;          /* seconds */
68         __s64 tv_nsec;         /* nanoseconds */
69 };
70
71 #define MSM_PARAM_GPU_ID     0x01
72 #define MSM_PARAM_GMEM_SIZE  0x02
73 #define MSM_PARAM_CHIP_ID    0x03
74 #define MSM_PARAM_MAX_FREQ   0x04
75 #define MSM_PARAM_TIMESTAMP  0x05
76 #define MSM_PARAM_GMEM_BASE  0x06
77 #define MSM_PARAM_NR_RINGS   0x07
78
79 struct drm_msm_param {
80         __u32 pipe;           /* in, MSM_PIPE_x */
81         __u32 param;          /* in, MSM_PARAM_x */
82         __u64 value;          /* out (get_param) or in (set_param) */
83 };
84
85 /*
86  * GEM buffers:
87  */
88
89 #define MSM_BO_SCANOUT       0x00000001     /* scanout capable */
90 #define MSM_BO_GPU_READONLY  0x00000002
91 #define MSM_BO_CACHE_MASK    0x000f0000
92 /* cache modes */
93 #define MSM_BO_CACHED        0x00010000
94 #define MSM_BO_WC            0x00020000
95 #define MSM_BO_UNCACHED      0x00040000
96
97 #define MSM_BO_FLAGS         (MSM_BO_SCANOUT | \
98                               MSM_BO_GPU_READONLY | \
99                               MSM_BO_CACHED | \
100                               MSM_BO_WC | \
101                               MSM_BO_UNCACHED)
102
103 struct drm_msm_gem_new {
104         __u64 size;           /* in */
105         __u32 flags;          /* in, mask of MSM_BO_x */
106         __u32 handle;         /* out */
107 };
108
109 #define MSM_INFO_IOVA   0x01
110
111 #define MSM_INFO_FLAGS (MSM_INFO_IOVA)
112
113 struct drm_msm_gem_info {
114         __u32 handle;         /* in */
115         __u32 flags;          /* in - combination of MSM_INFO_* flags */
116         __u64 offset;         /* out, mmap() offset or iova */
117 };
118
119 #define MSM_PREP_READ        0x01
120 #define MSM_PREP_WRITE       0x02
121 #define MSM_PREP_NOSYNC      0x04
122
123 #define MSM_PREP_FLAGS       (MSM_PREP_READ | MSM_PREP_WRITE | MSM_PREP_NOSYNC)
124
125 struct drm_msm_gem_cpu_prep {
126         __u32 handle;         /* in */
127         __u32 op;             /* in, mask of MSM_PREP_x */
128         struct drm_msm_timespec timeout;   /* in */
129 };
130
131 struct drm_msm_gem_cpu_fini {
132         __u32 handle;         /* in */
133 };
134
135 /*
136  * Cmdstream Submission:
137  */
138
139 /* The value written into the cmdstream is logically:
140  *
141  *   ((relocbuf->gpuaddr + reloc_offset) << shift) | or
142  *
143  * When we have GPU's w/ >32bit ptrs, it should be possible to deal
144  * with this by emit'ing two reloc entries with appropriate shift
145  * values.  Or a new MSM_SUBMIT_CMD_x type would also be an option.
146  *
147  * NOTE that reloc's must be sorted by order of increasing submit_offset,
148  * otherwise EINVAL.
149  */
150 struct drm_msm_gem_submit_reloc {
151         __u32 submit_offset;  /* in, offset from submit_bo */
152         __u32 or;             /* in, value OR'd with result */
153         __s32 shift;          /* in, amount of left shift (can be negative) */
154         __u32 reloc_idx;      /* in, index of reloc_bo buffer */
155         __u64 reloc_offset;   /* in, offset from start of reloc_bo */
156 };
157
158 /* submit-types:
159  *   BUF - this cmd buffer is executed normally.
160  *   IB_TARGET_BUF - this cmd buffer is an IB target.  Reloc's are
161  *      processed normally, but the kernel does not setup an IB to
162  *      this buffer in the first-level ringbuffer
163  *   CTX_RESTORE_BUF - only executed if there has been a GPU context
164  *      switch since the last SUBMIT ioctl
165  */
166 #define MSM_SUBMIT_CMD_BUF             0x0001
167 #define MSM_SUBMIT_CMD_IB_TARGET_BUF   0x0002
168 #define MSM_SUBMIT_CMD_CTX_RESTORE_BUF 0x0003
169 struct drm_msm_gem_submit_cmd {
170         __u32 type;           /* in, one of MSM_SUBMIT_CMD_x */
171         __u32 submit_idx;     /* in, index of submit_bo cmdstream buffer */
172         __u32 submit_offset;  /* in, offset into submit_bo */
173         __u32 size;           /* in, cmdstream size */
174         __u32 pad;
175         __u32 nr_relocs;      /* in, number of submit_reloc's */
176         __u64 relocs;         /* in, ptr to array of submit_reloc's */
177 };
178
179 /* Each buffer referenced elsewhere in the cmdstream submit (ie. the
180  * cmdstream buffer(s) themselves or reloc entries) has one (and only
181  * one) entry in the submit->bos[] table.
182  *
183  * As a optimization, the current buffer (gpu virtual address) can be
184  * passed back through the 'presumed' field.  If on a subsequent reloc,
185  * userspace passes back a 'presumed' address that is still valid,
186  * then patching the cmdstream for this entry is skipped.  This can
187  * avoid kernel needing to map/access the cmdstream bo in the common
188  * case.
189  */
190 #define MSM_SUBMIT_BO_READ             0x0001
191 #define MSM_SUBMIT_BO_WRITE            0x0002
192
193 #define MSM_SUBMIT_BO_FLAGS            (MSM_SUBMIT_BO_READ | MSM_SUBMIT_BO_WRITE)
194
195 struct drm_msm_gem_submit_bo {
196         __u32 flags;          /* in, mask of MSM_SUBMIT_BO_x */
197         __u32 handle;         /* in, GEM handle */
198         __u64 presumed;       /* in/out, presumed buffer address */
199 };
200
201 /* Valid submit ioctl flags: */
202 #define MSM_SUBMIT_NO_IMPLICIT   0x80000000 /* disable implicit sync */
203 #define MSM_SUBMIT_FENCE_FD_IN   0x40000000 /* enable input fence_fd */
204 #define MSM_SUBMIT_FENCE_FD_OUT  0x20000000 /* enable output fence_fd */
205 #define MSM_SUBMIT_FLAGS                ( \
206                 MSM_SUBMIT_NO_IMPLICIT   | \
207                 MSM_SUBMIT_FENCE_FD_IN   | \
208                 MSM_SUBMIT_FENCE_FD_OUT  | \
209                 0)
210
211 /* Each cmdstream submit consists of a table of buffers involved, and
212  * one or more cmdstream buffers.  This allows for conditional execution
213  * (context-restore), and IB buffers needed for per tile/bin draw cmds.
214  */
215 struct drm_msm_gem_submit {
216         __u32 flags;          /* MSM_PIPE_x | MSM_SUBMIT_x */
217         __u32 fence;          /* out */
218         __u32 nr_bos;         /* in, number of submit_bo's */
219         __u32 nr_cmds;        /* in, number of submit_cmd's */
220         __u64 bos;            /* in, ptr to array of submit_bo's */
221         __u64 cmds;           /* in, ptr to array of submit_cmd's */
222         __s32 fence_fd;       /* in/out fence fd (see MSM_SUBMIT_FENCE_FD_IN/OUT) */
223         __u32 queueid;         /* in, submitqueue id */
224 };
225
226 /* The normal way to synchronize with the GPU is just to CPU_PREP on
227  * a buffer if you need to access it from the CPU (other cmdstream
228  * submission from same or other contexts, PAGE_FLIP ioctl, etc, all
229  * handle the required synchronization under the hood).  This ioctl
230  * mainly just exists as a way to implement the gallium pipe_fence
231  * APIs without requiring a dummy bo to synchronize on.
232  */
233 struct drm_msm_wait_fence {
234         __u32 fence;          /* in */
235         __u32 pad;
236         struct drm_msm_timespec timeout;   /* in */
237         __u32 queueid;         /* in, submitqueue id */
238 };
239
240 /* madvise provides a way to tell the kernel in case a buffers contents
241  * can be discarded under memory pressure, which is useful for userspace
242  * bo cache where we want to optimistically hold on to buffer allocate
243  * and potential mmap, but allow the pages to be discarded under memory
244  * pressure.
245  *
246  * Typical usage would involve madvise(DONTNEED) when buffer enters BO
247  * cache, and madvise(WILLNEED) if trying to recycle buffer from BO cache.
248  * In the WILLNEED case, 'retained' indicates to userspace whether the
249  * backing pages still exist.
250  */
251 #define MSM_MADV_WILLNEED 0       /* backing pages are needed, status returned in 'retained' */
252 #define MSM_MADV_DONTNEED 1       /* backing pages not needed */
253 #define __MSM_MADV_PURGED 2       /* internal state */
254
255 struct drm_msm_gem_madvise {
256         __u32 handle;         /* in, GEM handle */
257         __u32 madv;           /* in, MSM_MADV_x */
258         __u32 retained;       /* out, whether backing store still exists */
259 };
260
261 /*
262  * Draw queues allow the user to set specific submission parameter. Command
263  * submissions specify a specific submitqueue to use.  ID 0 is reserved for
264  * backwards compatibility as a "default" submitqueue
265  */
266
267 #define MSM_SUBMITQUEUE_FLAGS (0)
268
269 struct drm_msm_submitqueue {
270         __u32 flags;   /* in, MSM_SUBMITQUEUE_x */
271         __u32 prio;    /* in, Priority level */
272         __u32 id;      /* out, identifier */
273 };
274
275 #define DRM_MSM_GET_PARAM              0x00
276 /* placeholder:
277 #define DRM_MSM_SET_PARAM              0x01
278  */
279 #define DRM_MSM_GEM_NEW                0x02
280 #define DRM_MSM_GEM_INFO               0x03
281 #define DRM_MSM_GEM_CPU_PREP           0x04
282 #define DRM_MSM_GEM_CPU_FINI           0x05
283 #define DRM_MSM_GEM_SUBMIT             0x06
284 #define DRM_MSM_WAIT_FENCE             0x07
285 #define DRM_MSM_GEM_MADVISE            0x08
286 /* placeholder:
287 #define DRM_MSM_GEM_SVM_NEW            0x09
288  */
289 #define DRM_MSM_SUBMITQUEUE_NEW        0x0A
290 #define DRM_MSM_SUBMITQUEUE_CLOSE      0x0B
291
292 #define DRM_IOCTL_MSM_GET_PARAM        DRM_IOWR(DRM_COMMAND_BASE + DRM_MSM_GET_PARAM, struct drm_msm_param)
293 #define DRM_IOCTL_MSM_GEM_NEW          DRM_IOWR(DRM_COMMAND_BASE + DRM_MSM_GEM_NEW, struct drm_msm_gem_new)
294 #define DRM_IOCTL_MSM_GEM_INFO         DRM_IOWR(DRM_COMMAND_BASE + DRM_MSM_GEM_INFO, struct drm_msm_gem_info)
295 #define DRM_IOCTL_MSM_GEM_CPU_PREP     DRM_IOW (DRM_COMMAND_BASE + DRM_MSM_GEM_CPU_PREP, struct drm_msm_gem_cpu_prep)
296 #define DRM_IOCTL_MSM_GEM_CPU_FINI     DRM_IOW (DRM_COMMAND_BASE + DRM_MSM_GEM_CPU_FINI, struct drm_msm_gem_cpu_fini)
297 #define DRM_IOCTL_MSM_GEM_SUBMIT       DRM_IOWR(DRM_COMMAND_BASE + DRM_MSM_GEM_SUBMIT, struct drm_msm_gem_submit)
298 #define DRM_IOCTL_MSM_WAIT_FENCE       DRM_IOW (DRM_COMMAND_BASE + DRM_MSM_WAIT_FENCE, struct drm_msm_wait_fence)
299 #define DRM_IOCTL_MSM_GEM_MADVISE      DRM_IOWR(DRM_COMMAND_BASE + DRM_MSM_GEM_MADVISE, struct drm_msm_gem_madvise)
300 #define DRM_IOCTL_MSM_SUBMITQUEUE_NEW    DRM_IOWR(DRM_COMMAND_BASE + DRM_MSM_SUBMITQUEUE_NEW, struct drm_msm_submitqueue)
301 #define DRM_IOCTL_MSM_SUBMITQUEUE_CLOSE  DRM_IOW (DRM_COMMAND_BASE + DRM_MSM_SUBMITQUEUE_CLOSE, __u32)
302
303 #if defined(__cplusplus)
304 }
305 #endif
306
307 #endif /* __MSM_DRM_H__ */