]> asedeno.scripts.mit.edu Git - linux.git/blob - block/blk-mq-debugfs.c
blk-mq-debugfs: support rq_qos
[linux.git] / block / blk-mq-debugfs.c
1 /*
2  * Copyright (C) 2017 Facebook
3  *
4  * This program is free software; you can redistribute it and/or
5  * modify it under the terms of the GNU General Public
6  * License v2 as published by the Free Software Foundation.
7  *
8  * This program is distributed in the hope that it will be useful,
9  * but WITHOUT ANY WARRANTY; without even the implied warranty of
10  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
11  * General Public License for more details.
12  *
13  * You should have received a copy of the GNU General Public License
14  * along with this program.  If not, see <https://www.gnu.org/licenses/>.
15  */
16
17 #include <linux/kernel.h>
18 #include <linux/blkdev.h>
19 #include <linux/debugfs.h>
20
21 #include <linux/blk-mq.h>
22 #include "blk.h"
23 #include "blk-mq.h"
24 #include "blk-mq-debugfs.h"
25 #include "blk-mq-tag.h"
26 #include "blk-rq-qos.h"
27
28 static void print_stat(struct seq_file *m, struct blk_rq_stat *stat)
29 {
30         if (stat->nr_samples) {
31                 seq_printf(m, "samples=%d, mean=%lld, min=%llu, max=%llu",
32                            stat->nr_samples, stat->mean, stat->min, stat->max);
33         } else {
34                 seq_puts(m, "samples=0");
35         }
36 }
37
38 static int queue_poll_stat_show(void *data, struct seq_file *m)
39 {
40         struct request_queue *q = data;
41         int bucket;
42
43         for (bucket = 0; bucket < BLK_MQ_POLL_STATS_BKTS/2; bucket++) {
44                 seq_printf(m, "read  (%d Bytes): ", 1 << (9+bucket));
45                 print_stat(m, &q->poll_stat[2*bucket]);
46                 seq_puts(m, "\n");
47
48                 seq_printf(m, "write (%d Bytes): ",  1 << (9+bucket));
49                 print_stat(m, &q->poll_stat[2*bucket+1]);
50                 seq_puts(m, "\n");
51         }
52         return 0;
53 }
54
55 static void *queue_requeue_list_start(struct seq_file *m, loff_t *pos)
56         __acquires(&q->requeue_lock)
57 {
58         struct request_queue *q = m->private;
59
60         spin_lock_irq(&q->requeue_lock);
61         return seq_list_start(&q->requeue_list, *pos);
62 }
63
64 static void *queue_requeue_list_next(struct seq_file *m, void *v, loff_t *pos)
65 {
66         struct request_queue *q = m->private;
67
68         return seq_list_next(v, &q->requeue_list, pos);
69 }
70
71 static void queue_requeue_list_stop(struct seq_file *m, void *v)
72         __releases(&q->requeue_lock)
73 {
74         struct request_queue *q = m->private;
75
76         spin_unlock_irq(&q->requeue_lock);
77 }
78
79 static const struct seq_operations queue_requeue_list_seq_ops = {
80         .start  = queue_requeue_list_start,
81         .next   = queue_requeue_list_next,
82         .stop   = queue_requeue_list_stop,
83         .show   = blk_mq_debugfs_rq_show,
84 };
85
86 static int blk_flags_show(struct seq_file *m, const unsigned long flags,
87                           const char *const *flag_name, int flag_name_count)
88 {
89         bool sep = false;
90         int i;
91
92         for (i = 0; i < sizeof(flags) * BITS_PER_BYTE; i++) {
93                 if (!(flags & BIT(i)))
94                         continue;
95                 if (sep)
96                         seq_puts(m, "|");
97                 sep = true;
98                 if (i < flag_name_count && flag_name[i])
99                         seq_puts(m, flag_name[i]);
100                 else
101                         seq_printf(m, "%d", i);
102         }
103         return 0;
104 }
105
106 static int queue_pm_only_show(void *data, struct seq_file *m)
107 {
108         struct request_queue *q = data;
109
110         seq_printf(m, "%d\n", atomic_read(&q->pm_only));
111         return 0;
112 }
113
114 #define QUEUE_FLAG_NAME(name) [QUEUE_FLAG_##name] = #name
115 static const char *const blk_queue_flag_name[] = {
116         QUEUE_FLAG_NAME(STOPPED),
117         QUEUE_FLAG_NAME(DYING),
118         QUEUE_FLAG_NAME(BIDI),
119         QUEUE_FLAG_NAME(NOMERGES),
120         QUEUE_FLAG_NAME(SAME_COMP),
121         QUEUE_FLAG_NAME(FAIL_IO),
122         QUEUE_FLAG_NAME(NONROT),
123         QUEUE_FLAG_NAME(IO_STAT),
124         QUEUE_FLAG_NAME(DISCARD),
125         QUEUE_FLAG_NAME(NOXMERGES),
126         QUEUE_FLAG_NAME(ADD_RANDOM),
127         QUEUE_FLAG_NAME(SECERASE),
128         QUEUE_FLAG_NAME(SAME_FORCE),
129         QUEUE_FLAG_NAME(DEAD),
130         QUEUE_FLAG_NAME(INIT_DONE),
131         QUEUE_FLAG_NAME(NO_SG_MERGE),
132         QUEUE_FLAG_NAME(POLL),
133         QUEUE_FLAG_NAME(WC),
134         QUEUE_FLAG_NAME(FUA),
135         QUEUE_FLAG_NAME(FLUSH_NQ),
136         QUEUE_FLAG_NAME(DAX),
137         QUEUE_FLAG_NAME(STATS),
138         QUEUE_FLAG_NAME(POLL_STATS),
139         QUEUE_FLAG_NAME(REGISTERED),
140         QUEUE_FLAG_NAME(SCSI_PASSTHROUGH),
141         QUEUE_FLAG_NAME(QUIESCED),
142 };
143 #undef QUEUE_FLAG_NAME
144
145 static int queue_state_show(void *data, struct seq_file *m)
146 {
147         struct request_queue *q = data;
148
149         blk_flags_show(m, q->queue_flags, blk_queue_flag_name,
150                        ARRAY_SIZE(blk_queue_flag_name));
151         seq_puts(m, "\n");
152         return 0;
153 }
154
155 static ssize_t queue_state_write(void *data, const char __user *buf,
156                                  size_t count, loff_t *ppos)
157 {
158         struct request_queue *q = data;
159         char opbuf[16] = { }, *op;
160
161         /*
162          * The "state" attribute is removed after blk_cleanup_queue() has called
163          * blk_mq_free_queue(). Return if QUEUE_FLAG_DEAD has been set to avoid
164          * triggering a use-after-free.
165          */
166         if (blk_queue_dead(q))
167                 return -ENOENT;
168
169         if (count >= sizeof(opbuf)) {
170                 pr_err("%s: operation too long\n", __func__);
171                 goto inval;
172         }
173
174         if (copy_from_user(opbuf, buf, count))
175                 return -EFAULT;
176         op = strstrip(opbuf);
177         if (strcmp(op, "run") == 0) {
178                 blk_mq_run_hw_queues(q, true);
179         } else if (strcmp(op, "start") == 0) {
180                 blk_mq_start_stopped_hw_queues(q, true);
181         } else if (strcmp(op, "kick") == 0) {
182                 blk_mq_kick_requeue_list(q);
183         } else {
184                 pr_err("%s: unsupported operation '%s'\n", __func__, op);
185 inval:
186                 pr_err("%s: use 'run', 'start' or 'kick'\n", __func__);
187                 return -EINVAL;
188         }
189         return count;
190 }
191
192 static int queue_write_hint_show(void *data, struct seq_file *m)
193 {
194         struct request_queue *q = data;
195         int i;
196
197         for (i = 0; i < BLK_MAX_WRITE_HINTS; i++)
198                 seq_printf(m, "hint%d: %llu\n", i, q->write_hints[i]);
199
200         return 0;
201 }
202
203 static ssize_t queue_write_hint_store(void *data, const char __user *buf,
204                                       size_t count, loff_t *ppos)
205 {
206         struct request_queue *q = data;
207         int i;
208
209         for (i = 0; i < BLK_MAX_WRITE_HINTS; i++)
210                 q->write_hints[i] = 0;
211
212         return count;
213 }
214
215 static const struct blk_mq_debugfs_attr blk_mq_debugfs_queue_attrs[] = {
216         { "poll_stat", 0400, queue_poll_stat_show },
217         { "requeue_list", 0400, .seq_ops = &queue_requeue_list_seq_ops },
218         { "pm_only", 0600, queue_pm_only_show, NULL },
219         { "state", 0600, queue_state_show, queue_state_write },
220         { "write_hints", 0600, queue_write_hint_show, queue_write_hint_store },
221         { "zone_wlock", 0400, queue_zone_wlock_show, NULL },
222         { },
223 };
224
225 #define HCTX_STATE_NAME(name) [BLK_MQ_S_##name] = #name
226 static const char *const hctx_state_name[] = {
227         HCTX_STATE_NAME(STOPPED),
228         HCTX_STATE_NAME(TAG_ACTIVE),
229         HCTX_STATE_NAME(SCHED_RESTART),
230 };
231 #undef HCTX_STATE_NAME
232
233 static int hctx_state_show(void *data, struct seq_file *m)
234 {
235         struct blk_mq_hw_ctx *hctx = data;
236
237         blk_flags_show(m, hctx->state, hctx_state_name,
238                        ARRAY_SIZE(hctx_state_name));
239         seq_puts(m, "\n");
240         return 0;
241 }
242
243 #define BLK_TAG_ALLOC_NAME(name) [BLK_TAG_ALLOC_##name] = #name
244 static const char *const alloc_policy_name[] = {
245         BLK_TAG_ALLOC_NAME(FIFO),
246         BLK_TAG_ALLOC_NAME(RR),
247 };
248 #undef BLK_TAG_ALLOC_NAME
249
250 #define HCTX_FLAG_NAME(name) [ilog2(BLK_MQ_F_##name)] = #name
251 static const char *const hctx_flag_name[] = {
252         HCTX_FLAG_NAME(SHOULD_MERGE),
253         HCTX_FLAG_NAME(TAG_SHARED),
254         HCTX_FLAG_NAME(SG_MERGE),
255         HCTX_FLAG_NAME(BLOCKING),
256         HCTX_FLAG_NAME(NO_SCHED),
257 };
258 #undef HCTX_FLAG_NAME
259
260 static int hctx_flags_show(void *data, struct seq_file *m)
261 {
262         struct blk_mq_hw_ctx *hctx = data;
263         const int alloc_policy = BLK_MQ_FLAG_TO_ALLOC_POLICY(hctx->flags);
264
265         seq_puts(m, "alloc_policy=");
266         if (alloc_policy < ARRAY_SIZE(alloc_policy_name) &&
267             alloc_policy_name[alloc_policy])
268                 seq_puts(m, alloc_policy_name[alloc_policy]);
269         else
270                 seq_printf(m, "%d", alloc_policy);
271         seq_puts(m, " ");
272         blk_flags_show(m,
273                        hctx->flags ^ BLK_ALLOC_POLICY_TO_MQ_FLAG(alloc_policy),
274                        hctx_flag_name, ARRAY_SIZE(hctx_flag_name));
275         seq_puts(m, "\n");
276         return 0;
277 }
278
279 #define REQ_OP_NAME(name) [REQ_OP_##name] = #name
280 static const char *const op_name[] = {
281         REQ_OP_NAME(READ),
282         REQ_OP_NAME(WRITE),
283         REQ_OP_NAME(FLUSH),
284         REQ_OP_NAME(DISCARD),
285         REQ_OP_NAME(SECURE_ERASE),
286         REQ_OP_NAME(ZONE_RESET),
287         REQ_OP_NAME(WRITE_SAME),
288         REQ_OP_NAME(WRITE_ZEROES),
289         REQ_OP_NAME(SCSI_IN),
290         REQ_OP_NAME(SCSI_OUT),
291         REQ_OP_NAME(DRV_IN),
292         REQ_OP_NAME(DRV_OUT),
293 };
294 #undef REQ_OP_NAME
295
296 #define CMD_FLAG_NAME(name) [__REQ_##name] = #name
297 static const char *const cmd_flag_name[] = {
298         CMD_FLAG_NAME(FAILFAST_DEV),
299         CMD_FLAG_NAME(FAILFAST_TRANSPORT),
300         CMD_FLAG_NAME(FAILFAST_DRIVER),
301         CMD_FLAG_NAME(SYNC),
302         CMD_FLAG_NAME(META),
303         CMD_FLAG_NAME(PRIO),
304         CMD_FLAG_NAME(NOMERGE),
305         CMD_FLAG_NAME(IDLE),
306         CMD_FLAG_NAME(INTEGRITY),
307         CMD_FLAG_NAME(FUA),
308         CMD_FLAG_NAME(PREFLUSH),
309         CMD_FLAG_NAME(RAHEAD),
310         CMD_FLAG_NAME(BACKGROUND),
311         CMD_FLAG_NAME(NOUNMAP),
312         CMD_FLAG_NAME(NOWAIT),
313 };
314 #undef CMD_FLAG_NAME
315
316 #define RQF_NAME(name) [ilog2((__force u32)RQF_##name)] = #name
317 static const char *const rqf_name[] = {
318         RQF_NAME(SORTED),
319         RQF_NAME(STARTED),
320         RQF_NAME(SOFTBARRIER),
321         RQF_NAME(FLUSH_SEQ),
322         RQF_NAME(MIXED_MERGE),
323         RQF_NAME(MQ_INFLIGHT),
324         RQF_NAME(DONTPREP),
325         RQF_NAME(PREEMPT),
326         RQF_NAME(COPY_USER),
327         RQF_NAME(FAILED),
328         RQF_NAME(QUIET),
329         RQF_NAME(ELVPRIV),
330         RQF_NAME(IO_STAT),
331         RQF_NAME(ALLOCED),
332         RQF_NAME(PM),
333         RQF_NAME(HASHED),
334         RQF_NAME(STATS),
335         RQF_NAME(SPECIAL_PAYLOAD),
336         RQF_NAME(ZONE_WRITE_LOCKED),
337         RQF_NAME(MQ_POLL_SLEPT),
338 };
339 #undef RQF_NAME
340
341 static const char *const blk_mq_rq_state_name_array[] = {
342         [MQ_RQ_IDLE]            = "idle",
343         [MQ_RQ_IN_FLIGHT]       = "in_flight",
344         [MQ_RQ_COMPLETE]        = "complete",
345 };
346
347 static const char *blk_mq_rq_state_name(enum mq_rq_state rq_state)
348 {
349         if (WARN_ON_ONCE((unsigned int)rq_state >=
350                          ARRAY_SIZE(blk_mq_rq_state_name_array)))
351                 return "(?)";
352         return blk_mq_rq_state_name_array[rq_state];
353 }
354
355 int __blk_mq_debugfs_rq_show(struct seq_file *m, struct request *rq)
356 {
357         const struct blk_mq_ops *const mq_ops = rq->q->mq_ops;
358         const unsigned int op = rq->cmd_flags & REQ_OP_MASK;
359
360         seq_printf(m, "%p {.op=", rq);
361         if (op < ARRAY_SIZE(op_name) && op_name[op])
362                 seq_printf(m, "%s", op_name[op]);
363         else
364                 seq_printf(m, "%d", op);
365         seq_puts(m, ", .cmd_flags=");
366         blk_flags_show(m, rq->cmd_flags & ~REQ_OP_MASK, cmd_flag_name,
367                        ARRAY_SIZE(cmd_flag_name));
368         seq_puts(m, ", .rq_flags=");
369         blk_flags_show(m, (__force unsigned int)rq->rq_flags, rqf_name,
370                        ARRAY_SIZE(rqf_name));
371         seq_printf(m, ", .state=%s", blk_mq_rq_state_name(blk_mq_rq_state(rq)));
372         seq_printf(m, ", .tag=%d, .internal_tag=%d", rq->tag,
373                    rq->internal_tag);
374         if (mq_ops->show_rq)
375                 mq_ops->show_rq(m, rq);
376         seq_puts(m, "}\n");
377         return 0;
378 }
379 EXPORT_SYMBOL_GPL(__blk_mq_debugfs_rq_show);
380
381 int blk_mq_debugfs_rq_show(struct seq_file *m, void *v)
382 {
383         return __blk_mq_debugfs_rq_show(m, list_entry_rq(v));
384 }
385 EXPORT_SYMBOL_GPL(blk_mq_debugfs_rq_show);
386
387 static void *hctx_dispatch_start(struct seq_file *m, loff_t *pos)
388         __acquires(&hctx->lock)
389 {
390         struct blk_mq_hw_ctx *hctx = m->private;
391
392         spin_lock(&hctx->lock);
393         return seq_list_start(&hctx->dispatch, *pos);
394 }
395
396 static void *hctx_dispatch_next(struct seq_file *m, void *v, loff_t *pos)
397 {
398         struct blk_mq_hw_ctx *hctx = m->private;
399
400         return seq_list_next(v, &hctx->dispatch, pos);
401 }
402
403 static void hctx_dispatch_stop(struct seq_file *m, void *v)
404         __releases(&hctx->lock)
405 {
406         struct blk_mq_hw_ctx *hctx = m->private;
407
408         spin_unlock(&hctx->lock);
409 }
410
411 static const struct seq_operations hctx_dispatch_seq_ops = {
412         .start  = hctx_dispatch_start,
413         .next   = hctx_dispatch_next,
414         .stop   = hctx_dispatch_stop,
415         .show   = blk_mq_debugfs_rq_show,
416 };
417
418 struct show_busy_params {
419         struct seq_file         *m;
420         struct blk_mq_hw_ctx    *hctx;
421 };
422
423 /*
424  * Note: the state of a request may change while this function is in progress,
425  * e.g. due to a concurrent blk_mq_finish_request() call. Returns true to
426  * keep iterating requests.
427  */
428 static bool hctx_show_busy_rq(struct request *rq, void *data, bool reserved)
429 {
430         const struct show_busy_params *params = data;
431
432         if (rq->mq_hctx == params->hctx)
433                 __blk_mq_debugfs_rq_show(params->m,
434                                          list_entry_rq(&rq->queuelist));
435
436         return true;
437 }
438
439 static int hctx_busy_show(void *data, struct seq_file *m)
440 {
441         struct blk_mq_hw_ctx *hctx = data;
442         struct show_busy_params params = { .m = m, .hctx = hctx };
443
444         blk_mq_tagset_busy_iter(hctx->queue->tag_set, hctx_show_busy_rq,
445                                 &params);
446
447         return 0;
448 }
449
450 static int hctx_ctx_map_show(void *data, struct seq_file *m)
451 {
452         struct blk_mq_hw_ctx *hctx = data;
453
454         sbitmap_bitmap_show(&hctx->ctx_map, m);
455         return 0;
456 }
457
458 static void blk_mq_debugfs_tags_show(struct seq_file *m,
459                                      struct blk_mq_tags *tags)
460 {
461         seq_printf(m, "nr_tags=%u\n", tags->nr_tags);
462         seq_printf(m, "nr_reserved_tags=%u\n", tags->nr_reserved_tags);
463         seq_printf(m, "active_queues=%d\n",
464                    atomic_read(&tags->active_queues));
465
466         seq_puts(m, "\nbitmap_tags:\n");
467         sbitmap_queue_show(&tags->bitmap_tags, m);
468
469         if (tags->nr_reserved_tags) {
470                 seq_puts(m, "\nbreserved_tags:\n");
471                 sbitmap_queue_show(&tags->breserved_tags, m);
472         }
473 }
474
475 static int hctx_tags_show(void *data, struct seq_file *m)
476 {
477         struct blk_mq_hw_ctx *hctx = data;
478         struct request_queue *q = hctx->queue;
479         int res;
480
481         res = mutex_lock_interruptible(&q->sysfs_lock);
482         if (res)
483                 goto out;
484         if (hctx->tags)
485                 blk_mq_debugfs_tags_show(m, hctx->tags);
486         mutex_unlock(&q->sysfs_lock);
487
488 out:
489         return res;
490 }
491
492 static int hctx_tags_bitmap_show(void *data, struct seq_file *m)
493 {
494         struct blk_mq_hw_ctx *hctx = data;
495         struct request_queue *q = hctx->queue;
496         int res;
497
498         res = mutex_lock_interruptible(&q->sysfs_lock);
499         if (res)
500                 goto out;
501         if (hctx->tags)
502                 sbitmap_bitmap_show(&hctx->tags->bitmap_tags.sb, m);
503         mutex_unlock(&q->sysfs_lock);
504
505 out:
506         return res;
507 }
508
509 static int hctx_sched_tags_show(void *data, struct seq_file *m)
510 {
511         struct blk_mq_hw_ctx *hctx = data;
512         struct request_queue *q = hctx->queue;
513         int res;
514
515         res = mutex_lock_interruptible(&q->sysfs_lock);
516         if (res)
517                 goto out;
518         if (hctx->sched_tags)
519                 blk_mq_debugfs_tags_show(m, hctx->sched_tags);
520         mutex_unlock(&q->sysfs_lock);
521
522 out:
523         return res;
524 }
525
526 static int hctx_sched_tags_bitmap_show(void *data, struct seq_file *m)
527 {
528         struct blk_mq_hw_ctx *hctx = data;
529         struct request_queue *q = hctx->queue;
530         int res;
531
532         res = mutex_lock_interruptible(&q->sysfs_lock);
533         if (res)
534                 goto out;
535         if (hctx->sched_tags)
536                 sbitmap_bitmap_show(&hctx->sched_tags->bitmap_tags.sb, m);
537         mutex_unlock(&q->sysfs_lock);
538
539 out:
540         return res;
541 }
542
543 static int hctx_io_poll_show(void *data, struct seq_file *m)
544 {
545         struct blk_mq_hw_ctx *hctx = data;
546
547         seq_printf(m, "considered=%lu\n", hctx->poll_considered);
548         seq_printf(m, "invoked=%lu\n", hctx->poll_invoked);
549         seq_printf(m, "success=%lu\n", hctx->poll_success);
550         return 0;
551 }
552
553 static ssize_t hctx_io_poll_write(void *data, const char __user *buf,
554                                   size_t count, loff_t *ppos)
555 {
556         struct blk_mq_hw_ctx *hctx = data;
557
558         hctx->poll_considered = hctx->poll_invoked = hctx->poll_success = 0;
559         return count;
560 }
561
562 static int hctx_dispatched_show(void *data, struct seq_file *m)
563 {
564         struct blk_mq_hw_ctx *hctx = data;
565         int i;
566
567         seq_printf(m, "%8u\t%lu\n", 0U, hctx->dispatched[0]);
568
569         for (i = 1; i < BLK_MQ_MAX_DISPATCH_ORDER - 1; i++) {
570                 unsigned int d = 1U << (i - 1);
571
572                 seq_printf(m, "%8u\t%lu\n", d, hctx->dispatched[i]);
573         }
574
575         seq_printf(m, "%8u+\t%lu\n", 1U << (i - 1), hctx->dispatched[i]);
576         return 0;
577 }
578
579 static ssize_t hctx_dispatched_write(void *data, const char __user *buf,
580                                      size_t count, loff_t *ppos)
581 {
582         struct blk_mq_hw_ctx *hctx = data;
583         int i;
584
585         for (i = 0; i < BLK_MQ_MAX_DISPATCH_ORDER; i++)
586                 hctx->dispatched[i] = 0;
587         return count;
588 }
589
590 static int hctx_queued_show(void *data, struct seq_file *m)
591 {
592         struct blk_mq_hw_ctx *hctx = data;
593
594         seq_printf(m, "%lu\n", hctx->queued);
595         return 0;
596 }
597
598 static ssize_t hctx_queued_write(void *data, const char __user *buf,
599                                  size_t count, loff_t *ppos)
600 {
601         struct blk_mq_hw_ctx *hctx = data;
602
603         hctx->queued = 0;
604         return count;
605 }
606
607 static int hctx_run_show(void *data, struct seq_file *m)
608 {
609         struct blk_mq_hw_ctx *hctx = data;
610
611         seq_printf(m, "%lu\n", hctx->run);
612         return 0;
613 }
614
615 static ssize_t hctx_run_write(void *data, const char __user *buf, size_t count,
616                               loff_t *ppos)
617 {
618         struct blk_mq_hw_ctx *hctx = data;
619
620         hctx->run = 0;
621         return count;
622 }
623
624 static int hctx_active_show(void *data, struct seq_file *m)
625 {
626         struct blk_mq_hw_ctx *hctx = data;
627
628         seq_printf(m, "%d\n", atomic_read(&hctx->nr_active));
629         return 0;
630 }
631
632 static int hctx_dispatch_busy_show(void *data, struct seq_file *m)
633 {
634         struct blk_mq_hw_ctx *hctx = data;
635
636         seq_printf(m, "%u\n", hctx->dispatch_busy);
637         return 0;
638 }
639
640 static void *ctx_rq_list_start(struct seq_file *m, loff_t *pos)
641         __acquires(&ctx->lock)
642 {
643         struct blk_mq_ctx *ctx = m->private;
644
645         spin_lock(&ctx->lock);
646         return seq_list_start(&ctx->rq_list, *pos);
647 }
648
649 static void *ctx_rq_list_next(struct seq_file *m, void *v, loff_t *pos)
650 {
651         struct blk_mq_ctx *ctx = m->private;
652
653         return seq_list_next(v, &ctx->rq_list, pos);
654 }
655
656 static void ctx_rq_list_stop(struct seq_file *m, void *v)
657         __releases(&ctx->lock)
658 {
659         struct blk_mq_ctx *ctx = m->private;
660
661         spin_unlock(&ctx->lock);
662 }
663
664 static const struct seq_operations ctx_rq_list_seq_ops = {
665         .start  = ctx_rq_list_start,
666         .next   = ctx_rq_list_next,
667         .stop   = ctx_rq_list_stop,
668         .show   = blk_mq_debugfs_rq_show,
669 };
670 static int ctx_dispatched_show(void *data, struct seq_file *m)
671 {
672         struct blk_mq_ctx *ctx = data;
673
674         seq_printf(m, "%lu %lu\n", ctx->rq_dispatched[1], ctx->rq_dispatched[0]);
675         return 0;
676 }
677
678 static ssize_t ctx_dispatched_write(void *data, const char __user *buf,
679                                     size_t count, loff_t *ppos)
680 {
681         struct blk_mq_ctx *ctx = data;
682
683         ctx->rq_dispatched[0] = ctx->rq_dispatched[1] = 0;
684         return count;
685 }
686
687 static int ctx_merged_show(void *data, struct seq_file *m)
688 {
689         struct blk_mq_ctx *ctx = data;
690
691         seq_printf(m, "%lu\n", ctx->rq_merged);
692         return 0;
693 }
694
695 static ssize_t ctx_merged_write(void *data, const char __user *buf,
696                                 size_t count, loff_t *ppos)
697 {
698         struct blk_mq_ctx *ctx = data;
699
700         ctx->rq_merged = 0;
701         return count;
702 }
703
704 static int ctx_completed_show(void *data, struct seq_file *m)
705 {
706         struct blk_mq_ctx *ctx = data;
707
708         seq_printf(m, "%lu %lu\n", ctx->rq_completed[1], ctx->rq_completed[0]);
709         return 0;
710 }
711
712 static ssize_t ctx_completed_write(void *data, const char __user *buf,
713                                    size_t count, loff_t *ppos)
714 {
715         struct blk_mq_ctx *ctx = data;
716
717         ctx->rq_completed[0] = ctx->rq_completed[1] = 0;
718         return count;
719 }
720
721 static int blk_mq_debugfs_show(struct seq_file *m, void *v)
722 {
723         const struct blk_mq_debugfs_attr *attr = m->private;
724         void *data = d_inode(m->file->f_path.dentry->d_parent)->i_private;
725
726         return attr->show(data, m);
727 }
728
729 static ssize_t blk_mq_debugfs_write(struct file *file, const char __user *buf,
730                                     size_t count, loff_t *ppos)
731 {
732         struct seq_file *m = file->private_data;
733         const struct blk_mq_debugfs_attr *attr = m->private;
734         void *data = d_inode(file->f_path.dentry->d_parent)->i_private;
735
736         /*
737          * Attributes that only implement .seq_ops are read-only and 'attr' is
738          * the same with 'data' in this case.
739          */
740         if (attr == data || !attr->write)
741                 return -EPERM;
742
743         return attr->write(data, buf, count, ppos);
744 }
745
746 static int blk_mq_debugfs_open(struct inode *inode, struct file *file)
747 {
748         const struct blk_mq_debugfs_attr *attr = inode->i_private;
749         void *data = d_inode(file->f_path.dentry->d_parent)->i_private;
750         struct seq_file *m;
751         int ret;
752
753         if (attr->seq_ops) {
754                 ret = seq_open(file, attr->seq_ops);
755                 if (!ret) {
756                         m = file->private_data;
757                         m->private = data;
758                 }
759                 return ret;
760         }
761
762         if (WARN_ON_ONCE(!attr->show))
763                 return -EPERM;
764
765         return single_open(file, blk_mq_debugfs_show, inode->i_private);
766 }
767
768 static int blk_mq_debugfs_release(struct inode *inode, struct file *file)
769 {
770         const struct blk_mq_debugfs_attr *attr = inode->i_private;
771
772         if (attr->show)
773                 return single_release(inode, file);
774         else
775                 return seq_release(inode, file);
776 }
777
778 static const struct file_operations blk_mq_debugfs_fops = {
779         .open           = blk_mq_debugfs_open,
780         .read           = seq_read,
781         .write          = blk_mq_debugfs_write,
782         .llseek         = seq_lseek,
783         .release        = blk_mq_debugfs_release,
784 };
785
786 static const struct blk_mq_debugfs_attr blk_mq_debugfs_hctx_attrs[] = {
787         {"state", 0400, hctx_state_show},
788         {"flags", 0400, hctx_flags_show},
789         {"dispatch", 0400, .seq_ops = &hctx_dispatch_seq_ops},
790         {"busy", 0400, hctx_busy_show},
791         {"ctx_map", 0400, hctx_ctx_map_show},
792         {"tags", 0400, hctx_tags_show},
793         {"tags_bitmap", 0400, hctx_tags_bitmap_show},
794         {"sched_tags", 0400, hctx_sched_tags_show},
795         {"sched_tags_bitmap", 0400, hctx_sched_tags_bitmap_show},
796         {"io_poll", 0600, hctx_io_poll_show, hctx_io_poll_write},
797         {"dispatched", 0600, hctx_dispatched_show, hctx_dispatched_write},
798         {"queued", 0600, hctx_queued_show, hctx_queued_write},
799         {"run", 0600, hctx_run_show, hctx_run_write},
800         {"active", 0400, hctx_active_show},
801         {"dispatch_busy", 0400, hctx_dispatch_busy_show},
802         {},
803 };
804
805 static const struct blk_mq_debugfs_attr blk_mq_debugfs_ctx_attrs[] = {
806         {"rq_list", 0400, .seq_ops = &ctx_rq_list_seq_ops},
807         {"dispatched", 0600, ctx_dispatched_show, ctx_dispatched_write},
808         {"merged", 0600, ctx_merged_show, ctx_merged_write},
809         {"completed", 0600, ctx_completed_show, ctx_completed_write},
810         {},
811 };
812
813 static bool debugfs_create_files(struct dentry *parent, void *data,
814                                  const struct blk_mq_debugfs_attr *attr)
815 {
816         d_inode(parent)->i_private = data;
817
818         for (; attr->name; attr++) {
819                 if (!debugfs_create_file(attr->name, attr->mode, parent,
820                                          (void *)attr, &blk_mq_debugfs_fops))
821                         return false;
822         }
823         return true;
824 }
825
826 int blk_mq_debugfs_register(struct request_queue *q)
827 {
828         struct blk_mq_hw_ctx *hctx;
829         int i;
830
831         if (!blk_debugfs_root)
832                 return -ENOENT;
833
834         q->debugfs_dir = debugfs_create_dir(kobject_name(q->kobj.parent),
835                                             blk_debugfs_root);
836         if (!q->debugfs_dir)
837                 return -ENOMEM;
838
839         if (!debugfs_create_files(q->debugfs_dir, q,
840                                   blk_mq_debugfs_queue_attrs))
841                 goto err;
842
843         /*
844          * blk_mq_init_sched() attempted to do this already, but q->debugfs_dir
845          * didn't exist yet (because we don't know what to name the directory
846          * until the queue is registered to a gendisk).
847          */
848         if (q->elevator && !q->sched_debugfs_dir)
849                 blk_mq_debugfs_register_sched(q);
850
851         /* Similarly, blk_mq_init_hctx() couldn't do this previously. */
852         queue_for_each_hw_ctx(q, hctx, i) {
853                 if (!hctx->debugfs_dir && blk_mq_debugfs_register_hctx(q, hctx))
854                         goto err;
855                 if (q->elevator && !hctx->sched_debugfs_dir &&
856                     blk_mq_debugfs_register_sched_hctx(q, hctx))
857                         goto err;
858         }
859
860         if (q->rq_qos) {
861                 struct rq_qos *rqos = q->rq_qos;
862
863                 while (rqos) {
864                         blk_mq_debugfs_register_rqos(rqos);
865                         rqos = rqos->next;
866                 }
867         }
868
869         return 0;
870
871 err:
872         blk_mq_debugfs_unregister(q);
873         return -ENOMEM;
874 }
875
876 void blk_mq_debugfs_unregister(struct request_queue *q)
877 {
878         debugfs_remove_recursive(q->debugfs_dir);
879         q->sched_debugfs_dir = NULL;
880         q->debugfs_dir = NULL;
881 }
882
883 static int blk_mq_debugfs_register_ctx(struct blk_mq_hw_ctx *hctx,
884                                        struct blk_mq_ctx *ctx)
885 {
886         struct dentry *ctx_dir;
887         char name[20];
888
889         snprintf(name, sizeof(name), "cpu%u", ctx->cpu);
890         ctx_dir = debugfs_create_dir(name, hctx->debugfs_dir);
891         if (!ctx_dir)
892                 return -ENOMEM;
893
894         if (!debugfs_create_files(ctx_dir, ctx, blk_mq_debugfs_ctx_attrs))
895                 return -ENOMEM;
896
897         return 0;
898 }
899
900 int blk_mq_debugfs_register_hctx(struct request_queue *q,
901                                  struct blk_mq_hw_ctx *hctx)
902 {
903         struct blk_mq_ctx *ctx;
904         char name[20];
905         int i;
906
907         if (!q->debugfs_dir)
908                 return -ENOENT;
909
910         snprintf(name, sizeof(name), "hctx%u", hctx->queue_num);
911         hctx->debugfs_dir = debugfs_create_dir(name, q->debugfs_dir);
912         if (!hctx->debugfs_dir)
913                 return -ENOMEM;
914
915         if (!debugfs_create_files(hctx->debugfs_dir, hctx,
916                                   blk_mq_debugfs_hctx_attrs))
917                 goto err;
918
919         hctx_for_each_ctx(hctx, ctx, i) {
920                 if (blk_mq_debugfs_register_ctx(hctx, ctx))
921                         goto err;
922         }
923
924         return 0;
925
926 err:
927         blk_mq_debugfs_unregister_hctx(hctx);
928         return -ENOMEM;
929 }
930
931 void blk_mq_debugfs_unregister_hctx(struct blk_mq_hw_ctx *hctx)
932 {
933         debugfs_remove_recursive(hctx->debugfs_dir);
934         hctx->sched_debugfs_dir = NULL;
935         hctx->debugfs_dir = NULL;
936 }
937
938 int blk_mq_debugfs_register_hctxs(struct request_queue *q)
939 {
940         struct blk_mq_hw_ctx *hctx;
941         int i;
942
943         queue_for_each_hw_ctx(q, hctx, i) {
944                 if (blk_mq_debugfs_register_hctx(q, hctx))
945                         return -ENOMEM;
946         }
947
948         return 0;
949 }
950
951 void blk_mq_debugfs_unregister_hctxs(struct request_queue *q)
952 {
953         struct blk_mq_hw_ctx *hctx;
954         int i;
955
956         queue_for_each_hw_ctx(q, hctx, i)
957                 blk_mq_debugfs_unregister_hctx(hctx);
958 }
959
960 int blk_mq_debugfs_register_sched(struct request_queue *q)
961 {
962         struct elevator_type *e = q->elevator->type;
963
964         if (!q->debugfs_dir)
965                 return -ENOENT;
966
967         if (!e->queue_debugfs_attrs)
968                 return 0;
969
970         q->sched_debugfs_dir = debugfs_create_dir("sched", q->debugfs_dir);
971         if (!q->sched_debugfs_dir)
972                 return -ENOMEM;
973
974         if (!debugfs_create_files(q->sched_debugfs_dir, q,
975                                   e->queue_debugfs_attrs))
976                 goto err;
977
978         return 0;
979
980 err:
981         blk_mq_debugfs_unregister_sched(q);
982         return -ENOMEM;
983 }
984
985 void blk_mq_debugfs_unregister_sched(struct request_queue *q)
986 {
987         debugfs_remove_recursive(q->sched_debugfs_dir);
988         q->sched_debugfs_dir = NULL;
989 }
990
991 void blk_mq_debugfs_unregister_rqos(struct rq_qos *rqos)
992 {
993         debugfs_remove_recursive(rqos->debugfs_dir);
994         rqos->debugfs_dir = NULL;
995 }
996
997 int blk_mq_debugfs_register_rqos(struct rq_qos *rqos)
998 {
999         struct request_queue *q = rqos->q;
1000         const char *dir_name = rq_qos_id_to_name(rqos->id);
1001
1002         if (!q->debugfs_dir)
1003                 return -ENOENT;
1004
1005         if (rqos->debugfs_dir || !rqos->ops->debugfs_attrs)
1006                 return 0;
1007
1008         if (!q->rqos_debugfs_dir) {
1009                 q->rqos_debugfs_dir = debugfs_create_dir("rqos",
1010                                                          q->debugfs_dir);
1011                 if (!q->rqos_debugfs_dir)
1012                         return -ENOMEM;
1013         }
1014
1015         rqos->debugfs_dir = debugfs_create_dir(dir_name,
1016                                                rqos->q->rqos_debugfs_dir);
1017         if (!rqos->debugfs_dir)
1018                 return -ENOMEM;
1019
1020         if (!debugfs_create_files(rqos->debugfs_dir, rqos,
1021                                   rqos->ops->debugfs_attrs))
1022                 goto err;
1023         return 0;
1024  err:
1025         blk_mq_debugfs_unregister_rqos(rqos);
1026         return -ENOMEM;
1027 }
1028
1029 void blk_mq_debugfs_unregister_queue_rqos(struct request_queue *q)
1030 {
1031         debugfs_remove_recursive(q->rqos_debugfs_dir);
1032         q->rqos_debugfs_dir = NULL;
1033 }
1034
1035 int blk_mq_debugfs_register_sched_hctx(struct request_queue *q,
1036                                        struct blk_mq_hw_ctx *hctx)
1037 {
1038         struct elevator_type *e = q->elevator->type;
1039
1040         if (!hctx->debugfs_dir)
1041                 return -ENOENT;
1042
1043         if (!e->hctx_debugfs_attrs)
1044                 return 0;
1045
1046         hctx->sched_debugfs_dir = debugfs_create_dir("sched",
1047                                                      hctx->debugfs_dir);
1048         if (!hctx->sched_debugfs_dir)
1049                 return -ENOMEM;
1050
1051         if (!debugfs_create_files(hctx->sched_debugfs_dir, hctx,
1052                                   e->hctx_debugfs_attrs))
1053                 return -ENOMEM;
1054
1055         return 0;
1056 }
1057
1058 void blk_mq_debugfs_unregister_sched_hctx(struct blk_mq_hw_ctx *hctx)
1059 {
1060         debugfs_remove_recursive(hctx->sched_debugfs_dir);
1061         hctx->sched_debugfs_dir = NULL;
1062 }