drm/i915: Keep contexts pinned until after the next kernel context switch

author Chris Wilson <chris@chris-wilson.co.uk>

Fri, 14 Jun 2019 16:46:04 +0000 (17:46 +0100)

committer Chris Wilson <chris@chris-wilson.co.uk>

Fri, 14 Jun 2019 18:03:32 +0000 (19:03 +0100)
author Chris Wilson <chris@chris-wilson.co.uk>
Fri, 14 Jun 2019 16:46:04 +0000 (17:46 +0100)
committer Chris Wilson <chris@chris-wilson.co.uk>
Fri, 14 Jun 2019 18:03:32 +0000 (19:03 +0100)
diff --git a/drivers/gpu/drm/i915/gem/i915_gem_context.c b/drivers/gpu/drm/i915/gem/i915_gem_context.c

index c86ca9f215329279f2f358392b3809d258c08c47..6200060aef05e503002ca29c625ad9e371a3c603 100644 (file)
--- a/drivers/gpu/drm/i915/gem/i915_gem_context.c
+++ b/drivers/gpu/drm/i915/gem/i915_gem_context.c
@@ -692,17 +692,6 @@ int i915_gem_contexts_init(struct drm_i915_private *dev_priv)
         return 0;
  }
  
-void i915_gem_contexts_lost(struct drm_i915_private *dev_priv)
-{
-       struct intel_engine_cs *engine;
-       enum intel_engine_id id;
-
-       lockdep_assert_held(&dev_priv->drm.struct_mutex);
-
-       for_each_engine(engine, dev_priv, id)
-               intel_engine_lost_context(engine);
-}
-
  void i915_gem_contexts_fini(struct drm_i915_private *i915)
  {
         lockdep_assert_held(&i915->drm.struct_mutex);
@@ -1203,10 +1192,6 @@ gen8_modify_rpcs(struct intel_context *ce, struct intel_sseu sseu)
         if (ret)
                 goto out_add;
  
-       ret = gen8_emit_rpcs_config(rq, ce, sseu);
-       if (ret)
-               goto out_add;
-
         /*
          * Guarantee context image and the timeline remains pinned until the
          * modifying request is retired by setting the ce activity tracker.
@@ -1214,9 +1199,12 @@ gen8_modify_rpcs(struct intel_context *ce, struct intel_sseu sseu)
          * But we only need to take one pin on the account of it. Or in other
          * words transfer the pinned ce object to tracked active request.
          */
-       if (!i915_active_request_isset(&ce->active_tracker))
-               __intel_context_pin(ce);
-       __i915_active_request_set(&ce->active_tracker, rq);
+       GEM_BUG_ON(i915_active_is_idle(&ce->active));
+       ret = i915_active_ref(&ce->active, rq->fence.context, rq);
+       if (ret)
+               goto out_add;
+
+       ret = gen8_emit_rpcs_config(rq, ce, sseu);
  
  out_add:
         i915_request_add(rq);
diff --git a/drivers/gpu/drm/i915/gem/i915_gem_context.h b/drivers/gpu/drm/i915/gem/i915_gem_context.h

index 630392c77e48d76ab978d7c16c4d6c04f83198ff..9691dd062f727d9ca96161f2e3ca05b083964f24 100644 (file)
--- a/drivers/gpu/drm/i915/gem/i915_gem_context.h
+++ b/drivers/gpu/drm/i915/gem/i915_gem_context.h
@@ -134,7 +134,6 @@ static inline bool i915_gem_context_is_kernel(struct i915_gem_context *ctx)
  
  /* i915_gem_context.c */
  int __must_check i915_gem_contexts_init(struct drm_i915_private *dev_priv);
-void i915_gem_contexts_lost(struct drm_i915_private *dev_priv);
  void i915_gem_contexts_fini(struct drm_i915_private *dev_priv);
  
  int i915_gem_context_open(struct drm_i915_private *i915,
diff --git a/drivers/gpu/drm/i915/gem/i915_gem_pm.c b/drivers/gpu/drm/i915/gem/i915_gem_pm.c

index 6e75702c567170b3f73a885932bcc0976522d34a..141f3ea349a4d38efa58fdcfe3db595636fa3b09 100644 (file)
--- a/drivers/gpu/drm/i915/gem/i915_gem_pm.c
+++ b/drivers/gpu/drm/i915/gem/i915_gem_pm.c
@@ -10,6 +10,22 @@
  #include "i915_drv.h"
  #include "i915_globals.h"
  
+static void call_idle_barriers(struct intel_engine_cs *engine)
+{
+       struct llist_node *node, *next;
+
+       llist_for_each_safe(node, next, llist_del_all(&engine->barrier_tasks)) {
+               struct i915_active_request *active =
+                       container_of((struct list_head *)node,
+                                    typeof(*active), link);
+
+               INIT_LIST_HEAD(&active->link);
+               RCU_INIT_POINTER(active->request, NULL);
+
+               active->retire(active, NULL);
+       }
+}
+
  static void i915_gem_park(struct drm_i915_private *i915)
  {
         struct intel_engine_cs *engine;
@@ -17,8 +33,10 @@ static void i915_gem_park(struct drm_i915_private *i915)
  
         lockdep_assert_held(&i915->drm.struct_mutex);
  
-       for_each_engine(engine, i915, id)
+       for_each_engine(engine, i915, id) {
+               call_idle_barriers(engine); /* cleanup after wedging */
                 i915_gem_batch_pool_fini(&engine->batch_pool);
+       }
  
         i915_timelines_park(i915);
         i915_vma_parked(i915);
diff --git a/drivers/gpu/drm/i915/gem/i915_gem_shrinker.c b/drivers/gpu/drm/i915/gem/i915_gem_shrinker.c

index a521f23c18adf33e0ad34ce9f3ccfe5ec311b732..c851c4029597fef3a844007feddb310306926e45 100644 (file)
--- a/drivers/gpu/drm/i915/gem/i915_gem_shrinker.c
+++ b/drivers/gpu/drm/i915/gem/i915_gem_shrinker.c
@@ -160,18 +160,13 @@ i915_gem_shrink(struct drm_i915_private *i915,
                 return 0;
  
         /*
-        * When shrinking the active list, also consider active contexts.
-        * Active contexts are pinned until they are retired, and so can
-        * not be simply unbound to retire and unpin their pages. To shrink
-        * the contexts, we must wait until the gpu is idle.
-        *
-        * We don't care about errors here; if we cannot wait upon the GPU,
-        * we will free as much as we can and hope to get a second chance.
+        * When shrinking the active list, we should also consider active
+        * contexts. Active contexts are pinned until they are retired, and
+        * so can not be simply unbound to retire and unpin their pages. To
+        * shrink the contexts, we must wait until the gpu is idle and
+        * completed its switch to the kernel context. In short, we do
+        * not have a good mechanism for idling a specific context.
          */
-       if (shrink & I915_SHRINK_ACTIVE)
-               i915_gem_wait_for_idle(i915,
-                                      I915_WAIT_LOCKED,
-                                      MAX_SCHEDULE_TIMEOUT);
  
         trace_i915_gem_shrink(i915, target, shrink);
         i915_retire_requests(i915);
diff --git a/drivers/gpu/drm/i915/gt/intel_context.c b/drivers/gpu/drm/i915/gt/intel_context.c

index 285e869713e8a91ccb5eba6be7cff83f0f43568b..42f45744d8595cc373681779a9e2fca175e79267 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_context.c
+++ b/drivers/gpu/drm/i915/gt/intel_context.c
@@ -61,7 +61,6 @@ int __intel_context_do_pin(struct intel_context *ce)
  
                 i915_gem_context_get(ce->gem_context); /* for ctx->ppgtt */
  
-               intel_context_get(ce);
                 smp_mb__before_atomic(); /* flush pin before it is visible */
         }
  
@@ -89,20 +88,45 @@ void intel_context_unpin(struct intel_context *ce)
                 ce->ops->unpin(ce);
  
                 i915_gem_context_put(ce->gem_context);
-               intel_context_put(ce);
+               intel_context_active_release(ce);
         }
  
         mutex_unlock(&ce->pin_mutex);
         intel_context_put(ce);
  }
  
-static void intel_context_retire(struct i915_active_request *active,
-                                struct i915_request *rq)
+static int __context_pin_state(struct i915_vma *vma, unsigned long flags)
  {
-       struct intel_context *ce =
-               container_of(active, typeof(*ce), active_tracker);
+       int err;
  
-       intel_context_unpin(ce);
+       err = i915_vma_pin(vma, 0, 0, flags | PIN_GLOBAL);
+       if (err)
+               return err;
+
+       /*
+        * And mark it as a globally pinned object to let the shrinker know
+        * it cannot reclaim the object until we release it.
+        */
+       vma->obj->pin_global++;
+       vma->obj->mm.dirty = true;
+
+       return 0;
+}
+
+static void __context_unpin_state(struct i915_vma *vma)
+{
+       vma->obj->pin_global--;
+       __i915_vma_unpin(vma);
+}
+
+static void intel_context_retire(struct i915_active *active)
+{
+       struct intel_context *ce = container_of(active, typeof(*ce), active);
+
+       if (ce->state)
+               __context_unpin_state(ce->state);
+
+       intel_context_put(ce);
  }
  
  void
@@ -125,8 +149,46 @@ intel_context_init(struct intel_context *ce,
  
         mutex_init(&ce->pin_mutex);
  
-       i915_active_request_init(&ce->active_tracker,
-                                NULL, intel_context_retire);
+       i915_active_init(ctx->i915, &ce->active, intel_context_retire);
+}
+
+int intel_context_active_acquire(struct intel_context *ce, unsigned long flags)
+{
+       int err;
+
+       if (!i915_active_acquire(&ce->active))
+               return 0;
+
+       intel_context_get(ce);
+
+       if (!ce->state)
+               return 0;
+
+       err = __context_pin_state(ce->state, flags);
+       if (err) {
+               i915_active_cancel(&ce->active);
+               intel_context_put(ce);
+               return err;
+       }
+
+       /* Preallocate tracking nodes */
+       if (!i915_gem_context_is_kernel(ce->gem_context)) {
+               err = i915_active_acquire_preallocate_barrier(&ce->active,
+                                                             ce->engine);
+               if (err) {
+                       i915_active_release(&ce->active);
+                       return err;
+               }
+       }
+
+       return 0;
+}
+
+void intel_context_active_release(struct intel_context *ce)
+{
+       /* Nodes preallocated in intel_context_active() */
+       i915_active_acquire_barrier(&ce->active);
+       i915_active_release(&ce->active);
  }
  
  static void i915_global_context_shrink(void)
diff --git a/drivers/gpu/drm/i915/gt/intel_context.h b/drivers/gpu/drm/i915/gt/intel_context.h

index 6d5453ba2c1e006a0991ddcf7c6ed172886ce68c..a47275bc4f0101e506d4ed740fb261b3a0c04bfa 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_context.h
+++ b/drivers/gpu/drm/i915/gt/intel_context.h
@@ -102,6 +102,9 @@ static inline void intel_context_exit(struct intel_context *ce)
                 ce->ops->exit(ce);
  }
  
+int intel_context_active_acquire(struct intel_context *ce, unsigned long flags);
+void intel_context_active_release(struct intel_context *ce);
+
  static inline struct intel_context *intel_context_get(struct intel_context *ce)
  {
         kref_get(&ce->ref);
diff --git a/drivers/gpu/drm/i915/gt/intel_context_types.h b/drivers/gpu/drm/i915/gt/intel_context_types.h

index 825fcf0ac9c4723a81323a913cda31d6ebba13dd..e95be4be9612f2f1c8308ae732bb15689cd7d70c 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_context_types.h
+++ b/drivers/gpu/drm/i915/gt/intel_context_types.h
@@ -56,10 +56,10 @@ struct intel_context {
         intel_engine_mask_t saturated; /* submitting semaphores too late? */
  
         /**
-        * active_tracker: Active tracker for the external rq activity
-        * on this intel_context object.
+        * active: Active tracker for the rq activity (inc. external) on this
+        * intel_context object.
          */
-       struct i915_active_request active_tracker;
+       struct i915_active active;
  
         const struct intel_context_ops *ops;
  
diff --git a/drivers/gpu/drm/i915/gt/intel_engine.h b/drivers/gpu/drm/i915/gt/intel_engine.h

index 1439fa4093ac14badc125e759ef6f97fd394f93d..3b5a6d1529974c430aee6bf88f5931434000f145 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_engine.h
+++ b/drivers/gpu/drm/i915/gt/intel_engine.h
@@ -467,8 +467,6 @@ static inline void intel_engine_reset(struct intel_engine_cs *engine,
  bool intel_engine_is_idle(struct intel_engine_cs *engine);
  bool intel_engines_are_idle(struct drm_i915_private *dev_priv);
  
-void intel_engine_lost_context(struct intel_engine_cs *engine);
-
  void intel_engines_reset_default_submission(struct drm_i915_private *i915);
  unsigned int intel_engines_has_context_isolation(struct drm_i915_private *i915);
  
diff --git a/drivers/gpu/drm/i915/gt/intel_engine_cs.c b/drivers/gpu/drm/i915/gt/intel_engine_cs.c

index 39220e16ea26451bca2372f35f7baed7bdb8b592..22242e927baa147bc551b921a09ac3267828d850 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_engine_cs.c
+++ b/drivers/gpu/drm/i915/gt/intel_engine_cs.c
@@ -611,6 +611,8 @@ static int intel_engine_setup_common(struct intel_engine_cs *engine)
  {
         int err;
  
+       init_llist_head(&engine->barrier_tasks);
+
         err = init_status_page(engine);
         if (err)
                 return err;
@@ -870,6 +872,7 @@ void intel_engine_cleanup_common(struct intel_engine_cs *engine)
         if (engine->preempt_context)
                 intel_context_unpin(engine->preempt_context);
         intel_context_unpin(engine->kernel_context);
+       GEM_BUG_ON(!llist_empty(&engine->barrier_tasks));
  
         i915_timeline_fini(&engine->timeline);
  
@@ -1201,26 +1204,6 @@ void intel_engines_reset_default_submission(struct drm_i915_private *i915)
                 engine->set_default_submission(engine);
  }
  
-/**
- * intel_engine_lost_context: called when the GPU is reset into unknown state
- * @engine: the engine
- *
- * We have either reset the GPU or otherwise about to lose state tracking of
- * the current GPU logical state (e.g. suspend). On next use, it is therefore
- * imperative that we make no presumptions about the current state and load
- * from scratch.
- */
-void intel_engine_lost_context(struct intel_engine_cs *engine)
-{
-       struct intel_context *ce;
-
-       lockdep_assert_held(&engine->i915->drm.struct_mutex);
-
-       ce = fetch_and_zero(&engine->last_retired_context);
-       if (ce)
-               intel_context_unpin(ce);
-}
-
  bool intel_engine_can_store_dword(struct intel_engine_cs *engine)
  {
         switch (INTEL_GEN(engine->i915)) {
diff --git a/drivers/gpu/drm/i915/gt/intel_engine_pm.c b/drivers/gpu/drm/i915/gt/intel_engine_pm.c

index 903bee3d6c6d5b47c9f4cd594af6b343b1927626..d14e352b0b1720652ac099b62fe4122385b26616 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_engine_pm.c
+++ b/drivers/gpu/drm/i915/gt/intel_engine_pm.c
@@ -88,6 +88,8 @@ static bool switch_to_kernel_context(struct intel_engine_cs *engine)
  
         /* Check again on the next retirement. */
         engine->wakeref_serial = engine->serial + 1;
+
+       i915_request_add_barriers(rq);
         __i915_request_commit(rq);
  
         return false;
diff --git a/drivers/gpu/drm/i915/gt/intel_engine_types.h b/drivers/gpu/drm/i915/gt/intel_engine_types.h

index 01223864237a8fa1cbbc46cc47107442ac0d6f09..33a31aa2d2ae6d5cec8e5554da009517a1c29018 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_engine_types.h
+++ b/drivers/gpu/drm/i915/gt/intel_engine_types.h
@@ -11,6 +11,7 @@
  #include <linux/irq_work.h>
  #include <linux/kref.h>
  #include <linux/list.h>
+#include <linux/llist.h>
  #include <linux/types.h>
  
  #include "i915_gem.h"
@@ -288,6 +289,7 @@ struct intel_engine_cs {
         struct intel_ring *buffer;
  
         struct i915_timeline timeline;
+       struct llist_head barrier_tasks;
  
         struct intel_context *kernel_context; /* pinned */
         struct intel_context *preempt_context; /* pinned; optional */
@@ -435,17 +437,6 @@ struct intel_engine_cs {
  
         struct intel_engine_execlists execlists;
  
-       /* Contexts are pinned whilst they are active on the GPU. The last
-        * context executed remains active whilst the GPU is idle - the
-        * switch away and write to the context object only occurs on the
-        * next execution.  Contexts are only unpinned on retirement of the
-        * following request ensuring that we can always write to the object
-        * on the context switch even after idling. Across suspend, we switch
-        * to the kernel context and trash it as the save may not happen
-        * before the hardware is powered down.
-        */
-       struct intel_context *last_retired_context;
-
         /* status_notifier: list of callbacks for context-switch changes */
         struct atomic_notifier_head context_status_notifier;
  
diff --git a/drivers/gpu/drm/i915/gt/intel_lrc.c b/drivers/gpu/drm/i915/gt/intel_lrc.c

index b8f5592da18f8ae44542bdf295bfe3172a679109..d0a51752386fbdc9b351ddc27dfa4fe982de9b02 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_lrc.c
+++ b/drivers/gpu/drm/i915/gt/intel_lrc.c
@@ -1422,60 +1422,11 @@ static void execlists_context_destroy(struct kref *kref)
         intel_context_free(ce);
  }
  
-static int __context_pin(struct i915_vma *vma)
-{
-       unsigned int flags;
-       int err;
-
-       flags = PIN_GLOBAL | PIN_HIGH;
-       flags |= PIN_OFFSET_BIAS | i915_ggtt_pin_bias(vma);
-
-       err = i915_vma_pin(vma, 0, 0, flags);
-       if (err)
-               return err;
-
-       vma->obj->pin_global++;
-       vma->obj->mm.dirty = true;
-
-       return 0;
-}
-
-static void __context_unpin(struct i915_vma *vma)
-{
-       vma->obj->pin_global--;
-       __i915_vma_unpin(vma);
-}
-
  static void execlists_context_unpin(struct intel_context *ce)
  {
-       struct intel_engine_cs *engine;
-
-       /*
-        * The tasklet may still be using a pointer to our state, via an
-        * old request. However, since we know we only unpin the context
-        * on retirement of the following request, we know that the last
-        * request referencing us will have had a completion CS interrupt.
-        * If we see that it is still active, it means that the tasklet hasn't
-        * had the chance to run yet; let it run before we teardown the
-        * reference it may use.
-        */
-       engine = READ_ONCE(ce->inflight);
-       if (unlikely(engine)) {
-               unsigned long flags;
-
-               spin_lock_irqsave(&engine->timeline.lock, flags);
-               process_csb(engine);
-               spin_unlock_irqrestore(&engine->timeline.lock, flags);
-
-               GEM_BUG_ON(READ_ONCE(ce->inflight));
-       }
-
         i915_gem_context_unpin_hw_id(ce->gem_context);
-
-       intel_ring_unpin(ce->ring);
-
         i915_gem_object_unpin_map(ce->state->obj);
-       __context_unpin(ce->state);
+       intel_ring_unpin(ce->ring);
  }
  
  static void
@@ -1512,7 +1463,10 @@ __execlists_context_pin(struct intel_context *ce,
                 goto err;
         GEM_BUG_ON(!ce->state);
  
-       ret = __context_pin(ce->state);
+       ret = intel_context_active_acquire(ce,
+                                          engine->i915->ggtt.pin_bias |
+                                          PIN_OFFSET_BIAS |
+                                          PIN_HIGH);
         if (ret)
                 goto err;
  
@@ -1521,7 +1475,7 @@ __execlists_context_pin(struct intel_context *ce,
                                         I915_MAP_OVERRIDE);
         if (IS_ERR(vaddr)) {
                 ret = PTR_ERR(vaddr);
-               goto unpin_vma;
+               goto unpin_active;
         }
  
         ret = intel_ring_pin(ce->ring);
@@ -1542,8 +1496,8 @@ __execlists_context_pin(struct intel_context *ce,
         intel_ring_unpin(ce->ring);
  unpin_map:
         i915_gem_object_unpin_map(ce->state->obj);
-unpin_vma:
-       __context_unpin(ce->state);
+unpin_active:
+       intel_context_active_release(ce);
  err:
         return ret;
  }
diff --git a/drivers/gpu/drm/i915/gt/intel_ringbuffer.c b/drivers/gpu/drm/i915/gt/intel_ringbuffer.c

index b3bf47e8162f819fd037cce902a921cec928376b..cc901edec09a482bd0f14deb2dfa224393e550da 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_ringbuffer.c
+++ b/drivers/gpu/drm/i915/gt/intel_ringbuffer.c
@@ -1349,45 +1349,9 @@ static void __context_unpin_ppgtt(struct i915_gem_context *ctx)
                 gen6_ppgtt_unpin(i915_vm_to_ppgtt(vm));
  }
  
-static int __context_pin(struct intel_context *ce)
-{
-       struct i915_vma *vma;
-       int err;
-
-       vma = ce->state;
-       if (!vma)
-               return 0;
-
-       err = i915_vma_pin(vma, 0, 0, PIN_GLOBAL | PIN_HIGH);
-       if (err)
-               return err;
-
-       /*
-        * And mark is as a globally pinned object to let the shrinker know
-        * it cannot reclaim the object until we release it.
-        */
-       vma->obj->pin_global++;
-       vma->obj->mm.dirty = true;
-
-       return 0;
-}
-
-static void __context_unpin(struct intel_context *ce)
-{
-       struct i915_vma *vma;
-
-       vma = ce->state;
-       if (!vma)
-               return;
-
-       vma->obj->pin_global--;
-       i915_vma_unpin(vma);
-}
-
  static void ring_context_unpin(struct intel_context *ce)
  {
         __context_unpin_ppgtt(ce->gem_context);
-       __context_unpin(ce);
  }
  
  static struct i915_vma *
@@ -1477,18 +1441,18 @@ static int ring_context_pin(struct intel_context *ce)
                 ce->state = vma;
         }
  
-       err = __context_pin(ce);
+       err = intel_context_active_acquire(ce, PIN_HIGH);
         if (err)
                 return err;
  
         err = __context_pin_ppgtt(ce->gem_context);
         if (err)
-               goto err_unpin;
+               goto err_active;
  
         return 0;
  
-err_unpin:
-       __context_unpin(ce);
+err_active:
+       intel_context_active_release(ce);
         return err;
  }
  
diff --git a/drivers/gpu/drm/i915/gt/mock_engine.c b/drivers/gpu/drm/i915/gt/mock_engine.c

index 6d7562769eb2e4cb512578c0c5190540c7dab70f..d1ef515bac8d8c3b95021119c1af6b45d0d4f324 100644 (file)
--- a/drivers/gpu/drm/i915/gt/mock_engine.c
+++ b/drivers/gpu/drm/i915/gt/mock_engine.c
@@ -146,12 +146,18 @@ static void mock_context_destroy(struct kref *ref)
  
  static int mock_context_pin(struct intel_context *ce)
  {
+       int ret;
+
         if (!ce->ring) {
                 ce->ring = mock_ring(ce->engine);
                 if (!ce->ring)
                         return -ENOMEM;
         }
  
+       ret = intel_context_active_acquire(ce, PIN_HIGH);
+       if (ret)
+               return ret;
+
         mock_timeline_pin(ce->ring->timeline);
         return 0;
  }
@@ -328,14 +334,9 @@ void mock_engine_free(struct intel_engine_cs *engine)
  {
         struct mock_engine *mock =
                 container_of(engine, typeof(*mock), base);
-       struct intel_context *ce;
  
         GEM_BUG_ON(timer_pending(&mock->hw_delay));
  
-       ce = fetch_and_zero(&engine->last_retired_context);
-       if (ce)
-               intel_context_unpin(ce);
-
         intel_context_unpin(engine->kernel_context);
  
         intel_engine_fini_breadcrumbs(engine);
diff --git a/drivers/gpu/drm/i915/i915_active.c b/drivers/gpu/drm/i915/i915_active.c

index 863ae12707bac4b853655ef912da8eb2df920012..2d019ac6db2032e1adacd1f1b9e76423090a39a1 100644 (file)
--- a/drivers/gpu/drm/i915/i915_active.c
+++ b/drivers/gpu/drm/i915/i915_active.c
@@ -157,6 +157,7 @@ void i915_active_init(struct drm_i915_private *i915,
         ref->retire = retire;
         ref->tree = RB_ROOT;
         i915_active_request_init(&ref->last, NULL, last_retire);
+       init_llist_head(&ref->barriers);
         ref->count = 0;
  }
  
@@ -263,6 +264,83 @@ void i915_active_fini(struct i915_active *ref)
  }
  #endif
  
+int i915_active_acquire_preallocate_barrier(struct i915_active *ref,
+                                           struct intel_engine_cs *engine)
+{
+       struct drm_i915_private *i915 = engine->i915;
+       unsigned long tmp;
+       int err = 0;
+
+       GEM_BUG_ON(!engine->mask);
+       for_each_engine_masked(engine, i915, engine->mask, tmp) {
+               struct intel_context *kctx = engine->kernel_context;
+               struct active_node *node;
+
+               node = kmem_cache_alloc(global.slab_cache, GFP_KERNEL);
+               if (unlikely(!node)) {
+                       err = -ENOMEM;
+                       break;
+               }
+
+               i915_active_request_init(&node->base,
+                                        (void *)engine, node_retire);
+               node->timeline = kctx->ring->timeline->fence_context;
+               node->ref = ref;
+               ref->count++;
+
+               llist_add((struct llist_node *)&node->base.link,
+                         &ref->barriers);
+       }
+
+       return err;
+}
+
+void i915_active_acquire_barrier(struct i915_active *ref)
+{
+       struct llist_node *pos, *next;
+
+       i915_active_acquire(ref);
+
+       llist_for_each_safe(pos, next, llist_del_all(&ref->barriers)) {
+               struct intel_engine_cs *engine;
+               struct active_node *node;
+               struct rb_node **p, *parent;
+
+               node = container_of((struct list_head *)pos,
+                                   typeof(*node), base.link);
+
+               engine = (void *)rcu_access_pointer(node->base.request);
+               RCU_INIT_POINTER(node->base.request, ERR_PTR(-EAGAIN));
+
+               parent = NULL;
+               p = &ref->tree.rb_node;
+               while (*p) {
+                       parent = *p;
+                       if (rb_entry(parent,
+                                    struct active_node,
+                                    node)->timeline < node->timeline)
+                               p = &parent->rb_right;
+                       else
+                               p = &parent->rb_left;
+               }
+               rb_link_node(&node->node, parent, p);
+               rb_insert_color(&node->node, &ref->tree);
+
+               llist_add((struct llist_node *)&node->base.link,
+                         &engine->barrier_tasks);
+       }
+       i915_active_release(ref);
+}
+
+void i915_request_add_barriers(struct i915_request *rq)
+{
+       struct intel_engine_cs *engine = rq->engine;
+       struct llist_node *node, *next;
+
+       llist_for_each_safe(node, next, llist_del_all(&engine->barrier_tasks))
+               list_add_tail((struct list_head *)node, &rq->active_list);
+}
+
  int i915_active_request_set(struct i915_active_request *active,
                             struct i915_request *rq)
  {
diff --git a/drivers/gpu/drm/i915/i915_active.h b/drivers/gpu/drm/i915/i915_active.h

index 7d758719ce39d03dc7b0741786030de8978cebf6..d55d37673944895a48984bb88c6dcaa5d573a8d0 100644 (file)
--- a/drivers/gpu/drm/i915/i915_active.h
+++ b/drivers/gpu/drm/i915/i915_active.h
@@ -406,4 +406,9 @@ void i915_active_fini(struct i915_active *ref);
  static inline void i915_active_fini(struct i915_active *ref) { }
  #endif
  
+int i915_active_acquire_preallocate_barrier(struct i915_active *ref,
+                                           struct intel_engine_cs *engine);
+void i915_active_acquire_barrier(struct i915_active *ref);
+void i915_request_add_barriers(struct i915_request *rq);
+
  #endif /* _I915_ACTIVE_H_ */
diff --git a/drivers/gpu/drm/i915/i915_active_types.h b/drivers/gpu/drm/i915/i915_active_types.h

index b679253b53a5fa5dee6228aa7d7d123fb5025da8..c025991b9233e2b92d4b5f9a616a0f131bebc718 100644 (file)
--- a/drivers/gpu/drm/i915/i915_active_types.h
+++ b/drivers/gpu/drm/i915/i915_active_types.h
@@ -7,6 +7,7 @@
  #ifndef _I915_ACTIVE_TYPES_H_
  #define _I915_ACTIVE_TYPES_H_
  
+#include <linux/llist.h>
  #include <linux/rbtree.h>
  #include <linux/rcupdate.h>
  
@@ -31,6 +32,8 @@ struct i915_active {
         unsigned int count;
  
         void (*retire)(struct i915_active *ref);
+
+       struct llist_head barriers;
  };
  
  #endif /* _I915_ACTIVE_TYPES_H_ */
diff --git a/drivers/gpu/drm/i915/i915_gem.c b/drivers/gpu/drm/i915/i915_gem.c

index 217236596202450a9fa6019fcfaa717403d800a5..335efeaad4f168c63551a74f35471363299bf3d6 100644 (file)
--- a/drivers/gpu/drm/i915/i915_gem.c
+++ b/drivers/gpu/drm/i915/i915_gem.c
@@ -1199,10 +1199,6 @@ void i915_gem_sanitize(struct drm_i915_private *i915)
  
         intel_uncore_forcewake_put(&i915->uncore, FORCEWAKE_ALL);
         intel_runtime_pm_put(&i915->runtime_pm, wakeref);
-
-       mutex_lock(&i915->drm.struct_mutex);
-       i915_gem_contexts_lost(i915);
-       mutex_unlock(&i915->drm.struct_mutex);
  }
  
  void i915_gem_init_swizzling(struct drm_i915_private *dev_priv)
diff --git a/drivers/gpu/drm/i915/i915_request.c b/drivers/gpu/drm/i915/i915_request.c

index da76e4d1c7f172097e9544782659b4ceccd22b3b..38d112d8aba7704bcad679faf0106f66ac50a0b6 100644 (file)
--- a/drivers/gpu/drm/i915/i915_request.c
+++ b/drivers/gpu/drm/i915/i915_request.c
@@ -213,18 +213,6 @@ static void __retire_engine_request(struct intel_engine_cs *engine,
         spin_unlock(&rq->lock);
  
         local_irq_enable();
-
-       /*
-        * The backing object for the context is done after switching to the
-        * *next* context. Therefore we cannot retire the previous context until
-        * the next context has already started running. However, since we
-        * cannot take the required locks at i915_request_submit() we
-        * defer the unpinning of the active context to now, retirement of
-        * the subsequent request.
-        */
-       if (engine->last_retired_context)
-               intel_context_unpin(engine->last_retired_context);
-       engine->last_retired_context = rq->hw_context;
  }
  
  static void __retire_engine_upto(struct intel_engine_cs *engine,
@@ -759,9 +747,6 @@ __i915_request_create(struct intel_context *ce, gfp_t gfp)
  
         rq->infix = rq->ring->emit; /* end of header; start of user payload */
  
-       /* Keep a second pin for the dual retirement along engine and ring */
-       __intel_context_pin(ce);
-
         intel_context_mark_active(ce);
         return rq;
  
diff --git a/drivers/gpu/drm/i915/selftests/mock_gem_device.c b/drivers/gpu/drm/i915/selftests/mock_gem_device.c

index 82f2be6cec5b6b8b290e44bd8e2c221621900632..64bc51400ae75bcdfff798d0f36117c2c83fc1d0 100644 (file)
--- a/drivers/gpu/drm/i915/selftests/mock_gem_device.c
+++ b/drivers/gpu/drm/i915/selftests/mock_gem_device.c
@@ -56,7 +56,6 @@ static void mock_device_release(struct drm_device *dev)
  
         mutex_lock(&i915->drm.struct_mutex);
         mock_device_flush(i915);
-       i915_gem_contexts_lost(i915);
         mutex_unlock(&i915->drm.struct_mutex);
  
         flush_work(&i915->gem.idle_work);
author	Chris Wilson <chris@chris-wilson.co.uk>
	Fri, 14 Jun 2019 16:46:04 +0000 (17:46 +0100)
committer	Chris Wilson <chris@chris-wilson.co.uk>
	Fri, 14 Jun 2019 18:03:32 +0000 (19:03 +0100)
drivers/gpu/drm/i915/gem/i915_gem_context.c		patch \| blob \| history
drivers/gpu/drm/i915/gem/i915_gem_context.h		patch \| blob \| history
drivers/gpu/drm/i915/gem/i915_gem_pm.c		patch \| blob \| history
drivers/gpu/drm/i915/gem/i915_gem_shrinker.c		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_context.c		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_context.h		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_context_types.h		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_engine.h		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_engine_cs.c		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_engine_pm.c		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_engine_types.h		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_lrc.c		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_ringbuffer.c		patch \| blob \| history
drivers/gpu/drm/i915/gt/mock_engine.c		patch \| blob \| history
drivers/gpu/drm/i915/i915_active.c		patch \| blob \| history
drivers/gpu/drm/i915/i915_active.h		patch \| blob \| history
drivers/gpu/drm/i915/i915_active_types.h		patch \| blob \| history
drivers/gpu/drm/i915/i915_gem.c		patch \| blob \| history
drivers/gpu/drm/i915/i915_request.c		patch \| blob \| history
drivers/gpu/drm/i915/selftests/mock_gem_device.c		patch \| blob \| history