drm/amdgpu: add ring soft recovery v4

author Christian König <christian.koenig@amd.com>

Tue, 21 Aug 2018 09:11:36 +0000 (11:11 +0200)

committer Alex Deucher <alexander.deucher@amd.com>

Mon, 27 Aug 2018 20:10:07 +0000 (15:10 -0500)
author Christian König <christian.koenig@amd.com>
Tue, 21 Aug 2018 09:11:36 +0000 (11:11 +0200)
committer Alex Deucher <alexander.deucher@amd.com>
Mon, 27 Aug 2018 20:10:07 +0000 (15:10 -0500)
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_job.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_job.c

index facc0f08d804437adb284f74cc5cb22d6a97c979..34e54d41f5ca626b89a80fff6e6da0ba76d85d49 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_job.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_job.c
@@ -33,6 +33,12 @@ static void amdgpu_job_timedout(struct drm_sched_job *s_job)
         struct amdgpu_ring *ring = to_amdgpu_ring(s_job->sched);
         struct amdgpu_job *job = to_amdgpu_job(s_job);
  
+       if (amdgpu_ring_soft_recovery(ring, job->vmid, s_job->s_fence->parent)) {
+               DRM_ERROR("ring %s timeout, but soft recovered\n",
+                         s_job->sched->name);
+               return;
+       }
+
         DRM_ERROR("ring %s timeout, signaled seq=%u, emitted seq=%u\n",
                   job->base.sched->name, atomic_read(&ring->fence_drv.last_seq),
                   ring->fence_drv.sync_seq);
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_ring.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_ring.c

index 5dfd26be1eecff3b0742e73a72e3c2dfee07aa68..b70e85ec147d54d4784be1b9b66639be9ff26d8a 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_ring.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_ring.c
@@ -383,6 +383,31 @@ void amdgpu_ring_emit_reg_write_reg_wait_helper(struct amdgpu_ring *ring,
         amdgpu_ring_emit_reg_wait(ring, reg1, mask, mask);
  }
  
+/**
+ * amdgpu_ring_soft_recovery - try to soft recover a ring lockup
+ *
+ * @ring: ring to try the recovery on
+ * @vmid: VMID we try to get going again
+ * @fence: timedout fence
+ *
+ * Tries to get a ring proceeding again when it is stuck.
+ */
+bool amdgpu_ring_soft_recovery(struct amdgpu_ring *ring, unsigned int vmid,
+                              struct dma_fence *fence)
+{
+       ktime_t deadline = ktime_add_us(ktime_get(), 10000);
+
+       if (!ring->funcs->soft_recovery)
+               return false;
+
+       atomic_inc(&ring->adev->gpu_reset_counter);
+       while (!dma_fence_is_signaled(fence) &&
+              ktime_to_ns(ktime_sub(deadline, ktime_get())) > 0)
+               ring->funcs->soft_recovery(ring, vmid);
+
+       return dma_fence_is_signaled(fence);
+}
+
  /*
   * Debugfs info
   */
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_ring.h b/drivers/gpu/drm/amd/amdgpu/amdgpu_ring.h

index 409fdd9b9710b2f7dc989f9b8a7e5a2a76cf098f..9cc239968e4062f58fdbe85446600cb7dd8f82ba 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_ring.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_ring.h
@@ -168,6 +168,8 @@ struct amdgpu_ring_funcs {
         /* priority functions */
         void (*set_priority) (struct amdgpu_ring *ring,
                               enum drm_sched_priority priority);
+       /* Try to soft recover the ring to make the fence signal */
+       void (*soft_recovery)(struct amdgpu_ring *ring, unsigned vmid);
  };
  
  struct amdgpu_ring {
@@ -260,6 +262,8 @@ void amdgpu_ring_fini(struct amdgpu_ring *ring);
  void amdgpu_ring_emit_reg_write_reg_wait_helper(struct amdgpu_ring *ring,
                                                 uint32_t reg0, uint32_t val0,
                                                 uint32_t reg1, uint32_t val1);
+bool amdgpu_ring_soft_recovery(struct amdgpu_ring *ring, unsigned int vmid,
+                              struct dma_fence *fence);
  
  static inline void amdgpu_ring_clear_ring(struct amdgpu_ring *ring)
  {
author	Christian König <christian.koenig@amd.com>
	Tue, 21 Aug 2018 09:11:36 +0000 (11:11 +0200)
committer	Alex Deucher <alexander.deucher@amd.com>
	Mon, 27 Aug 2018 20:10:07 +0000 (15:10 -0500)
drivers/gpu/drm/amd/amdgpu/amdgpu_job.c		patch \| blob \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_ring.c		patch \| blob \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_ring.h		patch \| blob \| history