]> asedeno.scripts.mit.edu Git - linux.git/commitdiff
drm/amdgpu: allow ras interrupt callback to return error data
authorTao Zhou <tao.zhou1@amd.com>
Mon, 22 Jul 2019 12:27:25 +0000 (20:27 +0800)
committerAlex Deucher <alexander.deucher@amd.com>
Wed, 31 Jul 2019 19:50:23 +0000 (14:50 -0500)
add error data as parameter for ras interrupt cb and process it

Signed-off-by: Tao Zhou <tao.zhou1@amd.com>
Reviewed-by: Dennis Li <dennis.li@amd.com>
Reviewed-by: Hawking Zhang <Hawking.Zhang@amd.com>
Signed-off-by: Alex Deucher <alexander.deucher@amd.com>
drivers/gpu/drm/amd/amdgpu/amdgpu_ras.c
drivers/gpu/drm/amd/amdgpu/amdgpu_ras.h

index 143153a3c5b096226d4530addbe581baea74ba95..b248c8250d7548dbab02513e2a6cfe504c7b9479 100644 (file)
@@ -1005,7 +1005,7 @@ static void amdgpu_ras_interrupt_handler(struct ras_manager *obj)
        struct ras_ih_data *data = &obj->ih_data;
        struct amdgpu_iv_entry entry;
        int ret;
-       struct ras_err_data err_data = {0, 0};
+       struct ras_err_data err_data = {0, 0, 0, NULL};
 
        while (data->rptr != data->wptr) {
                rmb();
@@ -1020,14 +1020,14 @@ static void amdgpu_ras_interrupt_handler(struct ras_manager *obj)
                 * from the callback to udpate the error type/count, etc
                 */
                if (data->cb) {
-                       ret = data->cb(obj->adev, &entry);
+                       ret = data->cb(obj->adev, &err_data, &entry);
                        /* ue will trigger an interrupt, and in that case
                         * we need do a reset to recovery the whole system.
                         * But leave IP do that recovery, here we just dispatch
                         * the error.
                         */
                        if (ret == AMDGPU_RAS_UE) {
-                               obj->err_data.ue_count++;
+                               obj->err_data.ue_count += err_data.ue_count;
                        }
                        /* Might need get ce count by register, but not all IP
                         * saves ce count, some IP just use one bit or two bits
index 0920db7aff3449cebbaf1a2ec21b8c36b55da46c..2c86a5135ec9b8b14833f29744b5d2ccec4b6d10 100644 (file)
@@ -76,9 +76,6 @@ struct ras_common_if {
        char name[32];
 };
 
-typedef int (*ras_ih_cb)(struct amdgpu_device *adev,
-               struct amdgpu_iv_entry *entry);
-
 struct amdgpu_ras {
        /* ras infrastructure */
        /* for ras itself. */
@@ -108,21 +105,6 @@ struct amdgpu_ras {
        uint32_t flags;
 };
 
-struct ras_ih_data {
-       /* interrupt bottom half */
-       struct work_struct ih_work;
-       int inuse;
-       /* IP callback */
-       ras_ih_cb cb;
-       /* full of entries */
-       unsigned char *ring;
-       unsigned int ring_size;
-       unsigned int element_size;
-       unsigned int aligned_element_size;
-       unsigned int rptr;
-       unsigned int wptr;
-};
-
 struct ras_fs_data {
        char sysfs_name[32];
        char debugfs_name[32];
@@ -149,6 +131,25 @@ struct ras_err_handler_data {
        int last_reserved;
 };
 
+typedef int (*ras_ih_cb)(struct amdgpu_device *adev,
+               struct ras_err_data *err_data,
+               struct amdgpu_iv_entry *entry);
+
+struct ras_ih_data {
+       /* interrupt bottom half */
+       struct work_struct ih_work;
+       int inuse;
+       /* IP callback */
+       ras_ih_cb cb;
+       /* full of entries */
+       unsigned char *ring;
+       unsigned int ring_size;
+       unsigned int element_size;
+       unsigned int aligned_element_size;
+       unsigned int rptr;
+       unsigned int wptr;
+};
+
 struct ras_manager {
        struct ras_common_if head;
        /* reference count */