]> asedeno.scripts.mit.edu Git - linux.git/commit
powerpc/64s: Report SLB multi-hit rather than parity error
authorMichael Ellerman <mpe@ellerman.id.au>
Wed, 13 Jun 2018 13:24:14 +0000 (23:24 +1000)
committerMichael Ellerman <mpe@ellerman.id.au>
Thu, 12 Jul 2018 11:08:10 +0000 (21:08 +1000)
commit54dbcfc211f15586c57d27492f938eb4df964257
treee96c32f125e4e30e4644aa432b6f15c55806244f
parente11b64b1ef336f8976e5bf194b0eede48954f419
powerpc/64s: Report SLB multi-hit rather than parity error

When we take an SLB multi-hit on bare metal, we see both the multi-hit
and parity error bits set in DSISR. The user manuals indicates this is
expected to always happen on Power8, whereas on Power9 it says a
multi-hit will "usually" also cause a parity error.

We decide what to do based on the various error tables in mce_power.c,
and because we process them in order and only report the first, we
currently always report a parity error but not the multi-hit, eg:

  Severe Machine check interrupt [Recovered]
    Initiator: CPU
    Error type: SLB [Parity]
      Effective address: c000000ffffd4300

Although this is correct, it leaves the user wondering why they got a
parity error. It would be clearer instead if we reported the
multi-hit because that is more likely to be simply a software bug,
whereas a true parity error is possibly an indication of a bad core.

We can do that simply by reordering the error tables so that multi-hit
appears before parity. That doesn't affect the error recovery at all,
because we flush the SLB either way.

Signed-off-by: Michael Ellerman <mpe@ellerman.id.au>
Reviewed-by: Nicholas Piggin <npiggin@gmail.com>
Signed-off-by: Michael Ellerman <mpe@ellerman.id.au>
arch/powerpc/kernel/mce_power.c