[haiku-sysadmin] Re: SMART error (CurrentPendingSector) detected on host: baron

  • From: Urias McCullough <umccullough@xxxxxxxxx>
  • To: haiku-sysadmin@xxxxxxxxxxxxx
  • Date: Wed, 27 Apr 2016 05:46:04 -0700

On Wed, Apr 27, 2016 at 4:19 AM, Axel Dörfler <axeld@xxxxxxxxxxxxxxxx> wrote:

Am 27.04.2016 um 13:02 schrieb root:

This message was generated by the smartd daemon running on:

    host name:  baron
    DNS domain: haiku-os.org

The following warning/error was logged by the smartd daemon:

Device: /dev/sda, 24 Currently unreadable (pending) sectors


It's even higher now -- someone has the contact data for Hetzner, I'd be
willing look into that then.

Ugh.

We will have to schedule a replacement - they usually give us a
'window' - prior to the replacement, someone has to shutdown the
servers (shutdown of baron *should* gracefully shutdown the VMs I
believe, although I haven't really tested this). We also need to make
sure and tell them either which serial # is bad, or which serial # is
good. I snagged the smartctl output a while back, but it's on my old
workstation, which is currrently powered down - so someone will need
to check again.

Once Hetzner shuts everything down, replaces the disk, and the server
is back up, the raid array needs to be rebuilt using mdadm. I've done
it before, it's not so bad if you follow (good) instructions.
Basically, you remove the failed partition from the array(s), clone
the partition table to the new disk, and re-add each partition to the
array(s) and they should begin rebuilding. Gonna take a while.

Hetzner should hang onto the "failed" disk for a while just in case
something goes horribly wrong.

Unfortunately, I'm heading out of town for 2 days in about an hour...
so you're on your own if you choose to do this.

I think you have to login to hetzner's server management console to
file a ticket - I have the login details somewhere, but I may not have
time to locate them and send them your way until I get back home.

- Urias

Other related posts: