[haiku-commits] Re: Gerrit down

  • From: "Alexander von Gluck IV" <kallisti5@xxxxxxxxxxx>
  • To: haiku-commits@xxxxxxxxxxxxx
  • Date: Tue, 22 May 2018 14:57:59 +0000

May 22, 2018 9:48 AM, "Adrien Destugues" <pulkomandy@xxxxxxxxxxxxx> wrote:

22 mai 2018 16:44 "Alexander von Gluck IV" <kallisti5@xxxxxxxxxxx> a écrit:

May 22, 2018 2:41 AM, "Stephan Aßmus" <superstippi@xxxxxx> wrote:

Hi,

Am 20.05.2018 um 18:47 schrieb Alexander von Gluck IV:

Gerrit began throwing 500 errors in it's UI this morning. After checking > 
the git repositories
(they are still valid) I decided to restart the > Gerrit application.
Gerrit is now crashing OpenJDK on bootup. For the lovely backtrace see >
https://pastebin.com/2cRgTypp
I'm looking at updating to OpenJDK 1.9 or 1.10 from our OpenJDK 1.8 to > see 
if it helps.
Thanks for your hard work in keeping everything running!

Let it be noted, though, that Java was not at fault...

Technically it was... I mean massive memory corruption isn't *that* big of a 
deal, right? :-)

We are getting used to virtual machines and the like, but don't forget the 
basic rules: if in
doubt, blame the hardware!

Heh, I was beginning to suspect hardware when I was getting inconsistent 
corruption during
git gc's and git fsck's (removing java and docker from the equation)

I hate to assume hardware without a pretty strong feeling as it can become a 
scapegoat
for other issues.

However, once I ran a yum update and yum crashed... My "oh shit hardware" 
triggered.

Thanks for investigating the issue and getting things back up in such a short 
time :)

No problem.

I feel partly responsible since my normal non-ecc server build-out involves 
running a
memtest86+ burn-in. Hetzner really doesn't have a kvm offering though, so I'm 
really
not sure we could.

I was hoping they would run a memory test... but they ended up just "swapping 
all the ram".
I wish their analysis was more 'definite' to give us some warm fuzzies.

 -- Alex

Other related posts: