[Linuxtrent] ancora crash del server (debian testing)

  • From: emanuele <emanuele@xxxxxxxxxxxxxx>
  • To: linuxtrent@xxxxxxxxxxxxx
  • Date: Sun, 19 Nov 2006 14:44:40 +0100

Altro crash del server di cui vi parlavo anche qualche giorno fa. E'
accaduto proprio ora mentre un portatile stava facendo un backup
(via rsync) sul server. I dati da trasferire erano alcuni Gb trasferiti
tramite LAN.

Questo dovrebbe smentire che la scheda di rete, quella che esce su
internet, sia difettosa. Stavolta e' la scheda di rete della LAN che
era coinvolta nel traferimento dati e quella verso internet era
_totalmente_ senza traffico (le volte precedenti era il contrario).

Alcune considerazioni di sintesi:
- e' ora abbastanza certo che i blocchi avvengano in concomitanza di intenso
  traffico di rete (tutti i casi recenti sono avvenuti in questa
circostanza)
- sembra che non sia la saturazione della banda quanto il totale trasferito
  (in upload o download) a essere concomitante al problema
- la cosa sembra non dipendere dalle schede di rete (il blocco avviene sia
  che si carichi l'una -LAN- piuttosto che l'altra - internet)
- il BUG presente nei log e' sempre lo stesso: "unable to handle kernel
paging
  request" (vedi oltre per il log completo)
- il BUG non blocca completamente la macchina: ping funziona e da altri
log vedo
  che CRON gira ancora. Pero' quasi tutto il resto non va (o causa il blocco
  definitivo).

L'unica cosa che mi viene in mente a questo punto e' fare un controllo
approfondito della RAM (che potro' fare solo tra alcuni giorni). L'hd e'
continuamente monitorato e non emergono problemi.

Chiunque avesse idee nuove, e' bene accetto!

Emanuele

Questo il log del kernel che ha portato il blocco (questa volta e'
reiserfs che inizia
la caduta in cascata):
-------------------------------------------------------
Nov 19 13:09:07 localhost kernel: BUG: unable to handle kernel paging
request at virtual address 00020004
Nov 19 13:09:07 localhost kernel:  printing eip:
Nov 19 13:09:07 localhost kernel: f8935790
Nov 19 13:09:07 localhost kernel: *pde = 00000000
Nov 19 13:09:07 localhost kernel: Oops: 0002 [#1]
Nov 19 13:09:07 localhost kernel: SMP
Nov 19 13:09:07 localhost kernel: Modules linked in: xt_tcpudp xt_limit
ipt_MASQUERADE xt_state iptable_nat ip_nat ip_conntra
ck nfnetlink iptable_filter ip_tables x_tables ipv6 ext2 mbcache
dm_snapshot dm_mirror dm_mod w83627hf hwmon_vid eeprom i2c_i
sa psmouse ide_generic snd_intel8x0 snd_ac97_codec snd_ac97_bus snd_pcm
snd_timer snd_page_alloc i810_audio snd_mpu401 snd_mp
u401_uart evdev ac97_codec snd_rawmidi snd_seq_device snd analog shpchp
pci_hotplug i2c_sis96x sis_agp rtc agpgart 8250_pnp p
arport_pc parport i2c_core soundcore floppy pcspkr ns558 gameport
reiserfs usbhid ide_cd cdrom ide_disk generic ohci_hcd sis5
513 ide_core 8139cp ehci_hcd sis900 usbcore 8139too mii thermal
processor fan
Nov 19 13:09:07 localhost kernel: CPU:    0
Nov 19 13:09:07 localhost kernel: EIP:    0060:[<f8935790>]    Not
tainted VLI
Nov 19 13:09:07 localhost kernel: EFLAGS: 00010206  
(2.6.17-2-vserver-k7 #1)
Nov 19 13:09:07 localhost kernel: EIP is at reiserfs_free_jh+0x15/0x4d
[reiserfs]
Nov 19 13:09:07 localhost kernel: eax: 00020008   ebx: 00020000   ecx:
c13d8500   edx: 00000000
Nov 19 13:09:07 localhost kernel: esi: decd3afc   edi: decd3afc   ebp:
f8bc5000   esp: dfb39e90
Nov 19 13:09:07 localhost kernel: ds: 007b   es: 007b   ss: 0068
Nov 19 13:09:07 localhost kernel: Process kswapd0 (pid: 117[#0],
threadinfo=dfb38000 task=dffa5550)
Nov 19 13:09:07 localhost kernel: Stack: decd3afc c13d8500 f8923175
f8923101 00000000 00000000 000002bc c015b33e
Nov 19 13:09:07 localhost kernel:        c13d8500 f76654e8 c014777b
c13d8500 000002e6 c01479ee ffffffff f76654e8
Nov 19 13:09:07 localhost kernel:        0000000e 00000000 c13d8500
c13d8520 c13d9640 c13d9660 c13dda00 c13dda20
Nov 19 13:09:07 localhost kernel: Call Trace:
Nov 19 13:09:07 localhost kernel:  <f8923175>
reiserfs_releasepage+0x74/0x94 [reiserfs]  <f8923101>
reiserfs_releasepage+0x0/
0x94 [reiserfs]
Nov 19 13:09:07 localhost kernel:  <c015b33e>
try_to_release_page+0x2e/0x40  <c014777b> invalidate_complete_page+0x1b/0x69
Nov 19 13:09:07 localhost kernel:  <c01479ee>
invalidate_mapping_pages+0x5e/0xac  <c016f5cf>
shrink_icache_memory+0xd4/0x1ae
Nov 19 13:09:07 localhost kernel:  <c0147f77> shrink_slab+0xdf/0x144 
<c0148dba> balance_pgdat+0x20d/0x320
Nov 19 13:09:07 localhost kernel:  <c0148ff4> kswapd+0xd5/0xd7 
<c012cd3b> autoremove_wake_function+0x0/0x2d
Nov 19 13:09:07 localhost kernel:  <c0148f1f> kswapd+0x0/0xd7 
<c0101005> kernel_thread_helper+0x5/0xb
Nov 19 13:09:07 localhost kernel: Code: 59 b8 fb ff ff ff eb 09 b8 fb ff
ff ff eb 02 31 c0 5b 5e 5f 5d c3 56 89 c6 53 8b 58 2
4 85 db 74 3f c7 40 24 00 00 00 00 8d 43 08 <c7> 43 04 00 00 00 00 8b 4b
08 8b 50 04 89 51 04 89 0a 89 40 04
Nov 19 13:09:07 localhost kernel: EIP: [<f8935790>]
reiserfs_free_jh+0x15/0x4d [reiserfs] SS:ESP 0068:dfb39e90
--------------------------------------------


-- 
Per iscriversi  (o disiscriversi), basta spedire un  messaggio con OGGETTO
"subscribe" (o "unsubscribe") a mailto:linuxtrent-request@xxxxxxxxxxxxx


Other related posts: