[Linuxtrent] kernel crash

  • From: Emanuele Olivetti <olivetti@xxxxxx>
  • To: LinuxTrent <linuxtrent@xxxxxxxxxxxxx>
  • Date: Tue, 07 Nov 2006 11:13:58 +0100

Ciao,
su un server con debian testing ho dei crash frequenti: mi accade
circa ogni un paio di settimane (o piu' frequentemente se ho
un'intensa di rete, tipo spostare Gb di dati, ma e' piu' un'intuizione
che un fatto certo). Il server e' piuttosto scarico. L'ultimo crash
c'e' stato poco fa e sto cercando di tracciare il tutto. Questo e'
apparso in kern.log :

------
Nov  7 09:11:26 localhost kernel: BUG: unable to handle kernel paging request 
at virtual address 00020000
Nov  7 09:11:26 localhost kernel:  printing eip:
Nov  7 09:11:26 localhost kernel: c0143615
Nov  7 09:11:26 localhost kernel: *pde = 00000000
Nov  7 09:11:26 localhost kernel: Oops: 0000 [#1]
Nov  7 09:11:26 localhost kernel: SMP
Nov 7 09:11:26 localhost kernel: Modules linked in: xt_tcpudp xt_limit ipt_MASQUERADE xt_state iptable_nat ip_nat ip_conntrack nfnetlink iptable_filter ip_tables x_tables ipv6 ext2 mbcache dm_snapshot dm_mirror dm_mod psmouse ide_generic snd_intel8x0 snd_ac97_codec snd_ac97_bus snd_pcm snd_timer snd_page_alloc shpchp pci_hotplug 8250_pnp sis_agp snd_mpu401 snd_mpu401_uart agpgart snd_rawmidi snd_seq_device snd analog i2c_sis96x floppy i2c_core rtc evdev i810_audio ac97_codec soundcore parport_pc parport ns558 pcspkr gameport reiserfs usbhid ide_cd cdrom ide_disk generic ohci_hcd sis5513 ide_core 8139cp ehci_hcd sis900 usbcore 8139too mii thermal processor fan
Nov  7 09:11:26 localhost kernel: CPU:    0
Nov  7 09:11:26 localhost kernel: EIP:    0060:[<c0143615>]    Not tainted VLI
Nov  7 09:11:26 localhost kernel: EFLAGS: 00210097   (2.6.17-2-vserver-k7 #1)
Nov  7 09:11:26 localhost kernel: EIP is at find_get_pages+0x2e/0x50
Nov  7 09:11:26 localhost kernel: eax: c001002c   ebx: 00000004   ecx: dfb39ee8 
  edx: 00020000
Nov  7 09:11:26 localhost kernel: esi: 0000000e   edi: 00000005   ebp: d232e850 
  esp: dfb39ea0
Nov  7 09:11:26 localhost kernel: ds: 007b   es: 007b   ss: 0068
Nov  7 09:11:26 localhost kernel: Process kswapd0 (pid: 117[#0], 
threadinfo=dfb38000 task=dffa5550)
Nov  7 09:11:26 localhost kernel: Stack: 00000000 dfb39ed0 00000029 00000000 
c01476ab dfb39ed8 d232e7a0 00000000
Nov  7 09:11:26 localhost kernel:        c0147a29 0000000e ffffffff d232e850 
00000000 00000000 c1718f60 c1770e40
Nov  7 09:11:26 localhost kernel:        c171cb40 c1718480 00020000 c153a200 
dc25f624 dc25f638 00000001 000000d0
Nov  7 09:11:26 localhost kernel: Call Trace:
Nov  7 09:11:26 localhost kernel:  <c01476ab> pagevec_lookup+0x17/0x1d  
<c0147a29> invalidate_mapping_pages+0x99/0xac
Nov  7 09:11:26 localhost kernel:  <c0147cd0> truncate_inode_pages+0x9/0xd  
<c016f5cf> shrink_icache_memory+0xd4/0x1ae
---------

Il kernel in questione e' 2.6.17-2-vserver-k7, il pc in questione e'
un AMD non recentissimo (sempron 2600) con 1 solo disco IDE e 1Gb di
RAM. E' esposto su internet solo con ssh.

A quanto "interpreto" dal log di cui sopra, vedo che la funziona
find_get_pages non e' andata a buon termine e infatti la prima riga e'
eloquente:

"BUG: unable to handle kernel paging request at virtual address 00020000"

Anche precedentemente con un kernel differente avevo dei crash ma non
ho potuto tracciare la cosa e non ho i piu' i log per cui non so dire
se il bug fosse lo stesso. Il crash precedente a questo (non molto
tempo fa, stesso kernel per la cronaca) dava lo stesso messaggio
"BUG:...." e segnalava che la funzione incriminata era invece
find_lock_page.

Avevo anche fatto girare memtest per un po' di tempo (piu' di un anno
fa pero'), senza avere il minimo problema. Riprovero' appena possibile.

Qualcuno sa darmi suggerimenti su come affrontare la questione? Sapete
interpretare meglio il log?

Grazie in anticipo,

Emanuele
--
Per iscriversi  (o disiscriversi), basta spedire un  messaggio con OGGETTO
"subscribe" (o "unsubscribe") a mailto:linuxtrent-request@xxxxxxxxxxxxx


Other related posts: