[Ilugc] Frequent crashes, interpreting kernel logs

  • From: solar345@xxxxxxxxx (Antano Solar)
  • Date: Sun May 13 22:20:55 2007

On 5/13/07, Kumar Appaiah <akumar@xxxxxxxxxxxxx> wrote:

Dear ILUGC,

Of late, my machine has been freezing sporadically with some
error. Though I have tried Googling the error, I have not been able to
get a satisfactory diagnosis of what the cause could be. Therefore, I
was wondering whether someone on the list could interpret the message
better.

Please note that I was using the NVidia provided drivers for the Riva
TNT2 card. I have currently disabled it, but have reason to suspect
that these crashes are independent of that. Also, I am using
reiserfs. I get the error with both the stock Debian Etch kernel
2.6.18-4-486 and a custom compiled 2.6.21.1. Is it a software problem
or a hardware problem?

Here's the relevant part of the syslog during that crash (when the
NVidia driver was present):

May 11 11:37:14 greatbear kernel: Eeek! page_mapcount(page) went negative! 
(-1)
May 11 11:37:14 greatbear kernel:   page pfn = 19315
May 11 11:37:14 greatbear kernel:   page->flags = 4000086c
May 11 11:37:14 greatbear kernel:   page->count = 2
May 11 11:37:14 greatbear kernel:   page->mapping = dfffca18
May 11 11:37:14 greatbear kernel:   vma->vm_ops = 0xc0348688
May 11 11:37:14 greatbear kernel:   vma->vm_ops->nopage = 
filemap_nopage+0x0/0x2ee
May 11 11:37:14 greatbear kernel:   vma->vm_file->f_op->mmap = 
reiserfs_file_mmap+0x0/0x36
May 11 11:37:14 greatbear kernel: ------------[ cut here ]------------
May 11 11:37:14 greatbear kernel: kernel BUG at mm/rmap.c:596!
May 11 11:37:14 greatbear kernel: invalid opcode: 0000 [#1]
May 11 11:37:14 greatbear kernel: SMP
May 11 11:37:14 greatbear kernel: Modules linked in: nls_iso8859_1 isofs udf 
ipv6 tcp_diag inet_diag nvidia(P) button ac battery ext3 jbd mbcache loop 
tsdev snd_cmipci gameport snd_pcm_oss snd_mixer_oss snd_pcm snd_page_alloc 
snd_opl3_lib snd_hwdep snd_mpu401_uart snd_seq_dummy snd_seq_oss snd_seq_midi 
snd_seq_midi_event snd_seq snd_timer snd_rawmidi snd_seq_device parport_pc 
parport rtc snd soundcore i2c_i801 floppy psmouse serio_raw pcspkr i2c_core 
intel_agp agpgart shpchp pci_hotplug evdev ide_cd cdrom ide_disk piix generic 
ide_core uhci_hcd usbcore 8139cp 8139too mii thermal processor fan vga16fb 
vgastate
May 11 11:37:14 greatbear kernel: CPU:    0
May 11 11:37:14 greatbear kernel: EIP:    0060:[<c0157ed9>]    Tainted: P     
  VLI
May 11 11:37:14 greatbear kernel: EFLAGS: 00010282   (2.6.21.1 #1)
May 11 11:37:14 greatbear kernel: EIP is at page_remove_rmap+0xce/0xed
May 11 11:37:14 greatbear kernel: eax: 0000003c   ebx: c13262a0   ecx: 
00000046   edx: 00000046
May 11 11:37:14 greatbear kernel: esi: e24758b4   edi: 00000020   ebp: 
d522fc08   esp: d3835dfc
May 11 11:37:14 greatbear kernel: ds: 007b   es: 007b   fs: 00d8  gs: 0000  
ss: 0068
May 11 11:37:14 greatbear kernel: Process aptitude (pid: 4756, ti=d3834000 
task=d8b5a070 task.ti=d3834000)
May 11 11:37:14 greatbear kernel: Stack: c030a7ad dfffca18 c13262a0 b7702000 
c0152bb4 00000000 e24758b4 d3835e74
May 11 11:37:14 greatbear kernel:        00000000 00000001 b7800000 d51d5b74 
df1bc740 c1505da0 00000000 fffffe36
May 11 11:37:14 greatbear kernel:        c12a45ec d51d5b74 00119ff8 b7b95000 
00000000 d3835e74 df0965c0 df1bc740
May 11 11:37:14 greatbear kernel: Call Trace:
May 11 11:37:14 greatbear kernel:  [<c0152bb4>] unmap_vmas+0x25c/0x4a8
May 11 11:37:14 greatbear kernel:  [<c0155563>] exit_mmap+0x75/0xe1
May 11 11:37:14 greatbear kernel:  [<c011e4d4>] mmput+0x1d/0x75
May 11 11:37:14 greatbear kernel:  [<c0122cdc>] do_exit+0x1b1/0x6ac
May 11 11:37:14 greatbear kernel:  [<c0123243>] sys_exit_group+0x0/0xd
May 11 11:37:14 greatbear kernel:  [<c012a53d>] 
get_signal_to_deliver+0x366/0x389
May 11 11:37:14 greatbear kernel:  [<c010344d>] do_notify_resume+0x84/0x5cc
May 11 11:37:14 greatbear kernel:  [<c011b9d0>] default_wake_function+0x0/0xc
May 11 11:37:14 greatbear kernel:  [<c0121d78>] put_files_struct+0x8d/0xa7
May 11 11:37:14 greatbear kernel:  [<c01188ed>] do_page_fault+0x277/0x512
May 11 11:37:14 greatbear kernel:  [<c01371bd>] sys_futex+0x98/0xab
May 11 11:37:14 greatbear kernel:  [<c0103d8a>] work_notifysig+0x13/0x19
May 11 11:37:14 greatbear kernel:  =======================
May 11 11:37:14 greatbear kernel: Code: c0 74 0d 8b 50 08 b8 dd a7 30 c0 e8 
f7 39 fe ff 8b 46 48 85 c0 74 14 8b 40 10 85 c0 74 0d 8b 50 2c b8 fc a7 30 c0 
e8 dc 39 fe ff <0f> 0b eb fe 8b 53 10 83 e2 01 f7 da 83 c2 04 89 d8 59 5b 5b 
5e
May 11 11:37:14 greatbear kernel: EIP: [<c0157ed9>] 
page_remove_rmap+0xce/0xed SS:ESP 0068:d3835dfc
May 11 11:37:14 greatbear kernel: Fixing recursive fault but reboot is needed!


Try running the memcheck !

Other related posts: