E' capitata anche a me la stessa cosa, Ho spostato una scheda di rete da uno slot pci ad un altro e non ha piu dato errori. Da: Alessandro Carloni <kaya84@xxxxxxxxx> Risposta: <linuxtrent@xxxxxxxxxxxxx> Data: giovedì 14 giugno 2012 12.08 A: <linuxtrent@xxxxxxxxxxxxx> Oggetto: [Linuxtrent] Proxmox: errore device md-4 Buongiorno a tutti, ringraziando il buon Marco e Mauro per il "primo soccorso" volevo esporre un problema che mi ha leggermente preoccupato. Arrivato in ufficio, noto che non c'è l'email del backup di uno dei due nodi proxmox. Penso a una mancanza di corrente che ha scollegato il router (attualmente fuori dall'ups) ma nessun indicatore al riguardo. Eseguo così un dmesg sul nodo proxmox e noto la seguente cosa: device-mapper: snapshots: Invalidating snapshot: Unable to allocate exception. EXT3-fs error (device dm-4): ext3_find_entry: reading directory #2 offset 0 Buffer I/O error on device dm-4, logical block 0 lost page write due to I/O error on dm-4 EXT3-fs error (device dm-4): ext3_find_entry: reading directory #2 offset 0 ------------[ cut here ]------------ WARNING: at fs/buffer.c:1164 mark_buffer_dirty+0x23/0x80() Hardware name: S5000VSA Modules linked in: nfs lockd fscache nfs_acl auth_rpcgss sunrpc vzethdev vznetdev simfs vzrst vzcpt vzdquota vzmon vzdev ip6t_REJECT ip6table_mangle ip6table_filter ip6_tables xt_tcpudp xt_length xt_hl xt_tcpmss xt_TCPMSS iptable_mangle iptable_filter xt_multiport xt_limit xt_dscp ipt_REJECT ip_tables x_tables vzevent tun kvm_intel kvm ib_iser rdma_cm ib_cm iw_cm ib_sa ib_mad ib_core ib_addr iscsi_tcp libiscsi_tcp libiscsi scsi_transport_iscsi bridge stp ext4 jbd2 crc16 snd_pcm snd_timer snd serio_raw soundcore i2c_i801 snd_page_alloc evdev ioatdma i5k_amb i2c_core psmouse shpchp rng_core dca pci_hotplug pcspkr button i5000_edac edac_core processor ext3 jbd mbcache dm_mirror dm_region_hash dm_log dm_snapshot raid10 raid456 async_raid6_recov async_pq raid6_pq async_xor xor async_memcpy async_tx raid1 raid0 multipath linear md_mod osst st usbhid hid ata_piix ata_generic ehci_hcd uhci_hcd sym53c8xx scsi_transport_spi aacraid libata usbcore nls_base e1000e thermal fan thermal_sys [last unloaded: scsi_wait_scan] Pid: 8128, comm: standard Not tainted 2.6.32-4-pve #1 Call Trace: [<ffffffff8111149d>] ? mark_buffer_dirty+0x23/0x80 [<ffffffff8111149d>] ? mark_buffer_dirty+0x23/0x80 [<ffffffff8104e21c>] ? warn_slowpath_common+0x77/0xa3 [<ffffffff8111149d>] ? mark_buffer_dirty+0x23/0x80 [<ffffffffa02192de>] ? ext3_commit_super+0x4f/0x6f [ext3] [<ffffffffa021ab55>] ? ext3_handle_error+0x83/0xaa [ext3] [<ffffffffa021ac85>] ? ext3_error+0x83/0x90 [ext3] [<ffffffff81110a0e>] ? submit_bh+0x11c/0x123 [<ffffffff811120ae>] ? ll_rw_block+0xb4/0xf8 [<ffffffffa0217119>] ? ext3_find_entry+0x3e1/0x560 [ext3] [<ffffffff81182146>] ? vsnprintf+0x40a/0x449 [<ffffffff8131468b>] ? thread_return+0xdc/0x143 [<ffffffff81073da6>] ? charge_dcache+0x61/0xb9 [<ffffffffa0217ae2>] ? ext3_lookup+0x30/0xe4 [ext3] [<ffffffff810f9412>] ? do_lookup+0xf1/0x178 [<ffffffff810f9eab>] ? __link_path_walk+0x689/0x811 [<ffffffff810fa1bb>] ? path_walk+0x44/0x85 [<ffffffff810fb4db>] ? do_path_lookup+0x20/0x77 [<ffffffff810fc81f>] ? user_path_at+0x48/0x79 [<ffffffff81066a16>] ? autoremove_wake_function+0x0/0x2e [<ffffffff81066c01>] ? remove_wait_queue+0x12/0x4d [<ffffffff810f4d50>] ? vfs_fstatat+0x2c/0x57 [<ffffffff810f4e43>] ? sys_newstat+0x11/0x30 [<ffffffff810f2172>] ? vfs_read+0xca/0xff [<ffffffff8105c92d>] ? sys_rt_sigprocmask+0xab/0xc4 [<ffffffff81010c12>] ? system_call_fastpath+0x16/0x1b ---[ end trace 589b990996a97ff0 ]--- Buffer I/O error on device dm-4, logical block 0 lost page write due to I/O error on dm-4 kvm: 2449: cpu0 unhandled wrmsr: 0x198 data 0 EXT3-fs error (device dm-4): ext3_find_entry: reading directory #2 offset 0 Buffer I/O error on device dm-4, logical block 0 lost page write due to I/O error on dm-4 EXT3-fs error (device dm-4): ext3_get_inode_loc: unable to read inode block - inode=2, block=1027 Buffer I/O error on device dm-4, logical block 0 lost page write due to I/O error on dm-4 Brividi: disco rotto?? Il sistema ha un controller adaptec 2130s e con due tre controlli non rilevo alcun disco rotto. Anche perchè, il sistema è presentato sotto /dev/sda e quindi mi chiedo da dove salti fuori questo dm-4. Alla fine della fiera capisco che riguarda lo snapshot per il backup che ha avuto qualche problema..ma non riesco a capire quale. Al momento questo dm-4 è ancora presente: px1:/# vgscan Reading all physical volumes. This may take a while... /dev/dm-4: read failed after 0 of 4096 at 100923277312: Input/output error /dev/dm-4: read failed after 0 of 4096 at 100923334656: Input/output error /dev/dm-4: read failed after 0 of 4096 at 0: Input/output error /dev/dm-4: read failed after 0 of 4096 at 4096: Input/output error /dev/dm-4: read failed after 0 of 4096 at 0: Input/output error Found volume group "fileserver" using metadata type lvm2 Found volume group "pve" using metadata type lvm2 px1:/# pvscan /dev/dm-4: read failed after 0 of 4096 at 100923277312: Input/output error /dev/dm-4: read failed after 0 of 4096 at 100923334656: Input/output error /dev/dm-4: read failed after 0 of 4096 at 0: Input/output error /dev/dm-4: read failed after 0 of 4096 at 4096: Input/output error /dev/dm-4: read failed after 0 of 4096 at 0: Input/output error PV /dev/sdb1 VG fileserver lvm2 [931.51 GB / 8.00 MB free] PV /dev/sda2 VG pve lvm2 [135.98 GB / 2.99 GB free] Total: 2 [1.04 TB] / in use: 2 [1.04 TB] / in no VG: 0 [0 ] px1:/# pvs /dev/dm-4: read failed after 0 of 4096 at 0: Input/output error PV VG Fmt Attr PSize PFree /dev/sda2 pve lvm2 a- 135.98G 2.99G /dev/sdb1 fileserver lvm2 a- 931.51G 8.00M il prossimo bacpx1:/# pvs /dev/dm-4: read failed after 0 of 4096 at 0: Input/output error PV VG Fmt Attr PSize PFree /dev/sda2 pve lvm2 a- 135.98G 2.99G /dev/sdb1 fileserver lvm2 a- 931.51G 8.00M Adesso la domanda è: - Cosa può aver causato il problema? indagando a fondo presumo sia andato fuori memoria a causa degli aggiornamenti delle VM (windows 2k3 principalmente) e quindi lo snapshot si è...incartato. - Ancora non ho lanciato il backup: funzionerà stanotte o ne lancio uno di prova? - come rimuovo questo dm-4? Grazie mille . A. -- Per iscriversi (o disiscriversi), basta spedire un messaggio con OGGETTO "subscribe" (o "unsubscribe") a mailto:linuxtrent-request@xxxxxxxxxxxxx