[Linuxtrent] Re: Proxmox: errore device md-4

E' capitata anche a me la stessa cosa,

Ho spostato una scheda di rete da uno slot pci ad un altro e non ha piu
dato errori.






Da:  Alessandro Carloni <kaya84@xxxxxxxxx>
Risposta:  <linuxtrent@xxxxxxxxxxxxx>
Data:  giovedì 14 giugno 2012 12.08
A:  <linuxtrent@xxxxxxxxxxxxx>
Oggetto:  [Linuxtrent] Proxmox: errore device md-4


Buongiorno a tutti, ringraziando il buon Marco e Mauro per il "primo
soccorso" volevo esporre un problema che mi ha leggermente preoccupato.
Arrivato in ufficio, noto che non c'è l'email del backup di uno dei due
nodi proxmox.
Penso a una mancanza di corrente che ha scollegato il router (attualmente
fuori dall'ups) ma nessun indicatore al riguardo.
Eseguo così un dmesg sul nodo proxmox e noto la seguente cosa:
device-mapper: snapshots: Invalidating snapshot: Unable to allocate
exception.
EXT3-fs error (device dm-4): ext3_find_entry: reading directory #2 offset 0
Buffer I/O error on device dm-4, logical block 0
lost page write due to I/O error on dm-4
EXT3-fs error (device dm-4): ext3_find_entry: reading directory #2 offset 0
------------[ cut here ]------------
WARNING: at fs/buffer.c:1164 mark_buffer_dirty+0x23/0x80()
Hardware name: S5000VSA
Modules linked in: nfs lockd fscache nfs_acl auth_rpcgss sunrpc vzethdev
vznetdev simfs vzrst vzcpt vzdquota vzmon vzdev ip6t_REJECT
ip6table_mangle ip6table_filter ip6_tables xt_tcpudp xt_length xt_hl
xt_tcpmss xt_TCPMSS iptable_mangle iptable_filter xt_multiport xt_limit
xt_dscp ipt_REJECT ip_tables x_tables vzevent tun kvm_intel kvm ib_iser
rdma_cm ib_cm iw_cm ib_sa ib_mad ib_core ib_addr iscsi_tcp libiscsi_tcp
libiscsi scsi_transport_iscsi bridge stp ext4 jbd2 crc16 snd_pcm snd_timer
snd serio_raw soundcore i2c_i801 snd_page_alloc evdev ioatdma i5k_amb
i2c_core psmouse shpchp rng_core dca pci_hotplug pcspkr button i5000_edac
edac_core processor ext3 jbd mbcache dm_mirror dm_region_hash dm_log
dm_snapshot raid10 raid456 async_raid6_recov async_pq raid6_pq async_xor
xor async_memcpy async_tx raid1 raid0 multipath linear md_mod osst st
usbhid hid ata_piix ata_generic ehci_hcd uhci_hcd sym53c8xx
scsi_transport_spi aacraid libata usbcore nls_base e1000e thermal fan
thermal_sys [last unloaded: scsi_wait_scan]
Pid: 8128, comm: standard Not tainted 2.6.32-4-pve #1
Call Trace:
 [<ffffffff8111149d>] ? mark_buffer_dirty+0x23/0x80
 [<ffffffff8111149d>] ? mark_buffer_dirty+0x23/0x80
 [<ffffffff8104e21c>] ? warn_slowpath_common+0x77/0xa3
 [<ffffffff8111149d>] ? mark_buffer_dirty+0x23/0x80
 [<ffffffffa02192de>] ? ext3_commit_super+0x4f/0x6f [ext3]
 [<ffffffffa021ab55>] ? ext3_handle_error+0x83/0xaa [ext3]
 [<ffffffffa021ac85>] ? ext3_error+0x83/0x90 [ext3]
 [<ffffffff81110a0e>] ? submit_bh+0x11c/0x123
 [<ffffffff811120ae>] ? ll_rw_block+0xb4/0xf8
 [<ffffffffa0217119>] ? ext3_find_entry+0x3e1/0x560 [ext3]
 [<ffffffff81182146>] ? vsnprintf+0x40a/0x449
 [<ffffffff8131468b>] ? thread_return+0xdc/0x143
 [<ffffffff81073da6>] ? charge_dcache+0x61/0xb9
 [<ffffffffa0217ae2>] ? ext3_lookup+0x30/0xe4 [ext3]
 [<ffffffff810f9412>] ? do_lookup+0xf1/0x178
 [<ffffffff810f9eab>] ? __link_path_walk+0x689/0x811
 [<ffffffff810fa1bb>] ? path_walk+0x44/0x85
 [<ffffffff810fb4db>] ? do_path_lookup+0x20/0x77
 [<ffffffff810fc81f>] ? user_path_at+0x48/0x79
 [<ffffffff81066a16>] ? autoremove_wake_function+0x0/0x2e
 [<ffffffff81066c01>] ? remove_wait_queue+0x12/0x4d
 [<ffffffff810f4d50>] ? vfs_fstatat+0x2c/0x57
 [<ffffffff810f4e43>] ? sys_newstat+0x11/0x30
 [<ffffffff810f2172>] ? vfs_read+0xca/0xff
 [<ffffffff8105c92d>] ? sys_rt_sigprocmask+0xab/0xc4
 [<ffffffff81010c12>] ? system_call_fastpath+0x16/0x1b
---[ end trace 589b990996a97ff0 ]---
Buffer I/O error on device dm-4, logical block 0
lost page write due to I/O error on dm-4
kvm: 2449: cpu0 unhandled wrmsr: 0x198 data 0
EXT3-fs error (device dm-4): ext3_find_entry: reading directory #2 offset 0
Buffer I/O error on device dm-4, logical block 0
lost page write due to I/O error on dm-4
EXT3-fs error (device dm-4): ext3_get_inode_loc: unable to read inode
block - inode=2, block=1027
Buffer I/O error on device dm-4, logical block 0
lost page write due to I/O error on dm-4



Brividi: disco rotto??
Il sistema ha un controller adaptec 2130s e con due tre controlli non
rilevo alcun disco rotto.
Anche perchè, il sistema è presentato sotto /dev/sda e quindi mi chiedo da
dove salti fuori questo dm-4.

Alla fine della fiera capisco che riguarda lo snapshot per il backup che
ha avuto qualche problema..ma non riesco a capire quale.
Al momento questo dm-4 è ancora presente:
px1:/# vgscan
  Reading all physical volumes.  This may take a while...
  /dev/dm-4: read failed after 0 of 4096 at 100923277312: Input/output
error
  /dev/dm-4: read failed after 0 of 4096 at 100923334656: Input/output
error
  /dev/dm-4: read failed after 0 of 4096 at 0: Input/output error
  /dev/dm-4: read failed after 0 of 4096 at 4096: Input/output error
  /dev/dm-4: read failed after 0 of 4096 at 0: Input/output error
  Found volume group "fileserver" using metadata type lvm2
  Found volume group "pve" using metadata type lvm2

px1:/# pvscan
  /dev/dm-4: read failed after 0 of 4096 at 100923277312: Input/output
error
  /dev/dm-4: read failed after 0 of 4096 at 100923334656: Input/output
error
  /dev/dm-4: read failed after 0 of 4096 at 0: Input/output error
  /dev/dm-4: read failed after 0 of 4096 at 4096: Input/output error
  /dev/dm-4: read failed after 0 of 4096 at 0: Input/output error
  PV /dev/sdb1   VG fileserver   lvm2 [931.51 GB / 8.00 MB free]
  PV /dev/sda2   VG pve          lvm2 [135.98 GB / 2.99 GB free]
  Total: 2 [1.04 TB] / in use: 2 [1.04 TB] / in no VG: 0 [0   ]


px1:/# pvs
  /dev/dm-4: read failed after 0 of 4096 at 0: Input/output error
  PV         VG         Fmt  Attr PSize   PFree
  /dev/sda2  pve        lvm2 a-   135.98G 2.99G
  /dev/sdb1  fileserver lvm2 a-   931.51G 8.00M


il prossimo bacpx1:/# pvs
  /dev/dm-4: read failed after 0 of 4096 at 0: Input/output error
  PV         VG         Fmt  Attr PSize   PFree
  /dev/sda2  pve        lvm2 a-   135.98G 2.99G
  /dev/sdb1  fileserver lvm2 a-   931.51G 8.00M

Adesso la domanda è:
- Cosa può aver causato il problema? indagando a fondo presumo sia andato
fuori memoria a causa degli aggiornamenti delle VM (windows 2k3
principalmente) e quindi lo snapshot si è...incartato.
- Ancora non ho lanciato il backup: funzionerà stanotte o ne lancio uno di
prova?
- come rimuovo questo dm-4?

Grazie mille .

A.



--
Per iscriversi  (o disiscriversi), basta spedire un  messaggio con OGGETTO
"subscribe" (o "unsubscribe") a mailto:linuxtrent-request@xxxxxxxxxxxxx


Other related posts: