[Linuxtrent] (forse) problema hardware - lungo

  • From: Roberto Cavada <cavada@xxxxxxxxxxx>
  • To: linuxtrent@xxxxxxxxxxxxx
  • Date: Mon, 29 Apr 2002 14:30:42 +0200

Ciao,=20
 l'argomento non e' strettamente legato a linux (anche se e l'unico so=20
installato), e spero che nonostante l'OT qualcuno abbia una qualche=20
idea di quale possa essere il problema. Oltre che per l'OT, vi prego=20
di scusare la lunghezza di questa mail.=20

Il mio pc e' questo (segue descrizione problema):
- asus a7v=20
- athlon 750 mhz
- controller promise (no raid)
- matrox g400=20
- sb 1024
- (non ricordo adesso la potenza erogabile dall'alimentatore)

La distibuzione e' suse 7.3

Il pc ha dato segni di malfunzionamento tempo fa, come bloccaggi,=20
freezing improvvisi, impossibilita' di installare il so (anche con=20
winzoss 98) per vari errori durante l'accesso alla ram, memtest86 che=20
segnalava un grande numero di indirizzi bacati, il test bios della=20
ram che segnalava memory error.=20
Pensando di essermi giocato l'unico banco di ram presente (128mb) l'ho=20
sostituito con uno da 256, e per un po' il sistema ha funzionato bene=20
(qualche giorno).=20
Poi sono ricomparsi problemi molto simili, come riavvii improvvisi,=20
freezing, ecc.=20
In particolare memtest86 segnala una lunga lista di indirizzi bacati=20
(nessun problema per il bios test, ma non mi e' chiaro se il nuovo=20
banco ram prevede il parity checking).=20

Durante la scompattazione del kernel ottengo un crc error con=20
conseguente kernel panic.=20

Ora la cosa buffa e' che questi problemi *non* sono deterministici.=20
- i crc error del kernel avvengono solo di tanto in tanto. In caso di=20
avvio corretto il sistema puo' funzionare bene per un tempo=20
assolutamente aleatorio (da pochi minuti a diverse ore). Mi sembra =20
che in questo caso il non determinismo sia ortogonale al carico del=20
sistema.=20
- gli indirizzi bacati segnalati da memtest86 non sono *mai* li=20
stessi, anche se segnalati sempre a gruppi in cui gli indirizzi sono=20
vicini tra loro.=20

In pratica non riesco a farmi un'idea di quello che succede.=20
Queste le misure che ho tentato:
1) impostazione manuale della tensione del core della cpu a 1.6V,=20
pensando a un possibile problema della scheda madre;
2) le ventole cpu e alimentatore funzionano correttamente (e girano=20
col giusto verso);
3a) le temperature segnalate dal bios sembrano corrette e molto al di=20
sotto delle soglie;
3b) le tensioni sono abbastanza stabili (a parte per le negative, sul=20
10% piu' basse);=20
4) eliminato tutto il superflo, come la scheda sonora e quella di=20
rete;=20
5) il sistema si comporta in modo identico con una diversa scheda=20
video;=20
6) tentativi con frequenze di cpu, bus e ram piu' basse.=20

Idee?=20
Grazie.=20
roberto
-- 
PROSSIMA ASSEMBLEA: lunedi 29 Aprile 2002 ore 20:45
Per iscriversi  (o disiscriversi), basta spedire un  messaggio con SOGGETTO
"subscribe" (o "unsubscribe") a mailto:linuxtrent-request@xxxxxxxxxxxxxxxxx


Other related posts: