Depuis que j’utilise un P5B-VM d’assus, j’ai nombre d’ennui, mais celui-ci qui est la cause de pas mal de crash de mon serveur de production est de loin le plus ennuyeux : les données sont corrompues sur les disques… de façon aléatoire.
J’ai mis un moment pour cerner la cause … le temps de vérifier les deux disques utilisés en SATA, de checker la mémoire, puis de s’assurer que ce ne soit pas lié à l’usage de XEN ou du RAID… Maintenant, c’est clair, le problème apparaît sur une Linux de base fraîchement installé … pourquoi, c’est encore un grand mystere, mais donc attention à cette carte mère !!!
Ma config : ASUS P5B-VM (bios 901) avec core 2 duo underclocker (ca merde aussi à frequence normale) @ 1.6G / 4Go de Ram / 2 HD Sata 80Go. Kernel 2.6.18 (Opensuse 10.2)
Mise en evidence du problème :
xen-prod:/ # head –bytes=300m /dev/urandom > test
xen-prod:/ # for i in `seq 0 9` ; do cp test test$i ; done
xen-prod:/ # md5sum test*
014666c728c9e3b8299579fae499864a test
014666c728c9e3b8299579fae499864a test0
333fd93d093ac612cd8d5f65628f734e test1
1ab6ee68c6a7d9ff5a05f9d63f0f6df6 test2
96e96483e3175a59c9c05b6720514e1e test3
014666c728c9e3b8299579fae499864a test4
b24dbccc9f4831f8825ab4a55a3be4aa test5
8493efc9c14e4b5c162ac23696fbc16a test6
6a5f4301f66d0379049d79d0e14e2a87 test7
2c81cfa1c3a03aba134574922ee5d75c test8
2ea15c8392bfd0123472a80125bb3abe test9
Soit après copie, 70% des fichiers diffèrent de l’orignal !!
J’ai un peu tout essayé : desactivé le Memory remapping et me priver de 1.2G, passer le sata en mode “compatible” ; ext3 / reisefs … rien n’y fait !!!
Je suis a deux doigts d’aller m’acheter un autre carte mère, donc mon conseil, éviter celle-ci… et si vous avez une solution … contactez moi !
Après quelques recherches supplémentaires, en enlevant 2G le problème disparaît. la mémoire n’est pas en cause puisqu’en inversant les barrettes le problème n’apparaît plus non plus. C’est bien la carte mère (ou sa gestion sous linux) qui pose problème. J’avais lu des problèmes liés au chip ethernet, mais pas au contrôleur SATA … il y en a donc … Bref, au choix .. un serveur à 2Gb ou une nouvelle carte mère.. je crois que je vais tenter l’option n°2