Linux 2.6.x 64-bit NFS-Server crash

Hallo,

habe hier ein Problem, das ich nicht
verstehe.

Ein auf SuSE-92 beruhender kleiner Athlon-64-Cluster
(mit 64-bit nfs-utils-1.0.6-113) unter Kernel
default-2.6.8-24.10, der über 10MBit an einem
SuSE-91-basierendem Server (mit nfs-utils-1.0.6-103)
unter kernel smp-2.6.5-7.111.19 laufen soll, macht
folgendes Problem:

Wenn ich vom 91-Server aus (fstab:
[r1:/home/name /home/name/cluster/r1 nfs rw,soft,noauto,user,exec 0 0]
dieses user-Verzeichnis auf dem 92-Client (exports:
[/home/name *(rw,root_squash,sync)]
mounten will, dann hängt sich der client augenblick-
lich hart auf. Reset ist angesagt. Umgekehrt mounten
die Clients problemlos Verzeichnisse vom Server.

Das ist mir ein Rätsel, da ich bisher immer immer
problemlos verschiedene Distributionen und Kernel-
varianten durcheinandergemountet habe.

Noch jemand Probleme mit x64-(kernel-)NFS-Server?
Kann das am NIC der A64-Rechner liegen (Asus K8V-X
mit Marvell-Chip an einem 10MBit-Hub).

Seltsamerweise hat es *manchmal* mit dem mounten
geklappt. Aber sehr selten. 1 von 10.
Hmmmm.

Grüße

CMБ

Hallo,

Hi,

Wenn ich vom 91-Server aus (fstab:
[ r1:/home/name /home/name/cluster/r1 nfs
rw,soft,noauto,user,exec 0 0 ]
dieses user-Verzeichnis auf dem 92-Client (exports:
[/home/name *(rw,root_squash,sync)]
mounten will, dann hängt sich der client augenblick-
lich hart auf.

Was bedeutet das? Schmiert der Kernel ab oder was? NFS braucht manchmal so seine 10min, bis es sich gefangen hat. Ein komisches Phaenomen, an dem ich auch schon oefter geknabbert hab, ohne jemals eine Loesung dafuer zu finden.

Mehr Rat hab ich nicht. Doch, einen noch: beerdige NFS, schnell. (Ja, ich kenne nur AFS als einzige bessere Alternative. Ja, ich weiss, dass das sehr aufwendig ist. Ja, ich weiss, dass das nicht wirklich besser ist.)

Sorry,
Gruss vom Frank.

Hallo Frank,

Wenn ich vom 91-Server aus (fstab:
[ r1:/home/name /home/name/cluster/r1 nfs
rw,soft,noauto,user,exec 0 0 ]
dieses user-Verzeichnis auf dem 92-Client (exports:
[/home/name *(rw,root_squash,sync)]
mounten will, dann hängt sich der client augenblick-
lich hart auf.

Was bedeutet das? Schmiert der Kernel ab oder was?

Ja. Es kommt nichts Auffälliges in /var/log/messages an.

NFS braucht manchmal so seine 10min , bis es sich gefangen hat.
Ein komisches Phaenomen, an dem ich auch schon oefter
geknabbert hab, ohne jemals eine Loesung dafuer zu finden.

AAAAAAAAAAAAAAAAAhhhhhhhhhhhhh!

Vorhin hab ich die Mühlen nochmal neu gestartet
und bin frustriert nach Hause marschiert. Von zu
Hause (nach 2h) nochmal versucht, die Dinger auf
den Server zu mounten und gleichzeitig ‚messages‘
zu beobachten.

plötzlich geht es …

Aaahhh.

Mehr Rat hab ich nicht. Doch, einen noch: beerdige NFS,
schnell. (Ja, ich kenne nur AFS als einzige bessere
Alternative. Ja, ich weiss, dass das sehr aufwendig ist.
Ja, ich weiss, dass das nicht wirklich besser ist.)

Ach, ich denke, NFS tut es im Rahmen der gegebenen
Umstände. Ein paar Number Cruncher mit kleinen lokalen
Platten, die über NFS ihre Programme starten und ein
Server, der gelegentlich über NFS die Resultate abholt.
Alles in einem abgetrennten Netzwerk hinter einem
(nahezu immer ausgeschalteten) NAT.

Im Prinzip könnte man auf NFS ganz verzichten und die
Sache mit scp’s erledigen. Aber es ist so schön be-
quem, die cluster nodes auf ein Verzeichnis des Servers
zu mounten und dieses über Samba an die Windoofs-Kisten
im Umfeld freizugeben :wink:

Grüße & Danke für den rettenden Tipp.

CMБ