Plötzliche Grafikfehler System friert ein

Hallo Experten,

urplötzlich hängt sich unser server laufend auf.

Betriebssystem Server 2003 standart edition

Server läuft hoch, ganz normal, ich starte eine anwendung und dann löst sich das bild in durcheinandergewürfelte blöcke auf und das system hängt. strg,alt,entf auch nicht mehr möglich. Beim neustart fährt er ganz normal wieder hoch. manchmal läuft er auch durch. Der fehler ist manchmal tagelang verschwunden und dann passiert es wieder 3-4 mal am tag.

Habe die GK in verdacht. Leider ist es ein blade server mit onboard gk und der hat auch keinen agp oder pci express slot so das ich das mal eben testen könnte.

Jemand ne idee… ausser neuen server kaufen?

Gruß ralf

Hallo,

Habe die GK in verdacht.

ich auch. Gibt es vom Hersteller kein Diagnoseprogramm?

Gruß

S.J.

Hi Steve,

gab es bestimmt mal, das teil ist baujahr 2002. Es ist ein Supermicro 5013G bin da bisher noch nicht fündig geworden. Durch div. Neustarts lähmt der sql server auch noch das system CPU last bei 98% selbst wenn er angehalten ist.

Gruß Ralf

Hallo Experten,

urplötzlich hängt sich unser server laufend auf.

Betriebssystem Server 2003 standart edition

Server läuft hoch, ganz normal, ich starte eine anwendung und
dann löst sich das bild in durcheinandergewürfelte blöcke auf
und das system hängt. strg,alt,entf auch nicht mehr möglich.
Beim neustart fährt er ganz normal wieder hoch. manchmal läuft
er auch durch. Der fehler ist manchmal tagelang verschwunden
und dann passiert es wieder 3-4 mal am tag.

Habe die GK in verdacht. Leider ist es ein blade server mit
onboard gk und der hat auch keinen agp oder pci express slot
so das ich das mal eben testen könnte.

Neben softwarebedingten Problemen - was Du wenn Du nur ein eiknziges System betreibst nicht richtig diagnostizeiren kannst - kannst Du ein wenig an der Hardware Dein Glück versuchen, viel kann man allerdings leider nicht tun.

1.) Prozessor und Grafikchip Temperatur am Kühlkörper messen, Lüfter kontrollieren. Geht zur Not mit Software (CpuZ, GpuZ, Everest, MOM), aber ich ziehe es normalerweise vor, alle kritischen Bauteile mit einem Thermometer unter die Lupe zu nehmen. Dazu muss das Blade eine Weile laufen und dann schnell auseinandergenommen werden. Eventuell bekomst Du auch Themofühler ins Gehäuse - wenn Du in einer Firma arbeitest die mit Elektronik was am Hut hat findet man oft ziemlich nützliches Zeug im Elektroniklabor. Du kannst auch den anderen Weg gehen und das Blade mit Benchmark-Software (CPUBurner und Furmark) ordentlich stressen, wenn es dann abstürzt weißt Du, dass Du ein Temperaturproblem suchen musst. Das kommt bei Blades, wo es eng ist und heiß hergeht, oft vor. Auch mal den Schrank kritisch beäugen, ob Du dem Teil - vielleicht nur versuchsweise - kühle Luft zuführen kannst.

2.) Mal an allem was gesteckt oder gesockelt ist vorsichtig rütteln um einen Wackelkontakt aufzuspüren, alles was gesteckt oder gesockelt ist ausbauen und wieder reinmachen, um eventuell korrodierte Kontakte wieder blank zu bekommen. Ältere Maschinen entwickeln gerne mal Korrosions- und Wackelkontaktprobleme, alles frisch zusammenstecken hilft dann eine Weile, aber das Problem kommt meistens wieder. Also ist das nur gut, die Zeit bis zur Aschaffung eines neuen Geräts zu überbrücken. Vergiss auch die Speicherbänke nicht, Blades haben immer Onboard Grafik und zwacken sich den Grafikspeicher vom Hauptspeicher ab. Ein kaputter RAM Riegel könnte also auch einen solchen Effekt produzieren, also mal tauschen wenn Du noch passende irgendwo hast. Und leider hatte ich viele ältere Maschinen - meistens Notebooks, aber die sind Blades gar nicht unähnlich - wo sich nach langen Jahren die SMD Chips von den Mainboards ablösen, vor allem der Grafikchip scheint da anfällig. Der Rechner zeigt dann Probleme, wenn man auf den Grafikchip oder sienen Kühlkörper drückt.

Damit hättest Du dann alles getan was man als normaler Bastler an einem Blade an der Hardware noch selber tun kann.

Was generell schief geht: einen Server, von dem man abhängig ist, betreibt man niemals über 8 Jahre lang, und schon gar nicht ohne ein Redundanzkonzept für die Hardware. Lebensdauerende ist in der Regel 5 Jahre oder Einstellung des Supports durch den Hersteller, je nachdem was zuerst eintritt. Irgendwann geht alles kaputt, und dann steht man erst mal ziemlich hilflos da, wenn man nicht darauf vorbereitet ist …

Armin.

Moin Armin,

erstmal Dank für die Tips.

Ich habe mittlerweile bis auf eine Anwendung alles runter von dem Server. Habe die Kiste aus dem Serverrack entfernt und ihn in einen nicht genutzten Raum verbannt. Betreibe ihn jetzt offen dh. ohne
Deckel und oh Wunder er läuft. Ich trage mich mit dem Gedanken das Ding in Rente zu schicken weil ein celeron1700 mit 2gb ram als Server nicht so toll ist. Es ist ein SuperServer 5013G-i von Supermicro. Vielleicht ein neues mainboard rein und gut. Weiss vielleicht jemand wo man Boards für Blades herbekommt? Der Supermicrohändler ist da ein wenig unlustig…und übertrieben teuer. Von den Abmessungen würde jedes ATX board passen, aber in den meisten Fällen müsst ich ne Hutze aufs Gehäuse bauen wegen dem Prozessorkühler. Daher wäre ein Blade - kompatibles Board schon angebracht, denke ich.

Gruß Ralf

in einen nicht genutzten Raum verbannt. Betreibe ihn jetzt
offen dh. ohne
Deckel und oh Wunder er läuft.

Temperatur- oder Stromversorgungsproblem ist also wahrscheinlich. Bedenke, dass Du im anderen raum wahrscheinlich auch eine andere Stromversorgung hast.

Rückfrage: wenn Du das Teil tatsächlich einfach mal so in einem anderen Raum betreiben kannst - ist das dann auch sicher ein „Blade“? Du meist nicht zufällig einen Pizzabox-Server (das sind die ganz flachen 1HE Rackserver). Grund für die Frage: Blades stecken normalerweise zu Mehreren in einem speziellen Gehäuse - das hat man nicht einfach so rumliegen. Aber eigentlich ist das nicht relevant.

Ich trage mich mit dem Gedanken
das Ding in Rente zu schicken weil ein celeron1700 mit 2gb ram
als Server nicht so toll ist.

Der Celeron würde mich nicht stören, wenn er bisher kräftig genug war wird er auch weiter seinen Dienst tun :smile: 8 jahre alt und hat ein Hardwareproblem, keine Ersatzteile, kein Support - das würde mich stören :smile:

Es ist ein SuperServer 5013G-i
von Supermicro. Vielleicht ein neues mainboard rein und gut.

Weiss vielleicht jemand wo man Boards für Blades herbekommt?

Du gehst davon aus, dass es eine Norm für Blades/Pizzaboxen gibt. Gibt es meines Wissens nicht. ATX sagt nur, dass das Board von der Rückblende und den Bohrlöchern her passt. Andere Einflüsse: wo liegen die Stecker (damit die bestehenden Kabel passen), und wo liegt der Prozessor (damit die Kühllösung passt). Diese Einflüsse normt ATX nicht.

Der Supermicrohändler ist da ein wenig unlustig…und
übertrieben teuer. Von den Abmessungen würde jedes ATX board
passen, aber in den meisten Fällen müsst ich ne Hutze aufs
Gehäuse bauen wegen dem Prozessorkühler. Daher wäre ein Blade

  • kompatibles Board schon angebracht, denke ich.

Tja, wenn es „Blade-kompatibel“ gäbe. Gibt es aber m.E. nicht. Die Hersteller nehmen zwar manchmal Standard-Boards, aber das mechanische drumherum wird dann maßgeschneidert. Du kannst also nur die Datenblätter von allen möglichen Mainboards filzen und sehen, ob Du eins bekommst, das mechanisch halbwegs passt, und den Rest dann selber basteln.

Außerdem vorher gut recherchieren. Ich habe z.B. noch einen HP LP2000 in Betrieb (na ja, sagen wir mal sein Blechkleid), und da war usrprünglich zwar ein handelsübliches ASUS Mainboard drinnen, aber das hat HP mit einem angepassten BIOS versehen. Die ersten Umbauversuche (SCSI raus und SATA rein) sind dann daran gescheitert, dass das HP BIOS sich zickig gegen den SATA Controller gesperrt hat. Ich musste das Board erst einmal auf ASUS BIOS zurückbauen, und dann hat es so funktioniert wie es sollte. Allerdings habe ich dadurch die HP hardware-Diagnose und die Remote-Zugriffslösung (HP ILO) verloren, da dies eim HP BIOS verankert waren.

Unterm Strich lohnt sich die Baslelei, wenn man Zeitaufwand und Risiko einkalkuliert, auf keinen Fall, außer man verbucht das auf das Konto „Spaß und Hobby“, aber das hat im geschätlichen Bereich eigentlich nicht zu suchen.

Ich gebe Dir allerdings gute Chancen, das Kühlproblem - denn danach schaut es aus - in den Griff zu bekommen. Vor allem auch, weil die Lüfter in den letzten Jahren wegen der „leise“ Fraktion deutlich besser geworden sind. Wenn es also nur um einen Lüfter mit Drehzahlabfall geht kannst Du ihn leicht gegen einen anderen, eventuell sogar särkeren tauschen.

Armin.

Hallo Armin,

Es ist ein 1HE Rackserver…er läuft übrigens immer noch ohne Ausfall. Was die Performance angeht, war er für seine ursprünglichen Aufgaben schon etwas Schwachbrüstig. Vom Gehäüse her könnte man tatsächlich ein ATX Board reinstecken. Es scheitert an der Kühlung. Die Gehäuseabmessungen lassens einfach icht zu das man einen „normalen“ Prozessor mit Kühlkörper und Lüfter reinbaut. es geht nur mit flachem Kühlkörper den dann von einem Lüfter angepustet wird. Dafür ein eine gewisse Leistung norwendig und je mehr Leistung desto laut. Über Wasserkühlung habe ich mir allerdings noch keine Gedanken gemacht, evtl. geht was in der Richtung. Danke für deine Anreize.

Gruß Ralf

Hallo Armin,

Es ist ein 1HE Rackserver…er läuft übrigens immer noch ohne
Ausfall.

Ist also kein „Blade“, aber egal.

Vom
Gehäüse her könnte man tatsächlich ein ATX Board reinstecken.
Es scheitert an der Kühlung. Die Gehäuseabmessungen lassens
einfach icht zu das man einen „normalen“ Prozessor mit
Kühlkörper und Lüfter reinbaut. es geht nur mit flachem
Kühlkörper den dann von einem Lüfter angepustet wird.

SO isses. Hab mir gerade drei 2HE Einschübe umgebaut. Das ging, weil bei einer Höhe von 82mm gerade noch 80-er Lüfter verbaut werden können, und der Intel Boxed Kühler auch noch verwendet werden kann.

Vorher war auch ein gewaltiges Gebläse (Delta, 66dB Krach lt. Datenblatt) drinnen und ein riesiger proprietärer Kanal für die Luftführung, der natürlich nicht mehr passt.

Dafür
ein eine gewisse Leistung norwendig und je mehr Leistung desto
laut.

Mit ein wenig rechnen habe ich das ganz gut hinbekommen. Erstens war die alte Kühlung viel zu groß diemsnioniert, war auch für ein fettes P4 Doppel-Prozessor Board ausgelegt. Bestückt mit einem modernen ATX Board mit Stromspar Dual-Core läuft das System wunderbar mit dem Boxed Kühler, quer durchs Gehäuse habe ich allerdings noch ein Blech mit zwei langsam laufenden 80-er Lüftern verbauen müssen, das die warme Luft langsam rausschiebt, weil sonst der Boxed Kühler die Luft nur im Kreis rumschiebt und sich das Gehäuseinnere langsam aufheizt. Wärmestau verhindern reicht völlig. Im Netzteil sitzt ein ebenfalls langsam laufender geregelter Lüfter.

4 Lüfter lassen erst mal jeden aufjaulen, aber das System ist nur noch ganz leise hörbar (also nix fürs Wohnzimmer), aber im Büro gegenüber früher eine Wohltat und absolut in Ordnung.

Über Wasserkühlung habe ich mir allerdings noch keine
Gedanken gemacht, evtl. geht was in der Richtung. Danke für
deine Anreize.

Halte ich wenig davon. Erstens kühlt das Wasser per se ja nicht (außer Du lässt einen Schlauch in die Badewanne hängen …), sondern transportiert nur die Wärme von A nach B, wo Du sie dann leichter loswerden kannst. Du musst also bei B immer noch einen Kühler anbringen, eventuell mit Lüfter. Und was noch schlimemr ist: viele Wasserkühler halten kaum über die Garantie und werden undicht, und außerdem sitzen auch sonst noch ein Haufen Komponenten am Mainboard, die ein Minimum an Kühlung brauchen (die Festplatten, das Netzteil, die Southbridge und die Spannungsregler), also gehts ohne einen Gehäuseventilator wahrscheinlich sowieso nicht.

Gruß Ralf

…Armin