Hi …
Moin zusammen,
Habe hier einen Kunden der zwischen 11:00 und 11:30 kurze
Serverausfälle bekommt.
Zuallererst ein Tipp: stelle ABSOLUT sicher, dass die Uhrzeit tatsächlich einen Einfluss hat. Die meisten EDV Ausfälle kennen keine Uhr, und treten daher rund um die Uhr auf. Wenn Du Dich auf eine Uhrzeit festlegen kannst, und wenn das tatsächlich Fakt ist und nicht Traumvorstellung, ist das ein wichtiger Hinweis, wahrscheinlich sogar der Einzige Hinweis. Wäre blöd, wenn der auf Grund einer Falschbeobachtung irreführend wäre.
Die einzelnen Clienten unter dem Server verlieren die
Verbindung ebenso.
- von 11:00 PING durchlaufen lassen, und da gibts zu einiger
Zeit einge längere PING zeiten (höchste 178ms), ist da
eventuell etwas Faul?
Möglicherweise. Im LAN läuft ein PING gerade mal einige Millisekunden. 178 ms sind im LAN eine Ewigkeit, und können daher durchaus ein Problemindiz sein. Beachte aber als Erstes, dass PING kein LAN Diagnose Tool ist, es sendet in der Standardeinstellung mickrige 34 Bytes, und das nur halbduplex. Die Aussage von PING ist also nicht viel mehr als ein Test ob alle Stecker drinnen sind und ob man seine IP Hausaufgaben gemacht hat.
Und jetzt zum Problem. Leider ist das was Du bisher herausgefunden hast sehr vage. Nehmen wir an, die 11:00 - 11:30 sind Fakt. Dann liegt es natürlich nahe, nach einem Umwelteinfluss zu fahnden, der dann auftritt. Eine schwere Maschine z.B., die dann anläuft, und deren Störungen auf Grund schlecht gemachter Verkabelung bis ins LAN einstreuen. Wäre denkbar. Oder nach einer Ursache die zwischen 11 und 11:30 den Netzwerkverkehr drastisch erhöht. Ein automatisiertes Backup z.B. oder ein User, der just immer dann eine Vollkopie seines IPad ins Netz schieben zu müssen meint. Wenn ein LAN unter Druck gerät, neigt en die Komponenten eher zu Fehlern als wie wenn es im Leerlauf vor sich hin gammelt.
Wenn Du einen Zusammenhang mit Last vermutest, würdest Du die Gegenprobe machen und zu einer anderen Zeit künstlich Last generieren (z.B. mit IPerf). Tritt das Problem dann auch auf?
Beide Ursachen (Last oder Störungen) spürt man gewöhnlich durch Diagnose an den zentralen Switches auf. Störungen lassen die Fehlerzähler an den betroffenen Ports in die Höhe schießen, hohe Last erkennt man an den Paketzählern der Ports.
Blöd wenn mal wieder ein Sparefroh an der Arbeit war, der einen passiven (nicht managementfähigen) Switch verbaut hat. In so einem Fall würde ich als allererstes eine managementfähige Komponente einbauen, zumindest da wo der Datenverkehr zusammenläuft, alles andere ist Gestocher im Dunkeln, und kostet mehr Zeit als ein neuer Switch in der Anschaffung kostet. Teuflisch sind die beliebten kleinen Switchlein die man so mal einfach schnell irgendwo unter den Tisch schmeisst, wenn einem die LAN Anschlüsse ausgehen. Sie können ganz schwer lokalisierbare Störungen verursachen, und haben deshalb meiner Meinung nach in einem richtig gemanagten Netz nichts verloren.
Also Switch Management Software befragen, was wann wo los ist. Und dann bringst Du die Diagnosewerte der Switches zusammen mit den beobachteten Ausfällen. Und dann siehst Du eventuell etwas klarer in welche Richtung Du forschen musst. Eventuell outet sich ein Port als auffälliger Verursacher von Störungen oder Traffic.
Gruss Armin.