Diagnose / Beweislast

Moin,

Wie würdet ihr in einem solchen Fall vorgehen:

Ein Kunde erneuert seine komplette EDV. Unter anderem neue Ethernet-Switches von Hersteller A, sowie neue Endgeräte (mit Onboard-LAN-Adapter) vom Hersteller B. Alles namhafte Hersteller der Oberklasse.

Im laufenden Betrieb stellt sich heraus, dass die neuen Endgeräte immer wieder Dropouts haben, die Reconnects verursachen. Andere Endgeräte laufen dagegen an den Switches einwandfrei. Auch laufen die neuen Endgeräte mit anderen Switches einwandfrei. Externe Störquellen und Einflüsse der passiven Konponenten werden durch umfangreiche Tests ausgeschlossen.

Hersteller A prüft seine Geräte, kontrolliert alle Einstellungen der Switches, spielt die neueste Firmware auf und kommt zum Ergebnis, dass seine Geräte in Ordnung sind und er nichts mehr machen könne, weil ja seine Switches mit anderen Endgeräten einwandfrei zusammenarbeiten!

Hersteller B prüft seine Geräte, kontrolliert alle Einstellungen der Adapter, aktualisiert Firmware / Bios / Treiber und kommt zu dem Ergebnis, dass seine Geräte in Ordnung sind und er nichts mehr machen könne, weil ja seine Geräte mit anderen Switches einwandfrei zusammenarbeiten!

Der Kunde sitzt mit zwei einwandfreien Komponenten da, die aber nicht funktionieren.

Was kann er tun (ausser sich zu erschiessen)?
Gäbe es z.B. irgendwelche Firmen, die man mit einem Gutachten betrauen könnte? Weil: irgendeiner der beiden Hersteller muss ja wohl vom Ethernet-Regelwerk/-Normen abgewichen sein, oder?

Gruß
Stefan

Was kann er tun (ausser sich zu erschiessen)?
Gäbe es z.B. irgendwelche Firmen, die man mit einem Gutachten
betrauen könnte? Weil: irgendeiner der beiden Hersteller muss
ja wohl vom Ethernet-Regelwerk/-Normen abgewichen sein, oder?

Muss er nicht; HP hat an einigen Procurve-Switches der 4000er und 8000er Serie erst vor ca. 18 Monaten einige ähnliche Probleme mit Intel-Karten mit einer neuen Firmware aus der Welt geschafft. HP ist da aber sehr offen und hat das in den Relase-Notes auch erwähnt.

Ist die Hardware denn direkt beim Hersteller gekauft worden? Meistens läuft sowas doch über Partner und Distributoren. Hier würde ich das Geraffel einfach an den Lieferanten abgeben, meine Unzufriedenheit äußern.

Ansonsten würde ich, wenn es eng wird, vielleicht eine dritte Firma hinzuziehen, wie z.B. Fluke, die das ganze dann messen können.

Gruß,
Ecki

Hallo Stefan,

Was kann er tun (ausser sich zu erschiessen)?
Gäbe es z.B. irgendwelche Firmen, die man mit einem Gutachten
betrauen könnte? Weil: irgendeiner der beiden Hersteller muss
ja wohl vom Ethernet-Regelwerk/-Normen abgewichen sein, oder?

Eigentlich kann man nur herausfinden was schief geht, wenn man die Kombination aus A und B testet. Danach muss man dann analysieren WAS, WIE schief geht. Danach kann man dann auch aussagen wer die Norm nicht ganz einhält.

Manchmal gibt es auch den umgekehrten Fall:
So vor 15 Jahren hatt ich mal Probleme mit Modems eines bekannten Herstellers. Das besagte Modem funktionierte mit allen Modems als Gegenstation, ausser mit einem des gleichen Typs.

MfG Peter(TOO)

Moin,

wie immer es kommt darauf an. :smile:

Bei deinem Problem kann es sein das ein Hersteller sich nicht an die Norm hält. Es kann aber auch sein das sich beide nicht daran halten bzw. Sie sich innerhalb der Norm bewegen (der eine Rechts, der andere Links).

Wenn du es einfach haben möchtest, dann tausche einen der Hersteller einfach aus. (Manchmal holen einen solche Fehler aber wieder ein).

Ansonsten kommst du evtl. mit einer Testumgebung weiter. Versuche den Fehler zu reproduzieren ggf. auch in der produktiven Umgebung. Sobald du dazu in der Lage bist, kannst du dich mit gezielten Veränderung am Setup, dem Fehler annähern.

Manchmal sind es ganz triviale Dinge, warum etwas nicht funktioniert.

Leider kann ich dir aus der Ferne nicht weiterhelfen.
Ich muß selber an einem Fall dran sein.

Ich fahre immer gut damit, das ich Vermutungen aufstelle und diese fals.- bzw. verifiziere. Mögen die Vermutungen auch noch so unwahrscheinlich sein und auf den ersten Blick sogar total doof. Viele die mich nicht besser kennen, denken bestimmt oft „der Kerl hat keine Ahnung“.
Mittlerweile stehe ich über diesen Dingen, da mir der Erfolg meines Vorgehens oft Recht gibt.

Letztendlich ist es wie Puzzel zusammen zufügen. Irgendwann im laufe der Tests findest du die Puzzelteile und irgendwann fügen sich die Teile zu einem Bild zusammen.

polarix

Moin,

Muss er nicht; HP hat an einigen Procurve-Switches der 4000er
und 8000er Serie erst vor ca. 18 Monaten einige ähnliche
Probleme mit Intel-Karten mit einer neuen Firmware aus der
Welt geschafft. HP ist da aber sehr offen und hat das in den
Relase-Notes auch erwähnt.

Dumm nur, dass „Hersteller A“ nicht HP ist, sondern Enterasys. Nebenbei: mit HP läuft es…

Ist die Hardware denn direkt beim Hersteller gekauft worden?
Meistens läuft sowas doch über Partner und Distributoren. Hier
würde ich das Geraffel einfach an den Lieferanten abgeben,
meine Unzufriedenheit äußern.

Naja, einfach abgeben? Da muss man schon mit mehr kommen, eben einem juristisch haltbaren Beweis, dass die Komponente nicht der Norm oder nicht der Beschreibung entspricht.

Ansonsten würde ich, wenn es eng wird, vielleicht eine dritte
Firma hinzuziehen, wie z.B. Fluke, die das ganze dann messen
können.

Sowas macht Fluke? Sehr interessant! Danke für den Tipp, da werden wir die wohl mal kontaktieren.

Gruß
Stefan

Moin,

Eigentlich kann man nur herausfinden was schief geht, wenn man
die Kombination aus A und B testet. Danach muss man dann
analysieren WAS, WIE schief geht.

Mit den üblichen Mitteln (Sniffer) haben wir getestet. Ergebnis: die LAN-Karten der Endgeräte reagieren einfach für ein paar Sekunden nicht mehr. Es geht weder was rein noch raus. Dann legen sie wieder los, als wäre nicht gewesen.

Danach kann man dann auch
aussagen wer die Norm nicht ganz einhält.

Und genau dafür brauchen wir eine Firma, deren Möglichkeiten über eine reine Layer

Moin,

Bei deinem Problem kann es sein das ein Hersteller sich nicht
an die Norm hält. Es kann aber auch sein das sich beide nicht
daran halten bzw. Sie sich innerhalb der Norm bewegen (der
eine Rechts, der andere Links).

Das ist meine Befürchtung - oder soll ich sagen „Albtraum“?

Wenn du es einfach haben möchtest, dann tausche einen der
Hersteller einfach aus. (Manchmal holen einen solche Fehler
aber wieder ein).

Wir reden hier von 6-stelligen Materialkosten bei den Switches und 4-stelligen Endgerätezahlen. Selbst wenn einer der Lieferanten so kulant sein sollte und sein Geraffel zurück zu nehmen: allein der Rollback und neue Rollout würde Mannjahre verschlingen!

Ansonsten kommst du evtl. mit einer Testumgebung weiter.
Versuche den Fehler zu reproduzieren ggf. auch in der
produktiven Umgebung. Sobald du dazu in der Lage bist, kannst
du dich mit gezielten Veränderung am Setup, dem Fehler
annähern.

Das haben wir bis zur Vergasung bzw. Amoklauf der Tester gemacht. So ziemlich alles, was konfigurierbar ist, wurde permutativ konfiguriert. Das einzige, was wir noch nicht gemacht haben ist, mit Lendenschurz, Holzmaske vor dem Gesicht und einer Rassel in der Hand um die Geräte zu hopsen.

Manchmal sind es ganz triviale Dinge, warum etwas nicht
funktioniert.

Das kann zwar sein (…und nichts würde mich mehr freuen), ist aber unwahrscheinlich. Wir sind hier selber nicht schlecht in sowas und der Switchhersteller hatte sogar einen seiner Gurus aus dem Ausland einfliegen lassen - einen von den Typen, die man normalerweise tunlichst vor seinen Kunden versteckt…

Das Problem ist halt, das nur in der Kombination von A und B dieser spezielle Fehler auftritt. Tauscht man eine der beiden Komponenten aus, läuft’s wie Lottchen…

Das ist so, als würde ein Neuwagen mit dem Benzin von Tankstelle A nur noch 50 km/h laufen, mit dem Sprit jeder anderen Tanke aber 250 km/h. Gleichzeit würde aber jedes andere Auto mit dem Stoff von A volle Leistung bringen.

Ich befürchte, dass das Problem in Kürze die technische Ebene verlassen und auf die juristische Ebene kommen wird. Es geht halt um sehr viel Geld…

Gruß
Stefan

Hallo Stefan,

Mit den üblichen Mitteln (Sniffer) haben wir getestet.
Ergebnis: die LAN-Karten der Endgeräte reagieren einfach für
ein paar Sekunden nicht mehr. Es geht weder was rein noch
raus. Dann legen sie wieder los, als wäre nicht gewesen.

Sieht ja fast au wie wenn da ein Error-Recovery auf der Netzwerkkarte gemacht wird, mit einem entsprechend langen Timeout.
eigt der Treiber der entsprechenden Karte irgendwelche gestörten Pakete an oder macht der sogar einen Reset (dann müssten alle übertragenen Pakete wieder auf 0 stehen) ?

Danach kann man dann auch
aussagen wer die Norm nicht ganz einhält.

Und genau dafür brauchen wir eine Firma, deren Möglichkeiten
über eine reine Layer