Computeraußen-Flausen //1856

Manchmal kommt alles zusammen. Als ob ich momentan nicht schon genug am Hals hätte.
Jetzt spinnt auch noch mein Server rum!

Es hatte relativ harmlos vor etwa einer Woche damit angefangen, dass sich bestimmte Anwendungen nicht mehr starten ließen, oder sich eigenmächtig beendeten. Schließlich wurde ich auch ein paar mal automatisch ausgeloggt. Anfangs dachte ich noch, ich hätte mich vielleicht selbst versehentlich verklickt.
Später gab es noch mehr Merkwürdigkeiten, z.B. dass die Captionleisten zeitweise durchsichtig waren, die Fenster abgeschnitten, oder der Explorer plötzlich verschwunden.

Natürlich prüfte ich gleich nach, ob genügend Plattenplatz und Arbeitsspeicher verfügbar sind. Da dürfte reichlich vorhanden sein.
Im Taskmanager fand ich keine auffälligen Prozesse, und auch im Eventviewer sah ich nichts, was mir weiterhelfen würde.
Es deutet nichts auf Hardwareprobleme hin.

Ein neueres Anwendungsupdate hatte ich im Verdacht, so dass ich es deinstallierte. Zunächst schien der Server wieder stabil zu laufen, aber dann traten die Seltsamkeiten doch wieder auf.
Dass ich den Server bereits mehrmals booten ließ, brauche ich wohl nicht ausdrücklich zu erwähnen.

Ich kann den Server pingen, und ganz normal auf seine Shares zugreifen. Die von mir eingerichteten Dienste scheinen sich problemlos von außen ansprechen zu lassen.
Was inzwischen kaum noch geht, ist, sich von remote über den Terminal Client einzuloggen (manchmal kommt ein protocol error 0x112f, meistens aber gar keine Meldung – der Client versucht nur mehr oder weniger lang, eine Verbindung aufzubauen, bevor er abbricht).
Das heißt, dass ich extra runter in den Serverraum muss, wenn ich etwas an ihm machen will. Dazu habe ich aktuell eigentlich nun wirklich keine Zeit.

Selbstverständlich habe ich schon ziemlich am Anfang versucht, den Virenscanner drüberlaufen zu lassen. Nachdem er dreieinhalb Stunden ergebnislos rumgerödelt war, brach er mit einer Fehlermeldung ab. Noch bevor ich mir die Sache näher ansehen konnte, war ich ausgeloggt.
Beim nächsten Versuch, bei dem ich den Resourcenverbrauch besser im Auge behalten wollte, war der Bildschirm plötzlich schwarz (Mouse war aber weiterhin bedienbar) und blieb es auch, bis ich dem Server faktisch den Strom abschaltete.

Die Absicht, ein Live-System mit Diagnosetools aufzuspielen, scheiterte bisher an fehlender Zeit.

Wenn ich die Sache nicht selbst hinkriege, wird mir wohl nichts anderes übrigbleiben, als einen der IT-ler zu bitten, sich den Server mal anzusehen.
Im Worst Case läuft es auf eine Neuinstallation raus.

Über Anne Nühm (breakpoint)

Die Programmierschlampe.
Dieser Beitrag wurde unter Uncategorized abgelegt und mit , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

26 Antworten zu Computeraußen-Flausen //1856

  1. Leser schreibt:

    Also für mich klingt das so, wie ich Windows immer in Erinnerung habe, ganz normales Verhalten also 😉
    Nein, im Ernst: Weil das Ding im Serverraum steht, dürfte Verstaubung und dadurch überhitzte Systemtemperaturen als Ursache sehr unwahrscheinlich bis auszuschließen sein – der sitzt dann vermutlich in einem ordentlich klimatisierten Rack und ist daher für sowas nicht anfällig.
    Dann würde mir als nächstes einfallen, mal die SMART Werte der Platte anzuschauen, was die so von sich geben – der freie Platz ist beim Festplattentod irrelevant. Ebenso würde ich den RAM mal übers Wochenende (oder zumindest mal eine Nacht durch oder so) mit nem memtest86 testen, um zu sehen, was der sagt.
    Denn so unvorhersehbares Verhalten, wenn nicht dadurch verursacht, dass die Maschine selbst ein Ehrgefühl entwickelt hat, und sich fortan elementarste Sinnfragen stellt, weil sie als Server mit einem Windows-Betruebssystem betrieben wird, deutet trotzdem auf ein Hardwareproblem hin. Erst recht, wenn es unter keinen Umständen reproduzierbar ist.

    Like

    • Ich glaube nicht, dass es an den Platten oder dem RAM liegt. Trotzdem kann ein Test ja nicht schaden.

      Teilweise ist das Verhalten durchaus reproduzierbar. Da ich allerdings aktuell wirklich nicht den Nerv habe, mich da rein zu hängen, habe ich die Zeit noch nicht investiert, das im Detail rauszufinden.

      Like

  2. Plietsche Jung schreibt:

    Boote mal ein Live Linux von der CD und lass einen Virenscanner drüberlaufen. Dann weißt du zumindest, ob die HW in Ordnung ist.

    Ansonsten:

    Like

  3. ednong schreibt:

    Hm,
    wenn das immer erst nach einer Weile auftritt unabhängig von dem was du tust, dann würde ich auf ein Temperaturproblem tippen. Vielleicht hat das Mainboard Risse? Oder auch Speicherfehler.

    Like

    • Leser schreibt:

      Wenn es sich um einen „richtigen“ Server-Computer handelt, der in einem 19″ Rack steckt, dann ist ein Temperaturproblem ziemlich unwahrscheinlich. Die Dinger haben idR 4 bis 8 richtig kräftige (und laute!) Lüfter drin, die alle heiße Luft nach hinten rausblasen. Wenn sich so einer überhitzt, gibt er vorher ne Warnmeldung raus, dass 1, 2, x Lüfter ausgefallen sind. Alternativ wäre es ein Temperaturproblem, was dann aber das gesamte Rack betrifft, d.h. die Server darüber und darunter ebenfalls – zumindest, wenn diese auch schwer arbeiten. Ich glaube irgendwie nicht, dass Anne’s Server der einzige in dem Rack ist, der mal etwas ins Schwitzen kommt, weil alle CPUs mit irgend einer Rechenaufgabe (z.B. kompilieren) beschäftigt sind 😉
      Ebenso sind bei solcher Profi-Hardware Risse im Mainboard sehr unwahrscheinlich. Klar, ein Board kann mal sterben, aber das ist vielleicht eins von 1000, also da müsste sie schon sehr viel Pech haben. Die Dinger sind ja genau so gebaut, dass der ganze Mist, der bei PCs (erst recht bei Consumer-Kram) eintritt, eben gerade nicht passiert. Dazu gehört meines Wissens auch, dass das Mainboard im Gehäuse des Servers so montiert (und designt) ist, dass es sich (in einem vorher berechneten Maß) ausdehnen und wieder zusammen ziehen kann, und das Maß ist so berechnet, dass es gar nicht wärmer werden kann, als diese Toleranz…nicht umsonst sind diese Server ziemlich teuer!

      Gefällt 1 Person

    • Damit ist alles in Ordnung.

      Vielleicht ist das Problem sogar inzwischen gelöst.
      Am Freitag hatte ich noch den MySQL-Service (hatte ich mal zum rumprobieren installiert, aber nie genutzt) ausgeschaltet.
      Seither kann ich mich wieder promblemlos verbinden, und der Server scheint normal zu laufen (bis auf die Änderungen, die ich gemacht hatte).
      Ich warte noch ein wenig ab, schalte nächste Woche MySQL testhalber wieder ein, und wenn sich meine Vermutung bestätigt, wird MySQL deinstalliert.
      Das war anscheinend irgendein Resourcenkonflikt. Keine Ahnung, warum er erst jetzt auftrat, aber möglicherweise hat irgendein Update ihn aktiviert.

      Like

  4. Pingback: Registriert am falschen Ort //1882 | breakpoint

  5. Pingback: Getwitter im Mai //2046 | breakpoint

Hinterlasse einen Kommentar