vSphere VCSA – 6.7.0.42000 – Kein vMotion und erstellen von VMs möglich

Einige Zeit nach dem letzten Update der VCSA war es nicht mehr möglich eine VM anzulegen oder ein vMotion durchzuführen. Der Fehler kam plötzlich und ohne Meldungen im vCenter auf. Das betroffene vCenter verfügte über kein DRS und somit ist der Fehler längere Zeit nicht aufgefallen, auch da selten VMs angelegt werden.

Da mir der Fehler auch noch nie untergekommen ist hab ich einfach mal die Suchmachine angeworfen und bin auf einen Workaround gestoßen der sich auf den Profile-Driven Storage-Dienst bezieht.


https://kb.vmware.com/s/article/2118551

WICHTIG: MACHT EINEN SNAPSHOT DER VCSA-VM BEVOR IHR HIER WEITER MACHEN SOLLTET

https://blog.jamesblakeley.ca/wp-content/uploads/2015/09/PBM-Error.png
Ein allgemeiner Systemfehler ist aufgetreten: PBM error occurred during PreCreateCheckCallback: Connection refused: The remote service is not running, OR is overloaded, OR a firewall is rejecting connections.

In diesem Fall scheint der Profile-Driven Storage Service das Problem zu veruhrsachen.
Ich frage mich nur was der Dienst damit zu tun hat, schließlich nutzt die VCSA kein PDS…dazu später mehr

Der SPS-Service kann einfach über die Shell der VCSA neugestartet werden.
Dazu SSH auf die VCSA und geprüft ob der Dienst läuft:

Wie man sehen ann läuft dieser nicht. (Achtet auf das “Loaded: masked”)

Nun versuchte ich den Dienst neuzustarten:

Das sieht blöd aus, es hätte so einfach sein können. :/
Aber ist logisch, da der Dienst “masked” ist, also nicht nur disabled sondern quasi hard-disabled um ihn vor einem versehntlichen manuellen Start zu schützen.

Also nochmal alles auf Anfang, das Problem scheint vielleicht doch wo anderes zu liegen.
Ich erinnere mich noch daran das ein “df -h” meist die Ursache der Probleme offentlegt, nämlich dann wenn auf den Disks der VCSA der Platz knapp wird.

Wie man sieht ist /storage/archive zu 100% voll, dies könnte eine Ursache sein doch ist leider in der Regel nicht da diese per Design “volllaufen” kann und sich selbst aufräumt.

Also einfach mal versuchen alle Dienste anzustarten, den hier würden wir sehen wenn ein Dienststart fehlschlägt:

Keine Fehler 🙂

Also ab ins vCenter und getestet -> LÄUFT WIEDER 🙂
VMs können erstellt und verschoben werden.

Dann im nächsten verfügbaren Wartungsfenster die VCSA neustarten und prüfen ob der Zustand so bleibt oder wieder Probleme auftreten.

Fazit:
Der Befehl service-control –start –all hat das Problem vorerst behoben.