Zitat:
Zitat von Alex82 Hallo zusammen,
ich plage mich schon seid mehreren Wochen mit einem Problem in Punkto "Serverausfallsicherheit" herum.
Das Problem, welches ich habe ist Folgendes:
Jedesmal, wenn ich den sekundären Knoten meines Highavibility Clusters manuell abschiess, also beende, werden die Dienste bzw. Prozesse auf dem primären Knoten beendet.
Dies sollte jedoch nicht der Fall sein, da Heartbeat ja nur einen Failover mit anschließender Prozessübernahme einleiten soll, wenn der primäre Knoten nicht mehr verfügbar ist.
Es kommt dann auch noch hinzu, dass er die Prozesse auch nicht startet, wenn der sekundäre Knoten wieder verfügbar ist und damit auch wieder ein Heartbeat ausgetauscht wird.
Die "normalen" Failover Tests funktionieren ohne Probleme, nur dieser eben nicht.
Weiss jemand von euch vielleicht Rat?!
Würe mich sehr darüber freuen.
Bin am Verzweifeln!!!!!
Grüße Alex82 |
Bei Linux HA gibt es (nach eigener Erfahrung) folgende Dinge zu beachten:
1.) beide Nodes müssen identisch konfiguriert sein, d.h wenn z.B. ein Web Failover (Apache) machen möchtest, dann muss der Apache Daemon auf beiden Maschinen vorhanden und gleich konfiguriert sein.. sonst geht der Failover nicht, d.h. Heartbeat würde dann zwar die Ressourcenumleitung machen, jedoch scheitert dann das Failover z.B. daran, dass der Apache auf dem 2. Server aus irgendwelchen Gründen nicht startet etc...
2.) auf beiden Nodes müssen die Heartbeat Files (speziell die ha.cnf) in der gleichen Version installiert sein, sonst geht es ebenfalls nicht mit HA
3.) die erwähnte Konfigdatei muss bei beiden Maschinen identisch konfiguriert sein (am besten auf dem einen Server konfigurieren und dann auf den Slave rüberkopieren
4.) die beiden Maschinen (eigentlich logisch oder?) entweder per seriellem oder besser per Ethernet (am besten mit 2.ter Netzwerkkarte und separatem RJ45 Kabel) verbunden sein und sinnvollerweise quasi im eigenen Range arbeiten, z.B. 10.10.x.x
dann sollte es eigentlich so funktionieren...
ansonsten hilft auch die sehr gute Doku auf
LearningAboutHeartbeat: Linux HA
Zur Zeit ist mein Cluster aber offline, da ich gerade daran bin, diesen mit neuer HW zu bestücken.. von daher funktioniert der eine Server (Master) momentan als Standalone Lösung aber sobald dieser wieder online ist, werde ich gerne nochmals schauen.. ok?