PlusWell Cluster
容
錯(cuò)
軟
件
技
術(shù)
白
皮
書
北京天行健達(dá)信息技術(shù)有限公司
2005年3月
一、 PlusWell Cluster容錯(cuò)軟件技術(shù)簡(jiǎn)介及其應(yīng)用 (支持共享磁盤陣列方式)
(一) PlusWell Cluster Cluster容錯(cuò)軟件原理
1、 PlusWell Cluster Cluster容錯(cuò)軟件定義、特性、資源保護(hù)
PlusWell Cluster Cluster 容錯(cuò)軟件提供了一個(gè)完全容錯(cuò)的軟件解決方案,并提供數(shù)據(jù)、應(yīng)用程序和通信資源的高度可用性。PlusWell Cluster容錯(cuò)軟件不需要任何特別的容錯(cuò)硬件,并訪問特定節(jié)點(diǎn)的配置數(shù)據(jù)。PlusWell Cluster容錯(cuò)軟件會(huì)自動(dòng)地提供錯(cuò)誤檢測(cè)和現(xiàn)場(chǎng)恢復(fù)。
在出現(xiàn)故障的情況下,PlusWell Cluster容錯(cuò)軟件會(huì)將保護(hù)資源自動(dòng)轉(zhuǎn)換到一個(gè)根據(jù)預(yù)先設(shè)定好優(yōu)先權(quán)的系統(tǒng)。在實(shí)際進(jìn)行切換用戶時(shí), 會(huì)經(jīng)歷一個(gè)十分短暫的休眠,但是,當(dāng)系統(tǒng)完成了切換操作后,PlusWell Cluster容錯(cuò)軟件會(huì)在所選擇的節(jié)點(diǎn)上自動(dòng)地恢復(fù)操作。
可以被PlusWell Cluster容錯(cuò)軟件保護(hù)起來的資源是:
卷(Volume)
IP 地址
共享文件
管理器服務(wù)器名稱
應(yīng)用程序
定義的用戶
2、心跳故障檢測(cè)Heartbeat
PlusWell Cluster容錯(cuò)軟件在集群節(jié)點(diǎn)間保持著間歇的通信信號(hào),也叫做心跳信號(hào),是錯(cuò)誤檢測(cè)的一個(gè)機(jī)制。即通過每一個(gè)通信路徑,在兩個(gè)對(duì)等系統(tǒng)之間進(jìn)行周期性的握手,如果連續(xù)沒有收到的心跳信號(hào)到了一定的數(shù)目,PlusWell Cluster 容錯(cuò)軟件就把這條路徑標(biāo)示為失效(紅色)。
如果你只定義了一條通信路徑,當(dāng)PlusWell Cluster 容錯(cuò)軟件把這唯一的一條通信路徑標(biāo)為失效時(shí), PlusWell Cluster容錯(cuò)軟件便立即開始恢復(fù)過程。然而,如果你有冗余路徑, PlusWell Cluster容錯(cuò)軟件能夠通過第二條路徑確定是系統(tǒng)故障還是只是通信路徑有問題。如果PlusWell Cluster 容錯(cuò)軟件開啟優(yōu)先級(jí)第二的通信路徑并收到了心跳信號(hào),它就不開始failover恢復(fù),只需要把第一條通信路徑標(biāo)成紅色(失效),作為信號(hào)告訴你需要修復(fù)有故障的路徑。
一般情況下PlusWell Cluster容錯(cuò)軟件 只在下列事件發(fā)生時(shí),啟動(dòng)系統(tǒng)恢復(fù)功能:
所有的通信路徑故障。如果所有節(jié)點(diǎn)都沒能收到心跳信號(hào), 把所有通信路徑都標(biāo)為失效, PlusWell Cluster 容錯(cuò)軟件開始安全檢查。
安全檢查失敗。當(dāng)所有通信路徑故障時(shí),PlusWell Cluster容錯(cuò)軟件向整個(gè)網(wǎng)絡(luò)發(fā)出安全檢查信號(hào)。如果信號(hào)指出配對(duì)系統(tǒng)還“活”著的時(shí)候,PlusWell Cluster容錯(cuò)軟件不啟動(dòng)Failover。如果安全檢查沒從配對(duì)節(jié)點(diǎn)返回信號(hào),PlusWell Cluster容錯(cuò)軟件就開始Failover。
因而,為了減少由于潛在的通訊錯(cuò)誤所引起的不必要的系統(tǒng)切換,建議您使用不同介質(zhì)的多條通信路徑。
3、 通信路徑
PlusWell Cluster容錯(cuò)軟件支持在節(jié)點(diǎn)之間和心跳通訊中,使用如下通訊路徑:
(1) socket,即套接字。你使用任何的網(wǎng)絡(luò)硬件接口,只要它能夠支持TCP/IP的通訊協(xié)議。這樣的硬件包括:以太網(wǎng)、快速以網(wǎng)。
(2)串行口 在PlusWell Cluster容錯(cuò)軟件配置中, 你應(yīng)當(dāng)配置有一個(gè)串行口通信路徑。串口通信路徑需要利用RS232的擬調(diào)解線路來與PlusWell Cluster容錯(cuò)軟件系統(tǒng)相連接。
PlusWell Cluster 容錯(cuò)軟件假定當(dāng)通過心跳信號(hào)檢測(cè)其它服務(wù)器失敗時(shí),則認(rèn)為此服務(wù)器是關(guān)閉的。因此,為了避免不必要的失效切換,最好建立兩種以上獨(dú)立的物理路
|
|