RAID5+1的原理、架構、運作

目錄

RAID 5 (R5) 教學

RAID5 (R5) – 這是企業界最常見的架構,最少需 3台硬碟 or SSD。
其架構是 1TB + 1TB + 1TB = 2TB ( 虛擬儲存容量)。其儲存原理是當一隻檔案要寫入時,先分成數百數千個段 Block,同步分散寫入各硬碟內,您有發現 3台 1TB硬碟不是應該 = 3TB 的 RAID 嗎?為什麼只有 2TB? 另 1TB呢?事實上 RAID5 對每一台硬碟的規劃是 2/3 容量用來儲存資料,1/3 容量用來儲存『同步運算用 Blocks』後面會說明。

RAID5 其風險係數是 1/3,當故障任何一台 1TB硬碟時,RAID5 容量還是 = 2TB,這功能稱為『容錯』。但是故障 2台硬碟後就 ≠ 2TB。RAID5 最怕同時故障 2台硬碟,但同時故障 2台硬碟的機率高嗎?『高』…..
如何降低 RAID5 同時故障2台硬碟風險?建議可改用 RAID5=Spare 架構,如下說明。

RAID5 比起 RAID0 ,1, 10..是較可靠,風險低的架構。
優點:儲存容量高。
風險:低。容許任何一台硬碟故障,任何一台硬碟故障時,總容量還是 = 2TB,RAID5 還是可正常讀寫。

RAID 5 教學
RAID 5 正常時的架構
RAID 5 原理
RAID 5 故障 1台硬碟時的架構
RAID 5 故障2台硬碟時
RAID 5 故障2台硬碟時的架構

R5+1 (RAID5 + Spare) 是什麼?RAID 5重建?

R5+1 (RAID5 + Spare)最後一台空白硬碟當自動 Rebuild時用 – 這是最常見的架構,最少需 4台硬碟 or SSD。
其架構是 1TB + 1TB + 1TB + 1TB = 2TB ( 虛擬儲存容量)。其儲存原理是當一隻檔案要寫入時,先分成數百數千個段 Block,同步分散寫入其中3台硬碟內,您有發現 4台 1TB硬碟不是應該 = 4TB 的RAID 嗎?為什麼只有 2TB? 另 2TB呢?事實上 RAID5+Spare 的架構是先將其中 3台硬碟 Create RAID5後,最後一台空白硬碟是當未來『自動 Rebuild 時用』這台 Spare 是空白硬碟並無資料。這種機制的好處是,萬一有任何一台硬碟故障時,因 RAID 已安裝一台空白硬碟備用,可以立刻自動 Rebuild,不必再等找到空白硬碟時才 Rebuild,降低等待時又突然故障第 2台硬碟的風險。

RAID5 + Spare 其風險係數是 1/3,當故障任何一台 1TB硬碟時,RAID5 還是 = 2TB,這稱為『容錯』。但是仿間宣稱可以容許故障 2台硬碟並不正確,正確說法應是,當一台硬碟故障時,因為 RAID5 還是 = 2TB 資料還是可正常讀寫,這時 RAID5 會自動 Rebuild 至最後一台空白硬碟,但一定需 Rebuild 100% 完成,Rebuild 完成後即恢復成 RAID5 完整架構,又可容許故障一台。接下來記得趕快找一台空白硬碟更換已故障硬碟當 Spare。因
如再故障第 2台硬碟時,RAID5 就只剩 1TB,並不 ≠ 2TB,RAID5 就已毀損。


優點:儲存容量高。容許故障任何一台硬碟。
風險:低。任何一台硬碟故障時總容量還是 = 2TB。

RAID5+Spare 正常時架構
RAID5+Spare 正常時的架構
RAID5+spare 故障一台硬碟時架構
RAID5+spare 故障 1台硬碟時的架構
RAID5 重建
RAID5+Spare Rebuild 的架構

RAID 5 (R5) 故障2台硬碟?

RAID5 (R5) 同時故障 2台硬碟機率高嗎?本公司搶救 RAID5 已近 30年,幾乎每一組 RAID5 都是因同時故障 2台硬碟而來搶救資料。本公司有一理論,常對外宣導:

  • RAID5 新購時內部硬碟習慣安裝相同廠牌,型號,幾乎是相同一批貨。待過生產線的工程師都知道,有問題時同一批貨都有相同問題。
  • RAID5 幾乎是 24h 不關機,不可 off line,內部硬碟操的很兇,耗損當然很兇,一般 PC 還會每天關機休息,理論上 RAID 硬碟比一般 PC 硬碟更易故障。
  • 因為 RAID 硬碟都是同一機種,等於品質都相同。又都是同時使用,同時運轉,耗損當然也相同。

基於上述原因,RAID5『同時故障 2台硬碟』機率高嗎?高……….. RAID資料救援並非 100% 都可救出資料。

為了降低『同時故障 2台硬碟』風險,是否可安裝『不同機種』硬碟?當然可以。請繼續往下…..

RAID5 (R5) 硬碟每台都一定要用相同機種嗎?

RAID 內每台硬碟一定都需相同機種嗎?
這是已爭論多年的老問題,本公司是提出『不必相同機種的』一派。但只限 Hardware Controller Array,非 NAS 用的 Software Controller Array。

  • RAID 原廠設計時,就是要讓 RAID 可以 24h 運轉,耐操,品質要求非常高。如 RAID 已使用了 3年,當發生一台硬碟故障時,試問去哪裡找 3年前相同機種硬碟?
  • 萬一找不到相同機種硬碟呢?難道 RAID 就報廢嗎?
  • 就算真的辛苦找到相同硬碟,但已是 3年前生產的硬碟,還敢用嗎?還可撐多久呢?

基於上述問題,Disk Array 原廠絕不『設死』。
磁碟陣列只認硬碟的 SATA or SAS 。甚至不同容量都可用。舉例:3年前硬碟只有 1TB,3年後 1TB 早已淘汰,市面上都是 3TB,這時拿 3TB 插上還是可用,只是被當成 1TB 用。

新舊不同硬碟的讀寫速度不同,會不會不穩定?不必擔心,每台硬碟都有 Cache ,而 Array Controller Card 所有的 SAS Channel 會控制資料同步讀寫。但 NAS 是 Software Controller Array 基本上無此功能,除非多下成本,例如:在 SATA controller 上擴充 Cache…..但效能穩定度絕無法和 Hardware controller Array 相比。這就是『重機』和『小綿羊』的差別。這也是為何 NAS 較挑『硬碟』,而傳統的 Sever Disk Array 不挑硬碟的其中一個原因。

RAID 5 原理進階篇

More……

回到頂端