本帖最後由 pbodq 於 2024-11-25 20:21 編輯
如果有合理正常可靠既備份,
其實家用未必有RAID既需要
RAID主要用途係另你24X7不停服務
如果你有可靠BACKUP ...
tongziv 發表於 2024-11-25 09:24 AM



RAID 0如果遇上silent corruption,在未進行過一次backup時,無得修正。源發性永久data lost,只能發現error。當然這種extreme case機率極細,因為新鮮寫入的sectors,訊號難變質,一般不會馬上有sc,除非壞磁頭。通常cool down一兩年才開始做第一次backup時先至發現。

S$ RAID1或以上無這問題,能發現並修復,咁就可以確保寫入去backup那一刻的integrity係完全正確

呢個唔係RAID提供machine availability的話題,而係data correctness的功能。誰有辦法保證在寫入第一次backup那刻的values是正確呢?一子錯滿盤皆落索。所以始終有必要行RAID1以上。如果為左速度,RAID0快得幾多丫?要快gei都行SSD la。行RAID0只係為左慳錢慳bay位善用空間。

TOP

RAID 0如果遇上silent corruption,在未進行過一次backup時,無得修正。源發性永久data lost,只能發現e ...
pbodq 發表於 2024-11-25 20:02



理論性既野來
實際上出事起來,千千萬萬個FILE,你源頭出事,其實一樣會SYNC左去BACKUP,就算有BACKUP過
我唔信一般人有version backup control, weekly, monthly, incremental + full backup?
而RAID 1 一樣會有DATA老化問題,到時唔知邊隻碟既野先準,SYNC去 BACKUP 一樣衰

TOP

本帖最後由 mj001415 於 2024-11-26 12:30 編輯

用DS1821+ 加8隻16T既黎提供一下意見,我唔太建議用SHR,以前未轉1821+時有過唔好經歷,SHR死左救唔返,好彩嗰陣入面啲野唔重要,唔要都仲得,反而用raid5 救成功過。建議直接用raid5/6就好

新買剛起raid 既話,唔好用新增而直接重新起過,
用左一排既話就唔好一次新增幾隻,一隻一隻會咁做會穩陣啲
P.s. 當時由12T換16T一隻要17個鐘,換晒8隻唔駛7日,僅供參考。


用raid5/SHR1 ,8BAY用晒黎起一個pool既情況下,單隻上限係16T,Synology 限左一個pool最大係108TB。

Uploaded_via_HKEPC_IR_Pro_Android(7f889).jpg


via HKEPC IR 5.1.14 - Android(5.1.2F)

TOP

回覆 9# mac2009

HDD 係咁耐, 如果係全ssd raid 就會快好多

TOP

理論性既野來
實際上出事起來,千千萬萬個FILE,你源頭出事,其實一樣會SYNC左去BACKUP,就算有BACKUP過
我 ...
tongziv 發表於 2024-11-26 09:30 AM


當RAID 1有corruption時,除了知道哪一隻碟出事之外
還能夠從無出錯的碟read and overwrite去隻爛碟,disk 1 LBA987654 checksum出錯,就會去用disk 2  LBA987654去取代(假設disk 2 checksum是正確),為什麽你會說“唔知邊隻碟先準”?

要爭論的話,只有一個點:
兩隻disks的e.g. LBA 987654同時老化損毀,兩個checksum同時出錯,這機率有幾高?
如果概率高的話,才能說RAID1意義不大
P(both LBA 987654 defect)= 1/n x 1/n

相反,RAID0是任何一個sector出事就出事(假設無backup)
(1-P(全sectors正常) )x P(未做backup)

這明顯大過算式一好多

所以點解我話RAID0出事也是一個老化概率的賭博問題

TOP

當RAID 1有corruption時,除了知道哪一隻碟出事之外
還能夠從無出錯的碟read and overwrite去隻爛碟,disk 1 LBA987654 checksum出錯,就會去用disk 2  LBA987654去取代(假設disk 2 checksum是正確),為什麽你會說“唔知邊隻碟先準”?
pbodq 發表於 2024-11-26 13:56



    傳統 RAID 冇呢個 checksum 機制,當 2 隻碟嘅 data 唔 match 果陣,點先知道 A 碟準,B 碟準,定係兩個都唔準?其實呢個就係 bit rot 嘅來源,當然有 RAID 1 點都好過 RAID 0 完全無保護

其實正正因為呢個 bit rot 嘅問題,所以先出現新型嘅 filesystem,BTRFS(Synology 用緊),ZFS(TrueNAS/FreeNAS 之類),ReFS(Microsoft),引入更多 error correction,以及使用 copy-on-write 果 D 技術去從源頭防止出現問題

TOP

傳統 RAID 冇呢個 checksum 機制,當 2 隻碟嘅 data 唔 match 果陣,點先知道 A 碟準,B 碟準,定係 ...
fakeman 發表於 2024-11-26 14:27


checksum另一個問題係慢
RAID根本冇可能HANDLE到

TOP

checksum另一個問題係慢
RAID根本冇可能HANDLE到
tongziv 發表於 2024-11-26 14:41



    你講得無錯,其實 N 年前有 RAID 時 d 電腦都仲慢,所以先需要有專門嘅 hardware assisted RAID controller,但還算能力亦未足以 handle 大量 checksum 運算。不過當年 HDD size 細,相對 bit rot 機會其實係細,所以少好多人講,但而家碟大就好容易出事,同時間電腦快咗好多,CPU 計哂 RAIDZ2/Z3 兼且有哂 checksum 都係好濕碎。

TOP

其實家用,想用盡碟位,
可能UPSAGEL提及既UNRAID +offline checksum(snapraid) + backup
可能係最慳成本如果唔介意死左要花好長時間RESTORE 加上晚晚要有時間比佢計CHECKSUM既話

我覺得當碟同DATA都大時...CLOUD係安全過自己HOST..
自己仲要HOST,為左玩之外都睇唔到有咩好處了
如果DATA係緊要既話,自己HOST達到安全級別,成本一定貴過租CLOUD

TOP

傳統 RAID 冇呢個 checksum 機制,當 2 隻碟嘅 data 唔 match 果陣,點先知道 A 碟準,B 碟準,定係 ...
fakeman 發表於 2024-11-26 02:27 PM



話題講緊synology SHR RAID1

TOP