Mesi fa mi contatta un conoscente per chiedere consiglio per un nas.
Gli consiglio un modello a due baie e temendo una configurazione a cazzo "poi quando ti arriva chiamami che ti aiuto a configurarlo".
Non l'ho più sentito, me ne ero dimenticato.
Poco fa mi chiama
"sai quel nas che mi avevi consigliato?"
"L'hai preso in offerta al prime day? Se è andato in offerta hai fatto bene ad aspettare così tanto"
"no no l'avevo preso subito appena me lo hai consigliato, è arrivato subito e..."
Volendo fingere di non aver intuito "guarda, domani sera sono da te per configurarlo"
"No configurare l'ho configurato il quando è arrivato, bel modello, veloce e con tanto spazio ma ora c'è una lucina gialla e non vedo più i dati"
Ebbene sì, il pirla invece che farlo configurare a me, credo per paura gli chiedessi qualcosa, l'ha configurato da sé.
Raid zero ("ho letto che è più veloce e permette di salvare più dati del raid 1").
Ora è saltato un disco ed ovviamente nessun backup ("tanto c'è il RAID").
"Ed ora come facciamo?"
"Pesta a sangue chi ti ha configurato il nas fino a lasciarlo mezzo morto poi fai lo stesso con chi ha detto che il backup non serve se c'è il RAID"
*click*
Se domani leggo sul giornale di qualcuno che si è suicidato a suon di calci e pugni so di chi si parla.
Si ma dischi morti dopo neanche un anno, che sfiga
Mirror con due dischi non è poi così sicuro.
Se un disco muore proprio ok, ma se c'è "solo" una corruzione dei dati?
Scoperta l'incongruenza poi non è sempre banale capire quale dei due dati e quello buono...
AMD R9 9950X, Thermalright Peerless Assassin 120, Gigabyte B650 EAGLE, 32GB DDR5 6000MT/s CL30
AMD Rx 6800, ASUS XG32UQ + LG 32UL750
SSDs: Samsung 9100PRO 2TB, Solidigm P41+ 2TB
se è mirror è corrotto su entrambi i dischi
No intendo se uno dei due dischi ha dato i numeri e viene rilevata un incongruenza.
AMD R9 9950X, Thermalright Peerless Assassin 120, Gigabyte B650 EAGLE, 32GB DDR5 6000MT/s CL30
AMD Rx 6800, ASUS XG32UQ + LG 32UL750
SSDs: Samsung 9100PRO 2TB, Solidigm P41+ 2TB
il nas dovrebbe avvisarti tramite pannello quale è il disco sifulo e se sono presenti, anche coi led frontali
Solo quando è chiaro quale dei due dischi sta fallendo.
AMD R9 9950X, Thermalright Peerless Assassin 120, Gigabyte B650 EAGLE, 32GB DDR5 6000MT/s CL30
AMD Rx 6800, ASUS XG32UQ + LG 32UL750
SSDs: Samsung 9100PRO 2TB, Solidigm P41+ 2TB
eh?
Entrambi i dischi "funzionano".
In lettura un disco ti risponde 1 e l'altro di dice 0.
Chi dice cazzate?
AMD R9 9950X, Thermalright Peerless Assassin 120, Gigabyte B650 EAGLE, 32GB DDR5 6000MT/s CL30
AMD Rx 6800, ASUS XG32UQ + LG 32UL750
SSDs: Samsung 9100PRO 2TB, Solidigm P41+ 2TB
te lo dice il nas, è li per quello![]()
Già, con un efficace funzione tira_ad_indovinare().
AMD R9 9950X, Thermalright Peerless Assassin 120, Gigabyte B650 EAGLE, 32GB DDR5 6000MT/s CL30
AMD Rx 6800, ASUS XG32UQ + LG 32UL750
SSDs: Samsung 9100PRO 2TB, Solidigm P41+ 2TB
come vuoi
Non so quali magie pensi che il controller faccia, ma questo capisce solo se uno disco è chiaramente danneggiato... anzi se il disco gli dice di essere fallato.
AMD R9 9950X, Thermalright Peerless Assassin 120, Gigabyte B650 EAGLE, 32GB DDR5 6000MT/s CL30
AMD Rx 6800, ASUS XG32UQ + LG 32UL750
SSDs: Samsung 9100PRO 2TB, Solidigm P41+ 2TB
i nas decenti eseguono controlli di coerenza interni
E ti sto dicendo che il punto non è solo trovare l'incongruenza...
Senza contare che usano algoritmi veloci, non accurati.
Documentarmi su ZFS mi ha sgretolato tante certezze...
AMD R9 9950X, Thermalright Peerless Assassin 120, Gigabyte B650 EAGLE, 32GB DDR5 6000MT/s CL30
AMD Rx 6800, ASUS XG32UQ + LG 32UL750
SSDs: Samsung 9100PRO 2TB, Solidigm P41+ 2TB
Ultima modifica di Artyus; 22-06-21 alle 09:39
--------------------------------------------------------------
Since 12-07-2002 +4.719 messaggi
--------------------------------------------------------------
"The man in black fled across the desert and the
gunslinger followed." Stephen King - The Gunslinger
--------------------------------------------------------------
In realtà uscì, anni fa, uscì uno studio di big G sui loro dischi e sulle rotture.
Secondo i loro dati sulle milionate di dischi che usano i dischi si guastano più facilmente se esposti a sbalzi termici, numerosi spun up e, soprattutto, nei primi 3 mesi(presumo per difetti di produzione) o dopo 3 anni (presumo usura).
Finché sono stato una bestia da sala dati quando assemblavo i server infatti utilizzavo SEMPRE dischi di lotti diversi, possibilmente anche di produttori diversi.
Perché due dischi identici, prodotti nello stesso momento (stesso lotto, no?) che sono stati usati nello stesso modo (stesso raid quindi stesso uso)e sono stati esposti alle stesse temperature (essendo nello stesso server) ti rende ALTAMENTE probabile si guastino più o meno in contemporanea.
Su un parco macchine da 30000 - 35000 unità(dove lavoravo prima eravamo su quei numeri) metti in preventivo di cambiare diversi dischi ogni giorno ed a te non serve che i dischi non si guastino, è normale sia cosi, non puoi pretendere l'impossibile.
A te serve che non si guastino contemporaneamente su uno stesso RAID abbastanza dischi da rendere il RAID inconsistente, cambiare due dischi su due server ti costa pochi secondi, recuperare dati da un backup ti costa DECISAMENTE di più in termini di tempo ma soprattutto di disservizio.
Grazie per l'ansia, ordino altri 2 SSD da mettere in raid nel mio PC di casa![]()