Recentemente ho avuto la possibilità di testare brevemente un’appliance di deduplica Dell DR4000 (potete leggere la mia breve recensione qui), quindi dopo un anno ho provato DataDomain, ExaGrid e Dell. Escluso HP StoreOnce, ho provato tutte le appliance di deduplicazione principali, e ho potuto capire come funzionano, pro e contro, ma soprattutto i casi d’uso per la loro implementazione. Questo post non parla di quando usarli, ma quando NON usarli.
Sia chiaro: sono tutti ottimi prodotti, ognuno con i propri punti di forza, e credo che nessuno rimarrà deluso nell’usarli se ovviamente vengono impostati e utilizzati in modo corretto. Questo post non è affatto un “pestaggio” nei confronti di tali prodotti.
Ma (lo so che eravate in attesa di un ma) ci sono situazioni in cui questi prodotti sono ben lungi dall’essere la soluzione migliore per quei clienti alla ricerca di uno spazio per salvare i backup su disco.
I miei dubbi sono rivolti soprattutto ai modelli più piccoli di questi prodotti. Lasciate che vi mostri un esempio: pensate ad una deduplication appliance di 2 TB, qualunque essa sia. Tutte hanno un prezzo intorno ai 20k euro, e offrono 2 TB di storage nativo con uno spazio “forse” utilizzabile fino a 20x grazie alla deduplicazione. Io uso spesso Veeam Backup per la protezione dei dati di ambienti virtuali, così raramente ho visto un rapporto di deduplicazione di 20x, un valore più onesto sarebbe compreso tra 10 e 15 volte, ma facciamo finta di usare comunque 20. Questo vi dà una memoria utilizzabile di 40Tb.
Le prestazioni dei modelli con deduplica inline non sono così eccezionali per ovvie ragioni (l’attività di deduplica rallenta le operazioni di scrittura). Salvare dei backup completi su uno storage locale di un server fisico con un raid5 fatto con dischi SAS mi ha sempre mostrato valori più alti, anche usando la configurazione di Veeam “dedupe friendly” mentre salvavo su queste appliance.
Se la velocità di scrittura di una appliance è di circa 60-70 MB (i modelli più grandi sono più veloci), posso raggiungere quella velocità anche con un RAID SATA in wide striping creato sun un NAS “prosumer” (quelli con CPU quad core e una buona quantità di ram, come Qnap o Synology per citarne alcuni). E se provate a configurare un NAS per avere 40 TB a bordo, scoprirete che il prezzo totale è inferiore a 10k euro.
Stesso spazio, stesse prestazioni, la metà del prezzo.
E ho il sospetto che un NAS non deduplicato possa anche essere più veloce se effettuiamo un Instant VM Recovery per esempio.
Così, ho pian piano sviluppato una mia personale “regola generale” per la progettazione di soluzioni di backup su disco per i clienti. Le ragioni per scegliere una deduplication appliance a mio parere sono le seguenti:
– Avete più di 50-60 tb di backup da salvare. Più dati è necessario salvare, più questi prodotti sono una buona soluzione
– Avete bisogno di replicare questi i backup remotamente: le funzioni di replica di queste appliance migliori dei comuni NAS (di solito rsync), e possono evitarvi di dover utilizzare un server con a bordo un software di replica che legga i dati dal NAS sorgente e li salvino sul NAS di destinazione. I dati vengono replicati già deduplicati da tali apparecchi, con conseguente risparmio di banda, mentre con il software del NAS o con un server si deve replicare l’intera dimensione del backup
– Avete bisogno di qualcosa in grado di scalare in futuro. La facilità di scalare di un’appliance di deduplicazione è diversa in base al fornitore scelto (ExaGrid è un vero e proprio sistema scale-out, altri utilizzano cassetti aggiuntivi sulla medesima appliance)
– Si desidera un supporto di alto livello e quindi si sceglie un fornitore tradizionale piuttosto che un hardware “a buon mercato e da scaffalef”
Se le vostre esigenze sono tra quelle elencate qui, scegliete una appliance di deduplicazione. Altrimenti, pensateci due volte prima di sceglierne una, forse solo perché il vostro consulente dice semplicemente “è necessaria la deduplica per fare backup su disco”.