Veeam Backup and the maintenance of a Reverse Incremental Job

# Check how old is the last successful active full backup in Veeam Backup & Replication # # Author: Luca Dell'Oca # ldelloca@gmail.com # # You need to run this script directly in the Veeam Backup & Replication server. # # Version 1.0 - 26 March 2013 # Load Veeam Powershell Snapin Add-PSSnapin -Name VeeamPSSnapIn -ErrorAction SilentlyContinue # Get successful backup executions where the backup was a full one, and list only the most recent one. foreach($job in (Get-VBRJob | ? {$_.JobType -eq "Backup"})) { Get-VBRBackupSession | ?{$_.Jobname -eq $Job.name -and $_.JobType -eq "Backup" -and $_.IsFullMode -eq "True" -and $_.IsCompleted -eq "True" -and $_.Result -ne "Failed" -and ($_.isretrymode -eq $False -or $_.isretrymode -eq $True)} | Sort-Object EndTime -Descending | Select-Object -First 1 | select JobName, EndTime }

I backup reverse incremental di Veeam sono da sempre una delle soluzioni più apprezzate dai suoi utilizzatori. Al costo di un incremento di I/O sullo storage di backup rispetto a un semplice backup incrementale, permette di avere sullo storage un unico file di tipo full e una lunga catena di incrementi, permettendo in questo modo di risparmiare un notevole quantitativo di spazio.

Quello che molti utenti ignorano tuttavia, è che un Reverse Incremental non è un backup di tipo “Set and Forget”. Nonostante una catena reverse possa avere una storia anche di anni, questo suo utilizzo non è per nulla consigliabile, e anzi può portare a diversi problemi.

Ipotizziamo di salvare 10 VM in un unico job. La loro dimensione complessiva è 1 Tb, e Veeam tramite deduplica e compressione crea un file VBK di 500 Gb. Dopo qualche periodo vengono cancellate 2 VM, e la dimensione complessiva dei file VMDK si riduce a 700 Gb. Veeam ipoteticamente dovrebbe creare un file di backup di 350 Gb, ma notiamo invece che il file VBK continua ad essere 500 Gb. Questo avviene perchè non vi è possibilità di ridurre le dimensioni di un file VBK durante l’esecuzione del Job, l’unico metodo è realizzare un Active Full.

Un altro problema è la frammentazione. Per come funziona un Reverse Incremental, i blocchi in esso contenuti vengono continuamente sostituiti ed aggiornati da blocchi modificati. Questa attività porta col tempo a una eccessiva frammentazione del file VBK, frammentazione non risolvibile con normali procedure di defrag ad esempio della partizione NTFS dove i file vengono salvati, dato che è un frammentazione interna al file VBK stesso. Anche in questo caso, la soluzione è un backup Active Full.

Il problema maggiore però è un altro. Potrebbe capitare che durante un ripristino vi ritroviate con un errore simile al seguente:

Error during restore operation

Cosa è successo? Il file VBK da cui viene ripristinata una virtual machine è fondamentalmente corrotto, e il ripristino non è possibile.

Può capitare che non vi accorgiate di questo problema per diversi mesi, solitamente perchè fate spesso solo ripristini di tipo file, e quindi andate a leggere blocchi diversi da quelli che sono corrotti all’interno del file di backup. Se i blocchi corrotti sono contenuti nel file VBK, potrebbe oltretutto capitare che questi non vengano mai sovrascritti durante i backup schedulati, perchè ad esempio sono blocchi relativi ai file di sistema operativo del guest OS, che spesso non vengono più aggiornati dopo l’installazione iniziale. Questo fa si che ci si accorga del problema appunto dopo molti mesi, e quasi sicuramente quando si ha necessità di fare un ripristino…

Per risolvere il problema, come dicevo è necessario innanzitutto a pensare che anche i backup di tipo Reverse Incremental vanno gestiti e mantenuti, in particolare effettuando periodicamente un backup di tipo Active Full. Questo tipo di backup genera un nuovo file VBK senza leggere nessuno dei file precedenti della catena, diventando di fatto l’inizio di una nuova catena. E’ possibile realizzare un backup Active Full manualmente:

Manually start an Active Full

oppure, scelta migliore, configurare opportunamente il Job per realizzare periodicamente un Active Full. Nell’esempio sottostante viene creato un Active full il primo sabato del mese, ogni due mesi.

Periodic Active Full for a Reverse Incremental job

Non esiste una frequenza consigliata nel realizzare un Active Full, solitamente io li realizzo ogni due mesi. Ognuno deve, in base al proprio ambiente, trovare il corretto bilanciamento tra una frequenza eccessiva (che vanificherebbe i vantaggi di un reverse incremental) e una singola catena troppo lunga (che aumenterebbe il rischio di blocchi corrotti e VBK eccessivamente grandi).

Inoltre, bisogna tenere in considerazione due aspetti fondamentali nell’introdurre gli active full periodici nelle proprie schedulazioni: – i tempi di backup si allungano notevolmente, è bene quindi programmare l’active full in periodi di scarsa attività come ad esempio i weekend – fintanto che la retention del Job di backup non viene raggiunta, per un periodo di tempo ci saranno 2 file VBK a piena dimensione all’interno dello storage di backup, e il rischio di saturarlo è reale

Infine, come facciamo a sapere quando è stato realizzato l’ultimo backup di tupo Full? Possiamo alternativamente leggere a ritroso tutti i report di backup di Veeam, oppure utilizzare questo veloce script in powershell che ho realizzato:

# Check how old is the last successful active full backup in Veeam Backup & Replication
#
# Author: Luca Dell'Oca
# ldelloca@gmail.com
#
# You need to run this script directly in the Veeam Backup & Replication server.
#
# Version 1.0 - 26 March 2013
# Load Veeam Powershell Snapin
Add-PSSnapin -Name VeeamPSSnapIn -ErrorAction SilentlyContinue
# Get successful backup executions where the backup was a full one, and list only the most recent one.
foreach($job in (Get-VBRJob | ? {$_.JobType -eq "Backup"}))
{
Get-VBRBackupSession | ?{$_.Jobname -eq $Job.name -and $_.JobType -eq "Backup" -and $_.IsFullMode -eq "True" -and $_.IsCompleted -eq "True" -and $_.Result -ne "Failed" -and ($_.isretrymode -eq $False -or $_.isretrymode -eq $True)} | Sort-Object EndTime -Descending | Select-Object -First 1 | select JobName, EndTime
}

Il suo output darà risultati simili a questo:

Script output

Ci sono due backup tra quelli presenti il cui utimo full è stato realizzato quasi 5 mesi prima.

La lezione che ricaviamo da questo articolo è semplice: NON esistono sistemi “set and forget”, mai.

Tecnologia active backup catena chain full incremental maintenance manutenzione replication reverse veeam

Share this:

Share this: