#VMworld Europe 2011: #BCO2874 vSphere High Availability 5.0 and SMP Fault Tolerance – Technical Overview

0 Flares Twitter 0 Facebook 0 LinkedIn 0 Email -- 0 Flares ×

Ho assistito stamattina alla mia prima sessione al VMworld Europe 2011.

La prima parte della sessione è stata una descrizione del nuovo HA, riscritto completamente nella versione 5.0. Lo speaker, Keith Farkas di VMware, ha innanzitutto mostrato come è cambiato HA nell’ultima versione di vSphere: rimozione di AAH in favore di FDM, rimozione dei nodi primari/secondari, heartbeat secondario tramite storage.

 

La seconda parte, spiegata da Jim Chow sempre di VMware, è stata sicuramente più interessante: l’argomento era infatti SMP e FT, ovvero la possibilità di eseguire FT con virtual machines multi-CPU. Benchè quanto mostrato era dichiaratamente ancora in fase di sviluppo, questa funzione è da sempre attesa dai clienti VMware, praticamente dal giorno stesso in cui FT è stato presentato. Tanto che la sala era piena nonostante la grande capienza.

Molte utenti sarebbero infatti più che felici di poter proteggere tramite FT alcune delle VMs più critiche, vista anche la facilità d’uso della funzione e il fatto che, essendo completamente trasparente al sistema operativo guest, non ha limitazioni d’uso o configurazioni particolari da attivare come nei cluster.

Tuttavia, il limite di poter assegnare una sola vCPU ha da sempre limitato questo utilizzo, insieme all’impossibilità di creare snapshots dei dischi di macchine protette da FT.

 

Come detto dallo speaker, implementare questa funzione in software, come FT, è una attività veramente difficile, anche per un team di sviluppo numeroso e skillato come quello di VMware. Nonostante ciò, alcuni punti sono stati raggiunti:

– per gestire il traffico generato dalle CPU multiple, la nic per FT Logging è stata aggiornata a 10 Gbit

– un nuovo protocollo al posto di vLockstep pensato fin dall’inizio per gestire SMP

– non più uno shared disk, ma due dischi separati (una per la VM primaria e una per la ghost) replicati opportunamente

 

Di questa nuova tecnologia è stata fatta anche una demo, che devo dire ha impressionato un pò tutti: un server linux con un database Oracle a bordo, e 4 vCPU. Allo spegnimento forzato del nodo ESXi dove era in esecuzione la VM primaria, la VM di backup ha continuato ad eseguire il workload che gli era stato assegnato.

Dai test fatti, le performance con FT in SMP degradano rispetto a macchine con lo stesso numero di processori ma non protette da Ft. Credo che se anche rimanesse questo degrado, sarebbe accettabile in cambio del livello di protezione garantito da FT.

 

Ultimissima domanda alla fine della sessione: “quando potremo fare le snapshots delle VM protette da FT?”.

Risposta: “Ci stiamo lavorando”….