VMware vSphere HA (High Availability) adalah sebuah utilitas yang disertakan dalam software VMware vSphere yang berfungsi untuk me-restart virtual machine (VM) yang gagal pada host server alternatif, sehingga bisa mengurangi downtime aplikasi.

vSphere HA memungkinkan administrator server untuk menggabungkan beberapa server fisik dalam satu jaringan menjadi sebuah grup logis yang disebut cluster high availability. Jika terjadi kegagalan server, misalnya crash sistem, mati listrik, atau gangguan jaringan, vSphere HA akan mendeteksi VM yang down lalu me-restart VM tersebut di server lain yang stabil dalam cluster. Proses pemindahan workload yang gagal ke sistem cadangan ini dikenal sebagai failover.

VMware pertama kali memperkenalkan vSphere HA di Virtual Infrastructure 3 pada tahun 2006 dan sejak itu terus mengembangkan serta mendukung fitur ini.

Secara umum, istilah high availability dipakai untuk menggambarkan sistem atau aplikasi yang selalu tersedia dan berfungsi sesuai ekspektasi dengan persentase uptime yang sangat tinggi. Di data center enterprise, availability sistem biasanya melebihi 99% dan sering diukur dalam istilah “berapa banyak nine” (misalnya 99.99%).

Fitur VMware vSphere HA

VMware vSphere HA membantu organisasi meningkatkan availability dengan mendeteksi VM yang gagal lalu me-restart VM tersebut di server fisik lain secara otomatis tanpa campur tangan manual. Hal ini bisa dilakukan karena file VMDK (Virtual Machine Disk) disimpan di shared storage yang dapat diakses semua server fisik dalam cluster HA.

VMware Distributed Resource Scheduler (DRS) sering dipakai bersama dengan vSphere HA untuk menyeimbangkan kembali workload yang dipindahkan ke host alternatif. Dengan kombinasi HA dan DRS, organisasi bisa memastikan VM yang direstart tidak membebani performa VM lain di host failover.

Fitur VMware Fault Tolerance juga bisa digunakan untuk tingkat availability yang lebih tinggi. Jika vSphere HA hanya me-restart VM setelah gagal (dengan jeda deteksi dan booting), Fault Tolerance menjaga salinan redundan dari VM yang dilindungi, sehingga bisa langsung mengambil alih operasi VM utama yang gagal tanpa downtime.

Cara kerja vSphere HA

VMware vSphere HA menggunakan sebuah utilitas bernama Fault Domain Manager agent untuk memantau ketersediaan host ESXi dan me-restart VM yang gagal. Saat konfigurasi awal, admin mendefinisikan sekumpulan server sebagai cluster high availability. Fault Domain Manager dijalankan di setiap host dalam cluster. Salah satu host akan dipilih sebagai host master, sementara host lain menjadi slave, untuk memantau sinyal dari host lain dan berkomunikasi dengan vCenter Server.

Server host dalam cluster HA berkomunikasi melalui heartbeat, yaitu pesan periodik yang menandakan host masih berfungsi normal. Jika host master tidak menerima heartbeat dari host atau VM lain dalam cluster, vSphere HA akan melakukan tindakan korektif. Aksi yang diambil bergantung pada jenis kegagalan dan preferensi user. Jika hanya VM yang gagal sementara host masih berjalan, VM akan direstart di host yang sama. Jika seluruh host gagal, vSphere HA akan merestart semua VM di host lain dalam cluster.

Selain itu, HA juga bisa merestart VM jika host masih aktif tapi kehilangan koneksi jaringan dengan cluster. Host master akan memeriksa apakah host tersebut masih bisa berkomunikasi dengan data store bersama. Shared storage seperti Storage Area Network (SAN) memungkinkan semua host dalam cluster mengakses file disk VM dan me-restart VM meskipun sebelumnya berjalan di host lain.

Cara setup dan menggunakan vSphere HA

Langkah pertama untuk setup vSphere HA adalah membuat cluster melalui vSphere Web Client dengan opsi Create a Cluster, lalu memilih host ESXi dan shared storage yang akan masuk cluster. Cluster HA minimal harus punya dua host, tetapi biasanya organisasi menggunakan cluster lebih besar untuk pooling resource dan menangani lebih banyak kegagalan.

Admin kemudian bisa mengaktifkan fitur vSphere HA melalui Web Client pada menu Manage > Settings > vSphere HA. Setelah itu, admin dapat menyesuaikan konfigurasi dan preferensi sesuai kebutuhan.

Persyaratan dan best practice VMware vSphere HA

Administrator dapat mengatur banyak parameter HA, misalnya berapa lama VM atau host dianggap unavailable sebelum vSphere HA mencoba merestart (default 120 detik). Admin juga bisa mengatur urutan restart VM, yang berguna ketika resource cluster tidak cukup untuk me-restart semua VM sekaligus. Biasanya, VM yang menjalankan aplikasi mission-critical diberi prioritas restart lebih tinggi.

Organisasi juga bisa mendefinisikan aturan affinity dan anti-affinity untuk membatasi penempatan VM tertentu. Aturan ini mencegah VM tertentu direstart di server tertentu atau di server yang sudah menjalankan VM lain yang spesifik. Tujuannya agar VM yang CPU-intensive tidak menumpuk di host yang sama setelah failover, atau mencegah dua instance aplikasi kritikal berada di satu host yang sama yang bisa menyebabkan single point of failure (SPOF).

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *