Nutanix Cluster’daki CVM’lerden birinin erişlemez duruma geldiği zaman yapılan incelemede aşağıdaki yayımlanan bug’a hit ettiğimiz anlaşıldı. Çözüm olarak manuel şekilde HBA firmware’leri güncellenmesi önerildi. Ancak daha sonra LCM Darksite paket ile HBA update’in gelmesiyle tüm cluster HBA update’i otomatik olarak gerçekleştirdik.
Bu sebeple manuel adımlar araştırılmış ve dökümante edilmişti.
Multiple disks marked offline on node running PH16 firmware
Article #
Last modified onJun 28th 2020
Summary:
When LCM upgrades LSI SAS 3008 HBA firmware to PH 16, disks IO instability has been noted that can cause disk IO degradation and node instability and resiliency concerns.
Versions affected:
ALL AOS Version
Solution:
Please manually upgrade the firmware on NX-G4, NX-G5, NX-G6, NX-G7 nodes to PH16.00.10.00 to resolve this issue.
Binaries and procedure is mentioned in KB-6937.
MANUALLY UPDATING HBA CONTROLLER FIRMWARE
Bu task Nutanix HBA sabit yazılımını güncellemek için gerekli adımları içerir.
Prosedür
1) HBA ürün yazılımı güncellemesi ISO’ya bir bağlantı almak ve ISO’yu sisteminize indirmek için Nutanix Destek ile iletişime geçin.
2) CVM’yi ve node’u kapatın.
- HBA kartı tek node’lu bir kümedeyse, Tek Düğümlü Bir Kümeyi Kapatma bölümündeki adımlar izleyin.
- HBA kartı çok node’lu bir kümedeyse, Çok Düğümlü Kümeyi Kapatma bölümündeki adımları izleyin.
3)ISO güncellemesini indirdiğiniz sistemden, node’un IPMI web kullanıcı arayüzüne ulaşmak için bir web tarayıcısına node’un IPMI IP adresini girin.
4)PMI web kullanıcı arayüzünde Remote Control > Console Redirection.Figure. Console redirection
5)Launch Console butonuna basın.
6)Konsol menüsünden Virtual Media > Virtual Storage.Figure. Virtual storage seçin.
7)Sanal Depolama iletişim kutusunda, depolama ayarlarını belirtin.
- Logical Drive Type field’a, ISO Dosyası öğesini seçin.
- Image File Name and Full Path field’a , Open Image’ı seçin, ISO dosyasını indirdiğiniz konuma göz atın ve Aç’a tıklayın.
- ISO’yu node’a monte etmek için Plug In’i seçin.
8) OK’u tıklayın.
9)ISO’dan yeniden başlamak için node’u açın.
Ana bilgisayar ISO’ya yeniden başladığında, sas3flash yardımcı programı güncellemeyi otomatik olarak gerçekleştirir.
10)Virtual Storage dialog box’da, ISO’nun bağlantısını kesmek için Plug Out’a tıklayın.
11)IPMI web kullanıcı arayüzünden bağlantıyı kesin ve ana bilgisayarı normal şekilde yeniden başlatın.
- HBA kartı tek node’lu bir kümedeyse, Tek Node’lu Küme Başlatma bölümündeki adımları izleyin.
- HBA kartı node’lu bir kümedeyse, Çok Node’lu Küme Başlatma bölümündeki adımları izleyin
12)CVM’den aygıt yazılımı sürümünü doğrulayın.
nutanix@cvm$ sudo /usr/local/nutanix/bootstrap/lib/lsi-sas/sas3flash -list
SHUTTING DOWN A MULTINODE CLUSTER
Aşağıdaki adımlar, MANUALLY UPDATING HBA CONTROLLER FIRMWARE 2.madde detaylarını içerir.
Node Shutdown Prechecks
Node’un güvenli bir şekilde kapatılmasını engelleyebilecek herhangi bir sorun olmadığından emin olmak için kontrol edin. (node’un kapatılması gerekmese bile bu kontroller faydalıdır.)
Bu task hakkında;
Tahmini tamamlama süresi: 5 dakika
Prosedür
- Prism’de, Ana sayfaya gidin ve Data Resiliency Status Green OK olduğuna emin olun.
- Prism’de Health page’e gidin ve Actions > Run NCC Checks komutunu çalıştırın.
- All Checks’i seçin ve çalıştırın.
Alternatif olarak, CVM’den aşağıdaki komutu çalıştırın:
nutanix@cvm$ ncc health_checks run_all |
4)Herhangi bir kontrol başarısız olursa, çıktıda sağlanan ilgili KB makalesine ve sorunu çözme hakkında bilgi için Nutanix Küme Kontrol Kılavuzu: NCC Referansı’na bakın.
5) Çözümlenemeyen başarısız kontrolleriniz varsa, node’u kapatmadan önce Nutanix Destek ile iletişime geçin.
6) NCCshow_hardware_info komutunu çalıştırarak bileşen ayrıntılarını toplayın.
nutanix@cvm$ ncc hardware_info show_hardware_info
7) Show_hardware_info komutunun çıktısını kaydedin, böylece daha sonra bileşen değişimini doğrularken ayrıntıları karşılaştırabilirsiniz.
Preparing Nodes for Shutdown
Prosedür
- Her node’un CVM’sinde oturum açın ve BIOS, BMC ve SATA DOM sürümlerini not edin.
- /Etc/nutanix/firmware_config.json yapılandırma dosyasından sürümleri doğrulayın.
cat /etc/nutanix/firmware_config.json
- Her düğümün IPMI IP adresini bulun (IPMI web kullanıcı arayüzüne erişmek için gereklidir.
nutanix@cvm$ ncc ipmi_info |
Shutting Down a Node in a Cluster (vSphere Web Client)
Prosedür
- vCenter’da oturum açın
- DRS etkinleştirilmediyse, Denetleyici VM dışındaki tüm VM’leri kümedeki başka bir ana bilgisayara manuel olarak taşıyın veya başka bir ana bilgisayara taşımak istemediğiniz Denetleyici VM dışındaki tüm VM’leri kapatın.
Kümede DRS etkinleştirilmişse, bu adımı atlayabilirsiniz.
- İlgili Host’a sağ tıklayın Maintenance Mode > Enter Maintenance Mode yapın.
- SSH ile CVM’de oturum açın ve CVM’yi kapatın.
nutanix@cvm$ cvm_shutdown -P now
- CVM kapandıktan sonra, ana bilgisayarın maintenance moduna geçmesini bekleyin.
- Host’a sağ tıklayıp Shut Down seçin.