S.M.A.R.T SSD en ESXi

De enunpimpam
Saltar a: navegación, buscar

Prácticamente he ido sustituyendo los disco duros mecánicos por SSD, en todos los host que administro, el problema que me he encontrado es poder detectar algún posible fallo, debido a que los SSD tienen una vida util dependiendo de las celdas que se pueden sobrescribir 1000 en los SSD TLC o 100.000 en los SLC.

Por eso este hecho me parece interesante poder controlar estos datos de escritura de las celdas, desafortunadamente no hay opción de controlar estos valores desde VMware Host Client, pero podemos usara la herramienta smartmontools que nos permite poder acceder a los datos de control de S.M.A.R.T

El valor que tendremos que tener en cuenta es 'TBW (Total Bytes Written) este valor describe cuantos Bytes se pueden escribir en todo el dispositivo, hasta que espire la garantía, el valor lo podremos leer en S.M.A.R.T en el campo Total_LBAs_Written

Instalar smartctl

smartmontools

Descarga

copiar el archivo vib en /tmp/

Aceptar instalación de CommunitySupported

esxcli software acceptance set --level=CommunitySupported

Instalar

esxcli software vib install -v /tmp/smartctl-6.6-4321.x86_64.vib

/opt/smartmontools/smartctl -d [Device Type] --all /dev/disks/[DISK]

Listar discos

Dev-disk.png

esxcli storage core device list
naa.50014ee25619eff0
   Display Name: Local ATA Disk (naa.50014ee25619eff0)
   Has Settable Display Name: true
   Size: 476940
   Device Type: Direct-Access
   Multipath Plugin: NMP
   Devfs Path: /vmfs/devices/disks/naa.50014ee25619eff0
   Vendor: ATA
   Model: WDC WD5000AAJS-0
   Revision: 12.0
   SCSI Level: 5
   Is Pseudo: false
   Status: on
   Is RDM Capable: false
   Is Local: true
   Is Removable: false
   Is SSD: false
   Is VVOL PE: false
   Is Offline: false
   Is Perennially Reserved: false
   Queue Full Sample Size: 0
   Queue Full Threshold: 0
   Thin Provisioning Status: unknown
   Attached Filters:
   VAAI Status: unsupported
   Other UIDs: vml.0100000000202020202057442d574341533833323637313936574443205744
   Is Shared Clusterwide: false
   Is Local SAS Device: false
   Is SAS: false
   Is USB: false
   Is Boot USB Device: false
   Is Boot Device: false
   Device Max Queue Depth: 1
   No of outstanding IOs with competing worlds: 1
   Drive Type: unknown
   RAID Level: unknown
   Number of Physical Drives: unknown
   Protection Enabled: false
   PI Activated: false
   PI Type: 0
   PI Protection Mask: NO PROTECTION
   Supported Guard Types: NO GUARD SUPPORT
   DIX Enabled: false
   DIX Guard Type: NO GUARD SUPPORT
   Emulated DIX/DIF Enabled: false