Ya es célebre la TED Talk que Simón Sinek dió en el 2009 presentando el denominado “Circulo dorado” que, según Sinek, es una manera muy efectiva en que los líderes inspiran a otros a la acción:

Es también uno de los principios culturales de Nutanix iniciar con el porqué, luego el cómo y finalmente qué.
Después de casi 4 meses trabajando para Nutanix e interactuando con muchas personas dentro de éste ecosistema, he tenido que llegar a responderme (y responder a otros) una pregunta esencial cuya respuesta yo mismo necesito para mantener mi sentido de propósito en ésta labor:
¿Por qué Nutanix?
Es decir, ¿por qué alguien debería siquiera considerar a Nutanix como una opción para su infraestructura?
Madurez
Nutanix es el pionero y sigue siendo el líder en el segmento de hiperconvergencia de acuerdo con Gartner. Esto es un asunto ya conocido.
Por otro lado, Nutanix provee un sistema distribuido que entrega -como se espera de un Sistema Distribuido- un alto nivel de resiliencia/redundancia en el plano de Administración, Control y Datos. Captura las funciones vitales del datacenter para que se ejecuten de manera integrada y completamente en software: Almacenamiento, protección de datos, virtualización, administración y operaciones, seguridad y redes virtualizadas.
Valor
Adicionalmente, en el centro de la propuesta de valor de Nutanix se encuentran los siguientes aspectos:
- Simplicidad en todo el ciclo de vida: desde la adquisición hasta las operaciones. La complejidad cuesta a una organización, y mucho.
- Libertad para elegir: tanto el hipervisor (ESXi, Hyper-V o AHV) como el hardware
- Mantener el mayor nivel de satisfacción del usuario, así como el mejor soporte técnico en la industria. Esto se puede comprobar fácilmente con la métrica estándar de satisfacción de los usuarios -o Net Promoter Score– visible públicamente en https://customer.guru/net-promoter-score/nutanix. Basta comprobar allí mismo que el promedio de satisfacción en la industria de TI (si, eso incluye a todos los demás fabricantes) es de apenas 54 mientras que Nutanix se mantiene sobre 90.
¿Cómo lo logra Nutanix?
Ahora, algo más de detalle en cómo maneja Nutanix los diferentes aspectos del centro de datos, clasificados en Infrastructure Qualities:
- Disponibilidad
Hay una diferencia esencial en el manejo de fallas de Nutanix: se enfoca no sólo en garantizar la Disponibilidad de los datos ante una falla (lo cual lo pueden asegurar otras soluciones también) sino también asegurar la protección de esos datos durante la situación de falla (lo cual es particular de Nutanix).
Una solución estándar de Nutanix se compone de 3 nodos. Si alguno de esos nodos falla sucede lo siguiente:
- Los datos alojados en el nodo fallido están disponibles inmediatamente en algún otro nodo del clúster pues por defecto siempre se crea una réplica de cada dato en otro nodo.
- Tan pronto como se detecta la falla del nodo, las VM se reinician en otro nodo y acceden a sus datos inmediatamente
- También de manera automática y sin retardos, se inicia la réplica de los datos sobrevivientes para que estos no solo estén disponibles, sino también protegidos y la recuperación del nodo no se vuelva un asunto de emergencia, como ocurriría en una solución tradicional. No se requiere contar con 4 o más nodos para esta funcionalidad, empezando con 3 nodos ése es el funcionamiento.
- El alojamiento y replicación de datos ocurren con una granularidad de 1MB. De manera que si es un disco lo que falla, no sólo la recuperación de la redundancia de esos datos inicia inmediatamente, sino que implica una carga mucho menor en la red y por ende un tiempo menor para lograr la reprotección de los datos.

Por otro lado, al ser un auténtico sistema distribuido, la falla del dispositivo SSD/NVMe de caching no implica indisponibilidad de ninguno de los componentes del clúster.
- Administración
La gestión simplificada se lleva a cabo en Prism, sin importar el hipervisor o hardware que se elija, Prism es el punto central de gestión y visibilidad de todo el stack: hipervisor, VMs, almacenamiento, redes, nube hibrida. Las tareas más comunes de hipervisor y manejo de VMs se pueden ejecutar desde Prism, sin tener que acudir a la interfaz de gestión de la solución de virtualización.

El plano de Administración en Nutanix evita los puntos únicos de falla de manera nativa: cada nodo incluye una instancia del software de gestión, con lo cual por ejemplo en un clúster de 3 nodos, hay 3 instancias de Prism sin recurrir a ninguna configuración adicional. En caso de fallo de algún nodo, la capacidad de tener gestión de la plataforma no se ve afectada. Asimismo, si el software de gestión del hipervisor elegido llegase a fallar, Prism no tiene dependencia con éste y puede seguir entregando métricas y visibilidad de la infraestructura virtual.
- Desempeño
¿Por qué siquiera tomar en cuenta una solución de hiperconvergencia que no corre in-kernel?
Nutanix despliega una controladora virtual en cada nodo, conocida como CVM (Controller Virtual Machine).
Es cierto que el camino más rápido a los datos es el que va por Máquina Virtual > Kernel hipervisor > Controladora local > Disco. Sin embargo ésto solamente será valido si se puede asegurar que ése es el camino que toma toda VM para acceder a sus datos y que no tiene que agregar el paso de ir a la red. Este atributo se conoce como Localidad de Datos y es garantizado por Nutanix siempre. No importa si las VM se migran entre host, siempre accederán a la copia activa de sus datos de manera local, es decir, en el mismo host en el que residen.
La razón de no depender de la red tiene que ver con el hecho que ni Ethernet ni los protocolos derivados de éste, fueron diseñados para el tráfico de almacenamiento. Aspectos como las retransmisiones, el control de prioridades (PFC) y el evidente tiempo y procesamiento que le toma a un dato “subir” y “bajar” por la pila TCP/IP al enviarse/recibirse por la red hacen que cada vez más el cuello de botella de un almacenamiento distribuido sea la red. ¿La solución sería asignar más ancho de banda? No importa si usamos 10/25/40 etc Gbps, los problemas fundamentales que mencionamos persistirían.
Por éste aspecto fundamental de diseño, el desempeño de aplicaciones de misión crítica en Nutanix puede ser considerablemente superior. Entre varios otros tipos de aplicaciones ya validadas, es también por ésto que Nutanix fue el primer proveedor de HCI en ser certificado por SAP para correr HANA.
- Recuperabilidad/resiliencia
Nutanix posee funciones nativas para la toma de snapshots ligeros, de muy bajo impacto en el desempeño así como en la ocupación de espacio de almacenamiento, haciendo uso del método Redirect-on-Write. Utiliza estos snapshots para proveer backup, así como la habilidad de entregar Self Service Restore, o restauración granular de los respaldos para los usuarios de las VMs sin tener que integrar ninguna herramienta de terceros. Adicionalmente, lleva a cabo replicación entre datacenters así como alojamiento de respaldos en la nube pública de Amazon o Microsoft Azure, todo de manera nativa. Un video de cómo funciona se puede encontrar en: https://www.youtube.com/watch?v=c6UKQPX8CE8
- Seguridad
El software de Nutanix trae un nivel alto de hardening aplicado de fábrica. Adicionalmente, asegura que a lo largo de la vida de la solución siempre se mantenga alineado con el hardening pues automáticamente está verificando y resolviendo desviaciones, función conocida como SCMA o Security Configuration Management Automation. Por otro lado, el compromiso con la Integridad de los datos alojados en Nutanix es completo, pues el software automáticamente lleva a cabo revisiones frecuentes de checksum para cada extent almacenado en el clúster, resolviendo también automáticamente los problemas que encuentre al respecto.
El cifrado de los datos en reposo, lo puede llevar a cabo Nutanix incluso sin depender de una solución de terceros para el manejo de llaves (Key Management Servers) sino que nativamente puede cifrar cada dato alojado en el clúster para imposibilitar que sean accedidos al retirar los discos.
Conclusión
Hay mucho más que estaremos contando acerca de ésta historia, pero confío en que la información proveída en éste post sirva como referencia para muchos de los casos en los que ésta pregunta surgirá.
Saludos!