Como profesional de la informática, administré un entorno de System Center Configuration Manager (SCCM) para una organización sanitaria. Déjeme darle un ejemplo de una situación en la que la automatización se estropeó durante un despliegue de software rutinario.
SCCM tiene un método que le permite desplegar el software a una, 10 o 10.000 máquinas a la vez. Es un maestro en la instalación de software en miles de máquinas en cuestión de minutos. Las implementaciones de software son un gran ahorro de tiempo y, en este caso, permiten que sólo un par de personas manejen 5.000 computadoras de escritorio. Eso no podría haber sido posible sin una herramienta como SCCM, así que, ¿qué fue lo que falló? Para ser franco, me puse demasiado cómodo.
Una noche, después de pasar todo el día empaquetando una nueva pieza de software que necesitaba ser desplegada en toda la empresa, llegó el momento de llevar el software a todos los 5.000 escritorios. Se creía que era una instalación de software rutinaria. Era un simple MSI que, durante las pruebas, tardaba menos de unos segundos en instalarse y se completaba con éxito cada vez. No estaba muy preocupado por este pequeño MSI. Había sacado paquetes mucho más grandes antes, pero lo que no me di cuenta fue que el tamaño no importaba.
El reloj marcaba las 3 a.m. y era la hora de la ventana de mantenimiento. Estando ya al tanto de las cosas, había preparado a todos los clientes y todos se instalaban a las 3 a.m. en punto. Las instalaciones fueron muy bien… hasta que noté que el servicio de asistencia comenzó a iluminarse. La gente llamaba por problemas aparentemente aleatorios con todo tipo de aplicaciones diferentes. Siendo un hospital, todavía había mucha gente trabajando a esa hora y no estaban contentos. Después de señalar el problema, noté que el despliegue se había dirigido accidentalmente a los SERVIDORES también, lo cual no era mi intención. Aún así, eso habría estado bien, pero un archivo en particular estaba en uso en estos servidores y el MSI decidió iniciar un reinicio!
Después de intentar sin éxito detener las cosas, era demasiado tarde. Había reiniciado casi el 75 por ciento de los 700 o más servidores del centro de datos. Como se puede imaginar, no fue un buen día en absoluto. Después de explicar exactamente qué pasó con la administración al día siguiente, y que fue completamente mi culpa, tuve la suerte de trabajar para un cliente comprensivo y pude mantener mi trabajo. Este fue un caso de la parte mala de la automatización.