¿Qué es un desastre de TI?
La mayoría de las empresas dependen en gran medida de la infraestructura de TI para crear, procesar y comunicar rápidamente grandes volúmenes de datos. Por eso, incluso unas pocas horas de interrupción del negocio, ya sea un fallo del sistema o una simple ralentización, pueden hacer que su negocio se tambalee. Estas interrupciones suelen ser el resultado de un desastre de TI, que a su vez puede estar provocado por diversos factores, desde desastres naturales hasta errores humanos y ataques cibernéticos.
¿Qué es un plan de recuperación ante desastres de TI y por qué es importante?
La mejor manera de minimizar los efectos negativos de un desastre informático es contar con un plan de recuperación ante desastres. Un plan de recuperación ante desastres informáticos, o DRP, es un conjunto de instrucciones paso a paso diseñadas para minimizar el impacto de los desastres informáticos naturales o provocados por el hombre. Con él en la mano, obtendrá los siguientes beneficios:
- Interrupción mínima o nula en las operaciones comerciales
- Recuperación rápida de cargas de trabajo críticas para la misión
- Personal de TI bien preparado con un plan de acción definido
- Alcance de daños predecible y limitado
Para poder elaborar un plan de recuperación ante desastres, deberá tomar medidas específicas. Veámoslas en detalle.
Paso 1. Describa los procesos y recursos que son cruciales para su negocio
En primer lugar, priorice sus procesos empresariales y determine cuáles de ellos deben restaurarse inmediatamente después de una interrupción a cualquier precio. A continuación, defina las aplicaciones de las que dependen sus procesos más importantes. Analice la duración aceptable de la interrupción para cada aplicación y asigne a los miembros del personal que serán responsables de la recuperación. A continuación, eche un vistazo a sus procesos y recursos empresariales desde el punto de vista de su empresa mediante la realización de un análisis de impacto empresarial. Le ayudará a averiguar cómo se verán afectados los distintos aspectos de su negocio por el tiempo de inactividad. Este análisis debe abarcar los riesgos legales y de cumplimiento normativo, así como el coste del tiempo de inactividad y la pérdida de ingresos. El paso debería dar como resultado una lista ordenada por la importancia de sus activos.
Paso 2. Determine cuánto tiempo puede permitirse que su empresa esté inactiva
En este paso, tratará términos como RPO, RTO y MTD. RPO, u objetivo de punto de recuperación, es básicamente la cantidad máxima aceptable de tiempo entre las copias de seguridad de sus datos. RTO significa objetivo de tiempo de recuperación, que es la cantidad máxima de tiempo necesaria para la restauración completa de su sistema después de una interrupción. MTD, o tiempo de inactividad máximo tolerable, es una métrica general que muestra cuánto tiempo su empresa puede permitirse estar fuera de línea sin correr riesgos. Determine estas métricas con cuidado y luego continúe con el siguiente paso.
Paso 3. Encuentre una solución de recuperación ante desastres rentable que se adapte mejor a sus necesidades
Si le pregunta a Google sobre la recuperación ante desastres, verá docenas de proveedores de servicios con cientos de opciones: una gran cantidad de opciones. Para evitar perderse en esta abundancia, recuerde que su objetivo es proteger sus datos y mantener los costos razonables. Utilice los resultados de la investigación que realizó en los pasos anteriores para definir el conjunto adecuado de características y propiedades para su caso.
Por lo general, una solución de recuperación ante desastres eficaz incluye las siguientes características esenciales:
- Copia de seguridad automática. El software que elija debe cumplir con su objetivo de recuperación de desastres (RPO), de modo que sus datos se respalden automáticamente dentro de los intervalos requeridos.
- Desduplicación. Esta función le permite optimizar la cantidad de datos eliminando los duplicados, lo que minimiza los costos de almacenamiento.
- Replicación. Una opción que a menudo se pasa por alto, pero que, de hecho, es la piedra angular de casi cualquier plan de recuperación ante desastres. La replicación le permite tener copias exactas de sus datos en varios servidores y es perfecta para restaurar rápidamente el acceso a sistemas críticos después de un desastre, lo que garantiza tiempos de recuperación más cortos.
- Plan de recuperación ante desastres. Toda solución de recuperación ante desastres debe incluir un plan de recuperación ante desastres. La mayoría de los proveedores de soluciones ofrecen el desarrollo de un plan de recuperación ante desastres basado en el análisis de su empresa y sus cargas de trabajo y activos de misión crítica.
- Orquestación. Al ser una forma de automatización, la orquestación garantiza que los sistemas críticos y las operaciones comerciales vuelvan a funcionar durante una interrupción del servicio.
- Retorno automático. Esta función permite que los sistemas regresen a su sitio principal original tan pronto como se restablezca su funcionalidad.
- Descarga de instantáneas. Si desea poder devolver una parte o incluso todo el entorno a un estado original o anterior, puede considerar optar por esta función.
- Monitoreo. Una solución de recuperación ante desastres sólida debería permitirle monitorear el estado actual de sus activos de TI y, en última instancia, prevenir cualquier desastre con anticipación.
La lista completa no se limita únicamente a estas características: las soluciones de recuperación ante desastres avanzadas son complicadas y conllevan más aspectos. Con tantas ofertas dentro del nicho de soluciones de recuperación ante desastres, será mejor pedirle a sus posibles proveedores de recuperación ante desastres que lo ayuden a tomar la mejor decisión, analizar las tecnologías que ofrecen y evaluar su experiencia en el proceso.
Paso 4. Pruebe, ajuste y mantenga actualizado su plan de recuperación ante desastres
Para que su plan de recuperación ante desastres funcione, debe probarlo con el método de prueba hasta que falle. En otras palabras, considere escenarios en los que su plan pueda fallar; de esta manera, podrá encontrar sus principales fallas y resolverlas. Además, esto le ayudará a mantenerse a usted y a su personal clave en forma en caso de una emergencia real. Además, verifique su software, hardware y procesos internos.
Hay diferentes maneras de probar su plan de recuperación ante desastres: desde tutoriales económicos y simples hasta pruebas de interrupción total, que son las pruebas más exhaustivas y más disruptivas que brindan condiciones del mundo real.
Dado que cualquier infraestructura de TI evoluciona continuamente, debe asegurarse de que todos los cambios realizados se reflejen en su plan de recuperación ante desastres. Mantenga su plan actualizado y asegúrese de que los miembros de su personal estén al tanto de las últimas actualizaciones.
¿Qué más debes tener en cuenta para preparar tu negocio ante un desastre de TI?
Recuerde que idear una estrategia de recuperación ante desastres puede no ser suficiente para protegerlo de un desastre informático. De hecho, es solo una parte de un plan de continuidad empresarial, que es un enfoque más estratégico que lo ayudará a recuperarse después de un desastre.
Además de los planes de recuperación ante desastres y continuidad del negocio, es posible que desee considerar otro enfoque, la resiliencia de TI, que tiene que ver con la prevención de desastres de TI. Su objetivo es proteger todas las cargas de trabajo críticas de la empresa contra fallas antes de que ocurran problemas. Si bien siempre es mejor prevenir que curar, ningún sistema puede ser completamente resiliente. Por lo tanto, siempre necesitará planes de recuperación ante desastres y continuidad del negocio para mantener sus cargas de trabajo críticas en funcionamiento.
Leer más sobre Construyendo una estrategia BCDR sólida en nuestro artículo anterior.