As empresas modernas estão agora mais vulneráveis a desastres de TI do que nunca devido à sua grande dependência da infraestrutura de TI. Sempre que os dados são perdidos, o software não responde ou o hardware e o equipamento de rede falham, uma organização perde uma grande quantia de dinheiro. Mas há uma solução para minimizar o impacto ou até mesmo evitar isso – recuperação de desastres.
A recuperação de desastres é um conjunto de ferramentas e políticas que ajuda a restaurar dados, aplicativos e hardware de missão crítica para garantir a continuidade dos negócios após um incidente repentino de TI.
Sólido estratégia de recuperação de desastres deve ser baseada em uma estratégia de recuperação de desastres com um plano sendo parte integrante dela e tendo valores RTO e RPO claramente definidos. Antes de prosseguirmos, vamos elaborar esses termos.
Um plano de recuperação de desastres (DRP) é uma sequência documentada e acordada de etapas que devem ser tomadas quando ocorre um desastre de TI.
Um Recovery Time Objective (RTO) refere-se à quantidade máxima de tempo que pode passar após um incidente ocorrer antes que um determinado aplicativo ou serviço esteja funcionando novamente. Por exemplo, se uma organização usa um aplicativo de reconhecimento facial, e esse aplicativo tem um objetivo de tempo de recuperação de dez minutos, ele deve começar a funcionar novamente e estar disponível online dentro de dez minutos após uma interrupção.
Um Recovery Point Objective (RPO) é tecnicamente caracterizado por uma quantidade de tempo também, mas na verdade ele se refere à quantidade de dados que uma organização pode perder entre backups. Um RPO de 24 horas significa que, em caso de um desastre de TI, uma cópia dos dados que serão restaurados terá no máximo 24 horas. Em outras palavras, um recovery point objective determina a frequência com que uma cópia de snapshot do sistema é criada e copiada.
Para saber mais sobre os recursos essenciais da recuperação de desastres e os princípios básicos para elaborar um plano de recuperação de desastres, consulte o 'Como preparar sua empresa para um desastre de TI artigo.
As empresas buscam se recuperar de desastres de TI o mais rápido possível e com perdas mínimas, então não é nenhuma surpresa que elas prefiram optar por serviços confiáveis de um provedor renomado. É por isso que o Azure Site Recovery, que é um serviço de recuperação de desastres da Microsoft, é uma escolha óbvia para a maioria das empresas. Como resultado, a ASR foi nomeada líder do setor pela Gartner em 2016 e não perdeu sua posição de liderança desde então.
O Azure Site Recovery é uma boa escolha para organizações que têm cargas de trabalho de missão crítica executadas principalmente no VMware ou Hyper-V. O DRaaS da Microsoft é intimamente integrado ao Microsoft Endpoint Configuration Manager (antigo System Center Configuration Manager), um produto de software desenvolvido para gerenciar grandes conjuntos de computadores executando Windows NT, Windows Embedded, macOS, Linux ou UNIX, bem como vários sistemas operacionais móveis, o que torna o ASR conveniente para organizações que aderem à pilha da Microsoft.
O Azure Site Recovery permite que máquinas virtuais físicas locais, máquinas virtuais do Azure, Hyper-V e VMWare façam failover em caso de desastre e façam failback depois que ele for resolvido.
Inicialmente, a solução de recuperação de desastres da Microsoft era focada em armazenamento, eventualmente se expandindo para recuperação de desastres como serviço; agora, ela conta com um processo de replicação de dados quase constante, o que torna possível manter cópias sincronizadas.
O ASR também é famoso por sua eficiência de custo — apesar de ser embalado com um conjunto de recursos de backup, recuperação de desastres e relatórios, ele custará menos do que a maioria de seus concorrentes do setor. De certa forma, o Azure Site Recovery é uma alternativa de baixo custo para abordagens mais convencionais, onde as únicas despesas necessárias são com armazenamento para dar suporte aos instantâneos do aplicativo, a retenção de pontos de recuperação e uma taxa de serviço mensal.
O ASR é capaz de integração com soluções de continuidade de negócios e recuperação de desastres como Oracle Data Guard e SQL Always On. Do ponto de vista de proteção de carga de trabalho e aplicativo, o Site Recovery integra-se facilmente com inúmeras cargas de trabalho, incluindo DNS, Exchange, Active Directory, SAP, etc.
Como já dissemos, um objetivo de ponto de recuperação (RPO) e um objetivo de tempo de recuperação (RTO) são propriedades críticas de qualquer solução de recuperação de desastres, e é nisso que o ASR é bom — para a maioria das máquinas virtuais, um limite de RPO não excede 30 segundos, e para algumas delas a replicação é contínua. Quanto a um RTO, uma organização deve usar o Azure Traffic Manager, um balanceador de carga de tráfego baseado em DNS que distribui o tráfego entre as regiões do Azure, para reduzi-lo drasticamente, facilitando assim um eventual processo de recuperação.
Por outro lado, há algumas desvantagens que devem ser seriamente levadas em consideração antes de decidir se prefere o Azure Site Recovery em vez de outras soluções de recuperação de desastres.
Em primeiro lugar, a solução de recuperação de desastres do Azure exige um alto nível de conhecimento especializado, o que torna impossível usá-la sem um especialista em TI interno ou autônomo para todos os cenários de recuperação de desastres, exceto os mais simples.
Outra grande desvantagem do Azure Site Recovery é a falta de automação — por exemplo, o failover é um processo completamente manual, o que pode acabar sendo caro sem a devida consideração e conhecimento.
Mais uma deficiência que não deve ser ignorada é que o ASR requer software adicional para ser totalmente operacional e repleto de recursos. Assim, como já observado, para manter um RTO baixo, o Azure Traffic Manager deve ser usado. Ou, se uma organização executar configurações de várias VMs, o System Center Virtual Machine Manager será adicionalmente necessário.
Antes de prosseguir para a configuração de recuperação de desastres, as organizações devem certificar-se de que montaram uma estratégia sólida de recuperação de desastres para implementar. Na maioria dos casos, ela deve lidar com os seguintes problemas:
Depois que tiverem a estratégia em mãos, eles podem começar a colocá-la em prática.
A Microsoft sugere quatro cenários principais de recuperação de desastres para o Azure:
Dependendo do cenário escolhido, um plano de ação diferente será aplicado, mas na maioria dos casos incluirá estas etapas:
Para saber mais sobre cenários específicos e planos de ação apropriados, consulte o Seção de documentação do Microsoft Azure.
Vamos traçar um ponto final aqui. Como desastres de TI são uma ameaça para empresas que dependem de infraestrutura de TI, a recuperação de desastres se torna crucial no mundo moderno. Para ter certeza de que realmente vale a pena, basta calcular quanto sua organização pode perder em caso de horas de inatividade e comparar isso com o custo de adotar a recuperação de desastres. O MS Azure é uma solução com rica funcionalidade e flexibilidade de personalização disponível a um baixo custo, o que o torna uma das melhores ofertas para resiliência de TI.
No entanto, para ver o quadro completo, você deve se lembrar de que é preciso profundo conhecimento para configurar a recuperação de desastres no Azure. Existem outras desvantagens, como a falta de automação ou dependência de software adicional, que devem ser cuidadosamente consideradas antes de tomar uma decisão final sobre qual solução de recuperação de desastres escolher.
Uma descrição completa do Hystax OptScale como uma plataforma de capacitação FinOps – recursos, benefícios e funcionalidades do produto.
Grandes insights críticos sobre benchmarks, tendências e práticas recomendadas de gerenciamento de nuvem híbrida.
Descubra como analisar métricas de nuvem e obter recomendações de otimização de nuvem com base no seu uso.
1250 Borregas Ave, Sunnyvale, CA 94089, EUA | [email protected]