A temida perda de dados parece algo improvável? Se sua empresa ainda não tem um plano de recuperação de desastres, repense. 76% das organizações entrevistadas pela Arcserve relataram ter sofrido grave perda de dados críticos.
Além de ataques hackers, que estão cada vez mais robustos e agressivos, falhas humanas e problemas simples, como a queda de energia, podem comprometer informações sensíveis, afetando os negócios e até a sobrevivência da empresa.
Frente a qualquer tipo de problema, um plano de recuperação de desastres é fundamental e, neste artigo, vamos explicar como elaborar um documento com orientações adequadas para salvar os dados e manter sua empresa operando. Confira!
Plano de recuperação de desastres de TI: o que é
Um plano de recuperação de desastres ou disaster recovery (DR) é um documento com todas as políticas, medidas e responsáveis por executar ações visando a recuperação da infraestrutura tecnológica e dos sistemas da empresa, caso algum desastre ocorra.
E o que seria um desastre? A lista é ampla. Podemos considerar problemas causados pela interferência humana, seja um ataque cibernético ou uma simples falha, desastres naturais, como uma inundação, ou falhas da própria tecnologia.
Em todo caso, falamos de eventos que resultam em perda de dados e/ou comprometem a disponibilidade dos recursos tecnológicos da empresa, prejudicando o fluxo normal de trabalho e entregas.
Com base nisso, o plano de recuperação de desastres é um guia que considera todas as situações possíveis e apresenta estratégias adequadas e instruções detalhadas para a solução de cada problema.
Plano de recuperação de desastres de TI: principais métricas
Um bom plano de recuperação de desastres deve considerar duas métricas importantes em relação ao tempo: RPO e RTO.
Recovery Point Objective
RPO é sigla para Recovery Point Objective e tem a ver com a quantidade de dados que a empresa pode perder sem ter suas operações vitais afetadas. Assim, estabelece um limite de tolerância frente a um desastre e esse limite tem relação direta com a rotina de backups da organização.
Se os backups são feitos diariamente às 18h e um desastre ocorrer às 10h, o ponto de recuperação será às 18h do dia anterior. Ou seja, tudo o que foi salvo no último backup pode ser recuperado e o limite de tolerância considera os dados gerados desse momento em diante.
O RPO pode ter um limite menor, para aumentar o volume de informação salva e, para tanto, a empresa precisa determinar backups mais frequentes, realizando-os de 12h em 12h, por exemplo. Em todo caso, falamos de um ciclo que deve considerar o que a empresa precisa para seguir trabalhando normalmente, mesmo que um desastre ocorra.
Recovery Time Objective
Por sua vez, RTO é sigla para Recovery Time Objective e tem a ver com o tempo máximo que a TI pode levar para restabelecer um sistema ou o ambiente afetado pelo desastre.
Assim, a empresa precisa descobrir por quanto tempo pode ficar com o sistema parado sem que isso afete sua produtividade ou cause problemas de segurança. Com esse limite de tolerância definido, a TI pode determinar quais ferramentas e processos precisa seguir para conseguir fazer o download de dados, a reinstalação de softwares e aplicações, bem com os ajustes necessários em tempo hábil.
Como estratégia parte do plano de recuperação de desastres, a empresa precisa definir quais processos são mais críticos e, portanto, têm um RTO menor, devendo ser considerados prioridade no processo. Também deve criar orientações quanto às alternativas a serem seguidas caso o RTO seja ultrapassado.
Plano de recuperação de desastres de TI: o que deve incluir
As métricas aparecem primeiro porque são de extrema importância para o plano de recuperação de desastres, mas a há outros elementos que precisam fazer parte desse documento:
Objetivos
O objetivo do plano deve estar claro, indicando o que a empresa deseja alcançar durante e depois de um desastre, incluindo o objetivo do RPO e do RTO.
Para o RPO, o plano de recuperação de desastres deve indicar quantos dados a empresa está disposta a perder. Exemplo: pode-se perder, no máximo, cinco horas de dados, o que, nesse caso, significa que os backups devem ser realizados pelo menos a cada cinco horas.
Por sua vez, para o RTO, a empresa deve indicar o tempo limite de inatividade frente a um desastre. Exemplo: a TI deve viabilizar a retomada plena das operações em até quatro horas para evitar impactos graves aos negócios e seus processos.
Pessoal
Também é fundamental que o plano de recuperação de desastres indique quem são as pessoas responsáveis pelo cumprimento de cada ação descrita no documento. Para tanto, existem duas dicas importantes:
- A indicação não precisa ser nominal, podendo focar no cargo ou função exercida pelo profissional. Assim, não é preciso atualizar o documento sempre que houver mudança no quadro de funcionários;
- É necessário indicar quem assume a responsabilidade caso alguém esteja indisponível no momento do desastre.
Inventário de TI
O inventário é basicamente uma lista atualizada com todos os detalhes sobre ativos de hardware e software, bem como de serviços de nuvem que sejam necessários para a operação diária da empresa. Tudo discriminado com indicações sobre seu nível de criticidade, e status quanto a serem propriedade da empresa, alugados ou usados como um serviço.
Isso permite que a TI e os responsáveis por executar o plano possam conferir se tudo que compõe o ambiente de TI da empresa está recebendo a devida atenção durante a recuperação de desastres.
Procedimentos de backup
Como vimos, o plano de recuperação de desastres tem uma relação muito próxima com a rotina de backup da empresa. Por isso, o documento deve definir como deve ser feito o backup de cada recurso de dados, indicando exatamente onde, em quais dispositivos, em quais pastas e como a equipe deve fazer a recuperação de cada um desses recursos.
Procedimentos de recuperação de desastres
Ainda, é crucial entender que a recuperação de desastres é diferente do backup em si e que, portanto, tem procedimentos específicos que devem englobar todas as respostas de emergência frente a qualquer tipo de problema. Entram na lista:
- Backups de última hora;
- Procedimentos de mitigação e limitação de danos;
- Ações para a eliminação de ameaças à segurança cibernética.
Locais para a recuperação de desastres
Um bom plano precisa indicar um local de recuperação de desastres ativo, remoto e que permita que dados sejam frequentemente copiados para backup ou replicados em um data center alternativo que contenha todos os sistemas críticos da empresa.
A ideia é que, frente a qualquer desastre, as operações possam ser instantaneamente transferidas para um hotsite, favorecendo a continuidade do fluxo de trabalhos da organização.
Procedimentos de restauração
Por fim, é de suma importância que o plano de recuperação de desastre inclua orientações detalhadas sobre cada procedimento de restauração para a perda completa de sistemas.
Isso significa que cada detalhe necessário para recolocar os negócios online e funcionando plenamente de novo precisam estar no plano. Veja abaixo alguns dos procedimentos a serem considerados:
- Contar com uma abordagem estruturada para atingir os objetivos de RPO e SLA;
- Incluir detalhes críticos para procedimentos de recuperação frente a diferentes tipos de desastre; de ataques hackers a desastres naturais;
- Conter uma lista de toda a equipe de TI, incluindo funções, responsabilidades e informações de contato;
- Assegurar que cada membro da equipe conheça o plano de recuperação de desastres e saiba qual seu papel ou a quem recorrer;
- Garantir acessos e senhas necessárias para a execução do plano de recuperação;
- Definir um contato de Relações Públicas para que a organização possa se posicionar para a sociedade caso o desastre demande atenção a essa comunicação com os clientes e o público em geral.
Plano de recuperação de desastres de TI: como elaborar
O plano de desastres precisa ser desenvolvido com base na realidade da sua empresa, de modo a conter orientações possíveis de serem seguidas e explicadas de maneira clara e objetiva. Para chegar a esse resultado é preciso:
- Analisar toda a infraestrutura de TI da empresa ― para identificar a situação dos equipamentos e da rede utilizados na rotina de trabalho;
- Identificar fraquezas e possíveis riscos ― reconhecer as falhas de segurança e outros fatores que exponham a empresa a prováveis riscos e, ainda, apontar quais seriam esses riscos para entender o que poderia levar a uma situação de desastre;
- Determinar medidas para administrar essas fraquezas e reduzir riscos ― para que a empresa e seus colaboradores conheçam as ações necessárias para evitar problemas e minimizar suas consequências;
- Designar colaboradores ― em uma situação de desastre, colaboradores devem estar cientes de suas funções para colocar em prática medidas de segurança ou recuperação e outras ações protetivas, como a realização das rotinas de backup e contato com empresas que prestem suporte ao departamento de TI;
- Definir quais são as medidas prioritárias ― com base nos serviços mais cruciais para a empresa, visando garantir que as medidas de recuperação priorizem o que é mais vital e valioso para o negócio;
- Elaborar um checklist de recuperação ― para guiar a realização das medidas e melhor direcionar a equipe;
- Documentar medidas e responsáveis ― para que toda empresa tenha acesso a essas informações, saiba como proceder e a quem recorrer em caso de desastres.
Plano de recuperação de desastres de TI: benefícios
Não há dúvidas de que elaborar um plano de recuperação de desastres é um processo trabalhoso, mas os benefícios superam o desafio. Para além da vantagem óbvia de garantir a continuidade das operações em qualquer situação, há outras vantagens para a empresa. Veja:
Eficiência de custos
Existem diferentes elementos em um bom plano de recuperação que favorecem a eficiência de custos:
- Ações de prevenção de riscos: reduzem a ocorrência de problemas, sobretudo os causados por falhas humanas, evitando perdas e prejuízo;
- Ações de detecção de problemas: contribuem para que qualquer falha ou situação seja identificada o mais rápido possível, reduzindo o tempo de resposta;
- Ações corretivas: levam à restauração dos dados perdidos, garantindo a rápida retomada das operações e minimizando impactos ao fluxo de trabalho e às entregas da empresa.
Além disso, se a organização opta por fazer o gerenciamento de dados baseado em nuvem como parte do seu plano de recuperação de desastres, reduz ainda mais os custos de backup e manutenção dos sistemas de TI.
Aumento de produtividade
O plano de recuperação de desastres assegura que cada profissional conheça suas responsabilidades frente a um problema e tenha todos os recursos que precisa para agir. Isso favorece a produtividade, inclusive porque designa suplentes.
Maior capacidade de reter clientes
Um bom plano garante que a empresa consiga responder rapidamente a qualquer desastre, evitando ou minimizando os impactos para seus clientes e outros stakeholders. Isso diminui as chances de que algum problema afete a reputação e a credibilidade da organização, levando a perda de clientes e fornecedores.
Escalabilidade
O plano de recuperação de desastres aproxima a empresa de soluções inovadoras capazes de reduzir os custos de manutenção de backups e recuperação usando, por exemplo, soluções baseadas em nuvem que garantem mais flexibilidade e escalabilidade.
Além disso, o plano tende a reduzir o risco de falhas humanas, elimina hardwares desnecessários e otimiza os processos da TI. Com isso, tende a tornar o negócio como um todo mais ágil, resiliente e lucrativo.
Plano de recuperação de desastres de TI: conte com a Prolinx
Uma empresa que conte com uma TI interna robusta e devidamente capacitada pode reunir a expertise necessária para desenvolver um plano de recuperação de desastres por conta própria, mas essa não é a realidade mais comum.
Organizações de menor porte tendem a lidar com a falta de pessoal suficiente para executar essa tarefa e até as maiores podem considerar um desafio incluir o desenvolvimento de um documento tão detalhado e importante nas responsabilidades da TI interna.
Sendo assim, a decisão mais apropriada tende a ser contar com a ajuda de especialistas terceirizados, como a Prolinx. A alternativa é interessante porque, além de conhecimentos e da experiência para a elaboração de um plano claro e eficiente, nossos especialistas têm conhecimento para identificar riscos e corrigir falhas de segurança, diminuindo as chances de a empresa passar por qualquer tipo de desastre.
Achou interessante e quer saber mais sobre como a Prolinx pode ajudar no desenvolvimento plano de recuperação de desastres para a sua organização? Entre em contato!