Translate

sexta-feira, 15 de outubro de 2010

Como enfrentar o alto risco e o baixo controle de desastres na nuvem

Indisponibilidade é um problema que só tende a piorar com serviços e manutenção deficientes por parte do fornecedor da solução.
Por CIO/EUA

A exemplo do que acontece em outras empresas de pequeno e de médio porte, minha firma usa os serviços do Google para partilhar a agenda (Google Calendar). A solução se comunica de forma decente com servidores para sincronizar emails e não tem custo. Indubitavelmente isso trouxe, a ainda traz, milhões de usuários para a plataforma. Mas essa fama e adoração toda também evitam que as reclamações de usuários ecoem até as instâncias mais elevadas da organização e a impedem de dar conta de falhas presentes no serviço.

Certa vez tivemos um problema que afetou 0,2% dos usuários do Google Calendar por vários dias. Apesar de serem apenas 2 mil contas, o barulho causado pela insatisfação e ansiedade foram grandes.

Peter Sandman desenvolveu uma maneira de prever o nível de descontentamento de consumidores e de clientes. À medida que o percentual de perigo aumenta e o real controle sobre a questão diminui, mais severa pode ser a reação.

Infelizmente as soluções baseadas na nuvem trazem embutidos os dois fatores. Alto risco e baixo controle sobre eventuais desastres. Na nuvem os usuários não enxergam os outros computadores componentes da rede, também não podem realizar diagnósticos ou descer histericamente o corredor e solicitar ajuda do TI. Sequer o usuário de internet mais experiente tem noção acerca do tempo necessário para a correção de falhas e recuperação de dados. Além disso, os usuários não têm como saber se a página em branco apresentada durante a navegação representa uma indisponibilidade do servidor ou a perda completa do contingente de dados.

O Google só piorou as coisas ao deixar de aplicar os recursos necessários para se blindar contra o ressentimento de usuários frustrados com alguns de seus serviços. Adicionalmente a isso, vários sintomas foram potencializados por soluções de terceiros sobre o qual a organização não tem o menor controle.

O que sua equipe pode aprender com isso

Realizar a cópia de segurança com freqüência de todos os arquivos importantes é altamente recomendado. De fato, muitos deixam de realizar essa cópia pelo fato desse processo não ser automático. Então, que tal organizar pelo menos uma operação de backup semanal dos arquivos salvos na nuvem? Certifique-se de incluir nessa cópia os dados do administrador (DBA).

Antes de se filiar para o uso de serviços que rodem na nuvem, certifique-se de que o termo de uso da empresa prestadora de serviços prevê cobertura em caso de interrupções. Avalie a taxa de disponibilidade dos servidores nas planilhas da empresa e estude o ciclo de atualizações de software dos serviços que pretende contratar. O lacônico ícone de OK e não-OK do Google não é suficiente para essas avaliações.

Analise o histórico de interrupções de serviços do provedor à procura de evidências nas atualizações de vários quesitos técnicos. Se não as encontrar, mal sinal.

Visite os fóruns de discussões dos usuários em comunidades virtuais. Veja como atendem às solicitações de usuários. Se respondem de forma satisfatória e com que velocidade realizam as correções.

Se as intenções de sua organização com a ida para a nuvem forem sérias, esteja preparado para montar sua própria equipe de emergências par dar conta de três pontos cruciais:

1. verificar se o erro não é ocasionado por quem opera o sistema do lado cliente

2. identificar quais etapas de interação entre o cliente e o provedor estão ocasionando os erros.

3. documentar precisamente as ocorrências e as maneiras usadas para contornar as falhas e acompanhe os deadlines prometidos para correção de interrupções de serviços e outras falhas.

Fonte:http://computerworld.uol.com.br/tecnologia/2010/10/14/cloud-computing-nuvem-server-downtime/

Nenhum comentário:

Postar um comentário