Amazon como um simples comando “Typo Tomb Down Amazon S3 ” tirou parte da Internet do ar
Por Swati Khandelwal
“No, It wasn’t a cyberattack; A simple Command Typo took down Amazon S3 and big chunk of the Internet
#HumanError“
Como um simples comando Typo Tomb Down Amazon S3 grande parte da Internet saiu do ar por 5 horas
A Amazon admitiu que um comando incorretamente digitado durante uma depuração de rotina do sistema de faturamento da empresa causou a interrupção de 5 horas de alguns servidores Amazon Web Services (AWS) na terça-feira, 28 de fevereiro.
O problema tirou dezenas de milhares de sites e serviços do ar que ficaram completamente indisponível, enquanto outros mostram imagens quebradas e links, o que deixou os usuários on-line em todo o mundo confuso.
Os sites e serviços afetados pela interrupção incluem Quora, Slack, Médio, Giphy, Trello, Splitwise, Soundcloud e IFTTT, entre uma tonelada de outros sites.
Aqui está o que aconteceu
Na manhã de terça-feira, membros da equipe do Amazon Simple Storage Service (S3) estavam depurando o sistema de faturamento de armazenamento em nuvem S3.
Como parte do processo, a equipe precisava trabalhar em alguns servidores de faturamento off-line, mas infelizmente, funcionários da Amazon, acabaram derrubando um grande conjunto de servidores.
“Infelizmente, uma das entradas para o comando foi inserida incorretamente, e um conjunto maior de servidores foi removido “, disse a Amazon. “Os servidores que foram inadvertidamente removidos suportaram dois outros subsistemas S3.” … Ups.
Quanto à razão pela qual demorou mais do que o esperado para reiniciar determinados serviços, a Amazon diz que alguns de seus servidores não foram reiniciados em “muitos anos”.
Como o sistema S3 tem experimentado um crescimento massivo nos últimos anos, “o processo de reiniciar esses serviços e executar as verificações de segurança necessárias para validar a integridade dos metadados levou mais tempo do que o esperado”.
A empresa pediu desculpas pelo inconveniente enfrentado por seus clientes e prometeu que vai rever sua política de atualizações.
A Amazon disse que a empresa está fazendo “várias mudanças” como resultado desse incidente, incluindo medidas para evitar que uma entrada incorreta desencadeie tais problemas no futuro.
O erro de digitação que causou a interrupção da internet semana passada também nocauteou o AWS Service Health Dashboard, então a empresa teve que usar sua conta do Twitter para comunicar o incidente aos clientes.
Fonte: http://thehackernews.com