Espaço aéreo de Análise de Londres foi efetivamente encerrado na sexta-feira à tarde depois de um servidor de dados de voo caiu, os Serviços de Tráfego Aéreo Nacional (NATS) confirmou ao The Register depois de várias fontes nos deu detalhes específicos do cockup.
Centenas de vôos foram cancelados ou desviados depois NATS foi forçado a restringir o espaço aéreo sobre a capital por menos de uma hora. As operações são agora instalado e funcionando, e NATS diz investigações continuam - mas um par de fontes bem colocadas familiarizadas com a situação ter explicado o que deu errado.
Sistemas de controle de tráfego aéreo são enormemente complicado e cheio de sistemas à prova de falhas; quando você está dirigindo tubos que voam com centenas de pessoas e combustível de aviação altamente combustível, ninguém na NATS apenas asas de TI. Os problemas de hoje foram para baixo a uma combinação de uma falha no servidor e conexão de dados desencadeando os sistemas de segurança automáticos, que garantem que todo mundo fica no chão com segurança, embora um pouco atrasado em alguns casos.
Segurança na duplicação
A fim de manter o céu em funcionamento, o sistema de controle de tráfego aéreo (ATC) usa duplas alimentações de dados. Por um lado, todas as aeronaves têm de entregar um plano de vôo que mostra exatamente quando, onde e em que altitude, eles pretendem voar sobre o Reino Unido. Esses dados são armazenados em um servidor, apelidado de o sistema de processamento de dados de voo.
Ao mesmo tempo, todos os voos no espaço aéreo britânico são rastreados no radar e que as informações são enviadas para um servidor de voo central. Este servidor de voo corresponde ao progresso real do tráfego aéreo no radar com as informações planejado desde o sistema de processamento de dados de voo e alimenta os dados para controladores de operações direcionando o tráfego aéreo.
Na sexta-feira à tarde um IBM S / 390 de mainframe executando o sistema de processamento de dados de voo caiu, de acordo com fontes familiarizadas com o assunto.
Ainda não foi confirmado se foi uma falha de hardware ou software, mas uma fonte bem colocada disse que a máquina nunca tinha tido uma falha de hardware antes, então o software era mais provável. Há um sistema de processamento de dados de voo de backup, que entra em ação dentro de segundos se o primário falhar.
"Invariavelmente alguém coloca um plano de vôo errado e borks o sistema", uma fonte disse ao El Reg sob condição de anonimato.
"Se o mesmo dados vão para o servidor de backup que, às vezes, cair no mesmos problemas de processamento, e começar a mudança e para trás com o servidor principal. Quando chegarmos a transição, em seguida, a primeira coisa que normalmente é feito é para desligar o processador de backup . "
Fazer isso leva tempo, mas os engenheiros da NATS são utilizados para classificar os problemas rapidamente. Eles têm que, uma vez que uma vez que o sistema de processamento de dados de voo falhar, então a contagem regressiva começa antes que as medidas de segurança de emergência assumir o controle.
Se o sistema de processamento de dados de voo é para baixo por mais de oito minutos, os controladores de vôo alertas do servidor que os dados que ele está recebendo é obsoleto. Aeronave pode percorrer um longo caminho em sete minutos e os controladores de vôo alertas do servidor, que então se concentram em radar e começar a encerrar os voos, em um processo descrito como "degradação graciosa."
Trata-se de reduzir o fluxo de aeronaves em espaço aéreo britânico, mediante o encaminhamento de voos em outro lugar ou trazê-los para baixo tão rápida e segura possível ao seu destino. Dada a quantidade de vidas envolvidas aeronaves e segurança dos passageiros sempre precedência sobre a conveniência.
Nenhum comentário:
Postar um comentário