segunda-feira, 9 de dezembro de 2013

Como sistema de controle de tráfego aéreo do Reino Unido foi pego dormindo no trabalho


O business case para um multi-tenant, solução Recovery-como-um-serviço baseado em nuvem


A grande falha que atingiu o sistema de controle de tráfego aéreo da Grã-Bretanha no sábado foi devido a uma falha técnica com uma interface de tela de toque fornecido pelo Frequentis, The Register que aprendeu.


No sábado, 07 de dezembro, durante a preparação para um dos momentos mais movimentados do ano para os aeroportos do Reino Unido, os controladores de NATS (Air Services Nacional de Trânsito) sala de operações em Swanwick notou que seu sistema de repente parou de funcionar.







Ele rapidamente se tornou claro que um grande problema se desenrolava que causou atrasos para milhares de passageiros em voos dentro e fora do espaço aéreo Blighty no fim de semana.


Ao meio-dia em um típico sábado, NATS normalmente esperaria estar lidando cerca de 2.000 vôos. Mas no sábado acabado, ele foi forçado a reduzir essa carga em 20 por cento, enquanto seus engenheiros correram para resolver o cockup técnico.


NATS - que se apresenta como uma "parceria público-privada" entre seus próprios funcionários (segurando 5 por cento) sete grandes companhias aéreas (Holding 42 por cento), operador LHR Aeroportos Ltd (4 por cento) e do governo do Reino Unido (segurando uma por 49 cento "golden share") - inicialmente, e vagamente, disse que a falha foi conectado a um sistema de telefone interno que é usado pelos controladores de tráfego aéreo.


Naturalmente, El Reg procurou obter mais detalhes técnicos sobre o que tinha dado errado.


"A interrupção no sábado, foi causado por um problema com um sistema que permite Frequentis nossos controladores para falar com outras partes da operação", disse um porta-voz do NATS.


"Ele usa uma interface de tela sensível ao toque que carrega automaticamente todos os contatos - cerca de NATS e em outros órgãos envolvidos na rede de navegação aérea - que um controlador de que necessita para a parte específica do espaço aéreo que eles estão controlando naquele momento.


"É, portanto, garante que eles sempre podem chegar imediatamente a pessoa que precisa falar com e reconfigurar-se com configurações específicas para o setor que o controlador é responsável quando fazem login por seu turno."


Mas durante mudança de turno rotina de sábado, o sistema - que tem sido usado por NATS por 11 anos - entrou em colapso, forçando os controladores de terra aeronave enquanto os engenheiros tentaram corrigir o erro.


Entende-se que o sistema de telefone touchscreen não conseguiu configurar corretamente para que novas posições pode ser aberto para dividir os setores extras necessários para o controle do espaço aéreo durante o dia.


Os atrasos foram registrados nos aeroportos, incluindo Londres, Cardiff, Edimburgo, Glasgow e Dublin. NATS disse na época que a falha não comprometeu a segurança dos passageiros, mas alguns questionaram por contingência não chutar plenamente quando o sistema falhou.


NATS disse no sábado:



As medidas de contingência técnicas e operacionais que tivemos no local durante todo o dia nos permitiram entregar mais de 80 por cento da nossa operação normal. A redução da capacidade teve um efeito desproporcional sobre o sul da Inglaterra, pois é extremamente complexo e movimentado espaço aéreo e sinceramente me arrependo transtornos para nossos clientes de companhias aéreas e seus passageiros.


Para ser claro, este é um sistema muito complexo e sofisticado, com mais do que um milhão de linhas de software. Isto não é simplesmente telefones internos, é o sistema que os controladores usam para falar com outros órgãos ATC tanto no Reino Unido e na Europa e é o maior sistema de seu tipo na Europa.



Ele acrescentou que havia trabalhado em estreita colaboração com Frequentis para obter o sistema instalado e funcionando. Mas na segunda-feira de manhã, depois de um fim de semana de pressão política sobre a interrupção, NATS patrão Richard Deakin admitiu que era necessária uma investigação sobre a resiliência do espaço aéreo do Reino Unido.


"Estamos muito interessados ​​em fazer todo o possível para garantir a NATS indústria da aviação tem um completo entendimento da capacidade que está em vigor no Reino Unido e tomar todas as medidas ainda mais os nossos clientes e reguladores decidir são necessárias para ajudar a evitar uma repetição da última problemas de sábado ", disse ele.


Deakin acrescentou que o erro levou 14 horas para resolver e afirmou que NATS eventualmente "entregues mais de 90 por cento de uma agenda cheia de vôos durante o dia".


Foi a primeira vez que uma falha técnica tão grave tinha ocorrido desde que o sistema foi instalado em 2002, disse ele.


Mas não podemos deixar de concordar com o povo exasperado encalhado em aeroportos no fim de semana que - bastante razoável - perguntou por que um fracasso poderia ter acontecido em primeiro lugar com um sistema crítico. Redundância, muito? ®







via Alimentação (Feed)

Nenhum comentário:

Postar um comentário