Abstract:
|
Atualmente Computação de Alta Performance (HPC) está tornando-se mais necessária e ao mesmo tempo mais acessível. Isso deve-se a tendência de migração das plataformas especializadas para sistemas mais baratos e de propósito geral, ou seja, clusters. No aspecto de manutenção, isso implica em maior empenho por parte do responsável pelo sistema computacional, pois um cluster é formado por vários sistemas independentes. Este trabalho tem como objeto a implementação de uma ferramenta de software que auxilie na tarefa de manutenção de um cluster, monitorando todos os seus nodos e, caso encontre alguma falha, alertando o responsável através de uma mensagem SMS (Short Message Service). O serviço SMS tem basicamente a mesma funcionalidade do serviço de pager, porém garantem a entrega da mensagem mesmo que o dispositivo destino esteja indisponível momentaneamente. |