terça-feira, 18 de março de 2014

Boffins chineses gengibre até Hadoop com OpenFlow funil


Acesso de alto desempenho para armazenamento de arquivos


Poucos duvidam que a premissa de definidas pelo software de networking (SDN) é uma boa: as organizações que executam um monte de máquinas virtuais e redes virtuais podem se beneficiar da flexibilidade e automatização SDN oferece.


Os críticos, no entanto, salientar que SDN em sua forma atual não pode ter particularmente ampla aplicabilidade: simplesmente não há que muitos centros de dados com os problemas de tráfego SDN resolve.







Digite um artigo interessante de estudiosos chineses intitulado "Agendamento de banda-Aware com SDN em Hadoop: Uma Nova Tendência para Big Data" , que propõe SDN como uma solução para um problema de dados grande.


Os autores, de Huazhong Universidade de Wuhan da Ciência e Tecnologia, note que o Hadoop tem vários programadores de tarefas, mas nenhum deles leva em conta a largura de banda disponível. Essa falta, argumentam eles, significa "perder oportunidades para atribuição de tarefas otimizada."


Com o paralelismo do Hadoop uma de suas principais vantagens, perdendo a chance de encaixar em um emprego não é, obviamente, um grande resultado. Os estudiosos, portanto, a pergunta: "Podemos combinar a capacidade de SDN controle de banda com o sistema Hadoop para explorar uma solução de programação de tarefa otimizada que tem alta eficiência e agilidade em termos de trabalho o tempo de conclusão para o processamento de big data?"


Sem surpresa, a resposta é sim, graças a um novo agendador de tarefas que se propõem chamado de "Agendamento de banda-Aware com SDN em Hadoop", ou "BASS".


Abordagem BASS "é a interface com um controlador OpenFlow para aprender o máximo que puder sobre a largura de banda disponível em um cluster Hadoop e seu equipamento de rede de atendimento. Uma vez BASS reuniu esses dados, ele aloca tarefas baseadas em como rapidamente a rede pode levá-lo a um nó Hadoop.


Os autores oferecem resultados dos testes sugerem BASS é um pouco mais rápido do que outros programadores de emprego e até mesmo sugerir uma melhoria chamado "Pré-BASS" que adiciona alguma preparação de pré-processamento extra para que as filas podem ser ainda mais eficiente.


Os detalhes do papel testes feitos em um cluster Hadoop seis nó espalhados por dar hosts físicos. Isto é, naturalmente, muito aquém da escala em que muitos clusters Hadoop operar, mas os autores são otimistas que pode escalar BASS no futuro. ®







via Alimentação (Feed)

Nenhum comentário:

Postar um comentário