segunda-feira, 4 de novembro de 2013

MIT boffins: Use software para corrigir erros cometidos por silício em decomposição


Livre Regcast: Nuvem da Microsoft OS


Transistores menores significam mais ruído significa mais erros significa o colapso de tudo o que conhecemos e amamos sobre computadores, tais como a sua capacidade infalível para ser executado com perfeita estabilidade durante anos a fio ... certo?


Bem, talvez não tão perfeito, mas o problema básico permanece: cada vez menores tamanhos recurso microprocessador algum dia start esbarrar em física e transistores vai começar a produzir um número crescente de erros aleatórios.







Isso está levando alguns pesquisadores, incluindo um grupo do MIT, para propor simplesmente deixar os erros acontecem. Conforme descrito neste media anúncio , a idéia é dupla: alguns erros de bits pode ser ignorado (que vai notar um pixel errado ou dois em um filme de alta definição?), e outros pode ser corrigido no software.


Em todo o seu trabalho , os pesquisadores apresentam uma linguagem de programação chamada Confiar: seu trabalho é para trabalhar no pressuposto de que "pequenos erros" vão surgir a partir de transistores, e em vez disso "permite que os desenvolvedores de raciocinar a respeito da confiabilidade quantitativa de uma aplicação - ou seja, , a probabilidade de que ela produz o resultado correto quando executado em um hardware confiável. "


Para isso, contam captura ", um conjunto de restrições que é suficiente para assegurar que uma função satisfaz as especificações de fiabilidade quando executado na plataforma de hardware confiável subjacente". Em outras palavras, ele é projetado para responder à pergunta "qual é a probabilidade de que o hardware vai produzir um resultado sem erros, ou dentro de um limite de erro aceitável?", E se Confie avalia os resultados como igual ou melhor do que a previsão, permite o resultado como "correto".


Como o MIT Martin Rinard coloca no comunicado de imprensa: "Ao invés de fazer [hardware confiável] um problema, gostaria de fazer-lhe uma oportunidade. O que temos aqui é um ... sistema que permite raciocinar sobre o efeito dessa insegurança potencial em seu programa. "


Para funcionar, dependem das necessidades como condição de partida uma avaliação do provável confiabilidade do hardware subjacente. Ele também pressupõe que um modo de operação livre de erros existe - se por abrandar a velocidade do clock do hardware, ou executando-o com maior potência por um tempo - contra o qual o caso de uso pode ser baseline.


O que os pesquisadores estão satisfeitos com é que eles encontraram uma maneira simples para os programadores a bandeira instruções que podem tolerar erros: eles simplesmente marcar a instrução (ou programa) com um ponto. Se ele encontrar um ponto (por exemplo, se vê que a instrução está escrito TOTAL = TOTAL +. ENTRADA), Confie sabe para avaliar os resultados contra as taxas de falhas específicas.


No momento, o "dot-com a tag" código é projetado de modo que os usuários possam testar o desempenho de um programa contra as expectativas, e aperfeiçoar seu código, removendo o ponto-tags, se não encontrar erros de execução. Em trabalhos futuros, de Confie desenvolvedores querem permitir a marcação de blocos inteiros de código, de modo que, por exemplo, eles podem estipular "apenas 97 por cento dos pixels neste quadro de vídeo tem que ser decodificado corretamente".


Claro, nem todo mundo concorda que o software de correção de-hardware é "o caminho do futuro". Seria completamente negligente do registo ignorar o debate, especialmente quando o contra-argumento, de pesquisador de sistemas distribuídos na Microsoft, James Mickens, provavelmente vai ficar como um clássico de TI escrita cômico.


"[John] descobriu vários documentos que descrevem a recuperação assistida por hardware software. A idéia básica era simples: se o hardware sofre falhas mais transitórios, uma vez que fica menor, por que não permitir que o software para detectar cálculos errôneos e re-executá-los? Esta ideia pareceu promissora, até John percebeu que era a pior idéia. Software moderno mal funciona quando o hardware está correta, então contando com software para corrigir erros de hardware é como pedir Godzilla para evitar Mega-Godzilla de aterrorizar Japan. Isto não leva ao aumento dos valores de propriedade em Tóquio ".


O artigo completo, publicado na Usenix, é aqui . Aproveite. ®







via Alimentar (Feed)

Nenhum comentário:

Postar um comentário