quinta-feira, 6 de fevereiro de 2014

Google admite "garbage in, garbage out" problema de tradução


4 razões para terceirizar seu DNS


Sempre tão inteligente Google Traduz Google serviço pode estar caindo em desgraça com um problema conhecido por engenheiros grisalhos em todo o mundo: o lixo, sai lixo.


O problema foi discutido pelo diretor do Google de pesquisa, Peter Norvig no inovador conferência Conceitos Avançados da Nasa em Stanford, Califórnia na quarta-feira, em resposta a uma pergunta de um membro da platéia.







Norvig admitiu que o Google estava "consciente" de um problema causado por alguns sites que utilizam os serviços do Google para traduzir a sua cópia do corpo para outro idioma para criar uma versão localizada do seu site.


O problema com este método da taxa de corte (armários nus de tradutores fora do trabalho à parte) é que, se o Google indexa este site, ele pode, então, levar a tradução para os modelos ele se utiliza para formar o seu próprio motor de máquina de tradução.


Este problema pós-moderno significa que as máquinas do Google pode estar treinando-se em dados gerados por máquinas do Google, o que significa que ao invés de ficar progressivamente melhor com cada novo modelo, eles simplesmente estagnar.


"Não é um grande problema ainda - que poderia ficar pior", disse Norvig. "Nós principalmente abordá-la por julgar a qualidade de um site Se você olhar bem, vamos manter seus exemplos;. Se você olhar esboçado vamos atirá-los para fora."


O Google já tem procurado tornar mais difícil para os spammers para poluir a web com texto mal traduzido por desligar seu Google Translate API . Norvig também revelou uma abordagem em que o Google tentou impressões digitais cada tradução através da palavra e da sintaxe escolhas precisas que não seria óbvio para o leitor, mas seria óbvio para os bots do Google, mas disse que a empresa tinha se aposentado do esquema, uma vez que não foi eficaz . ®







via Alimentação (Feed)

Nenhum comentário:

Postar um comentário