Como os carros autônomos reconhecem coisas como sinais de rua e pedestres.

Em 2012, Geoffrey Hinton mudou a maneira como as máquinas vêem o mundo.

Junto com dois estudantes de pós-graduação na Universidade de Toronto, o Sr. Hinton, professor lá, construiu um sistema que poderia analisar milhares de fotos e se ensinar a identificar objetos comuns como flores e carros com uma precisão que não parecia possível.

Ele e seus alunos logo se mudaram para o Google, e a técnica matemática que impulsionou seu sistema – chamado rede neural – espalhou-se pelo mundo tecnológico. É assim que os carros autônomos reconhecem coisas como sinais de rua e pedestres.

Mas, como o próprio Sr. Hinton observa, sua idéia teve seus limites. Se uma rede neural é treinada em imagens que mostram uma xícara de café apenas de um lado, por exemplo, é improvável que reconheça uma xícara de café virada de cabeça para baixo.

Agora, o Sr. Hinton e Sara Sabour, um jovem pesquisador do Google, estão explorando uma técnica matemática alternativa que ele chama de uma rede de cápsulas. A idéia é construir um sistema que veja mais como um ser humano. Se uma rede neural vê o mundo em duas dimensões, uma rede de cápsulas pode vê-lo em três.

O Sr. Hinton, um expatriado britânico de 69 anos, abriu o laboratório de inteligência artificial da Google em Toronto este ano. O novo laboratório é emblemático do que alguns acreditam ser o futuro da pesquisa tecnológica de ponta: muito do que se espera que aconteça fora dos Estados Unidos na Europa, na China e em A.I. centros de pesquisa, como Toronto, que são mais acolhedores para pesquisadores imigrantes.

A Sra. Sabour é uma pesquisadora iraniana que terminou em Toronto depois que o governo dos Estados Unidos lhe negou um visto para estudar a visão computacional na Universidade de Washington.

Sua tarefa é transformar a idéia conceitual de Mr. Hinton em uma realidade matemática, e o projeto está dando frutos. Eles publicaram recentemente um artigo que mostra que, em certas situações, seu método pode reconhecer objetos com mais precisão ao vê-los a partir de ângulos desconhecidos.

“Pode generalizar muito melhor do que as redes neurais tradicionais que todos estão usando agora”, disse Sabour.

Quando entrei em seu escritório este mês, o Sr. Hinton, vestido com sua habitual camisa com botão e camisola, me entregou dois grandes blocos brancos. Eles pareciam algo que ele havia encontrado no fundo de um velho baú de brinquedo.

Ele explicou que os blocos eram duas metades de uma pirâmide, e ele perguntou se eu poderia colocar a piramide novamente. Isso não parecia muito difícil. Os blocos eram de forma estranha, mas cada um tinha apenas cinco lados. Tudo o que eu tinha que fazer era encontrar os dois lados que combinavam e alinhá-los. Mas não pude.

A maioria das pessoas falha neste teste, ele me disse, incluindo dois professores titulares no Massachusetts Institute of Technology. Um se recusou a tentar, e o outro insistiu que não era possível. É possível. Mas todos nós falhamos, explicou o Sr. Hinton, porque o enigma esconde a maneira natural de ver algo como uma pirâmide.

Nós não reconhecemos um objeto olhando um lado e depois outro e depois outro. Imaginamos a coisa toda sentada no espaço tridimensional. E por causa da forma como o quebra-cabeça corta a pirâmide em dois, isso nos impede de imaginá-lo no espaço 3-D, como normalmente faria.

Com suas redes de cápsulas, o Sr. Hinton pretende finalmente dar às máquinas a mesma perspectiva tridimensional que os humanos têm – permitindo que eles reconheçam um copo de café de qualquer ângulo depois de aprender o que parece de apenas um. Isso não é algo que as redes neurais podem fazer.

“É um fato que é ignorado pelos pesquisadores em visão computacional”, disse ele. “E isso é um grande erro”.

Manuscamente modelados na rede de neurônios no cérebro humano, as redes neurais são algoritmos que podem aprender tarefas discretas, identificando padrões em grandes quantidades de dados. Ao analisar milhares de fotos de carros, por exemplo, uma rede neural pode aprender a reconhecer um carro.

Esta idéia matemática data da década de 1950, mas o conceito encontrou aplicações do mundo real nos últimos anos, graças a melhorias no poder de processamento e a grande quantidade de dados gerados pela internet. Nos últimos cinco anos, as redes neurais aceleraram o progresso de tudo, desde assistentes digitais de smartphones até serviços de tradução de idiomas para robôs autônomos.

Mas esses métodos ainda estão longe de entregar máquinas com inteligência verdadeira – e é necessária uma nova pesquisa para entregar os tipos de máquinas autônomas que muitas das principais empresas de tecnologia estão agora a ser promissoras, incluindo computadores conversacionais e carros sem excitadores.

Sr. Hinton, que é um tipo de padrinho para o A.I. comunidade, faz parte de um grupo pequeno, mas cada vez mais vocal, de especialistas que estão trabalhando para empurrar a indústria para essas áreas alternativas de pesquisa.

Oren Etzioni, diretor executivo do Instituto Allen para Inteligência Artificial, com sede em Seattle, lamentou o que ele chamou de miopia da indústria. Seu foco atual nas redes neurais, disse ele, prejudicará o progresso de A.I. a longo prazo.

Eric Horvitz, que supervisiona muito o A.I. trabalhou na Microsoft, argumentou que as redes neurais e técnicas relacionadas eram pequenos avanços em comparação com tecnologias que chegariam nos próximos anos.

“Agora, o que estamos fazendo não é uma ciência, mas uma espécie de alquimia”, disse ele.

O Sr. Hinton reconhece que seu projeto em Toronto até agora mostrou apenas resultados preliminares. E outros, como o Sr. Etzioni e o Sr. Horvitz, acreditam que técnicas muito diferentes serão necessárias para conseguir máquinas verdadeiramente inteligentes. O Sr. Etzioni disse que, embora os métodos de aprendizado de máquina permanecessem no centro de A.I. trabalho, eles devem ser aumentados com outras técnicas. Eles são fundamentalmente limitados porque eles aprendem com os dados. Os dados certos nem sempre estão disponíveis.

Mas o Sr. Hinton acredita que suas redes de cápsulas podem expandir-se para uma maior variedade de situações, acelerando o progresso da visão por computador e coisas como a computação conversacional. As redes de cápsulas são uma tentativa de imitar a rede de neurônios do cérebro de forma mais complexa e estruturada e explicou que essa estrutura adicional poderia ajudar outras formas de inteligência artificial também.

Ele certamente entende que muitos serão céticos de sua técnica. Mas o Sr. Hinton também apontou que há cinco anos, muitos eram céticos das redes neurais.

“A história vai se repetir”, disse ele. “Eu acho que.”

Fonte: New York Time

Compartilhar:

0 Comentário(s)

Deixar Comentário

Login

Bem-vindo! Faça o login na sua conta

Lembrar-me Perdeu a senha?

Lost Password