🥇Não podemos confiar em sistemas de IA baseados apenas em aprendizado profundo

Este texto não é resultado de pesquisa científica, mas sim uma entre muitas opiniões sobre o nosso desenvolvimento tecnológico atual. E, ao mesmo tempo, é um convite à discussão.

Gary Marcus, professor da Universidade de Nova York, acredita firmemente que o aprendizado profundo desempenha um papel vital no desenvolvimento da IA. No entanto, ele também acredita que a ênfase excessiva nesse método pode levar ao seu descrédito.

No livro dele Reinventando a IA: Construindo inteligência artificial em que podemos confiar Marcus, neurocientista de formação que construiu sua carreira em pesquisas de ponta em IA, aborda as implicações técnicas e éticas. De uma perspectiva tecnológica, o aprendizado profundo pode imitar com sucesso as tarefas perceptivas que nosso cérebro realiza, como reconhecer imagens ou fala. No entanto, o aprendizado profundo não é adequado para outras tarefas, como entender conversas ou determinar relações de causa e efeito. Para criar máquinas inteligentes mais avançadas, capazes de resolver uma gama mais ampla de problemas — frequentemente chamadas de inteligência artificial geral —, o aprendizado profundo precisa ser combinado com outras técnicas.

Se um sistema de IA não compreender verdadeiramente suas tarefas ou o mundo ao seu redor, isso pode ter consequências perigosas. Mesmo as menores mudanças inesperadas no ambiente do sistema podem fazê-lo comportar-se de maneira errática. Há inúmeros exemplos disso: detectores de linguagem inadequada facilmente enganados; sistemas de busca de emprego que discriminam constantemente; e carros autônomos que colidem e, às vezes, matam motoristas ou pedestres. Criar inteligência artificial geral não é apenas um problema de pesquisa interessante; tem inúmeras aplicações práticas.

Em seu livro, Marcus e seu coautor, Ernest Davis, defendem um caminho diferente. Eles acreditam que ainda estamos longe de alcançar a IA geral, mas estão confiantes de que isso acontecerá mais cedo ou mais tarde.

Por que precisamos de IA geral? Versões especializadas já foram criadas e são bastante úteis.

É verdade, e os benefícios serão ainda maiores. Mas existem muitas tarefas que a IA especializada simplesmente não consegue resolver. Por exemplo, entender a fala comum, fornecer assistência geral em um mundo virtual ou um robô que possa auxiliar na limpeza e na cozinha. Essas tarefas estão além das capacidades da IA especializada. Outra questão prática interessante: a IA especializada poderia ser usada para criar um carro autônomo seguro? A experiência mostra que esse tipo de IA ainda apresenta muitos problemas de comportamento em situações anormais, mesmo ao dirigir, o que complica bastante a situação.

Acho que todos nós adoraríamos ter uma IA que nos ajudasse a fazer grandes descobertas na medicina. Não está claro se as tecnologias atuais são capazes disso, já que a biologia é um campo complexo. Seria preciso estar preparado para ler muitos livros. Os cientistas entendem as relações de causa e efeito entre redes e moléculas, e podem desenvolver teorias sobre planetas e assim por diante. No entanto, com IA especializada, não conseguimos criar máquinas capazes de fazer tais descobertas. Com IA geral, poderíamos revolucionar a ciência, a tecnologia e a medicina. Acredito que seja crucial continuarmos trabalhando em IA geral.

Parece que por "geral" você quer dizer IA forte?

Por "geral", quero dizer que a IA será capaz de pensar e resolver novos problemas instantaneamente. Diferentemente, por exemplo, do jogo Go, onde o problema não mudou nos últimos 2000 anos.

A inteligência artificial geral deveria ser capaz de tomar decisões tanto na política quanto na medicina. Isso é análogo à capacidade humana; qualquer pessoa sã pode fazer muito. Você pega estudantes inexperientes e, em poucos dias, os coloca para trabalhar em praticamente qualquer coisa, de problemas jurídicos a médicos. Isso acontece porque eles têm uma compreensão geral do mundo e sabem ler, podendo, portanto, contribuir para uma ampla gama de atividades.

A relação entre esse tipo de inteligência e a inteligência forte reside no fato de que uma inteligência fraca provavelmente será incapaz de resolver problemas gerais. Para criar algo robusto o suficiente para lidar com um mundo em constante mudança, talvez seja necessário, no mínimo, alcançar um nível de inteligência geral.

Mas ainda estamos longe disso. O AlphaGo funciona perfeitamente em um tabuleiro de 19x19, mas precisa ser retreinado para jogar em um tabuleiro retangular. Ou considere um sistema de aprendizado profundo comum: ele consegue reconhecer um elefante se estiver bem iluminado e a textura de sua pele estiver visível. Mas se apenas a silhueta do elefante estiver visível, o sistema quase certamente não conseguirá reconhecê-lo.

Em seu livro, você menciona que o aprendizado profundo não consegue atingir as capacidades da IA geral porque não é capaz de uma compreensão profunda.

Na ciência cognitiva, fala-se sobre a formação de vários modelos cognitivos. Estou sentado num quarto de hotel e percebo que há um armário ali, uma cama acolá, uma televisão acolá, e que está pendurada de um jeito estranho. Conheço todos esses objetos; não apenas os identifico. Também entendo como se relacionam entre si. Tenho ideias sobre como o mundo à minha volta funciona. Não são perfeitas. Podem estar erradas, mas são bastante boas. E, com base nelas, tiro muitas conclusões que orientam as minhas ações diárias.

O outro extremo é algo como o sistema de jogos Atari da DeepMind, que memorizou o que deveria fazer ao ver pixels em locais específicos da tela. Se você tiver dados suficientes, pode parecer que obteve algum entendimento, mas, na realidade, é muito superficial. Prova disso é que, se você deslocar objetos em três pixels, a IA joga muito pior. As mudanças a confundem. Isso é o oposto de um entendimento profundo.

Para resolver esse problema, você propõe um retorno à IA clássica. Quais vantagens devemos tentar explorar?

Existem diversas vantagens.

Em primeiro lugar, a IA clássica é, na verdade, uma estrutura para criar modelos cognitivos do mundo, que podem então ser usados para tirar conclusões.

Em segundo lugar, a IA clássica é perfeitamente compatível com regras. Há uma tendência estranha no aprendizado profundo atualmente, em que os especialistas estão tentando evitar regras. Eles querem fazer tudo com redes neurais e evitar qualquer coisa que se pareça com programação clássica. Mas existem problemas que foram resolvidos dessa forma sem que ninguém percebesse. Por exemplo, o planejamento de rotas no Google Maps.

Na realidade, precisamos de ambas as abordagens. O aprendizado de máquina é bom em aprender com dados, mas é muito ruim em capturar a abstração que um programa de computador representa. A IA clássica é boa em abstrações, mas precisa ser inteiramente programada manualmente, e existe conhecimento demais no mundo para programá-lo por completo. Claramente, precisamos combinar ambas as abordagens.

Isso se relaciona com o capítulo em que você fala sobre o que podemos aprender com a mente humana. Especificamente, o conceito, baseado na ideia já mencionada, de que nossa consciência é composta por muitos sistemas diferentes que operam de maneiras distintas.

Acho que existe outra maneira de explicar isso: cada sistema cognitivo que temos, na verdade, resolve problemas diferentes. Partes semelhantes da IA devem ser projetadas para resolver problemas diferentes, cada uma com suas próprias características distintas.

Atualmente, estamos tentando usar tecnologias multifuncionais para resolver problemas fundamentalmente diferentes. Compreender uma frase é completamente diferente de reconhecer um objeto. Mas as pessoas estão tentando usar aprendizado profundo para ambos. De uma perspectiva cognitiva, essas são tarefas fundamentalmente diferentes. Fico simplesmente impressionado com o pouco apreço que a IA clássica demonstra pela comunidade de aprendizado profundo. Por que esperar por uma solução mágica? Ela é inatingível, e buscas infrutíferas não conseguem compreender toda a complexidade da IA.

Você também menciona que sistemas de IA são necessários para entender relações de causa e efeito. Você acha que o aprendizado profundo, a IA clássica ou algo completamente novo nos ajudará com isso?

Esta é outra área para a qual o aprendizado profundo não é adequado. Ele não explica as causas dos eventos, mas sim calcula a probabilidade de um evento ocorrer sob determinadas condições.

Do que estamos falando? Você analisa certos cenários e entende por que as coisas acontecem e o que pode acontecer se certas circunstâncias mudarem. Posso olhar para o suporte da TV e imaginar que, se eu cortar uma das pernas, o suporte vai tombar e a TV vai cair. Isso é causa e efeito.

A IA clássica nos fornece algumas ferramentas para isso. Ela pode, por exemplo, imaginar o que é um suporte e o que é uma queda. Mas não vou exagerar. O problema é que a IA clássica depende em grande parte de informações completas sobre o que está acontecendo, enquanto eu cheguei a essa conclusão apenas observando a arquibancada. De alguma forma, consigo generalizar, imaginando partes da arquibancada que não consigo ver. Ainda não temos as ferramentas para implementar essa propriedade.

Você também menciona como os humanos possuem conhecimento inato. Como isso pode ser implementado em IA?

Ao nascermos, nosso cérebro já é um sistema altamente sofisticado. Ele não é fixo; a natureza cria um rascunho inicial. O aprendizado nos ajuda a revisar esse rascunho ao longo da vida.

O esboço básico do cérebro já possui certas capacidades. Um filhote de cabra montesa consegue descer uma montanha com precisão em poucas horas. Claramente, ele já tem uma compreensão do espaço tridimensional, do seu corpo e das relações entre eles. É um sistema extremamente complexo.

É em parte por isso que acho que precisamos de híbridos. É difícil imaginar como seria possível criar um robô que funcione bem em um mundo sem o mesmo conhecimento, em vez de começar do zero e aprender com uma longa e extensa experiência.

Quanto aos humanos, nosso conhecimento inato vem do nosso genoma, que evoluiu ao longo de um longo período de tempo. Mas com sistemas de IA, teremos que adotar uma abordagem diferente. Parte disso pode envolver as regras para construir nossos algoritmos. Parte disso pode envolver as regras para criar as estruturas de dados que esses algoritmos manipulam. E parte disso pode envolver o conhecimento que fornecemos diretamente às máquinas.

É interessante que no livro você mencione a ideia de confiança e a criação de sistemas baseados em confiança. Por que você escolheu esse critério em particular?

Acho que tudo isso é um pouco como um jogo agora. Acho que estamos vivendo um momento estranho na história, depositando tanta confiança em softwares que não são confiáveis. Não acho que as ansiedades que temos hoje durarão para sempre. Daqui a cem anos, a IA justificará nossa confiança, e talvez até antes.

Mas hoje, a IA é perigosa. Não no sentido que Elon Musk teme, mas no sentido de que os sistemas de entrevista de emprego discriminam as mulheres, independentemente do que os programadores façam, porque suas ferramentas são muito simples.

Gostaria de ver uma IA melhor. Não quero um "inverno da IA" em que as pessoas percebam que a IA não funciona e é francamente perigosa, e não queiram corrigi-la.

De certa forma, seu livro parece muito otimista. Você sugere que uma IA confiável pode ser construída. Só precisamos olhar em uma direção diferente.

É verdade, o livro é muito pessimista a curto prazo e muito otimista a longo prazo. Acreditamos que todos os problemas que descrevemos podem ser resolvidos se adotarmos uma visão mais ampla sobre quais seriam as respostas certas. E achamos que, se isso acontecer, o mundo será um lugar melhor.

Fonte: habr.com

Não podemos confiar em sistemas de IA construídos apenas com base no aprendizado profundo