Connect with us

Notícias

Crianças humanas são fonte de inspiração para novas abordagens de aprendizado de robôs

Publicado

on

Estamos vivendo um momento emocionante para a aprendizagem robótica. Durante décadas, as organizações se dedicaram a construir conjuntos de dados complexos e pioneiraram diferentes formas de ensinar os sistemas a realizar novas tarefas. Parece que estamos à beira de avanços reais quando se trata de implantar tecnologia que pode se adaptar e aprender no momento.

No último ano, vimos uma grande quantidade de estudos fascinantes. Um exemplo é o VRB (Vision-Robotics Bridge), apresentado pela Universidade Carnegie Mellon em junho. Esse sistema é capaz de aplicar aprendizados a partir de vídeos do YouTube em diferentes ambientes, para que um programador não precise considerar todas as possíveis variações.

No mês passado, a equipe de robótica do Google’s DeepMind também mostrou seu impressionante trabalho com o RT-2 (Robotic Transformer 2). Esse sistema é capaz de abstrair os detalhes mínimos na execução de uma tarefa. No exemplo dado, ao dizer a um robô para jogar um pedaço de lixo fora, não é necessário que um programador ensine o robô a identificar peças específicas de lixo, pegá-las e jogá-las fora para realizar uma tarefa aparentemente simples (pelo menos para os humanos).

Pesquisas adicionais, destacadas pela CMU nesta semana, comparam o trabalho realizado com a aprendizagem humana em estágio inicial. Especificamente, o agente de IA robótico é comparado a uma criança de três anos. O nível de aprendizagem é dividido em duas categorias: aprendizagem passiva e ativa.

A aprendizagem passiva nesse caso envolve ensinar um sistema a realizar uma tarefa mostrando vídeos ou treinando-o com os conjuntos de dados mencionados anteriormente. A aprendizagem ativa é exatamente o que parece: realizar uma tarefa e ajustar até acertar.

O RoboAgent, uma colaboração entre a CMU e a Meta AI (sim, a Meta), combina esses dois tipos de aprendizagem, assim como os humanos. Isso significa observar tarefas sendo executadas via internet e aprender ativamente por meio da teleoperação remota do robô. Segundo a equipe, o sistema é capaz de aplicar aprendizados de um ambiente para outro, assim como o sistema VRB mencionado acima.

“Um agente capaz desse tipo de aprendizagem nos aproxima de um robô geral que pode concluir uma variedade de tarefas em ambientes desconhecidos e evoluir continuamente à medida que adquire mais experiências”, afirma Shubham Tulsiani do Robotics Institute da CMU. “O RoboAgent pode treinar rapidamente um robô usando dados limitados no domínio, confiando principalmente em dados gratuitos disponíveis em abundância na internet para aprender uma variedade de tarefas. Isso pode tornar os robôs mais úteis em ambientes não estruturados, como casas, hospitais e outros espaços públicos”.

Um dos aspectos mais interessantes de tudo isso é o fato de que o conjunto de dados é de código aberto e universalmente acessível. Além disso, é projetado para ser usado com hardware robótico disponível no mercado, o que significa que pesquisadores e empresas podem usar e expandir um tesouro crescente de dados e habilidades robóticas.

“Os RoboAgents são capazes de habilidades com uma complexidade muito maior do que outros já alcançaram”, diz Abhinav Gupta do Robotics Institute. “Mostramos uma diversidade maior de habilidades do que qualquer outro agente robótico do mundo real, com eficiência e escala de generalização para cenários desconhecidos que são únicas”.

Tudo isso é extremamente promissor quando se trata de construir e implantar sistemas robóticos multipropósitos com o objetivo de desenvolver robôs de propósito geral. O objetivo é criar tecnologia que vá além das máquinas repetitivas em ambientes altamente estruturados que normalmente associamos aos robôs industriais. É claro que usar e escalar essas abordagens na vida real é muito mais desafiador do que se imagina.

Estamos apenas começando quando se trata dessas abordagens de aprendizagem robótica, mas estamos passando por um período emocionante para o surgimento de sistemas multipropósitos.