Robôs conversando como ChatGPT? Startup usa IA para revolucionar a robótica!

Imagine robôs de depósito conversando com você como o ChatGPT e aprendendo a manusear objetos de forma tão fluida quanto manipulamos palavras. Essa é a promessa da Covariant, startup de robótica que usa técnicas de aprendizagem de máquina semelhantes às usadas em chatbots para criar robôs capazes de navegar o mundo físico.
Inteligência Artificial além do digital
Já estamos familiarizados com a IA por trás de chatbots como o ChatGPT e geradores de imagens como o Midjourney, de vídeos como SORA, de audio e efeitos sonoros como o ElevenLabs ou mesmo de música como a GenAI da adobe. Essas ferramentas operam no mundo digital, respondendo a perguntas, criando textos e imagens impressionantes. A Covariant, sediada na Califórnia, vai além, aplicando o aprendizado de máquina para treinar robôs que operam em armazéns e centros de distribuição. Seu objetivo é que esses robôs entendam o ambiente ao redor e tomem decisões autônomas, como pegar, mover e classificar itens.
Essa tecnologia também permite que os robôs compreendam o inglês básico, possibilitando a comunicação natural, como se estivéssemos conversando com um chatbot. É importante ressaltar que a tecnologia ainda está em desenvolvimento, mas representa um salto significativo. Os mesmos sistemas de IA que impulsionam chatbots e geradores de imagens logo estarão presentes em robôs de armazém, veículos autônomos e até mesmo em nossas casas.
Aprendizado a partir de dados massivos
Assim como chatbots e geradores de imagens, a tecnologia robótica da Covariant aprende analisando enormes quantidades de dados digitais. Quanto mais dados forem fornecidos, melhor será o desempenho do sistema. A empresa, com financiamento de US$ 222 milhões, não fabrica robôs, mas sim o software que os controla. Seu foco inicial é o setor de armazéns, mas a tecnologia tem potencial para revolucionar a manufatura e até mesmo o transporte autônomo.
Redes neurais: o cérebro da nova geração de robôs
Os sistemas de IA que comandam chatbots e geradores de imagens são chamados de redes neurais, inspiradas na rede de neurônios do cérebro humano. Ao identificar padrões em grandes volumes de dados, esses sistemas aprendem a reconhecer palavras, sons e imagens, e até mesmo a gerá-los. É assim que o ChatGPT, da OpenAI, responde a perguntas, escreve textos e gera programas de computador. Suas habilidades vêm de um vasto aprendizado baseado em textos coletados pela internet (o que, em alguns casos gera problemas de violação de direitos autorais).
Empresas como a OpenAI estão indo além, criando sistemas que aprendem de diferentes tipos de dados simultaneamente. Por exemplo, ao analisar fotos e suas respectivas legendas, o sistema compreende a relação entre imagem e texto. Aprende que a palavra “banana” descreve uma fruta curva e amarela.
Usando técnicas similares, a Covariant, fundada por Pieter Abbeel (professor da Universidade da Califórnia, Berkeley) e três de seus ex-alunos, construiu um sistema para robôs de armazém. A empresa coleta há anos dados de câmeras e sensores para entender como esses robôs operam.
“Ele ingere todos os tipos de dados relevantes para robôs, ajudando-os a compreender o mundo físico e interagir com ele”, explica o Dr. Chen, da Covariant.
Ao combinar esses dados com a quantidade massiva de texto usada para treinar chatbots, a empresa criou uma IA que dota os robôs de uma ampla compreensão do ambiente.

Robôs que entendem o mundo (e até conversam)
Após identificar padrões nesse mix de imagens, dados sensoriais e texto, a tecnologia permite que o robô lide com situações inesperadas no mundo físico. Ele sabe como pegar uma banana, mesmo que nunca tenha visto uma antes. Também responde a instruções simples em inglês, assim como um chatbot. Se você disser “pegue uma banana”, ele entenderá. O mesmo vale para “pegue a fruta amarela”.
A tecnologia pode até gerar vídeos que preveem o que acontecerá durante a tentativa de pegar a banana. Esses vídeos não têm utilidade prática no armazém, mas demonstram a compreensão do robô sobre o ambiente.
“Se ele consegue prever os próximos quadros do vídeo, pode definir a estratégia certa a seguir”, afirma o Dr. Abbeel.
Desafios e promessas de uma nova era de IA
Gary Marcus, empreendedor de IA e professor emérito de psicologia e neurociência da Universidade de Nova York, acredita que a tecnologia pode ser útil em armazéns e outros ambientes onde erros são aceitáveis. No entanto, ele adverte que a implementação em fábricas e outras situações potencialmente perigosas seria mais complexa e arriscada.
“Tudo se resume ao custo do erro”, diz ele. “Se um robô de 70 kg pode causar danos, o custo pode ser alto.”
À medida que empresas treinam sistemas como o R.F.M. (sigla em inglês para modelo fundamental de robótica), em conjuntos de dados cada vez maiores e mais variados, os pesquisadores acreditam que haverá um rápido aprimoramento. Essa é uma mudança radical em relação à forma como os robôs operavam no passado.
Tradicionalmente, os engenheiros programavam robôs para realizar movimentos precisos repetidamente, como pegar caixas de um determinado tamanho ou fixar rebites em um ponto específico do para-choque de um carro. No entanto, esses robôs não lidavam bem com situações inesperadas ou aleatórias.
Ao aprender com dados digitais – centenas de milhares de exemplos do que acontece no mundo físico – os robôs podem começar a lidar com o inesperado. E quando esses exemplos são combinados com linguagem, os robôs também podem responder a sugestões de texto e voz, como um chatbot.
Isso significa que, assim como chatbots e geradores de imagens, os robôs se tornarão mais ágeis e adaptáveis.
“O que está nos dados digitais pode ser transferido para o mundo real”, afirma o Dr. Chen.
A tecnologia da Covariant representa um passo importante na evolução da IA, abrindo caminho para robôs mais inteligentes, flexíveis e interativos que podem colaborar com humanos em diversas tarefas. Essa nova era da robótica tem o potencial de revolucionar vários setores da indústria e transformar a maneira como vivemos e trabalhamos.
Fontes:
- Site da Covariant: https://covariant.ai/
- Artigo do New York Times sobre a tecnologia da Covariant:
https://www.nytimes.com/2024/03/11/technology/ai-robots-technology.html