Há um vídeo de um robô no laboratório da Figure fazendo café. Não é o tipo de “braço robótico seguindo precisamente um caminho pré-programado para operar um Keurig”. É o tipo onde você diz “ei, faça um café para mim” e ele entende as etapas — encontrar a xícara, identificar a máquina de café, apertar os botões certos, trazê-la até você. O tipo de fazer café que requer entender o que é café.
Temos robôs industriais há décadas. Robôs de soldagem nas fábricas de automóveis. Máquinas de pick-and-place na fabricação eletrônica. Braços de linha de montagem que repetem o mesmo movimento 10.000 vezes por dia com uma precisão submilimétrica. Esses robôs são impressionantes, mas são idiotas. Eles fazem exatamente o que foram programados para fazer e nada mais.
O que é diferente agora é a parte de IA. Os robôs estão aprendendo a ver, entender e se adaptar. E isso muda tudo o que os robôs podem fazer.
As Três Coisas que a IA Oferece aos Robôs
Olhos que entendem. A visão computacional combinada com sensores de profundidade permite que os robôs construam um modelo 3D de seu ambiente em tempo real. Não apenas “há um objeto nas coordenadas (3, 4, 2)”, mas “é uma xícara de café, está em pé, está na beira da mesa e parece frágil.” Essa compreensão semântica é o que torna um robô útil em um ambiente não estruturado como sua cozinha em comparação com um ambiente estruturado como um chão de fábrica.
Um cérebro que planeja. É aqui que os LLM entram em cena, e honestamente, fiquei surpreso com o quão bem isso funciona. O RT-2 do Google recebe uma instrução em linguagem natural como “pegue a lata de Coca e coloque no reciclável” e obtem as comandos motores para realizar isso — incluindo para objetos e situações nas quais não foi especificamente treinado. A mesma compreensão da linguagem que alimenta o ChatGPT se mostra realmente útil para dizer aos robôs o que eles devem fazer.
Mãos que aprendem. Os robôs tradicionais exigem que cada movimento seja pré-programado. Os robôs alimentados por IA aprendem por demonstração — você lhes mostra como dobrar uma toalha e eles entendem o princípio geral de dobrar toalhas, então adaptam isso para toalhas de diferentes tamanhos e formas. O sistema Mobile ALOHA de Stanford aprendeu tarefas de cozinha, limpeza e organização observando humanos. Não perfeitamente, mas o suficiente para ser útil.
Onde os Robôs Realmente Trabalham Hoje
Os armazéns são a história de sucesso. A Amazon tem mais de 750.000 robôs em seus centros de distribuição. Não são robôs humanoides vagando — são principalmente plataformas planas que transportam unidades de prateleiras até os funcionários, além de braços robóticos que classificam e embalam itens. A IA gerencia a navegação em um ambiente dinâmico onde milhares de robôs e humanos compartilham o espaço. É o maior despliegue de robótica IA do mundo, e isso funciona.
A cirurgia avançou mais do que a maioria das pessoas percebe. O sistema cirúrgico da Vinci foi utilizado em mais de 12 milhões de procedimentos. A IA oferece filtragem de tremores (mais estável do que qualquer mão humana), visualização 3D aumentada e assistência na posição dos instrumentos. Os cirurgiões mantêm o controle — o robô melhora suas capacidades em vez de substituí-las.
A agricultura está surpreendentemente avançada. Existem robôs que colhem morangos seletivamente — apenas os maduros, deixando as frutas imaturas para depois. Outros robôs identificam e eliminam ervas daninhas sem herbicidas. O desafio aqui é a variabilidade — cada campo é diferente, cada planta é ligeiramente diferente e a iluminação muda ao longo do dia. A IA gerencia essa variabilidade de uma maneira que a programação tradicional simplesmente não pode.
A Corrida pelos Humanoides
Todo mundo está construindo robôs humanoides agora, e as opiniões variam enormemente sobre se isso é genial ou arrogante.
Figure 01 e 02 são as demonstrações mais impressionantes que já vi. A interação em linguagem natural, o comportamento adaptativo e a manipulação que realmente parecem fluídas em vez de abruptas. A parceria com a OpenAI significa que os robôs da Figure entendem o contexto e as instruções de uma forma que parece realmente inteligente.
Optimus da Tesla recebe a maior cobertura da mídia porque é da Tesla. Os avanços foram mais rápidos do que os críticos esperavam — as demonstrações recentes mostram o Optimus caminhando, pegando objetos e realizando tarefas simples. Se as promessas de cronograma de Elon são realistas é outra questão (spoiler: provavelmente não são).
Atlas da Boston Dynamics é o robô humanoide original, e a versão elétrica é realmente impressionante do ponto de vista atlético. Saltos para trás, parkour, navegação dinâmica ao redor de obstáculos. Mas a diferença entre “demonstração impressionante” e “produto útil” ainda é ampla.
Minha opinião honesta sobre os humanoides: a questão não é se eles funcionarão um dia — certamente irão. A questão é se um fator de forma humanoide é a abordagem certa. Por que construir um robô em forma de humano para operar uma lava-louças quando você poderia construir uma lava-louças melhor? Robôs humanoides fazem sentido para ambientes projetados para humanos (casas, escritórios, lojas). Robôs projetados para objetivos específicos fazem sentido para tarefas específicas (armazéns, cirurgia, agricultura).
Os Problemas Não Resolvidos
A generalização continua sendo o ponto difícil. Um robô treinado para preparar café em uma Cozinha A tem dificuldades em uma Cozinha B, onde a máquina de café é diferente e as xícaras estão em um armário diferente. Os humanos lidam com isso sem esforço. Os robôs precisam de uma reformulação extensa ou de modelos básicos que consigam generalizar — e ainda não chegamos lá.
Segurança ao redor dos humanos. Um robô de armazém que colide com uma prateleira é chato. Um robô doméstico que atinge uma criança é inaceitável. Os requisitos de segurança para robôs próximos a humanos são ordens de grandeza mais altos do que para robôs industriais, e ainda estamos desenvolvendo os padrões e tecnologias para atendê-los.
O custo é proibitivo para os consumidores. A Figure não anunciou preços para consumidores, mas as estimativas colocam os robôs humanoides entre 50.000 e 100.000 dólares inicialmente. Isso é um carro, não um aparelho. A robótica destinada aos consumidores precisa atingir a faixa de 5.000 a 10.000 dólares para alcançar uma adoção em massa.
Minha Previsão para os Próximos Cinco Anos
Os robôs de armazém e logística estarão em toda parte. Os robôs cirúrgicos se expandirão para mais tipos de procedimentos. Os robôs agrícolas se tornarão comuns em grandes fazendas. Os robôs domésticos continuarão sendo novidades caras — suficientemente úteis para justificar o preço para os primeiros adotantes ricos, mas ainda não um item indispensável como o Roomba.
A variável na equação é se os modelos básicos para robótica farão uma descoberta na generalização. Se um robô pode aprender uma nova tarefa a partir de uma demonstração de 30 segundos em vez de horas de treinamento, a economia muda completamente. Vários grupos de pesquisa estão se aproximando disso. Os próximos anos prometem ser fascinantes.
🕒 Published: