NVIDIA apresenta plataforma full-stack para robôs humanoides, robotáxis e fábricas inteligentes
Cosmos 3, robôs humanoides e ferramentas para robotáxis são os destaques do mais recente avanço tecnológico da NVIDIA.
A NVIDIA apresentou um amplo conjunto de tecnologias voltado para acelerar o desenvolvimento de sistemas de Physical AI, expandindo sua atuação em robôs humanoides, veículos autônomos, manufatura de semicondutores e automação industrial.
Anunciados no GTC Taipei, os últimos lançamentos da empresa incluem o Cosmos 3, um foundation model aberto para Physical AI, um novo robô humanoide de referência construído sobre sua plataforma Isaac GR00T, ferramentas open-source de agentes para robótica e industrial AI, e novas iniciativas de manufatura de semicondutores baseadas em AI em parceria com a TSMC.
NOTA DA RAMOS DA INFORMÁTICA: NVIDIA Cosmos 3: O modelo está disponível como um open foundation model (modelo de fundação aberto) para Physical AI. Você pode encontrar o paper técnico e os links para os recursos no Hugging Face e no GitHub. O site do projeto é research.nvidia.com/labs/cosmos-lab/cosmos3
Em conjunto, os anúncios destacam a estratégia da NVIDIA de construir um ecossistema full-stack para Physical AI, cobrindo tudo, desde a geração de dados sintéticos e simulação até a implantação no mundo real.
“O big bang da Physical AI está chegando graças aos avanços em raciocínio multimodal de linguagem, visão e world models“, disse Jensen Huang, fundador e CEO da NVIDIA.
Ele acrescentou: “A família Cosmos 3 de open frontier omnimodels oferece aos desenvolvedores um salto geracional na capacidade de construir robôs, veículos autônomos e vision AI que percebem, raciocinam, planejam e agem no mundo físico.”
NOTA DA RAMOS DA INFORMÁTICA: NVIDIA Isaac GR00T: Trata-se de uma plataforma e um robô humanoide de referência (Reference Humanoid Robot). Os recursos técnicos e de desenvolvimento fazem parte da plataforma NVIDIA Isaac e podem ser encontrados em developer.nvidia.com/isaac. A página do NVIDIA Jetson Thor tem uma seção sobre o Isaac GR00T N1. Já o NVIDIA Jetson Thor: O site oficial do produto é nvidia.com/en-us/autonomous-machines/embedded-systems/jetson-thor
Construindo inteligência física
No centro do anúncio está o Cosmos 3, que a NVIDIA descreve como o primeiro fully open omnimodel do mundo capaz de entender e gerar texto, imagens, vídeo, som ambiente e ações dentro de um único sistema.
O modelo é construído sobre uma arquitetura mixture-of-transformers que combina raciocínio e geração de conteúdo. A NVIDIA afirma que o Cosmos 3 pode funcionar como um vision-language model, um world model para simular ambientes físicos ou como base para robot action models.
A empresa alega que o modelo lidera vários open-model benchmarks para geração de mundo, robotic action policies e compreensão de visão. O Cosmos 3 está disponível em múltiplas versões, incluindo o Cosmos 3 Super para aplicações de robótica e veículos autônomos de alta precisão e o Cosmos 3 Nano para inferência mais rápida.
A NVIDIA também lançou uma coleção de open-source physical AI skills and tools que permitem que agentes de AI executem tarefas em robótica, vision AI, direção autônoma, saúde e industrial digital twins. As ferramentas convertem workflows de desenvolvimento complexos em processos repetíveis e executáveis por agentes, que podem automatizar a geração de dados, simulação, treinamento e implantação.
Dos laboratórios para as fábricas
Para pesquisadores em robótica, a NVIDIA apresentou o Isaac GR00T Reference Humanoid Robot, um open reference design que combina o robô humanoide Unitree H2 Plus, mãos dextras Sharpa, computação de bordo Jetson Thor e a software stack Isaac GR00T.
A plataforma visa simplificar o desenvolvimento de robôs humanoides integrando hardware, simulação, treinamento e implantação em um único sistema. Organizações de pesquisa, incluindo Ai2, ETH Zurich, Stanford Robotics Center e UC San Diego, planejam usar a plataforma.
A NVIDIA também está trazendo a AI para o coração da manufatura de semicondutores por meio de sua colaboração com a TSMC.
A fabricante de chips está usando as bibliotecas NVIDIA CUDA-X e AI models para computational lithography, simulação de transistores, process control, inspeção de wafers e fab scheduling. De acordo com a NVIDIA, a TSMC alcançou melhorias em eficiência computacional enquanto também usa o NVIDIA Metropolis e o TAO Toolkit para melhorar a detecção de defeitos em escala nanométrica.
“A NVIDIA e a TSMC trabalham juntas há quase três décadas para ultrapassar os limites da computação”, disse Huang. “A TSMC está trazendo a NVIDIA AI e a accelerated computing para dentro da própria fab, enfrentando alguns dos desafios de design e manufatura mais complexos do mundo com simulação, otimização e AI.”
A NVIDIA também está explorando a Physical AI para veículos autônomos por meio do Alpamayo 2 Super, um reasoning model de 32 bilhões de parâmetros projetado para ajudar robotáxis a entender, planejar e responder a situações de trânsito complexas.
NOTAS DA RAMOS DA INFORMÁTICA:
-
NVIDIA Alpamayo 2 Super: Este é um reasoning VLA model (modelo de raciocínio de Visão-Linguagem-Ação) para veículos autônomos. A página da NVIDIA para o setor automotivo fornece detalhes sobre ele: nvidia.com/en-us/industries/automotive.
-
NVIDIA Metropolis e TAO Toolkit: O Metropolis é uma plataforma para aplicações de Vision AI, e o TAO Toolkit é uma ferramenta de baixo código para ajustar modelos. O portal para desenvolvedores NVIDIA é o ponto de partida para ambos: developer.nvidia.cn/metropolis.
-
Colaboração NVIDIA e TSMC: As iniciativas conjuntas em manufatura de semicondutores, incluindo o uso da biblioteca NVIDIA cuLitho, estão detalhadas no blog oficial da NVIDIA: blogs.nvidia.com/blog/taiwan-ecosystem-ai-infrastructure. Links relevantes incluem a página da NVIDIA CUDA-X e comunicados de imprensa.
html_content = “””
O “Big Bang” da IA Física: NVIDIA Cosmos 3, Isaac GR00T e a Revolução no Agro e na Indústria
Um mergulho profundo no ecossistema que está ensinando as máquinas a entenderem e agirem no mundo físico.
Fala, leitor do site! Se você achava que a Inteligência Artificial ia ficar só gerando textão e imagem no computador, pode tirar o cavalinho da chuva. O bagulho acabou de escalar para o mundo real. A NVIDIA mandou avisar no GTC Taipei que o “Big Bang” da IA Física (Physical AI) começou, e o nome da fera é Cosmos 3.
Aqui na Ramos da Informática, a gente não curte ficar só na superfície. Vamos destrinchar essa arquitetura, entender como o robô humanoide de referência Isaac GR00T funciona na prática e, o mais importante: como aplicar isso em cenários parrudas de verdade, incluindo o nosso gigantesco setor do Agronegócio (Agro).
1. Cosmos 3: O Omnimodelo que Sente o Mundo
O Cosmos 3 não é só mais um LLM. Ele é um open foundation model criado especificamente para a IA Física. Construído sobre uma arquitetura mixture-of-transformers (MoT), ele é capaz de processar texto, imagem, vídeo, áudio e, o mais animal: Ações.
Pensa numa IA que olha pra uma cena, entende a física dos objetos (o que é pesado, o que escorrega, o que quebra), planeja o movimento do braço robótico em coordenadas 2D/3D no espaço e prevê o que vai acontecer se ela soltar a peça. Isso é o Forward Dynamics do Cosmos 3.
2. Isaac GR00T e Jetson Thor: O “Cérebro” de Lata
Para a galera que põe a mão na graxa montando robôs, a NVIDIA lançou a plataforma Isaac GR00T. É um design de referência que já integra o Unitree H2 Plus com aquelas mãos mecânicas cheias de destreza.
O cérebro desse bicho roda no NVIDIA Jetson Thor. Tá ligado naquele trampo de calcular SLAM (Localização e Mapeamento Simultâneos), estimativa de pose (com o FoundationPose) e planejamento de movimento (cuMotion) em milissegundos para o robô não tropeçar e cair? O Jetson Thor faz isso mastigado.
O Pulo do Gato: Aplicações do Cosmos 3 e Isaac no AGRO
A gente sabe que o Brasil é movido a Agro, e a IA Física é a chave para o Agriculture 5.0. Saca só o que dá pra construir usando esse stack da NVIDIA na roça:
- Colheita Delicada com Isaac GR00T: Imagina um braço robótico colhendo morangos ou tomates. Usando as habilidades de raciocínio espacial do Cosmos 3 e o SyntheticaDETR, o robô não apenas localiza a fruta, mas entende a pressão exata que a garra precisa aplicar (Force Feedback) para não amassar o produto.
- Tratores Autônomos (VLA Models): Usando a mesma base do Alpamayo 2 Super (criado para robotáxis), tratores podem entender cenários não mapeados. Choveu e virou lama? O modelo prevê a perda de tração e altera a rota ou a potência das rodas em tempo real.
- Digital Twins da Lavoura com Isaac Sim + Omniverse: Meu, isso aqui é de explodir a cabeça. Você simula a plantação inteira no Omniverse. Insere os dados reais de clima e pragas, e usa o Cosmos 3 para simular enxames de drones agrícolas operando juntos antes de gastar um centavo com combustível na vida real.
Dicas Extras Avançadas para Devs (O “Nerd Mode”)
Se você já tá querendo codar isso aí, presta atenção nessas dicas de integração que pouca gente fala:
- OSMO + Kubernetes: Não tenta rodar o treinamento inteiro do seu robô na sua máquina. A NVIDIA tem o OSMO, uma plataforma nativa da nuvem para orquestração. Joga as simulações do Isaac Sim pro OSMO e escala no Kubernetes de forma distribuída.
- Transferência de Simulação para o Real (Sim-to-Real): O maior BO da robótica é que o que funciona na tela quebra no mundo físico. Use a engine de física Newton (agora open-source, feita com a DeepMind) dentro do Isaac Lab para gerar dados sintéticos tão reais que o Cosmos 3 não sente diferença quando vai pro hardware físico.
- Metropolis + TAO Toolkit na Inspeção de Grãos: Se você trampa com silos de soja, use o TAO Toolkit para treinar modelos leves de Visão Computacional (Vision AI) que identificam grãos mofados na esteira em milissegundos, rodando num Jetson Nano.
