Cosmos 3
NVIDIA представила Cosmos 3 — открытую foundation-модель для физичиского AI: робототехники, автономного транспорта и vision-агентов. Модель понимает и генерирует текст, изображения, видео, звук и действия, а также симулирует физические сценарии. Cosmos 3 построена на mixture-of-transformers-архитектуре: один transformer отвечает за reasoning, другой — за генерацию. Это помогает модели понимать движение, взаимодействие объектов и пространственно-временные связи перед … Читать далее