Qwen3.5 стремится стать мультимодальным агентом
Исследователи Alibaba представили Qwen3.5. Модель учится работать с разными типами данных. Цель — создать настоящего мультимодального агента.
Исследователи Alibaba представили Qwen3.5. Модель учится работать с разными типами данных. Цель — создать настоящего мультимодального агента.
Бывшие инженеры Google запустили стартап InfiniMind. Их платформа превращает видеопоток в структурированные данные. Компании наконец смогут понять, что происходит в их записях.
NVIDIA создала модель C-RADIOv4. Она объединяет три разные системы зрения в одну. Теперь не нужно выбирать между ними.
Нулевая рамка вокруг картинки — это не просто технический приём. Это статистическая ошибка, которая меняет работу всей нейросети.
DeepSeek представил новую версию системы распознавания текста. Она читает документы не слева направо, а по смыслу.
Ant Group создала модель, которая управляет роботами. Она видит, понимает команды и действует.
Забудьте про ручной ввод. Новая модель от Moonshot смотрит видео и пишет код сама. Достаточно одной загрузки.
Искусственный интеллект теперь может описывать снимки опухолей. Система UniRG от Microsoft пишет подробные заключения. Это разгрузит врачей-рентгенологов.
ИИ-агенты перестали быть слепыми. Теперь они видят экран и действуют, как человек.
ИИ от Salesforce теперь понимает команды вроде ‘передвинь бутылку слева направо’ и показывает, как сдвинется каждый пиксель.
Компания Black Forest Labs выпустила семейство компактных моделей FLUX.2 [klein]. Они генерируют и редактируют изображения меньше чем за секунду.
Инженеры Pinterest научили ИИ сортировать миллиарды товаров. Система создаёт тематические подборки за секунды.
Камеры Ring перестанут быть просто объективами. Они станут думающими помощниками, которые видят и понимают.
Нейросети для распознавания изображений оказались уязвимы. Их можно обмануть почти незаметными изменениями в картинке.
Учёные создали систему, которая сама находит и прячет приватные детали на фотографиях перед отправкой в общее хранилище.
Современные видео-модели искусственного интеллекта оказались уязвимы. Их можно обмануть с помощью специально созданных помех.