Архивы компьютерное зрение - AI Founder

Qwen3.5 стремится стать мультимодальным агентом

Qwen3.5 стремится стать мультимодальным агентом

Исследователи Alibaba представили Qwen3.5. Модель учится работать с разными типами данных. Цель — создать настоящего мультимодального агента.

Бывшие инженеры Google создают платформу для анализа видео

Бывшие инженеры Google создают платформу для анализа видео

Бывшие инженеры Google запустили стартап InfiniMind. Их платформа превращает видеопоток в структурированные данные. Компании наконец смогут понять, что происходит в их записях.

NVIDIA объединила три модели зрения в одну

NVIDIA создала модель C-RADIOv4. Она объединяет три разные системы зрения в одну. Теперь не нужно выбирать между ними.

Нейросети ошибаются из-за нулевой рамки вокруг изображений

Нулевая рамка вокруг картинки — это не просто технический приём. Это статистическая ошибка, которая меняет работу всей нейросети.

DeepSeek научил ИИ читать документы как человек

DeepSeek представил новую версию системы распознавания текста. Она читает документы не слева направо, а по смыслу.

Ant Group представила модель LingBot-VLA для управления роботами

Ant Group создала модель, которая управляет роботами. Она видит, понимает команды и действует.

Moonshot представила ИИ, который пишет код по видео

Moonshot представила ИИ, который пишет код по видео

Забудьте про ручной ввод. Новая модель от Moonshot смотрит видео и пишет код сама. Достаточно одной загрузки.

Microsoft научила ИИ писать медицинские заключения

Microsoft научила ИИ писать медицинские заключения

Искусственный интеллект теперь может описывать снимки опухолей. Система UniRG от Microsoft пишет подробные заключения. Это разгрузит врачей-рентгенологов.

Salesforce научила ИИ предсказывать движение по команде

ИИ от Salesforce теперь понимает команды вроде ‘передвинь бутылку слева направо’ и показывает, как сдвинется каждый пиксель.

Black Forest Labs выпустила компактные модели для генерации изображений

Компания Black Forest Labs выпустила семейство компактных моделей FLUX.2 [klein]. Они генерируют и редактируют изображения меньше чем за секунду.

Pinterest создал ИИ для каталогов из миллиардов товаров

Инженеры Pinterest научили ИИ сортировать миллиарды товаров. Система создаёт тематические подборки за секунды.

Основатель Ring рассказал о новой эре умных камер

Основатель Ring рассказал о новой эре умных камер

Камеры Ring перестанут быть просто объективами. Они станут думающими помощниками, которые видят и понимают.

Учёные ускорили взлом нейросетей в 70 раз

Учёные ускорили взлом нейросетей в 70 раз

Нейросети для распознавания изображений оказались уязвимы. Их можно обмануть почти незаметными изменениями в картинке.

ИИ научили скрывать конфиденциальные объекты на изображениях

ИИ научили скрывать конфиденциальные объекты на изображениях

Учёные создали систему, которая сама находит и прячет приватные детали на фотографиях перед отправкой в общее хранилище.

Исследователи нашли уязвимость в видео-моделях ИИ

Исследователи нашли уязвимость в видео-моделях ИИ

Современные видео-модели искусственного интеллекта оказались уязвимы. Их можно обмануть с помощью специально созданных помех.