Meta выпустила SAM 3 — ИИ, который распознает объекты и создает 3D-модели по текстовому описанию
Дата публикации
21.11.2025
В ближайшее время мы свяжемся с вами
19 ноября Meta представила SAM 3 и SAM 3D — новые модели искусственного интеллекта для распознавания и отслеживания объектов в изображениях и видео. Главная инновация в том, что кроме ручного выделения система понимает текстовые описания, а также может создавать трехмерные реконструкции из одного фото.
Предыдущие версии Segment Anything требовали указать на объект мышкой. SAM 3 работает иначе — достаточно написать «желтый автобус», и модель найдет такие автобусы на изображении. Система справится и с более сложной задачей, например «люди, которые сидят, но не носят красную кепку».
SAM 3 обрабатывает 270 тысяч уникальных концепций, что в 50 раз больше, чем существующие аналоги. Это не просто распознавание «человек» или «машина» — SAM 3 понимает контекст и мельчайшие нюансы.
SAM 3D делает то, что раньше требовало сложного софта. Загрузите фото предмета — и мгновенно получите его трехмерную модель. Система состоит из двух компонентов: SAM 3D Objects реконструирует объекты и сцены, а SAM 3D Body воспроизводит человеческие фигуры с точной оценкой пропорций.
Facebook Marketplace уже использует эту технологию для функции «View in Room», чтобы покупатели могли увидеть, как мебель будет смотреться в их комнате.
Для украинских компаний, которые создают интернет-магазины либо мобильные приложения, SAM 3D открывает новые возможности для AR-функций без значительных инвестиций в разработку.
Meta открыла доступ к моделям через Segment Anything Playground — платформу, где можно тестировать сегментацию на собственных изображениях и видео без навыков программирования. Достаточно загрузить файл и ввести текстовое описание объектов, которые нужно выделить.
В ближайшее время SAM 3 появится в Edits — новом приложении Meta для создания видео в Instagram. Украинские креаторы смогут применять эффекты к конкретным объектам в кадре и создавать профессиональный контент без сложного монтажа. То, что раньше требовало часов ручного редактирования, теперь будет занимать всего несколько секунд.
Новая технология также актуальна для компаний, занимающихся SEO-продвижением. Автоматическое распознавание и тегирование медиаконтента может значительно ускорить оптимизацию сайта для поисковых систем.
Исходный код SAM 3 уже доступен для разработчиков на GitHub. Интеграция с платформой компьютерного зрения Roboflow позволяет быстро настроить модель под конкретные бизнес-задачи. Технология также поддерживается в популярных IDE для разработки программного обеспечения — Cursor, GitHub Copilot, JetBrains и Replit.
Комментарии