Услуги
  • Сайты
  • Контент
  • Продвижение
  • Битрикс24
  • Приложения
Все услуги Оплата
Битрикс24
Все услуги Оплата
Поиск
  • Разработка интернет-магазина под ключ
  • Разработка сайтов
  • Разработка леднигов
  • Разработка на битрикс24
  • Разработка на Вордпресс

OpenAI и Google устроили дуэль релизов: GPT-5.2 против обновленного Deep Research

Дата публикации

12.12.2025

11 декабря стало днем большого противостояния. OpenAI выпустила GPT-5.2, а Google — буквально через несколько часов — ответила обновленным исследовательским агентом Deep Research на базе Gemini 3 Pro.

Что стоит за GPT-5.2

Релиз состоялся на фоне внутреннего кризиса в OpenAI. В начале декабря издание The Information сообщило, что CEO Сэм Альтман разослал сотрудникам записку с пометкой «code red». Причиной стало падение трафика ChatGPT и потеря доли рынка в пользу Google. По данным WSJ, некоторые сотрудники просили отложить запуск, чтобы иметь больше времени на доработку.

Несмотря на это, модель GPT-5.2 вышла и доступна в трех вариантах: Instant (быстрые ответы на рутинные запросы), Thinking (сложные задачи вроде программирования, анализа документов и математики) и Pro (максимальная точность для самых сложных проблем).

«Мы создали 5.2, чтобы раскрыть еще больше экономической ценности для людей. Модель лучше создает таблицы, презентации, пишет код, понимает изображения, работает с длинным контекстом и выполняет сложные многоэтапные проекты», — говорит директор по продукту в OpenAI Фиджи Симо.

Это уже третье обновление линейки за полгода — после запуска GPT-5.1 в ноябре. OpenAI заявляет о новых рекордах в бенчмарках по программированию, математике и мышлению. В частности, режим Thinking допускает на 38% меньше ошибок по сравнению с предшественником.

На собственном тесте SWE-Bench Pro (реальные задачи по разработке программного обеспечения) GPT-5.2 Thinking обходит Gemini 3 и Claude Opus 4.5. Но есть нюанс.

Точность стоит дороже

Модели, которые дольше «думают» перед ответом, более точные, но и более дорогие. Режимы Thinking и Deep Research потребляют значительно больше вычислительных мощностей, чем обычные чат-боты. Большинство счетов OpenAI уже оплачивает наличными, что свидетельствует о превышении расходов, которые способны покрыть партнеры и кредиты.

Еще когда OpenAI имела преимущество первопроходца, компания обязалась инвестировать $1,4 триллиона в AI-инфраструктуру в ближайшие годы. Теперь Google догоняет — и эти инвестиции превращаются в риск.

Фиджи Симо утверждает, что масштабирование позволяет зарабатывать больше, чтобы покрывать расходы на серверные ресурсы. Но добавляет: «Сегодня вы получаете гораздо больше интеллекта за то же количество вычислений и те же доллары, что и год назад».

Проблема генерации изображений в ChatGPT

У «Code red» Альтман якобы отметил, что генерация изображений — ключевой приоритет OpenAI. Особенно после вирусного успеха Google Nano Banana Pro в ноябре — с еще лучшим рендерингом текста и реалистичными фото. На прошлой неделе продемонстрировали лучшую интеграцию с другими сервисами Google, в том числе Google Labs Mixboard для автоматизированной генерации презентаций.В GPT-5.2 до сих пор нет нового генератора изображений. OpenAI якобы планирует выпустить модель с обновленным интерфейсом и лучшими изображениями в январе 2026 года, однако во время релиза это не подтвердили.

Banner

Изображение, сгенерированное Nano Banana Pro

В GPT-5.2 до сих пор нет нового генератора изображений. OpenAI якобы планирует выпустить модель с обновленным интерфейсом и лучшими изображениями в январе 2026 года, однако во время релиза это не подтвердили.

Ответ Google

В тот же день, 11 декабря, Google представила переосмысленный Deep Research — исследовательский агент на базе Gemini 3 Pro. Теперь это не просто инструмент для отчетов, а полноценный API, который разработчики могут встраивать в свои приложения.

Google отмечает, что Gemini 3 Pro — их «самая фактологичная» модель с минимумом галлюцинаций. Для длительных агентных задач, где ИИ принимает много автономных решений, это критично, ведь одна ошибка может разрушить весь результат.

Deep Research вскоре появится в Google Search, Google Finance, NotebookLM и приложении Gemini. Таким образом, компания готовится к миру, где людям больше не придется гуглить самостоятельно.

Google также создала DeepSearchQA — новый benchmark для тестирования агентов на сложных многошаговых задачах по поиску информации. На собственном тесте Deep Research победил, как и независимую проверку общих знаний экспертного уровня Humanity’s Last Exam. Но ChatGPT 5 Pro шел почти вплотную, а по результатам бенчмарка для браузерных агентов BrowserComp ChatGPT 5 Pro даже немного обошел Google. Однако эти сравнения устарели еще до публикации, потому что в тот же день OpenAI выпустила GPT-5.2.

Кто на самом деле победил?

Бенчмарки противоречивы: на собственных тестах OpenAI и Google выигрывают, тогда как на независимых обе модели идут почти вровень. Нельзя не упомянуть Claude Opus 4.5 от Anthropic, который по результатам SWE-Bench Verified до сих пор лидирует в программировании. Gemini 3 возглавляет большинство категорий на LMArena, а GPT-5.2 Thinking обходит обоих на тестах по рассуждению (правда, по данным самого OpenAI).

Как видим, разница между топовыми моделями сокращается, а их выбор зависит от конкретной задачи. Для пользователей и бизнеса это означает одно: конкуренция обостряется, а модели становятся умнее и доступнее. Поэтому самое время интегрировать ИИ в рабочие процессы — от автоматизации контента и поддержки клиентов до сложных задач аналитики и кастомной разработки программ.

Комментарии