Послуги
  • Сайти
  • Контент
  • Просування
  • Бітрікс24
  • Додатки
Усі послуги Оплата
Бітрікс24
Усі послуги Оплата
Пошук
  • Разработка интернет-магазина под ключ
  • Разработка сайтов
  • Разработка леднигов
  • Разработка на битрикс24
  • Разработка на Вордпресс

OpenAI та Google влаштували дуель релізів: GPT-5.2 проти оновленого Deep Research

Дата публікації

12.12.2025

11 грудня перетворилося на день великого протистояння. OpenAI випустила GPT-5.2, а Google — буквально за кілька годин — відповіла оновленим дослідницьким агентом Deep Research на базі Gemini 3 Pro.

Що стоїть за GPT-5.2

Реліз відбувся на тлі внутрішньої кризи в OpenAI. На початку грудня видання The Information повідомило, що CEO Сем Альтман розіслав співробітникам записку з позначкою «Code red». Причиною стало падіння трафіку ChatGPT і втрата… на користь Google. За даними WSJ, деякі працівники просили відкласти запуск, щоб мати більше часу на доопрацювання.

Попри це, модель GPT-5.2 вийшла та доступна у трьох варіантах: Instant (швидкі відповіді на рутинні запити), Thinking (складні завдання на кшталт програмування, аналізу документів і математики) та Pro (максимальна точність для найважчих проблем).

«Ми створили 5.2, щоб розблокувати ще більше економічної цінності для людей. Модель краще створює таблиці, презентації, пише код, розуміє зображення, працює з довгим контекстом і виконує складні багатокрокові проєкти», — каже директорка з продукту в OpenAI Фіджі Сімо.

Це вже третє оновлення лінійки за пів року — після запуску GPT-5.1 у листопаді. OpenAI заявляє про нові рекорди в бенчмарках з програмування, математики та міркування. Зокрема, режим Thinking допускає на 38% менше помилок порівняно з попередником.

На власному тесті SWE-Bench Pro (реальні завдання з розробки програмного забезпечення) GPT-5.2 Thinking обходить Gemini 3 і Claude Opus 4.5. Але є нюанс.

Точність коштує дорожче

Моделі, що довше «думають» перед відповіддю, точніші, проте дорожчі. Thinking і Deep Research режими споживають значно більше обчислювальних потужностей, аніж звичайні чат-боти. Більшість рахунків OpenAI вже сплачує готівкою, що свідчить про перевищення витрат, які здатні покрити партнери та кредити.

Компанія зобов’язалася інвестувати $1,4 трильйона в AI-інфраструктуру на найближчі роки, коли ще OpenAI мала перевагу першопрохідця. Тепер Google наздоганяє — і ці інвестиції перетворюються на ризик.

Фіджі Сімо стверджує, що масштабування дозволяє заробляти більше, аби покривати витрати на серверні ресурси. Проте додає: «Сьогодні ви отримуєте набагато більше інтелекту за ту саму кількість обчислень і тих самих доларів, що й рік тому».

Проблема генерації зображень у ChatGPT

У «Code red» Альтман нібито зазначив, що генерація зображень — ключовий пріоритет OpenAI. Особливо після вірусного успіху Google Nano Banana Pro у листопаді — з ще кращим рендерингом тексту та реалістичними фото. Минулого тижня продемонстрували кращу інтеграцію з іншими сервісами Google, зокрема, Google Labs Mixboard для автоматизованої генерації презентацій.

Banner

Зображення, згенероване Nano Banana Pro

У GPT-5.2 досі немає нового генератора зображень. OpenAI нібито планує випустити модель з оновленим інтерфейсом і кращими зображеннями в січні 2026-го, проте під час релізу це не підтвердили.

Відповідь Google

Того ж дня, 11 грудня, Google представила переосмислений Deep Research — дослідницького агента на базі Gemini 3 Pro. Тепер це не просто інструмент для звітів, а повноцінний API, який розробники можуть вбудовувати у власні застосунки.

Google наголошує, що Gemini 3 Pro — їхня «найфактологічніша» модель із мінімумом галюцинацій. Для тривалих агентних завдань, де ШІ приймає багато автономних рішень, це критично, адже одна помилка може зруйнувати весь результат.

Deep Research незабаром з’явиться в Google Search, Google Finance, NotebookLM і застосунку Gemini. Отже, компанія готується до світу, де людям більше не доведеться гуглити самостійно.

Google також створила DeepSearchQA — новий benchmark для тестування агентів на складних багатокрокових завданнях з пошуку інформації. На власному тесті Deep Research переміг, як незалежну перевірку загальних знань експертного рівня Humanity’s Last Exam. Але ChatGPT 5 Pro йшов майже впритул, а за результатами бенчмарку для браузерних агентів BrowserComp ChatGPT 5 Pro навіть трохи обійшов Google. Проте ці порівняння застаріли ще до публікації, бо того ж дня OpenAI випустила GPT-5.2.

Хто насправді переміг?

Бенчмарки суперечливі: на власних тестах OpenAI та Google виграють, тоді як на незалежних обидві моделі йдуть майже врівень. Не можна не згадати Claude Opus 4.5 від Anthropic, який за результатами SWE-Bench Verified досі лідирує в програмуванні. Gemini 3 очолює більшість категорій на LMArena, а GPT-5.2 Thinking обходить обох на тестах з міркування (щоправда, за даними самого OpenAI).

Як бачимо, різниця між топовими моделями звужується, а їхній вибір залежить від конкретного завдання. Для користувачів і бізнесу це означає одне: конкуренція загострюється, а моделі стають розумнішими й доступнішими. Тому саме час інтегрувати ШІ в робочі процеси — від автоматизації контенту та підтримки клієнтів до складних завдань аналітики та кастомної розробки програм.

Комментарии