OpenAI представила GPT-5.4 — первую массовую модель с нативным управлением компьютером. Нейросеть анализирует скриншоты экрана, кликает мышкой, печатает текст и выполняет команды без дополнительных API. Контекстное окно выросло до 1,05 млн токенов (+2,5x к GPT-5.2).
Mini/Nano-версии обеспечивают отклик <200мс — для реального времени. Модель уже доступна в ChatGPT Pro и API.
🎯 Ключевые возможности GPT-5.4
Управление ПК (OSWorld-Verified тест):
✅ 75% успешных операций (выше среднего человека)
✅ Открывает браузер → собирает данные → Excel → email
✅ Читает скриншоты, кликает кнопки, заполняет формы
✅ Контекст 1M токенов (держит план действий)
Mini/Nano (скорость):
GPT-5.4 Mini: 180-190 токенов/сек
GPT-5.4 Nano: ~200 токенов/сек (<50мс latency)
Цена API: $0.20/1M токенов (input)
Таблица характеристик:
| Модель | Контекст | Latency | Токены/сек | Цена API |
|---|---|---|---|---|
| GPT-5.4 | 1,05M | 500мс | 100-120 | $15/1M |
| GPT-5.4 Mini | 128K | <200мс | 180-190 | $3/1M |
| GPT-5.4 Nano | 64K | <50мс | 200 | $0.20/1M |
🧠 Как работает управление компьютером
1. Скриншот экрана → анализ интерфейса
2. GPT-5.4 строит план действий (показывает пользователю)
3. Клик/ввод текста → проверка результата
4. Корректировка по команде dev-модератора
5. Безопасность: user policies (разные уровни риска)
Примеры задач:
- Заполнить CRM → отправить 50 счетов
- Собрать данные с 10 сайтов → отчет Excel
- Автоматизировать рутину в 1C/QuickBooks
💰 Контракт с Пентагоном: $200M
OpenAI получила контракт Минобороны США на $200 млн (июнь 2025):
Цель: прототипы ИИ для задач нацбезопасности
Срок: до июля 2026
Аванс: $2 млн OpenAI
OpenAI for Government — новая инициатива
Задачи (военные + корпоративные):
- Анализ спутниковых снимков в реальном времени
- Автоматизация отчетности по логистике
- Computer use для военных интерфейсов
📈 Технические прорывы GPT-5.4
1. Computer use из коробки
Раньше — эксперимент o1/o3. Теперь — основная функция всех версий.
2. Мультимодальность
Image/audio/video + скриншоты экрана.
3. 1M контекст
Держит сложные многошаговые процессы.
4. Настраиваемое поведение
Dev-модераторы корректируют действия в реальном времени.
💻 API и доступность
ChatGPT Pro: $200/мес → GPT-5.4 + computer use
API: доступен всем (rate limits по регионам)
SDK: Playwright integration для computer use
Лимиты (2026):
GPT-5.4: 10K запросов/день (Pro)
GPT-5.4 Mini: 100K/день
GPT-5.4 Nano: 1M/день
🎯 Кому это нужно
Бизнес:
CRM/ERP автоматизация
Данные → отчеты → рассылка
Тестирование UI/UX
Разработчики:
Playwright + GPT-5.4 = end-to-end тесты
Скриншоты → код → деплой
Военные:
$200M контракт Пентагона
Спутники → отчеты → штаб
📊 Сравнение с конкурентами
| Модель | Computer use | Контекст | Latency | Цена |
|---|---|---|---|---|
| GPT-5.4 | ✅ Нативно | 1M | 500мс | $15/1M |
| Claude 3.7 | Эксперимент | 200K | 800мс | $20/1M |
| Gemini 2.1 | Нет | 1M | 600мс | $12/1M |
| Llama 4 | Через API | 128K | 1с | Open |
Преимущество GPT-5.4: computer use из коробки + скорость Mini/Nano.
🚀 Что дальше
Roadmap OpenAI 2026:
Июнь: GPT-5.5 (2M контекст)
Сентябрь: Enterprise computer use
Декабрь: GPT-5.6 Nano (10мс latency)
Пентагон: прототипы к июлю 2026 → полномасштабное внедрение.








