GPT-5.4: OpenAI осваивает управление компьютером и заключает контракт с Пентагоном

GPT-5.4 управление компьютером

OpenAI представила GPT-5.4 — первую массовую модель с нативным управлением компьютером. Нейросеть анализирует скриншоты экрана, кликает мышкой, печатает текст и выполняет команды без дополнительных API. Контекстное окно выросло до 1,05 млн токенов (+2,5x к GPT-5.2).

Mini/Nano-версии обеспечивают отклик <200мс — для реального времени. Модель уже доступна в ChatGPT Pro и API.

🎯 Ключевые возможности GPT-5.4

Управление ПК (OSWorld-Verified тест):

✅ 75% успешных операций (выше среднего человека)
✅ Открывает браузер → собирает данные → Excel → email
✅ Читает скриншоты, кликает кнопки, заполняет формы
✅ Контекст 1M токенов (держит план действий)

Mini/Nano (скорость):

GPT-5.4 Mini: 180-190 токенов/сек
GPT-5.4 Nano: ~200 токенов/сек (<50мс latency)
Цена API: $0.20/1M токенов (input)

Таблица характеристик:

МодельКонтекстLatencyТокены/секЦена API
GPT-5.41,05M500мс100-120$15/1M
GPT-5.4 Mini128K<200мс180-190$3/1M
GPT-5.4 Nano64K<50мс200$0.20/1M

🧠 Как работает управление компьютером

1. Скриншот экрана → анализ интерфейса
2. GPT-5.4 строит план действий (показывает пользователю)
3. Клик/ввод текста → проверка результата
4. Корректировка по команде dev-модератора
5. Безопасность: user policies (разные уровни риска)

Примеры задач:

  • Заполнить CRM → отправить 50 счетов
  • Собрать данные с 10 сайтов → отчет Excel
  • Автоматизировать рутину в 1C/QuickBooks

💰 Контракт с Пентагоном: $200M

OpenAI получила контракт Минобороны США на $200 млн (июнь 2025):

Цель: прототипы ИИ для задач нацбезопасности
Срок: до июля 2026
Аванс: $2 млн OpenAI
OpenAI for Government — новая инициатива

Задачи (военные + корпоративные):

  • Анализ спутниковых снимков в реальном времени
  • Автоматизация отчетности по логистике
  • Computer use для военных интерфейсов

📈 Технические прорывы GPT-5.4

1. Computer use из коробки
Раньше — эксперимент o1/o3. Теперь — основная функция всех версий.

2. Мультимодальность
Image/audio/video + скриншоты экрана.

3. 1M контекст
Держит сложные многошаговые процессы.

4. Настраиваемое поведение
Dev-модераторы корректируют действия в реальном времени.

💻 API и доступность

ChatGPT Pro: $200/мес → GPT-5.4 + computer use
API: доступен всем (rate limits по регионам)
SDK: Playwright integration для computer use

Лимиты (2026):

GPT-5.4: 10K запросов/день (Pro)
GPT-5.4 Mini: 100K/день
GPT-5.4 Nano: 1M/день

🎯 Кому это нужно

Бизнес:

CRM/ERP автоматизация
Данные → отчеты → рассылка
Тестирование UI/UX

Разработчики:

Playwright + GPT-5.4 = end-to-end тесты
Скриншоты → код → деплой

Военные:

$200M контракт Пентагона
Спутники → отчеты → штаб

📊 Сравнение с конкурентами

МодельComputer useКонтекстLatencyЦена
GPT-5.4✅ Нативно1M500мс$15/1M
Claude 3.7Эксперимент200K800мс$20/1M
Gemini 2.1Нет1M600мс$12/1M
Llama 4Через API128KOpen

Преимущество GPT-5.4: computer use из коробки + скорость Mini/Nano.

🚀 Что дальше

Roadmap OpenAI 2026:

Июнь: GPT-5.5 (2M контекст)
Сентябрь: Enterprise computer use
Декабрь: GPT-5.6 Nano (10мс latency)

Пентагон: прототипы к июлю 2026 → полномасштабное внедрение.

1

Автор публикации

не в сети 3 месяца

Irina Rybkina

54
Комментарии: 0Публикации: 198Регистрация: 01-02-2017
Оцените статью
Площадка для аналитиков, инвесторов, трейдеров, брокеров по всем финансовым рынкам мира.
Добавить комментарии

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!:

GPT-5.4: OpenAI осваивает управление компьютером и заключает контракт с Пентагоном
Дождались: что принесло выступление главы ФРС биржевым рынкам
Авторизация
*
*

Регистрация
*
*
*

Генерация пароля
Закрыть