QVABO STUDIO
AI

🎧 OpenAI выпустила три новых голосовых модели с уровнем рассуждений GPT-5

OpenAI представила GPT-Realtime-2, GPT-Realtime-Translate и GPT-Realtime-Whisper - новое поколение голосовых моделей, способных рассуждать, переводить и транскрибировать в реальном времени. Компания заявила, что прежние голосовые модели были значительно слабее текстовых, особенно в задачах, требующих глубокого анализа. Теперь голос становится полноценным интерфейсом.

🎧 OpenAI выпустила три новых голосовых модели с уровнем рассуждений GPT-5

Центральная модель - GPT-Realtime-2 - приносит в голосовые диалоги уровень рассуждений, сопоставимый с GPT-5. Контекстное окно выросло с 32 000 до 128 000 токенов, что позволяет вести более длинные и сложные беседы. Модель умеет вызывать несколько инструментов параллельно и сообщать о ходе работы фразами вроде «дайте проверить». При ошибках она не замолкает, а говорит «у меня сейчас с этим трудности». Разработчики могут настраивать интенсивность рассуждений по пяти уровням - от минимального до максимального. На высоком уровне точность на бенчмарке Big Bench Audio достигла 96,6% против 81,4% у предшественника.

Полная версия — в Telegram

Читать пост полностью

~1 мин чтения · @qvabo_studio

В Telegram
Оригинал
Tier-1 пресса
Qvabo Studio
Редакция
Открыть в Telegram