OpenAI выпускает обновления для реального времени в области аудио, визуализации и текста
Согласно Cointelegraph, OpenAI внесла четыре обновления в свои модели в октябре, чтобы помочь своим ИИ-моделям лучше проводить разговоры и улучшить распознавание изображений. Первое крупное обновление — это API в реальном времени, который позволяет разработчикам создавать приложения для генерации речи ИИ с использованием одного запроса, обеспечивая естественные разговоры, аналогичные продвинутым речевым моделям ChatGPT. Ранее разработчикам приходилось «сшивать» несколько моделей для создания таких опытов. Аудиовход обычно должен быть полностью загружен и обработан до получения ответа, что означает, что приложения в реальном времени, такие как голосовые разговоры, имеют высокую задержку. Благодаря потоковым возможностям Realtime API разработчики теперь могут реализовать мгновенные, естественные взаимодействия, как у голосового помощника. Работая на GPT-4, который будет выпущен в мае 2024 года, API обеспечивает вывод в реальном времени по аудио, визуальным и текстовым данным. Другое обновление включает инструменты тонкой настройки для разработчиков, которые позволяют им улучшать ответы ИИ, сгенерированные на основе изображений и текстовых вводов. Настройщик на основе изображений позволяет ИИ лучше понимать изображения, что приводит к улучшенному визуальному поиску и обнаружению объектов. Процесс включает обратную связь от людей, которые предоставляют примеры хороших и плохих ответов для обучения. В дополнение к обновлениям речи и зрения, OpenAI представила «дистилляцию модели» и «кэширование подсказок», которые позволяют меньшим моделям учиться у больших и сокращать затраты и время на разработку за счет повторного использования обработанного текста. OpenAI ожидает, что доходы вырастут до 11,6 миллиарда долларов в следующем году, по сравнению с прогнозируемыми 3,7 миллиарда долларов в 2024 году, согласно Reuters.
Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.
Вам также может понравиться
Nasdaq подает заявку на изменение Bitcoin ETF BlackRock для разрешения физического выкупа
Криптопроект Трампа WLFI добавил 3001 ETH и 95 WBTC