ИИ выражает эмоции, видит и поет: OpenAI представила улучшенную версию GPT-4

Купить софт майнер

  • Компания OpenAI представила мультимодальную модель GPT-4o.
  • Алгоритм способен принимать на вход текст, аудио или изображения и выдавать данные во всех трех форматах.
  • В ближайшие недели модель станет доступна для всех, включая бесплатных пользователей.
  • OpenAI также анонсировала обновление пользовательского веб-интерфейса ChatGPT и настольную версию чат-бота для macOS.

Лаборатория OpenAI представила новую мультимодальную модель искусственного интеллекта GPT-4o. По данным компании, эта технология ― еще один шаг к «гораздо более естественному взаимодействию человека с компьютером».

Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN

Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx

— OpenAI (@OpenAI) May 13, 2024

Буква «o» в названии означает omni ― GPT-4o способна принимать на вход любую комбинацию текста, аудио и изображений и выдавать данные во всех трех форматах. Модель также умеет распознавать эмоции, позволяет прерывать себя в процессе речи и может реагировать так же быстро, как и человек во время беседы.

По словам технического директора стартапа Миры Мурати, новый алгоритм обеспечивает интеллект «уровня GPT-4», но обладает лучшими возможностями в различных модальностях и средах.

«[…] Последние пару лет мы были сосредоточены на повышении интеллекта моделей. Это первый раз, когда мы делаем огромный шаг вперед, когда дело касается простоты использования», ― отметила она.

Во время презентации OpenAI продемонстрировала работу GPT-4o. Алгоритм в прямом эфире перевел между английским и итальянским языками, помог исследователю решить линейное уравнение в реальном времени на бумаге и дал рекомендации по глубокому дыханию руководителю лаборатории.

  Alex Lab обвиняет Lazarus Group в майском эксплоите на $4 млн

Отличие от предшественников

Предыдущий «ведущий и самый продвинутый» алгоритм GPT-4 Turbo мог анализировать изображения и текст для выполнения задач вроде извлечения написанного из картинок или описания содержимого на них. Но GPT-4o добавляет обработку речи.

Из-за того, что новая модель обучена использованию трех форматов данных, входная и выходная информация обрабатывается одной и той же нейронной сетью. Предшественники ― GPT-3.5 и GPT-4 ― позволяли пользователям задавать вопросы голосом, а затем транскрибировали звук в текст. Это лишало речь интонаций и эмоций и делало взаимодействие более медленным.

Купить асики майнинг

Благодаря GPT-4o использование ChatGPT стало похоже на общение с помощником.

Например, при разговоре с чат-ботом, базирующимся на новой модели, его можно прервать во время ответа. Согласно OpenAI, алгоритм обеспечивает реакцию «в реальном времени» и может даже улавливать нюансы звучания пользователя, генерируя в ответ голоса «в различных эмоциональных стилях», включая пение.

Улучшенные «зрение», язык и речь

GPT-4o расширяет возможности ChatGPT в плане зрения. Получив фотографию или экран рабочего стола, чат-бот теперь способен быстро отвечать на связанные с ними вопросы, начиная от «что происходит в этом программном коде?» и заканчивая «какая марка рубашки на этом человеке?».

По словам Мурати, в будущем эти функции будут развиваться. Хотя GPT-4o способна просматривать изображение меню на иностранном языке и переводить его, позже модель позволит ChatGPT, например, «смотреть» спортивную игру в прямом эфире и объяснять ее правила.

В лаборатории заявили, что новый алгоритм более многоязычен ― он может понимать около 50 языков.

Согласно компании, через API OpenAI и Azure OpenAI Service от Microsoft новая модель работает в два раза быстрее, распространяется дешевле и менее ограничена по скорости в сравнении с GPT-4 Turbo.

  «Первый биткоин-президент» Сальвадора Найиб Букеле принес присягу на второй срок

Пока поддержка голоса в API GPT-4o не распространяется на всех клиентов. Ссылаясь на риск неправомерного использования в компании отметили, что сперва запустят эту функцию для «небольшой группы доверенных партнеров» в ближайшие недели.

OpenAI предоставит новую модель для всех, включая бесплатных пользователей ChatGPT, в течение следующих недель. Владельцы премиум-подписок Plus и Team получат к ней доступ с «в пять раз меньшим» ограничением по количеству обращений.

Новый веб-интерфейс и приложение для ChatGPT

Лаборатория объявила о запуске обновленного пользовательского веб-интерфейса ChatGPT с «более диалоговым» главным экраном и макетом сообщений.

Также OpenAI представила настольную версию чат-бота для macOS, доступ к которой платные пользователи получат начиная с сегодняшнего дня. Версия для Windows появится позже в этом году.

Настольное приложение ChatGPT, используемое в задаче кодирования. Данные: OpenAI.

Кроме того, бесплатные пользователи ChatGPT получат доступ к GPT Store ― библиотеке и инструментам для создания сторонних чат-ботов с ИИ. Также им откроют некоторые ранее платные опции ChatGPT вроде функции «памяти».

Ранее СМИ утверждали, что 13 мая OpenAI представит поисковую систему на базе искусственного интеллекта.

Новейшее оборудование для майнинга относится к самым современным и недавно выпущенным устройствам, используемым для добычи криптовалют. Такое оборудование обычно включает в себя последние технологические достижения и улучшения, которые делают его более эффективным, мощным и энергоэффективным по сравнению с предыдущими моделями. Вот несколько ключевых аспектов новейшего оборудования:

  1. Параметры производительности:

    • Хэшрейт: Новейшее оборудование предлагает улучшенные показатели хэшрейта (скорости вычислений), что позволяет майнерам быстрее решать задачи и получать больше вознаграждений.
    • Энергоэффективность: Современные устройства имеют лучшую энергоэффективность, то есть потребляют меньше электроэнергии на единицу вычислительной мощности, что снижает затраты на электричество.
  2. Типы новейшего оборудования:

    • ASIC-майнеры: Новейшие модели ASIC-майнеров разрабатываются с более мощными чипами и улучшенной архитектурой, что делает их более эффективными для майнинга определенных криптовалют. Например, последние версии Antminer и WhatsMiner.
    • Видеокарты (GPU): Новейшие видеокарты, такие как NVIDIA GeForce RTX 4090 и AMD Radeon RX 7900 XTX, предлагают улучшенную производительность и поддержку новых технологий, что делает их подходящими для майнинга различных криптовалют.
  3. Технологические новшества:

    • Инновационные чипы: Разработка более продвинутых чипов и архитектур, которые повышают скорость обработки и уменьшают потребление энергии.
    • Обновления программного обеспечения: Новое оборудование часто поддерживает последние обновления программного обеспечения и прошивки, что позволяет улучшить его производительность и совместимость.
  Спотовые Ethereum ETF могут начать торговаться 2 июля

Добавить комментарий