OpenAI против Google: Gemini Live становится конкурентом голосового режима ChatGPT

Самые главные криптоновости в Телеграм-канале CryptoMoon, присоединяйтесь!👇

Cryptomoon Telegram


Как опытный криптоинвестор, внимательно следящий за технологическими достижениями, я должен признать, что продолжающаяся битва между OpenAI и Google меня заинтриговала. Недавний запуск Gemini Live от Google, несомненно, является захватывающим событием, особенно если учесть мое личное предпочтение плавного и естественного взаимодействия с помощниками искусственного интеллекта.

На мероприятии Made by Google 2024 компания Google представила функцию голосового чата под названием Gemini Live для своего искусственного помощника Gemini. Это новое дополнение призвано составить конкуренцию новейшему расширенному голосовому режиму OpenAI для ChatGPT. Gemini Live, доступный только премиум-пользователям, создан для того, чтобы сделать общение более естественным и увлекательным.

OpenAI против Google: Gemini Live конкурирует с голосовым режимом ChatGPT

На дискуссионной платформе X компания представила свой новый продукт Gemini Live, призванный составить конкуренцию последней голосовой функции OpenAI в расширенном режиме ChatGPT.

На мероприятии 2024 года новая функция была представлена ​​для опытных пользователей Gemini. Эта функция предназначена для того, чтобы сделать взаимодействие с ИИ более плавным и менее структурированным, позволяя пользователям делать паузу, менять темы или продолжать обсуждение в любое время, как при телефонном разговоре.

Знакомьтесь с Gemini Live: новый способ более естественного общения с Gemini.

Обдумывайте идеи
Прерывайтесь, чтобы задать вопросы
Приостановите чат и вернитесь к нему

Теперь распространяется на английском языке для подписчиков Gemini Advanced на телефонах @Android → …

— Google DeepMind (@GoogleDeepMind), 13 августа 2024 г.

Отличительной особенностью новейшего речевого движка Google является его способность генерировать непрерывный, эмоционально насыщенный и реалистичный диалог в течение нескольких ходов. Доступно десять голосов, каждый из которых звучит естественно, а ИИ способен имитировать голос пользователя в режиме реального времени. Эта функция громкой связи позволяет вести непрерывный разговор, даже когда телефон находится в фоновом режиме или заблокирован, что позволяет пользователям выполнять несколько задач одновременно, не прерывая чат.

Переходите к улучшению взаимодействия с ИИ

В результате модели помощника искусственного интеллекта Gemini 1.5 Pro и Gemini 1.5 Flash могут обрабатывать расширенные и сложные обсуждения благодаря большему контекстному окну по сравнению с другими моделями генеративного искусственного интеллекта. Эта функция позволяет Gemini Live поддерживать более длительные разговоры и более эффективно управлять информацией.

Было подтверждено, что помимо голосового управления к концу года в Gemini Live будет включена функциональность нескольких входов, впервые продемонстрированная на Google I/O 2024. Это усовершенствование позволяет ИИ понимать визуальные сигналы, такие как изображения и видео, и реагировать на них, что делает его более адаптируемым. В настоящее время эта функция доступна только на английском языке на устройствах Android, но вскоре будут добавлены дополнительные языки и совместимость с iOS.

Поскольку компания представляет эту новую функцию, они также планируют в ближайшем будущем запустить дополнительные функции и связи со своими услугами. В ближайшие недели Gemini собирается предложить расширенные функциональные возможности для приложений Google, таких как Calendar, Keep, Tasks и YouTube Music. Эти улучшения позволят пользователям более легко выполнять такие задачи, как создание списков воспроизведения, установка напоминаний и организация своего расписания с помощью голосовых команд.

В ближайшие дни пользователи Android смогут активировать Gemini не только внутри самого приложения, но и с помощью кнопки питания или голосовых команд. Это обновление обеспечит беспрепятственное взаимодействие между пользователями и Gemini в других приложениях, где они смогут задавать вопросы или запрашивать контент, например изображения, которые легко вписываются в их работу.

Задачи OpenAI с расширенным голосовым режимом

Во время конкуренции между OpenAI и Google в расширенном голосовом режиме Google для ChatGPT возникли проблемы на начальном этапе ограниченного тестирования. Эта инновационная функция, призванная улучшить качество чата за счет имитации более реалистичных разговоров, была встречена критикой, поскольку она может непреднамеренно сделать пользователей чрезмерно зависимыми от искусственного интеллекта из-за его реалистичного голосового взаимодействия.

В результате OpenAI выразила обеспокоенность по поводу потенциального будущего развития: установления социальных связей между пользователями и ИИ, что может оказать негативное влияние на взаимодействие людей.

Как научный сотрудник, работающий вместе с первоначальными создателями, я рад объявить о выпуске обновленной версии SWE-bench. Эта новая итерация призвана обеспечить более надежную оценку возможностей модели искусственного интеллекта (ИИ) при решении реальных задач программного обеспечения.

— OpenAI (@OpenAI), 13 августа 2024 г.

Помимо этого, компания работает над расширением возможностей разработки программного обеспечения для своих систем искусственного интеллекта. Чтобы решить эти проблемы, организация недавно обнародовала тщательно проверенную часть эталонного теста SWE, который более точно измеряет способность модели ИИ решать реальные проблемы с программным обеспечением. Это действие является частью постоянных усилий по обеспечению безопасности и практичности достижений в области искусственного интеллекта для повседневного использования.

Смотрите также

2024-08-13 22:28