Как исследователь, проявляющий большой интерес к искусственному интеллекту и его приложениям, я должен сказать, что последняя версия OpenAI Advanced Voice Mode (AVM) для ChatGPT — это действительно интересная разработка. Способность общаться на более чем 50 языках в сочетании с настраиваемыми инструкциями, памятью и улучшенным распознаванием акцента делает AVM многообещающим шагом на пути к более человечному взаимодействию с ИИ.
Новости об искусственном интеллекте: OpenAI представила официальный выпуск сложного речевого интерфейса (SSI), специально разработанного для ChatGPT, чтобы улучшить общение и предложить более интерактивный пользовательский интерфейс.
Несмотря на запуск, функциональность AVM (доступность, проверка и управление) в настоящее время недоступна в нескольких европейских странах, в том числе в ЕС, Великобритании, Швейцарии и Норвегии. В настоящее время эта функция доступна только пользователям ChatGPT Plus и Teams, но начиная со следующей недели она станет доступна для клиентов Enterprise и Edu.
OpenAI запускает расширенный голосовой режим
Сэм Альтман, возглавляющий OpenAI, инициировал развертывание расширенного голосового режима (AVM) для подписчиков своих пакетов Plus и Teams. Во вторник компания сделала это объявление через свой официальный аккаунт (ранее известный как Twitter), заявив, что эта функция будет доступна всем квалифицированным пользователям в течение предстоящей недели.
В этом обновлении представлены некоторые новые элементы, такие как пользовательские рекомендации, расширенная функциональность памяти, введение пяти различных голосов и улучшенные возможности распознавания акцентов.
На следующей неделе расширенная функция Voice станет доступна всем участникам Plus и Team в приложении ChatGPT.
Как я и ожидал, я обнаружил несколько интересных обновлений. Теперь я могу более точно настраивать инструкции, расширить свои возможности, добавив пять новых голосов, и насладиться улучшением произношения.
Он также может сказать «Извините, я опоздал» более чем на 50 языках.
— OpenAI (@OpenAI), 24 сентября 2024 г.
В статье упоминается, что усовершенствованная модель голоса (AVM) способна общаться более чем на пятидесяти различных языках. Он также демонстрирует универсальность, позволяя выражать такие фразы, как «Извините, я опоздал», что делает диалоговый ИИ более адаптируемым, когда дело доходит до использования языка.
Регионы, исключенные из развертывания AVM
Первоначально компания, возглавляемая Сэмом Альтманом, упомянула, что некоторые европейские регионы не сразу получат доступ к AVM. На данный момент такие страны, как страны ЕС, Великобритания, Швейцария, Исландия и Норвегия, не участвуют в первоначальном развертывании.
Компания не указала точные сроки, когда голосовые возможности будут доступны в этих областях, но, похоже, что могут возникнуть нормативные препятствия, задерживающие процесс. Недавние обновления ИИ подчеркивают растущие дебаты о том, как следует регулировать ИИ в Европе, уделяя особое внимание вопросам конфиденциальности и защиты данных.
OpenAI продолжает преодолевать юридические препятствия, которые могут препятствовать внедрению новых функций на определенных рынках. Кроме того, до появления новостей, связанных с искусственным интеллектом, у компании возникла проблема с безопасностью, когда ее основная учетная запись X была взломана с целью мошенничества с криптовалютой.
Лица, осуществившие кибератаку, использовали платформу для распространения ложной информации о вымышленном блокчейн-активе под названием «$OPENAI». Этот обман привел ничего не подозревающих пользователей на фишинговые сайты, где были украдены данные для входа в их крипто-кошельки. Мошенник обещал, что участие в этой несуществующей акции вознаградит пользователей долей предполагаемого токена.
Отсутствующие функции и юридические проблемы
Хотя AVM предлагает расширенные возможности голосового управления, похоже, что некоторые функции, продемонстрированные ранее, в настоящее время не являются частью их текущей линейки продуктов. Например, возможности совместного использования видео и экрана, продемонстрированные ChatGPT в мае, еще не были развернуты для публичного использования.
Этот дизайн включает в себя мультимедийные аспекты, позволяя пользователям одновременно работать как с визуальным, так и с аудиоконтентом. Например, он может предоставлять обратную связь по фотографиям или видео в режиме реального времени.
OpenAI, которому не хватает определенных характеристик, столкнулся с проблемами, включая юридические споры и проблемы с управлением контентом. Примером этого является удаление голоса «Скай» после того, как Скарлетт Йоханссон подала в суд. Однако компания Сэма Альтмана заявила, что сходство было непреднамеренным, и в качестве меры предосторожности решила прекратить использование голоса.
Смотрите также
- Прогнозы криптовалюты DOGS: анализ и прогноз цен на Dogs
- Прогнозы криптовалюты KAS: анализ и прогноз цен на Kaspa
- Прогнозы криптовалюты DEGEN: анализ и прогноз цен на Degen (Base)
- Прогнозы криптовалюты NOT: анализ и прогноз цен на NOT
- 10 лучших криптобирж без KYC в 2024 году
- Прогнозы криптовалюты ARPA: анализ и прогноз цен на ARPA
- Прогнозы криптовалюты TRB: анализ и прогноз цен на Tellor Tributes
- Прогнозы криптовалюты BB: анализ и прогноз цен на BounceBit
- Прогнозы криптовалюты ZK: анализ и прогноз цен на ZKsync
- Прогнозы криптовалюты ZRO: анализ и прогноз цен на LayerZero
2024-09-24 23:08