Reddit, Google и реальная цена лихорадки данных ИИ

Самые главные криптоновости в Телеграм-канале CryptoMoon, присоединяйтесь!👇

Cryptomoon Telegram


Reddit, Google и реальная цена лихорадки данных ИИ

Как человек, наблюдавший за цифровым ландшафтом в течение последнего десятилетия или около того, я своими глазами видел, как Интернет развивался и трансформировался с годами. Я помню время, когда поисковые системы, такие как Google и Bing, были в первую очередь ориентированы на индексацию веб-сайтов и предоставление пользователям точных и релевантных результатов. Но сейчас, похоже, ситуация изменилась к худшему.


На прошлой неделе Google оставался единственной значимой поисковой системой, интегрирующей Reddit. ни Microsoft Bing, ни DuckDuckGo, ориентированный на конфиденциальность, не предоставляют недавних ссылок на Reddit и не дают плодотворных результатов. Большинству интернет-пользователей этот сдвиг может показаться незначительным в ближайшем будущем, поскольку подавляющее большинство полагаются на Google, который контролирует примерно 90% доли мирового поискового рынка. Однако это интригующее событие, заслуживающее внимания. Reddit, зародившийся как агрегатор ссылок и превратившийся в активное онлайн-сообщество с более чем 80 миллионами активных пользователей в день (чем больше, тем лучше), как сообщается, к чему-то готовится. Почему эта популярная платформа, которая может похвастаться глубокими связями в сети и сыграла важную роль в формировании цифровой культуры, внезапно укрепила свои позиции?

Как энтузиаст технологических тенденций, я заметил, что в последнее время искусственный интеллект становится горячей темой, когда речь идет о необычном поведении технологических компаний. Например, в начале этого года Google попал в заголовки газет, заключив, как сообщается, соглашение с Reddit стоимостью примерно 60 миллионов долларов в год о лицензировании их данных для улучшения разработки моделей искусственного интеллекта. Кроме того, некоторые наблюдательные пользователи заметили рост количества сообщений Reddit, появляющихся в результатах поиска, при этом комментарии пользователей высоко ранжируются в различных запросах. Хотя эти истории взаимосвязаны, их также можно рассматривать как отдельные: такие компании, как Google, стремясь создать более совершенные модели искусственного интеллекта, стремятся лицензировать данные и избегать юридических споров. С другой стороны, пользователи уже некоторое время используют Reddit в качестве дополнения к поисковым запросам, что делает его популярным средством повышения качества поиска. Следовательно, Google, по сути, следует примеру своей пользовательской базы, интегрируя контент Reddit в результаты поиска.

На пересечении двух нарративов возникают осложнения. Поисковые системы собирают актуальную и актуальную информацию, используя ботов для перемещения по сети, индексации того, что они обнаруживают, и систематизации ее на основе запросов пользователей. Веб-сайты имеют некоторую власть над тем, происходит ли и каким образом это исследование, и существует множество причин, по которым они могут ограничить или запретить сканирование всех своих сайтов (например, владелец личного блога может предпочесть оставить устаревший блог недоступным для поисковых систем, в то время как Facebook позволяет обнаруживать профили пользователей, но не их содержимое). Однако в течение многих лет это исследование было простой и взаимной сделкой. Поисковые системы привлекли огромное количество пользователей, предоставляя ценные услуги; веб-сайты приветствовали и даже допускали сканирование поисковыми системами для охвата этой аудитории.

За последние несколько лет ползание приобрело дополнительную роль. Роботы, которые сканируют ваш сайт и собирают информацию, больше не просто создают поисковый индекс. Они также могут разрабатывать модель искусственного интеллекта. Это становится неожиданностью для многих веб-сайтов, поскольку эта новая функция никогда не была частью первоначального соглашения. Как пишет Дэвид Пирс в своей статье для The Verge, переход от построения поисковых индексов к обучению ИИ приводит к распаду фундаментального взаимопонимания в сети между пользователями и платформами. На смену симбиотическим отношениям приходит односторонняя эксплуатация, подпитываемая срочными и односторонними действиями как стартапов, так и технологических гигантов.

Первоначально последствия этого краха были ограниченными и в первую очередь затронули крупные веб-сайты и платформы, управляемые такими технологическими гигантами, как Facebook и Amazon, которые запретили сканерам таких компаний, как OpenAI. Однако такая ситуация сохранялась недолго. Учитывая, что Google активно инвестирует в искусственный интеллект, а Bing принадлежит Microsoft – крупному инвестору и партнеру OpenAI, – все поисковые системы в одночасье стали объектами искусственного интеллекта. В бой вступили новые типы сканеров, в результате чего все сканирование стало процессом, управляемым искусственным интеллектом. Этот сдвиг был очевиден для всех, кто внимательно следил за своим веб-трафиком, поскольку боты очищали контент с беспрецедентной скоростью.

Критики утверждают, что приобретение Google Reddit, несмотря на предыдущие опасения компании по поводу антимонопольного контроля, может дать ей несправедливое преимущество на рынке поисковых систем. Поскольку Reddit является одним из крупнейших источников подлинного человеческого текста в Интернете, более мелкие поисковые системы с трудом могут конкурировать без него.

Reddit играет решающую роль в завершении повествования, поскольку именно он обеспечивает соблюдение блоков. Microsoft, с другой стороны, признала, что их веб-сканеры были ограничены. По словам представителя Reddit в беседе с The Verge:

Наше постоянное партнерство с Google не имеет отношения к этому вопросу. Фактически, мы вели переговоры с несколькими поисковыми системами. Однако не каждая сторона готова взять на себя обязательные обязательства относительно обращения с контентом Reddit, особенно когда речь идет об использовании этого контента в целях искусственного интеллекта.

Руководство Reddit, будучи публичной компанией, приняло прагматичный подход, внедрив изменения, которые могут принести пользу акционерам, но могут отрицательно повлиять на общественность. Требуя от пользователей использовать Google для функций поиска, Reddit увеличивает свою зависимость от быстро развивающихся поисковых алгоритмов Google, на которые влияет технология искусственного интеллекта. Этот сдвиг может привести к притоку спам-контента в популярные темы из-за резкого роста трафика из поисковых запросов Google, направленного на повышение видимости в результатах поиска.

Google, как и Reddit, процветает благодаря философии и методам открытой сети. Однако такие эксклюзивные сделки сигнализируют о закате этой продуктивной эпохи, охватывающей десятилетия. В течение некоторого времени Интернет испытывал трудности из-за появления изолированных платформ, усиления консолидации рекламы и избытка контента от систем искусственного интеллекта, использующих его для обучения. Растущая угроза парсинга ИИ может стать последним ударом, потенциально превращая этот несовершенный, но замечательный эксперимент во взаимосвязанных сетях и человеческом диалоге в серию враждебных контрактов между конкурирующими технологическими гигантами.

Смотрите также

2024-07-28 12:30