Будущее Интернета: Революция ИИ-агентов в управлении цифровыми задачами

Искусственный интеллект способен осуществить мечту британского информатика Тима Бернерса-Ли, освобождая людей от рутинных задач, которые начнут выполнять ИИ-агенты. Об этом сообщает The Economist.

В 1999 году, всего через десять лет после появления Всемирной паутины, Бернерс-Ли описал будущее, в котором так называемые “интеллектуальные агенты” – машины, способные анализировать информацию и действовать на основе прочитанного – возьмут на себя задачи по планированию и поиску данных.

С тех пор интернет претерпел значительные изменения, однако пользователям по-прежнему нужно лично взаимодействовать с ним.

Современные большие языковые модели (LLM) начинают преодолевать этот барьер. Они способны подводить итоги документов, предоставлять ответы на вопросы и проводить анализ данных, но им все еще не хватает возможности осуществления действий.

Кевин Скотт, технический директор Microsoft, считает, что создание полностью автономных цифровых помощников не так уж далекое будущее. Главной преградой на этом пути является языковая составляющая, так как им необходимо наладить общение с интернет-сервисами и между собой.

Веб-сайты в основном взаимодействуют с миром через интерфейс прикладного программирования (API), сообщая, какие действия они могут выполнять, например, записывать на прием к врачу или показывать местоположение на карте.

Однако API разработаны для людей, что создает сложности для ИИ-агентов – каждый интерфейс обладает уникальными особенностями и требует изучения.

Чтобы цифровые помощники могли действовать в онлайн-пространстве независимо, необходимо стандартизированное общение. Эта задача возложена на протокол Model Context Protocol (MCP), разработанный стартапом Anthropic.

Майк Кригер, директор по продуктам компании, отметил, что концепция MCP возникла во время интеграции Claude с Gmail и GitHub, когда вместо индивидуального подключения каждого приложения к чат-боту была предложена разработка единого набора правил.

Агент может обратиться к серверу MCP, чтобы узнать, какие действия выполняет система – будь то бронирование рейса, отмена подписки или выплата компенсации. После этого генерируется действие от имени пользователя.

Например, если пользователь решает забронировать поездку из Лондона в Нью-Йорк, ему потребуется четкая схема действий.

Для этой координации необходимы правила, которые регулируют, как цифровые помощники идентифицируют друг друга, взаимодействуют и доверяют друг другу. В этой связи Google предложил протокол agent-to-agent (A2A), который позволяет агентам согласовывать, кто и что будет делать.

В декабре Linux Foundation создала организацию Agentic AI Foundation (AAIF), которая призвана предотвратить фрагментацию на рынке ИИ-агентов, обеспечивая совместимость и открытость продуктов.

Фонд станет платформой для развития общественных инициатив в области цифровых помощников, и среди его учредителей можно выделить такие компании, как AWS, Bloomberg, Cloudflare, Google, Cisco и другие.

Большинство веб-страниц, которые будут использовать агенты, ориентированы на восприятие человеком. Потребуются клики по меню для поиска информации.

Microsoft разработала Natural Language Web (NLWeb), чтобы облегчить доступ LLM к интернет-ресурсам.

Этот инструмент позволяет пользователям “общаться” с любым сайтом привычным языком. Например, на туристическом сайте пользователь может задать вопрос о предпочтительных вариантах отдыха с детьми, и NLWeb выдаст ответ на естественном языке.

Каждый подключенный к NLWeb ресурс может функционировать как сервер MCP, передавая контент агентам. Таким образом, NLWeb связывает современный визуальный интернет с тем форматом, который необходим ИИ-ассистентам.

С развитием ИИ-агентов формируется конкуренция платформ, напоминающая битву браузеров в 1990-х.

В те времена компании боролись за контроль над доступом к сети; сейчас браузеры преобразуются благодаря интеграции цифровых помощников. OpenAI и Perplexity уже запустили решения на базе ИИ-помощников, которые могут отслеживать рейсы, анализировать документы и управлять электронной почтой.

Однако их амбиции не ограничиваются этим. OpenAI интегрировала функцию прямых покупок в ChatGPT и добавила поддержку различных сервисов, таких как Spotify и Figma.

Такое развитие заботит действующих игроков рынка. Amazon потребовала, чтобы Perplexity исключила браузер с интегрированным ИИ-агентом из своего магазина, в то время как Airbnb решила не интегрироваться с ChatGPT, посчитав, что “функция еще полностью не готова”.

Рынок рекламы также должен адаптироваться. Текущий интернет ориентирован на монетизацию внимания пользователей. Alphabet и Meta являются ведущими игроками, извлекающими выгоду из этой модели.

Дон Сонг, эксперт из Калифорнийского университета в Беркли, утверждает, что маркетологи должны переключить свое внимание с людей на “внимание агентов”. Хотя тактика останется прежней – оптимизация рейтингов, таргетинг предпочтений и оплата размещения – но теперь целевой аудиторией станут алгоритмы.

Цифровые помощники могут значительно увеличить активность в интернете. Параг Агравал, основатель ИИ-стартапа Parallel Web Systems, утверждает, что интернет создан для людей, которые читают с человеческой скоростью. Агентам такие ограничения не присущи – они могут быстро сканировать тысячи страниц, переходить по ссылкам, которые остаются незамеченными, и выполнять несколько задач одновременно.

Однако существуют определенные риски. ИИ может ошибаться так же, как и люди, а также быть подвержен внешним атакам, например, из-за скрытых вредоносных команд на веб-страницах или в файлах.

Чтобы минимизировать эти угрозы, необходимы меры безопасности. Одна из них — ограничить доступ агентов только к надежным сервисам, другая — предоставить им узкий круг полномочий. Для выполнения особенно критических задач можно привлечь человека.

Стоит напомнить, что в ноябре Microsoft представила среду для тестирования ИИ-агентов, в ходе которой были выявлены уязвимости текущих цифровых помощников.