Замкнутый круг ИИ: будущее автономных ИИ-агентов и их развитие

Как мы сегодня воспринимаем ИИ?

Пост для руководителей, лидеров, которые никогда не программировали или забыли как это делается...

Помощник, коллега, сотрудник? Или просто невидимый ни для кого агент, который помогает нам быть чуть сильнее/честнее/хитрее (подберите свое слово) наших коллег?

Каждый час появляются новые инструменты и ИИ-агенты. По прогнозам рынок ИИ-агентов будет расти каждый код на 44% следующие 10 лет.

Давайте зафиксируем для истории - сегодня 15 ноября 2024 года.
На Hugging Face ровно 1 118 886 моделей.
(уже 1 119 090, Больше 200 моделей добавилось пока я писал этот пост)

И когда мы погружаемся в знакомство с моделями, пытаемся создать первых агентов, то мы начинаем экспериментировать. Мы действительно начинаем экспериментировать и креативить.

По одной простой причине. Сегодня ИИ способен на наш запрос безропотно создать то, что мы просим - текст, картинку, видео, приложение, web-сайт, автономный бизнес (ну тут еще пока не сразу, но очень скоро..) .

Всё это мы кажется могли делать и раньше... НО! Сегодня нам не нужно никого спрашивать, не нужно описывать и ставить задачи разработчикам, не нужно пытаться продумать до мельчайших подробностей идеи, чтобы их было не стыдно обсудить даже с друзьями .... Сегодня, можно об этом попросить ИИ.

Можно попросить придумать идеи. Можно попросить создать приложение, сайт и отправить их (реализованные прототипы) в свободное плавание, чтобы через месяц посмотреть какая из 10 гипотез наиболее близка к успеху и сфокусироваться только на ней.

Мы способны решить две самые главные задачи для бизнеса (особенно в B2B), которые были недоступны раньше:

1. Для меня как стратега и архитектора бизнеса - Как запустить на проверку свою самую сумасшедшую идею, не напрягая других (и делать это столько раз, сколько мне захочется, пока не получу результат) с минимальными затратами (без бюджета).

2. Для меня как руководителя - Как, получив обратную связь, максимально быстро масштабировать рабочую идею на рынок, чтобы собрать все сливки и не навредить текущему бизнесу.

Будем разбираться последовательно.
Сегодня только про первый вопрос.
Мы же руководители, нам всё равно кто-то нужен в помощь. Собираем себе помощника на базе ИИ инструментов.

Telegram +

n8n +

(OpenAI ChatGPT / Anthropic Claude) +

(ВАШИ ИНСТРУМЕНТЫ)

(вас ограничивает только ваша фантазия).

В чем ключевое отличие от всех подходов к разработке за последние 20-30-50 лет. За 30 могу ручаться, так как прошел этот путь самостоятельно, начиная с разработки первых low-code решений а начале 2000-х, и управляя командами разработки и внедрения последние 20 лет.

ИИ пишет код не вместо вас, а "рядом" с вами. Это значит, что этот код можно дальше передать команде, которая доведет его до совершенства.

Но именно Вы были тем, кто эту гипотезу придумал, проверил и доказал, что все вокруг ошибались, когда говорили, что это невозможно.

Что умеет делать мой агент (и я пока на той стадии, когда ИИ всё ещё не требует привлечения разработчиков. Я продолжаю разрабатывать его на естественном языке и насыщать его инструментами, чтобы):

1. Вести диалог: Отвечать текстом, картинками, голосом. Понимать тексты, картинки, голос. (гигиенический минимум современных моделей)

2. Искать в интернете: (то, что было прорывом Perplexity, а сейчас и OpenAI, легко закрывается поиском google, добавленным в агента)

3. Читать статьи по ссылкам: (Подсказка - чтобы написать такой инструмент, нужно попросить ИИ его написать на том языке, который вам нужен)

4. Считать: Генеративный ИИ не умеет "умножать" и "делить", поэтому нужно дать ему инструмент и объяснить как им пользоваться (на естественном языке). Для анализа финансовых отчетов - обязательно!

5. Вызывать внешние и корпоративные API и использовать их как инструменты. Простой запрос в телеграм-бот - "Какая выручка за 2023 год у компании ХХХХ?" и сервис по имени находит ИНН, делает запрос через API к Контур-Фокус (в моем случае) или к FMP (если компания международная и публичная, то изучает отчеты SEC. очень удобный сервис)

6. Добавлять любые инструменты - отправить письмо, сделать презентацию, подготовить отчет, создать таблицу... уволить сотрудника, выписать премию, похвалить себя (хотя после премии, кажется, это уже лишнее)

(Как создать своего собственного агента - обязательно покажу в одном из следующих постов)

Еще раз - что такое агент! я ему просто добавляю инструменты с пояснением на естественном языке. Например, "если в запросе тебя просят использовать поиск или, если твои знания заканчиваются раньше, чем события в запросе, то используй этот инструмент ".

И он сам определяет какие ему нужны инструменты при выполнении и в какой последовательности.

И если нужно - он сам вызовет их столько раз - сколько нужно и когда нужно. (учитывайте это, если автоматизируете отправку писем коллегам или начальству. Лучше добавить шаг подтверждения ;) )

Какой главный вопрос стоит перед нами сегодня - а что, если эта самая крутая модель, нас просто ограничит в доступе и отключит?

Честно признаюсь, последние три дня пытаюсь понять за что меня забанил Claude (и он даже вернул денег, так как у меня оплаченный API). Удобный доступ к истории всех своих запросов за последний год я потерял, но новый аккаунт завел. (Вспоминаем совет наших айтишников - всегда делаем бэкап! а личных данных - в первую очередь!)

Главный вопрос для меня - у многих LLM моделей начинает появляться цензура, и, возможно, именно автоматическая цензура меня отключила (где-то через два дня после перехода на думающего агента). Но ведь я не могу контролировать моего агента, который сегодня для решения моей задачи может разложить ее на несколько неудобных вопросов, которые могут противоречить Term of Services или Usage Policy. И если причина в этом, то мы сами себя ограничиваем в прогрессе...

Пока это не страшно - сама реализация агента сделана "над" моделями, на open-source инструментах, которых будет всё больше. Да и сам ИИ как технология демонетизируется и демократизируется очень быстро.

Поэтому я могу спокойно выбирать между Claude, ChatGPT и другими моделями.... и продолжать насыщать агента нужными мне инструментами.

С учетом скорости развития ИИ сегодня можно занимать только две позиции:

1. Вы пробуете доступные инструменты, понимая, что через 3-4 месяца любая платная надстройка или сервис над ними станут бесплатными. Ваша цель - найти работающий сценарий и на нём успеть заработать и эволюционировать на следующий. (стратегия разумного бизнеса)

2. Вы ждете, когда у ваших коллег по рынку заработает новый инструмент и вы к ним присоединитесь (Идеальная стратегия, если вы уже монополист)

На подумать: Если вы еще не собрали своего агента, но вдруг видите, что ваши коллеги стали начитаннее, продуктивнее, быстрее, креативнее (этот навык тоже начинает измеряться скоростью) то, возможно, они просто прочитали этот пост раньше вас?

Замкнутый круг ИИ? Будущее ИИ-агентов

Мы способны решить две самые главные задачи для бизнеса (особенно в B2B), которые были недоступны раньше: