Reymer Digital

Мой ИИ-стек инструментов

ИИ и Агенты
❗ Прошел месяц с выхода моих инструментов.
За это время вышли обновления, которые успели стать незаменимыми.
О том что полезно, что удивило или расстроило - буду делиться в "что нового".
1. Claude
▶️ Возможности бизнес-аналитики и визуализации. пример
▶️ Всё чаще использую Проекты
- когда нужно быстро поработать с информацией в одном контексте (контент для сайта, статьи с учетом наработок).
▶️ Читаю книги на английском, особенно когда хочется оставить перевод на русском. загружаешь pdf, настраиваешь системный промпт, чтобы читал в нужном стиле и просишь переводить главу за главой, поправляя если необходимо. Deepl переводит книги крайне плохо.
🔥 Добрались руки до MCP (Model Context Protocol) - универсальный протокол для подключения LLM к инструментам. Для примера видео как работает магия Claude с Blender - собираем автомобиль по картинке из Midjourney с помощью Hyper 3D в Blender. Даем команду - дальше Claude сам.
(очень много ошибок и лишних действий - но MCP - это будущее!)
2. ChatGPT
продолжаю использовать как второй инструмент. Ищет в интернете хорошо - по крайней мере про меня всё правда.
🔥 Основной прорыв этого месяца - работа с картинками. Посты про возможности 4о уже были. [1] [2]
▶️ Новая модель о3 теперь может думать и изучать фото по частям - пример на видео "Где сделано фото?" прекрасно определяет место и событие. Сам процесс размышления по фото прекрасен.
В последнее время появилось много "думающих" моделей - думают долго, а результат часто не полный или вообще не тот.
Свой "думающий агент" в формате диалога более надежен и управляем.
3. NotebookLM
теперь умеет создавать ментальные карты и искать новые источники.
▶️ Как раз сейчас работаю в нем над темой Agentic BPM (полное переосмысление 20 лет в автоматизации и управления бизнес-процессами. с ИИ будем всё менять). Пример как работает на видео.
4. Midjourney
Вышла версия 7. Продолжаю обучать профили под себя, так как старые бесполезны (всегда использую несколько - общий, под фотопортреты, рисунки и анимацию).
▶️ Добавился режим Драфт - можно на русском языке наговаривать, что хочется увидеть и корректировать изображение в диалоге - mj сам переводит в промпт на английском и довольно быстро отрисовывает варианты. пример в видео (без звука).
▶️ Теперь запросы можно писать на любом языке. Это и плюс и минус, так как mj сам решает какой контекст ему использовать в зависимости от языка - в качестве примера как он отрабатывает один и тот же промпт на разных языках "Город в 1990 году" - сразу понимаешь о какой стране идет речь. Попробуйте людей сами - эффект аналогичный:)
... руки-ноги всё еще бывают не идеальны, но в целом качество 7-ки подросло существенно.
5. Adobe
новинки будут скоро. пример как Firefly генерит по фото - танцующий Плампи.
6. Elevenlabs
можно создавать своих голосовых агентов, которые будут говорить вашим голосом, опираясь на текст, который вы дадите агенту. Добавил такого на сайт reymer.digital (только с VPN).
7. Cursor
После выхода Claude Sonnet 3.7 стал намного лучше. На нем полностью в режиме вайб-кодинга сделан раздел по ИИ-агентам на сайте.
Сейчас основной инструмент для разработки с ИИ.
Автоматизация и создание агентов
🔥 Плампи 2 - перевел своих агентов на Claude Sonnet 3.7.
Автоматически изменилась сама модель решения задач - агент стал делать больше итераций и запросов к разным инструментам, чтобы получить нужный ответ.
Дольше думает, но результаты интереснее и точнее, а за счет увеличенного контекстного окна еще и более полные.
Телеграм + агенты, привязанные к топикам, каждый со своим системным промптом, контекстной памятью и инструментами - пока самый удобный вариант ассистентов. И задачи между ними легко пересылать.
Всем хорошего ИИ-погружения.
До AGI и полностью автономных систем нам еще далеко, но движемся мы очень резво.
P.S. Кому всё еще мало сценариев - как нам жить вместе с ИИ - смотрим новый сезон "Черного зеркала"