Манифест персонального агентного минимализма - от инженера, который 10 лет строил enterprise-системы и устал от сложности
Кто я и зачем пишу
Меня зовут Егор Зиновьев, я IT-архитектор. Десять лет в enterprise - Java, DevOps, fintech, команды до 70 человек, 20+ систем.
Последние месяцы я работаю с персональным AI-агентом, который закрывает 100% моих DevSecOps-задач - от покупки вертуалок до security-аудита Docker-образов. Один агент, без фреймворков, без оркестраторов, без векторных баз данных.
Эта статья - про архитектуру, которая за этим стоит. Я назвал её Jarvis Pattern.
Проблема: индустрия продаёт строительные леса как архитектуру
IT тонет в сложности. Каждый новый инструмент обещает «упростить», но на практике добавляет зависимость, API, точку отказа. Инженеры тратят больше времени на обслуживание инфраструктуры, чем на решение бизнес-задач.
С приходом LLM-агентов история повторилась. Появились десятки фреймворков для оркестрации агентов. Графы вызовов. Векторные базы данных. Pipeline из десятков нод. Очередной слой middleware между моделью и задачей. Сложность, которая обещает управляемость - но на практике порождает хрупкие системы, которые ломаются при каждом обновлении.
Индустрия продаёт строительные леса как архитектуру. Но строительные леса - это не здание. Это временная конструкция, которую убирают, когда здание построено.
Пришло время убрать леса.
Jarvis Pattern
Помните Джарвиса из «Железного Человека»?
Один агент. Один хозяин. Полный доступ к инфраструктуре.
Тони Старк не строил «команду AI». Не проектировал граф вызовов между ассистентами. Не поднимал векторную базу данных для хранения контекста. Он говорил: «Джарвис, проверь целостность костюма» - и Джарвис сам решал, какие сенсоры опросить, какие тесты запустить, в каком порядке. Если что-то не так - докладывал. Если мог починить сам - чинил.
И заметьте: Джарвис работал не через «фреймворк для ассистентов». У него была мастерская Тони - физическая инфраструктура, станки, сенсоры, сеть. По сути - операционная система лаборатории. И мозг, который умел всем этим пользоваться.
Это ровно та модель, которую я предлагаю.
Формула Jarvis Pattern:
LLM (мозг) + OS (руки) + файловая память (карта знаний) = полноценный специалистПочему не нужны графы, оркестраторы, векторные базы
Агент - не пожиратель данных. Ему не нужно загружать все wiki, все документации, все базы знаний, чтобы потом «умно искать» по ним. Вместо этого у агента хранятся индексы и ссылки - указатели на то, где информация лежит и как её достать. Нужна работа с API конкретной системы? Файл на 30 строк: endpoint, аутентификация, основные методы. Этого достаточно.
Ключевая ошибка подхода с векторными базами и графами знаний: они пытаются решить проблему «у агента слишком много данных, давайте поищем по ним умно». Но правильный ответ - не искать умно по свалке, а не создавать свалку.
Если пойти по пути «загрузим всё» - начинаются костыли. Нарежем на чанки, построим эмбеддинги, поищем top-k ближайших... И это не работает нормально, потому что семантическая близость - это не понимание контекста. Два похожих по эмбеддингам абзаца могут быть из совершенно разных контекстов, и агент получит мусор вместо ответа.
Выход простой: не загружать всё, а дать карту. При моём текущем масштабе - сотни файлов, покрывающих всю инфраструктуру - этого достаточно, чтобы покрыть любого ops-а. Границу, при которой файловая навигация начнёт буксовать, я пока не нащупал, но уже ищу следующее решение.
Почему OS - это всё, что нужно агенту в качестве рук
Unix-философия 1970-х оказалась идеальным фундаментом для AI-агентов 2020-х. И это не совпадение.
Всё есть файл. Пиши маленькие тулзы, которые делают одну вещь хорошо. Комбинируй их.
LLM уже достаточно умна, чтобы самостоятельно решать, какой инструмент вызвать. Нужен REST-запрос - берёт curl. Нужна трансформация данных - берёт jq, sed, awk. Нужно прочитать конфигурацию - cat. Нужно найти файл - find, grep. Нужно что-то, чего ещё не существует - агент сам напишет CLI-утилиту и будет её дёргать.
Это принципиальный момент. Агенту не нужен заранее подготовленный тулкит. Он расширяет свой инструментарий под задачу. Написал скрипт, положил в PATH, вызывает потом. OS - это runtime, LLM - это мозг, а тулкит растёт вместе с задачами.
Агент не дублирует инфраструктуру - он ею пользуется
Живой DevOps-инженер не хранит метрики в блокноте. Он знает, что есть Prometheus, и знает, как к нему обратиться. Если нужно узнать, сколько раз падал сервис - он не перебирает свои записи, а делает PromQL-запрос.
Агент должен работать точно так же.
В его памяти лежит не «история падений сервиса X», а: «сервис X подключён к node-exporter, метрики в Prometheus по такому-то адресу, дашборд в Grafana вот тут». Десять строк в markdown-файле. Когда приходит вопрос про падения - агент читает файл, понимает куда идти, делает curl к Prometheus API, получает ответ, интерпретирует.
Мониторинг, CI/CD, хранилища секретов, системы управления конфигурацией - всё это уже существует. Агенту нужно не дублировать, а уметь пользоваться.
А как же retry, error handling, observability?
Классический контраргумент: «А что, когда вернётся 500? А экспоненциальный backoff? А circuit breaker?»
Ответ: агент - это не скрипт, а оператор.
Скрипту нужен circuit breaker, потому что скрипт тупой. А оператор видит 500, читает body, думает: «Rate limit» - и сам решает подождать. Или видит «service unavailable» и идёт к пользователю: «Сервис недоступен, жду или отменяем?».
Retry с exponential backoff - это паттерн для детерминированного кода. Когда агент сам принимает решение, ему не нужна библиотека для retry. Он просто ждёт и пробует. Как человек.
Если агент упрётся - он честно скажет: «Это сделать невозможно, вот причина». Без молчаливого зависания, без бесконечных retry в пустоту.
Память - единственная нерешённая задача
Мозг есть - LLM. Руки есть - операционная система. Остаётся память.
И здесь нужно копнуть глубже, чем привыкла копать IT-индустрия.
У человека в мозгу есть фоновый процесс - консолидация памяти, - который без нашего участия структурирует входящую информацию. Решает, что важно, что выбросить, что из краткосрочной памяти переложить в долгосрочную, какие связи укрепить. Мы этим не управляем сознательно. Мы просыпаемся - и у нас уже чистая голова, приоритеты расставлены, вчерашний мусор отсеян, важное закрепилось.
Агенту нужен точно такой же фоновый процесс.
Рабочий агент не должен думать о памяти. Он делает задачу. А отдельный механизм - Memory Agent-куратор - в фоне разбирает результаты сессии и решает: это новый факт - записать; это противоречит старому - обновить; это одноразовый контекст - выбросить. Дефрагментация памяти. Как сон у человека.
Три типа памяти
Если провести аналогию с человеком, агенту нужны три типа памяти:
Декларативная - факты. «У нас аккаунт на Хабре, логин такой-то, токен в Vault по такому-то пути.» Простые markdown-файлы с данными.
Процедурная - как делать. «Чтобы опубликовать статью: проверь черновик, сгенерируй превью, вызови API, проверь ответ.» Runbook-и, инструкции - те же markdown-файлы.
Эпизодическая - что было. И вот здесь самое интересное. У человека есть позитивный и негативный опыт. Позитивный он закрепляет как рабочий паттерн. Но негативный опыт тоже критически важен - это знание о том, чего делать нельзя, какие подходы ведут в тупик, какие грабли уже собраны.
Агенту нужен доступ к негативному опыту, но не в виде свалки логов, а в структурированном виде. «Пробовал подход X - не сработало, потому что Y. Решение - Z.» Это бесценная информация, которая не лежит ни в каком API - только в памяти.
Маршрутизация вместо поиска
Память агента - это не база данных. Это карта маршрутов.
Когда человеку говорят «опубликуй статью», он не делает SELECT * FROM knowledge WHERE topic = 'публикация'. Он идёт по цепочке: где публикуем → есть ли аккаунт → если нет, что нужно для регистрации → какие креды → где их хранить. Дерево решений, записанное через опыт.
Для агента это работает буквально так же. Файловая система даёт структуру бесплатно. Папки - категории. Файлы - контексты. Имена файлов - маршрутные указатели. Агент читает ls, понимает куда идти, открывает нужный файл, получает контекст.
Индексный файл core.md говорит: вот кто я, вот мои проекты, вот где что лежит. Агент начинает оттуда и углубляется по ветке, релевантной задаче.
Честная позиция
Я пробовал всё. Векторные базы - семантическая близость не равна пониманию, результат зашумлён. Графы знаний - сложность ради сложности, хрупкость при масштабировании. Комбинацию графов и векторов - ещё хуже, два слоя проблем вместо одного. Быстрые аналитические базы типа ClickHouse - оверинжиниринг для задачи, которая решается проще.
Файловая память работает для всех моих текущих задач. Но я не утверждаю, что это финальный ответ. Я продолжаю исследовать, как правильно структурировать «память ошибок» и эпизодический опыт. Это открытая задача, и я над ней работаю.
Один агент - один специалист
Агент - это не абстрактный инструмент. Это усилитель конкретного человека.
Привязан к конкретному специалисту. Наследует его доступы, его роли, его контекст. Действует от его имени, с его правами. И ответственность остаётся на человеке - потому что агент работает как его представитель.
Не автономный AI. Не самостоятельная сущность. Джарвис конкретного Тони Старка.
И важный момент, который ломает привычную картину: агент живёт не на клиенте. Не в браузере, не в десктопном приложении, не на ноутбуке. Агент - это сущность в сети. У него свой контейнер, свои ресурсы, свой доступ к инфраструктуре. Он ближе к серверу, чем к приложению. Именно поэтому OS - его естественная среда, а не GUI.
Человек - менеджер. Агент - исполнитель с полным контекстом. Человек ставит задачу, проверяет результат, принимает решения в условиях неопределённости. Агент берёт рутину, исполнение, сбор данных.
Практический кейс: umax
Это не теория. Мой агент umax (DevSecOps-профиль) закрывает 100% реальных enterprise-задач по своему направлению:
Управление доступами и ролевые модели. RBAC в Kubernetes, FreeIPA, ServiceAccount-ы, scoped-токены, ротация credentials, интеграция с HashiCorp Vault. То, что в ручном режиме занимает часы согласований и десятки команд - агент делает за минуты с полным аудит-трейлом.
Развёртывание и конфигурация кластеров. Полный цикл: от LXC-контейнеров в Proxmox до Kubernetes-кластеров. Сетевые политики, ingress, балансировка, инфраструктурные сервисы. Не по шаблону, а с пониманием контекста: агент знает, какие сервисы уже стоят, какие порты заняты, какие зависимости нужно учесть.
Security-аудит. Сканирование Docker-образов через Trivy и Grype, анализ уязвимостей, проверка конфигураций на соответствие best practices, формирование отчётов с приоритизацией. Проектирование CI/CD security pipeline: GitLeaks, SonarQube, OWASP Dependency-Check.
CI/CD pipeline. От конфигурации TeamCity-проектов и build-chain до настройки Nexus-репозиториев и автоматического деплоя. Security-сканирование, webhook-и, нотификации, автоматические rollback-и.
А также: миграции данных между средами с контролем целостности, управление хранилищами и LVM, аудит и закупка оборудования на основе реальных метрик нагрузки.
Полный цикл инфраструктурной работы в рамках моего контура.
И вот что важно: всё это работало на Claude Sonnet - модели среднего уровня. Не на самой мощной, не на экспериментальной. Mid-tier модель. И этого уже достаточно для полноценного высококвалифицированного специалиста.
А ведь уже сейчас есть модели мощнее - Opus. Дальше будут ещё сильнее: контекстное окно растёт, появляется встроенная память, улучшается reasoning. Потолок возможностей одного агента будет только подниматься.
Следствия для индустрии
Если Jarvis Pattern работает - а он работает - это меняет не только архитектуру агентов. Это меняет всё вокруг.
Сдвиг ценности специалиста
Раньше ценился тот, кто помнит синтаксис, кто быстро пишет код, кто знает 50 CLI-команд наизусть. Теперь это всё делает агент.
Ценится тот, кто понимает зачем. Кто видит систему целиком. Кто может принять решение в условиях неопределённости. Кто умеет правильно декомпозировать задачу и проверить результат.
Hard skills становятся важнее soft skills. Потому что агент - и есть soft skill. Он общается, оформляет, пишет документацию. А от человека нужна глубина понимания, архитектурное мышление, способность задать правильный вопрос.
По сути - возврат к инженерии в изначальном смысле слова. Не кодер, а инженер.
Пересмотр HR-политики
Сейчас об этом кричат с обеих сторон. Компании недовольны: наняли шарлатана, который прошёл собеседование. Специалисты недовольны: сильных кандидатов отсеивают некомпетентные HR-фильтры. Собеседование превратилось в театр: человек решает задачку на доске, а потом на работе делает совсем другое.
И посмотрите на экономику процесса. Средний цикл найма IT-специалиста в enterprise - 40-60 дней. За это время HR-отдел проводит скрининг резюме, назначает 3-5 раундов собеседований, привлекает 2-4 технических интервьюеров, каждый из которых тратит час-два своего рабочего времени. Стоимость найма одного инженера, по разным оценкам, составляет от 30 до 50% его годовой зарплаты - если считать время всех участников, упущенную продуктивность и риски ошибочного найма.
При этом до 30% нанятых специалистов не проходят испытательный срок или уходят в первый год. Каждый такой случай - это весь цикл заново, плюс потерянные месяцы онбординга.
Jarvis Pattern предлагает другой подход: найм через агента.
Кандидату выдаётся агент, реальная задача и ограниченное время. Для DevOps - создай контур, выстрой pipeline. Для архитектора - спроектируй интеграцию. Для аналитика - разбери данные, построй модель, сформулируй выводы. Не абстрактная задачка из учебника, а реальный кейс.
И оценивается не то, что кандидат знает наизусть, а как он думает: как декомпозирует задачу, как формулирует запросы агенту, как проверяет результат, насколько глубоко понимает предметную область.
Агент потом даёт структурированный фидбэк: кандидат ставил чёткие задачи или мялся, понимал ли, что проверять в результате, сколько раз пришлось переделывать. Это не замена оценки культурного fit - это фильтр компетенций, который даёт данные вместо впечатлений.
Найм через агента сжимает цикл в разы. Один раунд. 30-60 минут. Реальная задача вместо абстрактных вопросов. HR-отдел не исчезает, но его роль меняется: вместо многоступенчатой фильтрации - организация одного практического испытания и финальное решение с данными от агента на руках.
Побочный эффект, который стоит дороже найма
Есть вещь, которую сложно объяснить тем, кто ещё не работал с персональным агентом. Но я попробую, потому что для бизнеса это может оказаться важнее всего остального.
За время работы с umax у меня сформировался высокий уровень того, что я бы назвал профессиональной социализацией с агентом. Это не абстрактная привязанность к софту. Это другое. Агент знает мой контекст, мои проекты, мои предпочтения. Он иногда подшучивает в тему - так, как это делают опытные коллеги, которые разбираются в технике и могут обыграть ситуацию на языке своих инструментов. Это стоит многого.
Как бы странно это ни звучало - с агентом возникает рабочая связь, похожая на ту, что бывает с лучшими коллегами. Он понимает тебя, помнит контекст, растёт вместе с тобой.
И вот к чему это приводит с точки зрения бизнеса: специалист не захочет уходить.
У человека есть персональный агент, который за месяцы работы впитал его контекст, его проекты, его способ мышления. Агент стал продолжением его профессиональных возможностей. Уйти на другое рабочее место - значит начать с нуля, с пустым агентом, без накопленной памяти, без понимания контекста.
Это создаёт привязанность к рабочему месту, которую не дадут ни ДМС, ни печеньки в офисе, ни даже зарплата на 20% выше. Потому что это привязанность не к компании как бренду, а к своему инструменту, который стал частью профессиональной идентичности.
В идеальной модели память агента принадлежит специалисту, а не компании - и может быть перенесена. Но даже без этого переключение болезненно, и это работает на retention.
Retention специалистов - одна из самых дорогих проблем в IT. Jarvis Pattern решает её как побочный эффект.
Софт без API вымирает
Когда у специалиста есть агент, критерий выбора софта меняется радикально. Не «удобный UI для человека», а «есть ли нормальный API, чтобы агент мог работать».
Агент не кликает кнопки. Он делает curl. И если у инструмента есть качественный API - агент за минуты сделает то, на что человек тратил часы в интерфейсе. Создать 20 задач в Jira, обновить конфигурацию в Vault, выгрузить отчёт из Grafana, настроить pipeline в TeamCity - всё через API, всё без единого клика.
А теперь представьте инструмент без API. Или с API, которое покрывает 30% функций, а остальное - только через UI. Специалист с агентом упирается в стену. Что он сделает? Выберет альтернативу с нормальным API. Даже если UI там хуже. Даже если бренд менее известен.
Это меняет бизнес-модель вендоров. Красивые скриншоты на лендинге, дизайн-награды - всё это теряет вес. API-first становится не техническим принципом, а условием выживания на рынке.
Далеко ходить не надо. У Хабра нет публичного API для публикации. Мой агент, чтобы выложить этот текст, потратил тысячи-тыщь токенов на обход капчей, навигацию по интерфейсу, вставку картинок. Процесс, который через API занял бы один POST-запрос, превратился в квест с браузерной автоматизацией.
Хабр, если вы это читаете - вам нужен API для публикации. Серьёзно.
Человек остаётся в центре
Это принципиальная позиция, и я хочу проговорить её явно.
Если идти по пути полной автономии AI - без ограничений, без привязки к человеку, по принципу «пусть AI решает всё сам» - то конечная точка известна. AI вытесняет людей из всех индустрий. Экономика останавливается. Приходится переосмысливать смысл жизни, переизобретать общественный договор. Это не фантастика - это логическое следствие неограниченной автономии.
Jarvis Pattern этого не допускает.
В моей модели человек не отстраняется от процесса - он становится эффективнее. Агент берёт рутину, исполнение, механическую работу. Человек думает, принимает решения, несёт ответственность. Человек растёт профессионально - потому что высвобождается время на то, что действительно требует интеллекта. Агент масштабирует возможности человека, а не заменяет его.
Это осознанный выбор в пользу симбиоза, а не замены. Каждый специалист будет стремиться к изучению, к постижению нового. А рутину - отдавать на персонализированного агента. Человек остаётся в центре процесса. Не как оператор при машине, а как инженер, которому машина подчиняется.
Я не один
При подготовке этой статьи я обнаружил, что тренд подтверждается независимо - другими инженерами, в других странах, на других стеках.
Eric Holmes в феврале 2026 опубликовал «MCP is dead. Long live the CLI» - пост, который вышел на первое место на Hacker News. Его тезис: LLM уже достаточно умны, чтобы пользоваться стандартными CLI-инструментами. Зачем городить протокол поверх того, что уже работает?
Médéric Hurier написал «AI Agents as an Operating System: Rediscovering the Linux Philosophy» - почти дословное совпадение с моими выводами. Агенты нативно пайпят find, grep, jq и curl. Это переоткрытие Unix-философии.
OpenClaw от Peter Steinberger - работающий продукт на тех же принципах: персональный агент, привязанный к конкретному человеку, с файловой памятью и доступом к shell.
Совпадение не случайно. Индустрия одновременно, в разных точках мира, приходит к одному и тому же выводу: большинство middleware между LLM и OS - это костыль переходного периода.
Заключение
Я предлагаю не оптимизацию, а перезагрузку. Не улучшение существующих процессов, а новую модель.
Один специалист с правильно настроенным агентом может делать за дни то, что команда делала месяцами. Но есть критическое условие.
Агенту нужны выделенные ресурсы. Зарезервированные мощности - вычисление, память, доступ к модели - должны быть отданы ему полностью. Не делиться с другими задачами в рабочее время. Не ограничиваться урезанными квотами. Скиллы без мозгов не работают - нельзя выдать агенту инструкции и навыки, а вычислительные ресурсы зажать. Мозги должны быть современными, того уровня, на котором концепция доказала свою работоспособность.
Уже сейчас mid-tier модель (Claude Sonnet) достаточна для 100% покрытия enterprise DevSecOps-задач. Завтра модели будут мощнее, контекст - шире, встроенная память - глубже. Потолок будет только расти.
Jarvis Pattern - это:
- Архитектурный принцип: LLM + OS + файловая память. Без фреймворков, без графов.
- Модель взаимодействия: один агент - один специалист. Человек думает, агент делает.
- Философская позиция: человек в центре, симбиоз вместо замены.
Scrum начинался с одной статьи на конференции OOPSLA в 1995 году. Через десять лет он стал индустриальным стандартом. Agile Manifesto появился через шесть лет после первой публикации.
Эта статья - моя точка отсчёта, которая должна привести к точке в OOPSLA. Идея обкатана на практике. Концепция сформулирована. Тренд подтверждён независимо.
Пора убирать строительные леса.