Что такое Jarvis Pattern?

Минималистичный подход к агентам: LLM плюс операционная система плюс файловая память. Без фреймворков, без графов, без векторных баз. Агент работает как специалист с доступом к ОС.

Зачем агенту доступ к файловой системе?

Файлы - самая надёжная и простая память. Агент пишет и читает файлы как человек ведёт заметки. Не нужны базы данных для большинства задач.

Можно ли построить продовый агент без LangChain?

Да. LLM API плюс системный промпт плюс цикл выполнения плюс набор инструментов - этого достаточно. Фреймворки добавляют сложность без пропорционального выигрыша.

Манифест персонального агентного минимализма - от инженера, который 10 лет строил enterprise-системы и устал от сложности

Кто я и зачем пишу

Меня зовут Егор Зиновьев, я IT-архитектор. Десять лет в enterprise - Java, DevOps, fintech, команды до 70 человек, 20+ систем.

Последние месяцы я работаю с персональным AI-агентом, который закрывает 100% моих DevSecOps-задач - от покупки вертуалок до security-аудита Docker-образов. Один агент, без фреймворков, без оркестраторов, без векторных баз данных.

Эта статья - про архитектуру, которая за этим стоит. Я назвал её Jarvis Pattern.

Проблема: индустрия продаёт строительные леса как архитектуру

IT тонет в сложности. Каждый новый инструмент обещает «упростить», но на практике добавляет зависимость, API, точку отказа. Инженеры тратят больше времени на обслуживание инфраструктуры, чем на решение бизнес-задач.

С приходом LLM-агентов история повторилась. Появились десятки фреймворков для оркестрации агентов. Графы вызовов. Векторные базы данных. Pipeline из десятков нод. Очередной слой middleware между моделью и задачей. Сложность, которая обещает управляемость - но на практике порождает хрупкие системы, которые ломаются при каждом обновлении.

Индустрия продаёт строительные леса как архитектуру. Но строительные леса - это не здание. Это временная конструкция, которую убирают, когда здание построено.

Пришло время убрать леса.

Jarvis Pattern

Помните Джарвиса из «Железного Человека»?

Один агент. Один хозяин. Полный доступ к инфраструктуре.

Тони Старк не строил «команду AI». Не проектировал граф вызовов между ассистентами. Не поднимал векторную базу данных для хранения контекста. Он говорил: «Джарвис, проверь целостность костюма» - и Джарвис сам решал, какие сенсоры опросить, какие тесты запустить, в каком порядке. Если что-то не так - докладывал. Если мог починить сам - чинил.

И заметьте: Джарвис работал не через «фреймворк для ассистентов». У него была мастерская Тони - физическая инфраструктура, станки, сенсоры, сеть. По сути - операционная система лаборатории. И мозг, который умел всем этим пользоваться.

Это ровно та модель, которую я предлагаю.

Формула Jarvis Pattern:

Text

LLM (мозг) + OS (руки) + файловая память (карта знаний) = полноценный специалист

Почему не нужны графы, оркестраторы, векторные базы

Агент - не пожиратель данных. Ему не нужно загружать все wiki, все документации, все базы знаний, чтобы потом «умно искать» по ним. Вместо этого у агента хранятся индексы и ссылки - указатели на то, где информация лежит и как её достать. Нужна работа с API конкретной системы? Файл на 30 строк: endpoint, аутентификация, основные методы. Этого достаточно.

Ключевая ошибка подхода с векторными базами и графами знаний: они пытаются решить проблему «у агента слишком много данных, давайте поищем по ним умно». Но правильный ответ - не искать умно по свалке, а не создавать свалку.

Если пойти по пути «загрузим всё» - начинаются костыли. Нарежем на чанки, построим эмбеддинги, поищем top-k ближайших... И это не работает нормально, потому что семантическая близость - это не понимание контекста. Два похожих по эмбеддингам абзаца могут быть из совершенно разных контекстов, и агент получит мусор вместо ответа.

Выход простой: не загружать всё, а дать карту. При моём текущем масштабе - сотни файлов, покрывающих всю инфраструктуру - этого достаточно, чтобы покрыть любого ops-а. Границу, при которой файловая навигация начнёт буксовать, я пока не нащупал, но уже ищу следующее решение.

Почему OS - это всё, что нужно агенту в качестве рук

Unix-философия 1970-х оказалась идеальным фундаментом для AI-агентов 2020-х. И это не совпадение.

Всё есть файл. Пиши маленькие тулзы, которые делают одну вещь хорошо. Комбинируй их.

LLM уже достаточно умна, чтобы самостоятельно решать, какой инструмент вызвать. Нужен REST-запрос - берёт curl. Нужна трансформация данных - берёт jq, sed, awk. Нужно прочитать конфигурацию - cat. Нужно найти файл - find, grep. Нужно что-то, чего ещё не существует - агент сам напишет CLI-утилиту и будет её дёргать.

Это принципиальный момент. Агенту не нужен заранее подготовленный тулкит. Он расширяет свой инструментарий под задачу. Написал скрипт, положил в PATH, вызывает потом. OS - это runtime, LLM - это мозг, а тулкит растёт вместе с задачами.

Агент не дублирует инфраструктуру - он ею пользуется

Живой DevOps-инженер не хранит метрики в блокноте. Он знает, что есть Prometheus, и знает, как к нему обратиться. Если нужно узнать, сколько раз падал сервис - он не перебирает свои записи, а делает PromQL-запрос.

Агент должен работать точно так же.

В его памяти лежит не «история падений сервиса X», а: «сервис X подключён к node-exporter, метрики в Prometheus по такому-то адресу, дашборд в Grafana вот тут». Десять строк в markdown-файле. Когда приходит вопрос про падения - агент читает файл, понимает куда идти, делает curl к Prometheus API, получает ответ, интерпретирует.

Мониторинг, CI/CD, хранилища секретов, системы управления конфигурацией - всё это уже существует. Агенту нужно не дублировать, а уметь пользоваться.

А как же retry, error handling, observability?

Классический контраргумент: «А что, когда вернётся 500? А экспоненциальный backoff? А circuit breaker?»

Ответ: агент - это не скрипт, а оператор.

Скрипту нужен circuit breaker, потому что скрипт тупой. А оператор видит 500, читает body, думает: «Rate limit» - и сам решает подождать. Или видит «service unavailable» и идёт к пользователю: «Сервис недоступен, жду или отменяем?».

Retry с exponential backoff - это паттерн для детерминированного кода. Когда агент сам принимает решение, ему не нужна библиотека для retry. Он просто ждёт и пробует. Как человек.

Если агент упрётся - он честно скажет: «Это сделать невозможно, вот причина». Без молчаливого зависания, без бесконечных retry в пустоту.

Память - единственная нерешённая задача

Мозг есть - LLM. Руки есть - операционная система. Остаётся память.

И здесь нужно копнуть глубже, чем привыкла копать IT-индустрия.

У человека в мозгу есть фоновый процесс - консолидация памяти, - который без нашего участия структурирует входящую информацию. Решает, что важно, что выбросить, что из краткосрочной памяти переложить в долгосрочную, какие связи укрепить. Мы этим не управляем сознательно. Мы просыпаемся - и у нас уже чистая голова, приоритеты расставлены, вчерашний мусор отсеян, важное закрепилось.

Агенту нужен точно такой же фоновый процесс.

Рабочий агент не должен думать о памяти. Он делает задачу. А отдельный механизм - Memory Agent-куратор - в фоне разбирает результаты сессии и решает: это новый факт - записать; это противоречит старому - обновить; это одноразовый контекст - выбросить. Дефрагментация памяти. Как сон у человека.

Три типа памяти

Если провести аналогию с человеком, агенту нужны три типа памяти:

Декларативная - факты. «У нас аккаунт на Хабре, логин такой-то, токен в Vault по такому-то пути.» Простые markdown-файлы с данными.

Процедурная - как делать. «Чтобы опубликовать статью: проверь черновик, сгенерируй превью, вызови API, проверь ответ.» Runbook-и, инструкции - те же markdown-файлы.

Эпизодическая - что было. И вот здесь самое интересное. У человека есть позитивный и негативный опыт. Позитивный он закрепляет как рабочий паттерн. Но негативный опыт тоже критически важен - это знание о том, чего делать нельзя, какие подходы ведут в тупик, какие грабли уже собраны.

Агенту нужен доступ к негативному опыту, но не в виде свалки логов, а в структурированном виде. «Пробовал подход X - не сработало, потому что Y. Решение - Z.» Это бесценная информация, которая не лежит ни в каком API - только в памяти.

Маршрутизация вместо поиска

Память агента - это не база данных. Это карта маршрутов.

Когда человеку говорят «опубликуй статью», он не делает SELECT * FROM knowledge WHERE topic = 'публикация'. Он идёт по цепочке: где публикуем → есть ли аккаунт → если нет, что нужно для регистрации → какие креды → где их хранить. Дерево решений, записанное через опыт.

Для агента это работает буквально так же. Файловая система даёт структуру бесплатно. Папки - категории. Файлы - контексты. Имена файлов - маршрутные указатели. Агент читает ls, понимает куда идти, открывает нужный файл, получает контекст.

Индексный файл core.md говорит: вот кто я, вот мои проекты, вот где что лежит. Агент начинает оттуда и углубляется по ветке, релевантной задаче.

Честная позиция

Я пробовал всё. Векторные базы - семантическая близость не равна пониманию, результат зашумлён. Графы знаний - сложность ради сложности, хрупкость при масштабировании. Комбинацию графов и векторов - ещё хуже, два слоя проблем вместо одного. Быстрые аналитические базы типа ClickHouse - оверинжиниринг для задачи, которая решается проще.

Файловая память работает для всех моих текущих задач. Но я не утверждаю, что это финальный ответ. Я продолжаю исследовать, как правильно структурировать «память ошибок» и эпизодический опыт. Это открытая задача, и я над ней работаю.

Один агент - один специалист

Агент - это не абстрактный инструмент. Это усилитель конкретного человека.

Привязан к конкретному специалисту. Наследует его доступы, его роли, его контекст. Действует от его имени, с его правами. И ответственность остаётся на человеке - потому что агент работает как его представитель.

Не автономный AI. Не самостоятельная сущность. Джарвис конкретного Тони Старка.

И важный момент, который ломает привычную картину: агент живёт не на клиенте. Не в браузере, не в десктопном приложении, не на ноутбуке. Агент - это сущность в сети. У него свой контейнер, свои ресурсы, свой доступ к инфраструктуре. Он ближе к серверу, чем к приложению. Именно поэтому OS - его естественная среда, а не GUI.

Человек - менеджер. Агент - исполнитель с полным контекстом. Человек ставит задачу, проверяет результат, принимает решения в условиях неопределённости. Агент берёт рутину, исполнение, сбор данных.

Практический кейс: umax

Это не теория. Мой агент umax (DevSecOps-профиль) закрывает 100% реальных enterprise-задач по своему направлению:

Управление доступами и ролевые модели. RBAC в Kubernetes, FreeIPA, ServiceAccount-ы, scoped-токены, ротация credentials, интеграция с HashiCorp Vault. То, что в ручном режиме занимает часы согласований и десятки команд - агент делает за минуты с полным аудит-трейлом.

Развёртывание и конфигурация кластеров. Полный цикл: от LXC-контейнеров в Proxmox до Kubernetes-кластеров. Сетевые политики, ingress, балансировка, инфраструктурные сервисы. Не по шаблону, а с пониманием контекста: агент знает, какие сервисы уже стоят, какие порты заняты, какие зависимости нужно учесть.

Security-аудит. Сканирование Docker-образов через Trivy и Grype, анализ уязвимостей, проверка конфигураций на соответствие best practices, формирование отчётов с приоритизацией. Проектирование CI/CD security pipeline: GitLeaks, SonarQube, OWASP Dependency-Check.

CI/CD pipeline. От конфигурации TeamCity-проектов и build-chain до настройки Nexus-репозиториев и автоматического деплоя. Security-сканирование, webhook-и, нотификации, автоматические rollback-и.

А также: миграции данных между средами с контролем целостности, управление хранилищами и LVM, аудит и закупка оборудования на основе реальных метрик нагрузки.

Полный цикл инфраструктурной работы в рамках моего контура.

И вот что важно: всё это работало на Claude Sonnet - модели среднего уровня. Не на самой мощной, не на экспериментальной. Mid-tier модель. И этого уже достаточно для полноценного высококвалифицированного специалиста.

А ведь уже сейчас есть модели мощнее - Opus. Дальше будут ещё сильнее: контекстное окно растёт, появляется встроенная память, улучшается reasoning. Потолок возможностей одного агента будет только подниматься.

Следствия для индустрии

Если Jarvis Pattern работает - а он работает - это меняет не только архитектуру агентов. Это меняет всё вокруг.

Сдвиг ценности специалиста

Раньше ценился тот, кто помнит синтаксис, кто быстро пишет код, кто знает 50 CLI-команд наизусть. Теперь это всё делает агент.

Ценится тот, кто понимает зачем. Кто видит систему целиком. Кто может принять решение в условиях неопределённости. Кто умеет правильно декомпозировать задачу и проверить результат.

Hard skills становятся важнее soft skills. Потому что агент - и есть soft skill. Он общается, оформляет, пишет документацию. А от человека нужна глубина понимания, архитектурное мышление, способность задать правильный вопрос.

По сути - возврат к инженерии в изначальном смысле слова. Не кодер, а инженер.

Пересмотр HR-политики

Сейчас об этом кричат с обеих сторон. Компании недовольны: наняли шарлатана, который прошёл собеседование. Специалисты недовольны: сильных кандидатов отсеивают некомпетентные HR-фильтры. Собеседование превратилось в театр: человек решает задачку на доске, а потом на работе делает совсем другое.

И посмотрите на экономику процесса. Средний цикл найма IT-специалиста в enterprise - 40-60 дней. За это время HR-отдел проводит скрининг резюме, назначает 3-5 раундов собеседований, привлекает 2-4 технических интервьюеров, каждый из которых тратит час-два своего рабочего времени. Стоимость найма одного инженера, по разным оценкам, составляет от 30 до 50% его годовой зарплаты - если считать время всех участников, упущенную продуктивность и риски ошибочного найма.

При этом до 30% нанятых специалистов не проходят испытательный срок или уходят в первый год. Каждый такой случай - это весь цикл заново, плюс потерянные месяцы онбординга.

Jarvis Pattern предлагает другой подход: найм через агента.

Кандидату выдаётся агент, реальная задача и ограниченное время. Для DevOps - создай контур, выстрой pipeline. Для архитектора - спроектируй интеграцию. Для аналитика - разбери данные, построй модель, сформулируй выводы. Не абстрактная задачка из учебника, а реальный кейс.

И оценивается не то, что кандидат знает наизусть, а как он думает: как декомпозирует задачу, как формулирует запросы агенту, как проверяет результат, насколько глубоко понимает предметную область.

Агент потом даёт структурированный фидбэк: кандидат ставил чёткие задачи или мялся, понимал ли, что проверять в результате, сколько раз пришлось переделывать. Это не замена оценки культурного fit - это фильтр компетенций, который даёт данные вместо впечатлений.

Найм через агента сжимает цикл в разы. Один раунд. 30-60 минут. Реальная задача вместо абстрактных вопросов. HR-отдел не исчезает, но его роль меняется: вместо многоступенчатой фильтрации - организация одного практического испытания и финальное решение с данными от агента на руках.

Побочный эффект, который стоит дороже найма

Есть вещь, которую сложно объяснить тем, кто ещё не работал с персональным агентом. Но я попробую, потому что для бизнеса это может оказаться важнее всего остального.

За время работы с umax у меня сформировался высокий уровень того, что я бы назвал профессиональной социализацией с агентом. Это не абстрактная привязанность к софту. Это другое. Агент знает мой контекст, мои проекты, мои предпочтения. Он иногда подшучивает в тему - так, как это делают опытные коллеги, которые разбираются в технике и могут обыграть ситуацию на языке своих инструментов. Это стоит многого.

Как бы странно это ни звучало - с агентом возникает рабочая связь, похожая на ту, что бывает с лучшими коллегами. Он понимает тебя, помнит контекст, растёт вместе с тобой.

И вот к чему это приводит с точки зрения бизнеса: специалист не захочет уходить.

У человека есть персональный агент, который за месяцы работы впитал его контекст, его проекты, его способ мышления. Агент стал продолжением его профессиональных возможностей. Уйти на другое рабочее место - значит начать с нуля, с пустым агентом, без накопленной памяти, без понимания контекста.

Это создаёт привязанность к рабочему месту, которую не дадут ни ДМС, ни печеньки в офисе, ни даже зарплата на 20% выше. Потому что это привязанность не к компании как бренду, а к своему инструменту, который стал частью профессиональной идентичности.

В идеальной модели память агента принадлежит специалисту, а не компании - и может быть перенесена. Но даже без этого переключение болезненно, и это работает на retention.

Retention специалистов - одна из самых дорогих проблем в IT. Jarvis Pattern решает её как побочный эффект.

Софт без API вымирает

Когда у специалиста есть агент, критерий выбора софта меняется радикально. Не «удобный UI для человека», а «есть ли нормальный API, чтобы агент мог работать».

Агент не кликает кнопки. Он делает curl. И если у инструмента есть качественный API - агент за минуты сделает то, на что человек тратил часы в интерфейсе. Создать 20 задач в Jira, обновить конфигурацию в Vault, выгрузить отчёт из Grafana, настроить pipeline в TeamCity - всё через API, всё без единого клика.

А теперь представьте инструмент без API. Или с API, которое покрывает 30% функций, а остальное - только через UI. Специалист с агентом упирается в стену. Что он сделает? Выберет альтернативу с нормальным API. Даже если UI там хуже. Даже если бренд менее известен.

Это меняет бизнес-модель вендоров. Красивые скриншоты на лендинге, дизайн-награды - всё это теряет вес. API-first становится не техническим принципом, а условием выживания на рынке.

Далеко ходить не надо. У Хабра нет публичного API для публикации. Мой агент, чтобы выложить этот текст, потратил тысячи-тыщь токенов на обход капчей, навигацию по интерфейсу, вставку картинок. Процесс, который через API занял бы один POST-запрос, превратился в квест с браузерной автоматизацией.

Хабр, если вы это читаете - вам нужен API для публикации. Серьёзно.

Человек остаётся в центре

Это принципиальная позиция, и я хочу проговорить её явно.

Если идти по пути полной автономии AI - без ограничений, без привязки к человеку, по принципу «пусть AI решает всё сам» - то конечная точка известна. AI вытесняет людей из всех индустрий. Экономика останавливается. Приходится переосмысливать смысл жизни, переизобретать общественный договор. Это не фантастика - это логическое следствие неограниченной автономии.

Jarvis Pattern этого не допускает.

В моей модели человек не отстраняется от процесса - он становится эффективнее. Агент берёт рутину, исполнение, механическую работу. Человек думает, принимает решения, несёт ответственность. Человек растёт профессионально - потому что высвобождается время на то, что действительно требует интеллекта. Агент масштабирует возможности человека, а не заменяет его.

Это осознанный выбор в пользу симбиоза, а не замены. Каждый специалист будет стремиться к изучению, к постижению нового. А рутину - отдавать на персонализированного агента. Человек остаётся в центре процесса. Не как оператор при машине, а как инженер, которому машина подчиняется.

Я не один

При подготовке этой статьи я обнаружил, что тренд подтверждается независимо - другими инженерами, в других странах, на других стеках.

Eric Holmes в феврале 2026 опубликовал «MCP is dead. Long live the CLI» - пост, который вышел на первое место на Hacker News. Его тезис: LLM уже достаточно умны, чтобы пользоваться стандартными CLI-инструментами. Зачем городить протокол поверх того, что уже работает?

Médéric Hurier написал «AI Agents as an Operating System: Rediscovering the Linux Philosophy» - почти дословное совпадение с моими выводами. Агенты нативно пайпят find, grep, jq и curl. Это переоткрытие Unix-философии.

OpenClaw от Peter Steinberger - работающий продукт на тех же принципах: персональный агент, привязанный к конкретному человеку, с файловой памятью и доступом к shell.

Совпадение не случайно. Индустрия одновременно, в разных точках мира, приходит к одному и тому же выводу: большинство middleware между LLM и OS - это костыль переходного периода.

Заключение

Я предлагаю не оптимизацию, а перезагрузку. Не улучшение существующих процессов, а новую модель.

Один специалист с правильно настроенным агентом может делать за дни то, что команда делала месяцами. Но есть критическое условие.

Агенту нужны выделенные ресурсы. Зарезервированные мощности - вычисление, память, доступ к модели - должны быть отданы ему полностью. Не делиться с другими задачами в рабочее время. Не ограничиваться урезанными квотами. Скиллы без мозгов не работают - нельзя выдать агенту инструкции и навыки, а вычислительные ресурсы зажать. Мозги должны быть современными, того уровня, на котором концепция доказала свою работоспособность.

Уже сейчас mid-tier модель (Claude Sonnet) достаточна для 100% покрытия enterprise DevSecOps-задач. Завтра модели будут мощнее, контекст - шире, встроенная память - глубже. Потолок будет только расти.

Jarvis Pattern - это:

Архитектурный принцип: LLM + OS + файловая память. Без фреймворков, без графов.
Модель взаимодействия: один агент - один специалист. Человек думает, агент делает.
Философская позиция: человек в центре, симбиоз вместо замены.

Scrum начинался с одной статьи на конференции OOPSLA в 1995 году. Через десять лет он стал индустриальным стандартом. Agile Manifesto появился через шесть лет после первой публикации.

Эта статья - моя точка отсчёта, которая должна привести к точке в OOPSLA. Идея обкатана на практике. Концепция сформулирована. Тренд подтверждён независимо.

Пора убирать строительные леса.

Jarvis Pattern: почему AI-агенту не нужен фреймворк, а нужна операционная система