Поднять ИИ-команду у себя звучит тяжелее, чем есть на деле. Ты не обучаешь модели и не держишь GPU-кластер — ты запускаешь горстку согласованных агентов, доску задач и связующие сервисы в Docker, большая часть которых проводит время в ожидании ответа облачной модели. В итоге скромного VPS хватает, а характеристики легко прикинуть, как только понимаешь, что реально жрёт ресурсы.
Вот честный разбор, что закладывать и почему.
VPS (виртуальный частный сервер) — арендованный кусок физического сервера со своими CPU, RAM и диском, под управлением твоей ОС. Для self-hosted ИИ-команды это всегда-включённый бокс, где крутятся агенты, доска задач и пульт управления — данные остаются на нём, а не в чужом SaaS.
RAM — число, которое важнее всего
Память упирается первой. Self-hosted ИИ-офис держит несколько контейнеров разом — агентов, доску задач, пульт, базу, фоновый синк — и у этого следа есть пол.
- 8 ГБ — жёсткий минимум. Ниже — стек стартует и падает под нагрузкой, когда кончается память. Бокс на 4 ГБ упрётся в OOM, как только всё поднимется.
- 16 ГБ — комфортная рекомендация. Оставляет запас под всплески, больше одновременно работающих агентов и редкую крупную задачу.
- Плюс ~8 ГБ сверху, если планируешь гнать локальные модели-хелперы на том же боксе (об этом ниже).
Если провайдер даёт тиры 8 и 16 ГБ по близкой цене — бери 16: запас это дешёвая страховка от того одного загруженного дня, который иначе уронил бы офис.
CPU: четыре ядра на старт, больше — под параллель
Агенты в основном I/O-bound, когда зовут облачную модель: отправили запрос и ждут. Значит, для небольшой команды CPU редко бутылочное горло.
- 4 vCPU тянут небольшую команду на лёгкой последовательной нагрузке.
- 6–8 vCPU лучше, когда несколько агентов идут параллельно или нагрузка высокая — кодовые задачи, ресёрч-прогоны и фоновый синк борются за время.
CPU становится главным фактором только если запускаешь локальные модели на боксе — тогда тяжёлое переезжает с провайдера обратно на твоё железо.
Диск: минимум 60 ГБ, SSD
Хранилище — самое нетребовательное из трёх. Закладывай:
- ~60 ГБ минимум под Docker-образы, базу, логи и артефакты.
- 80–100 ГБ для комфортного запаса, если офис генерит много файлов.
Предпочитай SSD обычному диску — разница в отзывчивости видна сразу, когда стартуют контейнеры и опрашивается база.
Нужна ли GPU? Обычно нет
Самое частое заблуждение. Если агенты зовут облачную модель по твоему ключу, все вычисления модели на стороне провайдера — твой VPS лишь оркестрирует. GPU не нужна, и сервер по цене GPU тоже.
GPU появляется в картине, только если ты осознанно решаешь сам запускать большие локальные модели. Это опциональный путь для команд с причинами приватности или стоимости держать инференс у себя, и он полностью меняет разговор о железе. Для большинства свой ключ к облачной модели проще и дешевле.
Компромисс с локальной моделью
Есть золотая середина, о которой стоит знать. Небольшая локальная модель-хелпер — под рутину вроде сжатия контекста, заголовков и извлечения страниц — комфортно идёт на CPU с примерно 8 ГБ доп-RAM, без GPU. Она срезает расход платных токенов без большого скачка по железу. Гнать *большие* локальные модели под основную работу агентов — вот шаг, который требует серьёзной RAM и желательно GPU.
Прикидывать вручную не нужно. Укажи размер команды и нагрузку — и за секунды получи конкретную рекомендацию по RAM, vCPU и диску.
Купить — 15 400 ₽Сколько это реально стоит
Реальные числа важны, вот они. У мейнстрим-провайдеров сервер на 8 ГБ обходится примерно в $35–52/мес, а на 16 ГБ — около $69–96/мес. Шаред- и ARM-линейки Hetzner идут по низу; управляемые облака вроде DigitalOcean и Vultr — выше. Добавь небольшую надбавку, если закладываешь доп-RAM под локальные хелперы.
По сравнению с ИИ-SaaS за место — где горстка подписок на небольшую команду легко перебирает несколько сотен долларов в месяц — один правильно подобранный VPS плюс свой ключ обычно дешевле. (Полное сравнение разбираем в калькуляторе стоимости self-hosted vs SaaS.)
Подбери за секунды
Вместо того чтобы гадать, оценщик требований к VPS берёт размер команды, нагрузку и нужны ли локальные хелперы — и возвращает конкретную рекомендацию по RAM / vCPU / диску с примерной стоимостью в месяц. Он по правилам и без регистрации — тридцатисекундная проверка здравого смысла перед арендой бокса.
Когда характеристики ясны, развернуть сам офис — одна команда на этом сервере. Инструкция по установке проводит через весь процесс от и до.
FAQ
Сколько RAM нужно, чтобы поднять ИИ-команду у себя?
Закладывай минимум 8 ГБ как жёсткий порог и 16 ГБ как рекомендацию с запасом. Сервер на 4 ГБ упрётся в память, когда поднимутся Docker, доска задач и агенты. Если ещё гонишь локальные модели-хелперы на боксе — добавь примерно 8 ГБ.
Сколько ядер CPU нужно self-hosted ИИ-офису?
Четыре vCPU — база для небольшой команды на лёгкой нагрузке. Шесть-восемь vCPU лучше для средней-высокой нагрузки, где несколько агентов работают параллельно. Сами агенты в основном ждут ответа облачной модели (I/O-bound); CPU важнее, если запускаешь локальные модели.
Сколько стоит подходящий VPS в месяц?
Реально сервер на 8 ГБ обходится примерно в $35–52/мес, а на 16 ГБ — около $69–96/мес у мейнстрим-провайдеров вроде Hetzner, DigitalOcean и Vultr. Шаред- и ARM-линейки Hetzner бывают дешевле; управляемые облака — дороже.
Нужна ли GPU, чтобы поднять ИИ-команду?
Нет, если агенты ходят к облачной модели по твоему ключу — все тяжёлые вычисления на стороне провайдера. GPU важна только если хочешь сам запускать большие локальные модели, а это опционально.
Сколько нужно места на диске?
Около 60 ГБ — разумный минимум, а 80–100 ГБ дают комфортный запас под Docker-образы, базу и сгенерированные артефакты. SSD сильно предпочтительнее обычных дисков ради отзывчивости.
Нужна ли конкретная операционная система?
Чистый Linux — Ubuntu или Debian — с доступом root или sudo это стандартная цель. Стек работает в Docker, поэтому хосту в основном нужны свежее ядро и достаточно ресурсов.
