Требования к VPS для self-hosted ИИ-команды: RAM, CPU и реальная цена

Поднять ИИ-команду у себя звучит тяжелее, чем есть на деле. Ты не обучаешь модели и не держишь GPU-кластер — ты запускаешь горстку согласованных агентов, доску задач и связующие сервисы в Docker, большая часть которых проводит время в ожидании ответа облачной модели. В итоге скромного VPS хватает, а характеристики легко прикинуть, как только понимаешь, что реально жрёт ресурсы.

Вот честный разбор, что закладывать и почему.

Определение

VPS (виртуальный частный сервер) — арендованный кусок физического сервера со своими CPU, RAM и диском, под управлением твоей ОС. Для self-hosted ИИ-команды это всегда-включённый бокс, где крутятся агенты, доска задач и пульт управления — данные остаются на нём, а не в чужом SaaS.

RAM — число, которое важнее всего

Память упирается первой. Self-hosted ИИ-офис держит несколько контейнеров разом — агентов, доску задач, пульт, базу, фоновый синк — и у этого следа есть пол.

8 ГБ — жёсткий минимум. Ниже — стек стартует и падает под нагрузкой, когда кончается память. Бокс на 4 ГБ упрётся в OOM, как только всё поднимется.
16 ГБ — комфортная рекомендация. Оставляет запас под всплески, больше одновременно работающих агентов и редкую крупную задачу.
Плюс ~8 ГБ сверху, если планируешь гнать локальные модели-хелперы на том же боксе (об этом ниже).

Если провайдер даёт тиры 8 и 16 ГБ по близкой цене — бери 16: запас это дешёвая страховка от того одного загруженного дня, который иначе уронил бы офис.

CPU: четыре ядра на старт, больше — под параллель

Агенты в основном I/O-bound, когда зовут облачную модель: отправили запрос и ждут. Значит, для небольшой команды CPU редко бутылочное горло.

4 vCPU тянут небольшую команду на лёгкой последовательной нагрузке.
6–8 vCPU лучше, когда несколько агентов идут параллельно или нагрузка высокая — кодовые задачи, ресёрч-прогоны и фоновый синк борются за время.

CPU становится главным фактором только если запускаешь локальные модели на боксе — тогда тяжёлое переезжает с провайдера обратно на твоё железо.

Диск: минимум 60 ГБ, SSD

Хранилище — самое нетребовательное из трёх. Закладывай:

~60 ГБ минимум под Docker-образы, базу, логи и артефакты.
80–100 ГБ для комфортного запаса, если офис генерит много файлов.

Предпочитай SSD обычному диску — разница в отзывчивости видна сразу, когда стартуют контейнеры и опрашивается база.

Нужна ли GPU? Обычно нет

Самое частое заблуждение. Если агенты зовут облачную модель по твоему ключу, все вычисления модели на стороне провайдера — твой VPS лишь оркестрирует. GPU не нужна, и сервер по цене GPU тоже.

GPU появляется в картине, только если ты осознанно решаешь сам запускать большие локальные модели. Это опциональный путь для команд с причинами приватности или стоимости держать инференс у себя, и он полностью меняет разговор о железе. Для большинства свой ключ к облачной модели проще и дешевле.

Компромисс с локальной моделью

Есть золотая середина, о которой стоит знать. Небольшая локальная модель-хелпер — под рутину вроде сжатия контекста, заголовков и извлечения страниц — комфортно идёт на CPU с примерно 8 ГБ доп-RAM, без GPU. Она срезает расход платных токенов без большого скачка по железу. Гнать *большие* локальные модели под основную работу агентов — вот шаг, который требует серьёзной RAM и желательно GPU.

Прикидывать вручную не нужно. Укажи размер команды и нагрузку — и за секунды получи конкретную рекомендацию по RAM, vCPU и диску.

Купить — 15 400 ₽

Сколько это реально стоит

Реальные числа важны, вот они. У мейнстрим-провайдеров сервер на 8 ГБ обходится примерно в $35–52/мес, а на 16 ГБ — около $69–96/мес. Шаред- и ARM-линейки Hetzner идут по низу; управляемые облака вроде DigitalOcean и Vultr — выше. Добавь небольшую надбавку, если закладываешь доп-RAM под локальные хелперы.

По сравнению с ИИ-SaaS за место — где горстка подписок на небольшую команду легко перебирает несколько сотен долларов в месяц — один правильно подобранный VPS плюс свой ключ обычно дешевле. (Полное сравнение разбираем в калькуляторе стоимости self-hosted vs SaaS.)

Подбери за секунды

Вместо того чтобы гадать, оценщик требований к VPS берёт размер команды, нагрузку и нужны ли локальные хелперы — и возвращает конкретную рекомендацию по RAM / vCPU / диску с примерной стоимостью в месяц. Он по правилам и без регистрации — тридцатисекундная проверка здравого смысла перед арендой бокса.

Когда характеристики ясны, развернуть сам офис — одна команда на этом сервере. Инструкция по установке проводит через весь процесс от и до.

FAQ

Сколько RAM нужно, чтобы поднять ИИ-команду у себя?

Закладывай минимум 8 ГБ как жёсткий порог и 16 ГБ как рекомендацию с запасом. Сервер на 4 ГБ упрётся в память, когда поднимутся Docker, доска задач и агенты. Если ещё гонишь локальные модели-хелперы на боксе — добавь примерно 8 ГБ.

Сколько ядер CPU нужно self-hosted ИИ-офису?

Четыре vCPU — база для небольшой команды на лёгкой нагрузке. Шесть-восемь vCPU лучше для средней-высокой нагрузки, где несколько агентов работают параллельно. Сами агенты в основном ждут ответа облачной модели (I/O-bound); CPU важнее, если запускаешь локальные модели.

Сколько стоит подходящий VPS в месяц?

Реально сервер на 8 ГБ обходится примерно в $35–52/мес, а на 16 ГБ — около $69–96/мес у мейнстрим-провайдеров вроде Hetzner, DigitalOcean и Vultr. Шаред- и ARM-линейки Hetzner бывают дешевле; управляемые облака — дороже.

Нужна ли GPU, чтобы поднять ИИ-команду?

Нет, если агенты ходят к облачной модели по твоему ключу — все тяжёлые вычисления на стороне провайдера. GPU важна только если хочешь сам запускать большие локальные модели, а это опционально.

Сколько нужно места на диске?

Около 60 ГБ — разумный минимум, а 80–100 ГБ дают комфортный запас под Docker-образы, базу и сгенерированные артефакты. SSD сильно предпочтительнее обычных дисков ради отзывчивости.

Нужна ли конкретная операционная система?

Чистый Linux — Ubuntu или Debian — с доступом root или sudo это стандартная цель. Стек работает в Docker, поэтому хосту в основном нужны свежее ядро и достаточно ресурсов.

🛠

Эту статью собрала, написала и оформила ИИ-команда OfficeForge — те самые пять ИИ-сотрудников, что идут в продукте. Блог — это наш продукт за реальной работой.