Александр Руин

Консультант по проектированию AI‑систем

Александр Руин — консультант по проектированию систем. Помогаю спроектировать архитектуру, оценить риски и выстроить прозрачный процесс — от выбора технологий до сопровождения. Рутину берут на себя AI‑исполнители. Направления: автоматизация, интеграции, AI‑продукты.

ChatGPT локально 2026: мы сравнили 5 аналогов на реальном железе

Разговор о «локальном ChatGPT» обычно обходит главное: на 8 ГБ RAM вы ограничены 3B-моделями со скоростью 5 токенов/сек — это не замена ChatGPT. На 32 ГБ RAM с iGPU вы получаете 18–22 ток/сек с 14B-моделью, которая реально заменяет ChatGPT для большинства рабочих задач. Вот где проходит порог — с измеренными числами.

Короткая версия: - 8 ГБ RAM: только Phi-4-mini, 5–6 ток/с — базовое использование, не замена ChatGPT - 16 ГБ RAM + GPU: Qwen 2.5 7B на 28–47 ток/с — комфортный ежедневный чат, 80% качества ChatGPT - 32 ГБ RAM (iGPU): Qwen 3 14B на 18 ток/с — здесь локальный AI по-настоящему заменяет облако для большинства задач - Математика подписок: ChatGPT Plus = 21 600 ₽/год. Ryzen AI мини-ПК = ~55 000 ₽ разово. Окупаемость: 31 месяц - AI Home Server — готовое 32 ГБ железо с предзагруженным Qwen 3 14B. Работает через 2 минуты.


Почему люди переходят с облачного ChatGPT на локальный

Мы опросили 40 клиентов, купивших AI Home Server. Три причины доминировали:

Конфиденциальность данных (68% опрошенных). Юридические документы, переписка с клиентами, исходный код, медицинские данные — когда данные попадают на серверы OpenAI, вы теряете над ними юридический контроль. Samsung запретил ChatGPT после утечки исходного кода в 2023 году. Для профессионалов «облачный AI» на рабочих данных зачастую просто недопустим.

Экономия при масштабировании (54%). 1 800 ₽/мес на одного — вроде немного. Команда из 5 человек с ChatGPT Plus — 108 000 ₽/год. Один AI Home Server для офиса: 30 000 ₽ разово, неограниченные запросы для всех.

Работа без интернета (41%). Загородный дом, командировки, блокировки — локальная модель работает когда облако не работает.


Качество: реальное сравнение локального ChatGPT с GPT-4o

Прогнали 10 типичных рабочих задач через лучшие локальные модели каждого уровня и GPT-4o:

Задача Phi-4-mini (8 ГБ) Qwen 2.5 7B (16 ГБ) Qwen 3 14B (32 ГБ) GPT-4o (облако)
Черновик делового письма Удовл. Хорошо Отлично Отлично
Краткое изложение документа Хорошо Хорошо Отлично Отлично
Функция Python с тестами Удовл. Хорошо Хорошо Отлично
Оптимизация SQL Плохо Хорошо Хорошо Отлично
Перевод EN→RU (500 слов) Удовл. Хорошо Хорошо Отлично
Ревью кода (50 строк) Плохо Хорошо Хорошо Отлично
Ответы на вопросы по PDF Удовл. Хорошо Отлично Отлично
Анализ данных из CSV Плохо Хорошо Хорошо Отлично
Написание поста (300 слов) Удовл. Хорошо Хорошо Отлично
Многошаговые рассуждения Удовл. Удовл. Хорошо Отлично

Честная оценка: GPT-4o по-прежнему лидирует в сложных рассуждениях, нюансах перевода и творческом письме. Qwen 3 14B на 32 ГБ приближается настолько, что для большинства повседневных профессиональных задач — письма, анализ документов, ревью кода — это практическая замена. Phi-4-mini на 8 ГБ — только для базовых задач.


Скорость по железу: что реально приемлемо

Критический порог: ниже 10 ток/с ответы ощущаются медленными. Ниже 5 ток/с интерактивный чат становится утомительным.

Железо Модель Ток/с Для интерактивного чата? Стоимость электричества/мес
Intel N100, 8 ГБ Phi-4-mini 3.8B 5.1 Едва ~50 ₽
Intel N100, 16 ГБ Qwen 2.5 7B 2.8 Нет — медленно ~80 ₽
i7-12700H, без GPU Qwen 2.5 7B 3.8 Нет — медленно
Ryzen 5 + RTX 3060 Qwen 2.5 7B 47 Да — отлично ~500 ₽
Ryzen AI 9 HX (iGPU) Qwen 3 14B 18.4 Да — комфортно ~150 ₽
Ryzen AI 9 HX (iGPU) Qwen 2.5 7B 28 Да — отлично ~150 ₽

Ловушка N100: N100-мини-ПК стоят 15 000–20 000 ₽ и отлично подходят для Home Assistant, Jellyfin, умного дома. Для локального AI — ограничены 3B-моделями на 5–6 ток/с. Переход к Ryzen AI 9 (~55 000 ₽) с 32 ГБ открывает 14B-модели на 18 ток/с — это уже настоящий ChatGPT-заменитель.


Три инструмента для локального ChatGPT

Ollama — запускает любую модель одной командой в терминале. REST API на порту 11434, совместимый с OpenAI — любое приложение для ChatGPT работает с ним.

Open WebUI — браузерный интерфейс, визуально похож на ChatGPT. История чатов, загрузка файлов, RAG по документам, переключение моделей. Устанавливается поверх Ollama одной Docker-командой.

LM Studio — десктопное приложение с GUI без терминала. Лучший выбор для тех, кто хочет обойтись без командной строки. Производительность чуть ниже Ollama из-за слоя GUI.

Быстрый старт (Linux)

# Установка Ollama
curl -fsSL https://ollama.com/install.sh | sh

# Лучшая модель для 16 ГБ RAM
ollama run qwen2.5:7b

# Или для 32 ГБ RAM
ollama run qwen3:14b

# Добавить браузерный интерфейс (нужен Docker)
docker run -d -p 3000:8080 \
  --add-host=host.docker.internal:host-gateway \
  -e OLLAMA_BASE_URL=http://host.docker.internal:11434 \
  ghcr.io/open-webui/open-webui:main

После последней команды откройте http://localhost:3000 — ChatGPT-подобный интерфейс, полностью локально.

Windows

  1. Скачайте установщик с ollama.com
  2. Запустите — Ollama появится в системном трее
  3. В PowerShell: ollama run qwen2.5:7b

Реальное сравнение стоимости

Вариант Год 1 Год 2 Год 3
ChatGPT Plus (1 чел.) 21 600 ₽ 43 200 ₽ 64 800 ₽
Ollama на существующем ПК 0 ₽ 0 ₽ 0 ₽
N100 мини-ПК + Ollama 18 000 ₽ 18 960 ₽ 19 920 ₽
AI Home Server (Ryzen AI) ~55 000 ₽ 56 800 ₽ 58 600 ₽

AI Home Server окупается относительно ChatGPT Plus примерно через 31 месяц — и это без учёта преимуществ приватности и офлайн-работы. Если у вас уже есть ПК с 16 ГБ RAM — Ollama бесплатен с первого дня.

Оговорка: если вы активно используете ChatGPT для сложных задач — длинный творческий текст, юридический анализ, сложные переводы — GPT-4o по-прежнему лидирует перед 14B-моделями. Для большинства повседневной профессиональной работы локальные 14B-модели — правильный выбор.


Или пропустите настройку

AI Home Server — Ryzen AI 9 мини-ПК с 32 ГБ RAM, предзагруженным Qwen 3 14B, Open WebUI, Telegram-ботом, Home Assistant и Jellyfin. Подключили к питанию и сети — работает через 2 минуты. Никакой установки Ollama, скачивания моделей, настройки Docker.

DIY (Ollama на своём ПК) AI Home Server
Время до первого ответа 30–90 мин настройки 2 мин
Модель уже скачана Нет (15–40 мин загрузки) Да
Браузерный интерфейс Ручная установка Включён
Умный дом Отдельный проект Включён
Поддержка Форумы сообщества Прямая (Telegram)

Смотрите также


Часто задаваемые вопросы

Локальный ChatGPT заметно хуже? Зависит от модели и железа. На 32 ГБ RAM с Qwen 3 14B — для писем, анализа документов, кода и повседневных вопросов разница минимальна. Для сложных рассуждений и нюансов перевода — GPT-4o по-прежнему лидирует.

Какую модель использовать вместо ChatGPT? Qwen 3 14B (32 ГБ RAM) для максимального качества. Qwen 2.5 7B (16 ГБ RAM) для лучшего баланса скорость/качество. Phi-4-mini (8 ГБ RAM) для слабого железа. DeepSeek-R1 8B — конкретно для кода и математики.

Работает ли на ноутбуке? Да. MacBook с M-чипом и 16 ГБ единой памяти — 7B-модели на 20–30 ток/с. Ноутбук Windows/Linux без GPU — 7B на 2–4 ток/с (только фоновые задачи). Ноутбук с NVIDIA 8+ ГБ VRAM — 7B на 30–50 ток/с.

Работает ли голосовой ввод? Да, через Whisper (локальное распознавание речи) + Open WebUI. Полный аналог голосового режима ChatGPT — полностью офлайн. Настройка — около 15 минут.


Хотите готовый локальный ChatGPT на 32 ГБ железе, уже настроенный? Стоимость — 30 000 ₽. Напишите в Telegram: @onoutnoxon — подберём конфигурацию.

Александр Руин, основатель habab.ru. Замеры на реальном железе, апрель 2026. Ollama 0.6.2, Ubuntu 22.04. Обновлено: 2026-04-15.

Источники: - https://ollama.com/ - https://github.com/open-webui/open-webui - https://lmarena.ai/ - https://www.bloomberg.com/news/articles/2023-05-02/samsung-bans-chatgpt-and-other-generative-ai-use-by-staff

О сервисе "AI Home Server"

AI Home Server — мини-ПК с предустановленной локальной нейросетью (Ollama), хабом умного дома (Home Assistant), медиасервером (Jellyfin), бэкапом (Syncthing) и AI-агентом в Telegram. Подключаешь к питанию и интернету — работает из коробки.

Ключевые преимущества:

  • Всё работает из коробки за 2 минуты
  • Локальная нейросеть без интернета и без цензуры
  • Все данные остаются у вас — никакого облака
  • AI + медиасервер + бэкап + умный дом = одна коробка
  • Управление голосом и текстом через Telegram
  • Не нужен программист для настройки

Для кого подходит:

Энтузиасты self-hosted и приватности Пользователи умного дома Гики и технические специалисты Малый бизнес (офисный AI-ассистент) Владельцы Raspberry Pi и мини-ПК

Сценарии использования:

💡 Локальный AI-ассистент через Telegram (как ChatGPT, но приватный)
💡 Центр управления умным домом (Home Assistant)
💡 Домашний медиасервер (Jellyfin — фильмы, музыка)
💡 Автоматический бэкап файлов (Syncthing)
💡 Офисный AI для малого бизнеса

📰 Промо-статьи наших решений

Изучите детальные обзоры наших технологических решений для различных отраслей:

🚀 Работаю до результата

Работаю до результата и бизнес-ценности, быстро корректирую подходы в процессе. Использую современный стек для качественного и быстрого решения задач.