Дайте вашему LLM память, которую он не забудет
Drop-in REST API с постоянной межсессионной памятью для любого LLM. Поиск ~2-3мс. Никакой лишней инфраструктуры. Поиск за ~2-3мс. Никакой инфраструктуры.
Пайплайн памяти
Доказанные результаты — не просто обещания
Сравнение с базовым LLM без слоя памяти
Результаты — Exp 44 (gpt-4o-mini · text-embedding-3-small)
| Режим | Оценка судьи (0–3) | Попадание по ключевым словам |
|---|---|---|
| ★ NGT Memory (emb+graph) | 2.44 / 3 | 44% |
| ★ NGT Memory (emb only) | 2.44 / 3 | 44% |
| Без памяти (baseline) | 1.22 / 3 | 27% |
💡 В реалистичном A/B тесте память победила в 5 из 6 сценариев против той же модели без памяти.
LLM без памяти — сломаны по своей природе
Каждая сессия начинается с нуля. Пользователи вынуждены повторяться. ИИ даёт опасные обобщённые советы. NGT Memory это исправляет.
Реальный пример — Рекомендация ресторана в Киото
«Ippudo — отличное место для любителей рамена» — рекомендация мяса вегетарианцу
«Shigetsu в Tenryu-ji подаёт сёдзин рёри (буддийскую веганскую кухню)» — персонализировано, потому что помнит, что вы вегетарианец
Как работает NGT Memory
Простой пайплайн, который внедряет релевантные воспоминания в каждый LLM-промпт
Пайплайн запроса
Косинусное сходство
Семантически близкие факты извлекаются через векторный поиск
Хеббианский граф
Ассоциативные связи между концептами, как в мозге человека
Иерархическая консолидация
Важные факты автоматически переходят в долгосрочную память
По умолчанию Docker запускает один API воркер для консистентности in-memory сессий. Режим нескольких воркеров требует sticky routing или общего session backend.
Запуск за 5 минут
Drop-in REST API — никакой новой инфраструктуры, баз данных векторов и привязки к вендору
# 1. Клонировать репозиторий
git clone https://github.com/ngt-memory/ngt-memory.git
cd ngt-memory
# 2. Настроить окружение
cp .env.example .env
# Установить OPENAI_API_KEY в .env
# 3. Запустить сервис (1 воркер, сессии in-memory)
docker-compose up -d
# ✓ NGT Memory запущен на http://localhost:9190
Всё что нужно
Готовый к продакшену слой памяти со всеми необходимыми функциями для вашего LLM-приложения
Постоянная память
Сохраняет факты между сессиями — пользователи не повторяются
Быстрый поиск
~2-3мс в среднем, граф + косинус, без внешней БД
Drop-in REST API
Интегрируется в любое LLM-приложение за 5 минут
Изолированные сессии
Изолированная память на пользователя — каждая сессия полностью независима
Простой Docker деплой
Деплой одной командой — docker-compose up -d
Локальный режим
Работает полностью на вашей инфраструктуре — без облака
Хеббианский граф
Ассоциативные связи между концептами, как в мозге
Встроенная аналитика
Метрики памяти, статистика сессий, производительность поиска
API Key аутентификация
Опциональная защита эндпоинтов с настраиваемыми ключами
Сравнение с аналогами
NGT Memory — единственное решение, не требующее внешней векторной БД и обеспечивающее поиск менее 5мс
| Возможность | ★ ЛучшийNGT Memory | Mem0 | Zep | LangChain Memory |
|---|---|---|---|---|
| Самохостинг | ||||
| Без векторной БД | ||||
| Хеббианский граф | ||||
| Задержка поиска | ~2-3ms | ~50ms | ~100ms | ~30ms |
| Открытый код | ||||
| REST API |
Простые и прозрачные тарифы
Начните бесплатно. Масштабируйтесь по мере роста. Никаких скрытых платежей.
- Запросов/день:100 зап/день
- Сессии:1 сессия
- Модель:gpt-4.1-nano
- Поддержка:GitHub Issues
- Аналитика:
- Запросов/день:10 000 зап/день
- Сессии:100 сессий
- Модель:gpt-4.1-nano
- Поддержка:Email поддержка
- Аналитика:
- Запросов/день:Без ограничений
- Сессии:Без ограничений
- Модель:gpt-4.1-nano
- Поддержка:Приоритет + SLA
- Аналитика:
Все тарифы включают: постоянную память, REST API, Docker деплой, лицензию BSL 1.1
💳 Оплата через ЮKassa — банковские карты, СБП, ЮMoney
💡 Самохостинг? Бесплатно навсегда — просто клонируйте репозиторий.
Для реальных AI-приложений
От медицины до потребительских приложений — NGT Memory делает каждое LLM-приложение умнее
Медицинский AI-ассистент
Помнит аллергии, препараты и предыдущие реакции пациента между сессиями. Никогда не даёт советов, противоречащих известным условиям.
💡 Пациент упомянул аллергию на пенициллин 3 сессии назад → исключено из всех последующих рекомендаций
Личный AI-компаньон
Отслеживает предпочтения, ограничения при поездках и личные планы. Становится умнее с каждым разговором.
💡 Знает, что вы вегетарианец, живёте в Берлине и тренируетесь к марафону
Бот техподдержки
Помнит прошлые обращения, предпочтения по возвратам и индивидуальные ограничения клиента. Клиентам не нужно повторяться.
💡 Клиент обращался в поддержку 3 раза по поводу биллинга → контекст вставляется автоматически