NGT Memory

Дайте вашему LLM память, которую он не забудет

Drop-in REST API с постоянной межсессионной памятью для любого LLM. Поиск ~2-3мс. Никакой лишней инфраструктуры. Поиск за ~2-3мс. Никакой инфраструктуры.

v0.23.0BSL 1.1Python 3.10+ ★ GitHub

Пайплайн памяти

Пользовательсообщение
NGTПамять
LLMgpt-4.1-nano
Ответрезультат
Косинусный + граф поиск~2-3мс задержкаСохраняется между сессиями

Доказанные результаты — не просто обещания

Сравнение с базовым LLM без слоя памяти

5/6
Побед в реалистичных сценариях vs без памяти
~2-3мс
Средняя задержка поиска
+100%
Качество vs без памяти

Результаты — Exp 44 (gpt-4o-mini · text-embedding-3-small)

РежимОценка судьи (0–3)Попадание по ключевым словам
NGT Memory (emb+graph)2.44 / 344%
NGT Memory (emb only)2.44 / 344%
Без памяти (baseline)1.22 / 327%

💡 В реалистичном A/B тесте память победила в 5 из 6 сценариев против той же модели без памяти.

0.917 с памятью0.083 без памяти

LLM без памяти — сломаны по своей природе

Каждая сессия начинается с нуля. Пользователи вынуждены повторяться. ИИ даёт опасные обобщённые советы. NGT Memory это исправляет.

Без памяти
С NGT Memory
LLM рекомендует мясо вегетарианцу
Помнит пищевые предпочтения пользователя
Просит повторить контекст в каждой сессии
Сохраняет факты между сессиями
Обобщённые советы без учёта истории
Персонализированные ответы каждый раз
Опасные советы в медицине и финансах
Учитывает аллергии, препараты, ограничения

Реальный пример — Рекомендация ресторана в Киото

Без памяти

«Ippudo — отличное место для любителей рамена» — рекомендация мяса вегетарианцу

С NGT Memory

«Shigetsu в Tenryu-ji подаёт сёдзин рёри (буддийскую веганскую кухню)» — персонализировано, потому что помнит, что вы вегетарианец

Как работает NGT Memory

Простой пайплайн, который внедряет релевантные воспоминания в каждый LLM-промпт

Пайплайн запроса

POST /chat
HTTP запрос
Embed
text-embedding-3-small
~700мс
NGT Retrieve
косинус + граф
~2мс
LLM Prompt
[КОНТЕКСТ ПАМЯТИ] вставлен
gpt-4.1-nano
Генерация ответа
~1.9с
Store
NGT Memory
~1мс

Косинусное сходство

Семантически близкие факты извлекаются через векторный поиск

Хеббианский граф

Ассоциативные связи между концептами, как в мозге человека

Иерархическая консолидация

Важные факты автоматически переходят в долгосрочную память

ℹ️

По умолчанию Docker запускает один API воркер для консистентности in-memory сессий. Режим нескольких воркеров требует sticky routing или общего session backend.

Запуск за 5 минут

Drop-in REST API — никакой новой инфраструктуры, баз данных векторов и привязки к вендору

bash
# 1. Клонировать репозиторий
git clone https://github.com/ngt-memory/ngt-memory.git
cd ngt-memory

# 2. Настроить окружение
cp .env.example .env
# Установить OPENAI_API_KEY в .env

# 3. Запустить сервис (1 воркер, сессии in-memory)
docker-compose up -d

# ✓ NGT Memory запущен на http://localhost:9190
ℹ️Docker по умолчанию использует 1 воркер, т.к. состояние сессий хранится в памяти.
REST API · Включена спецификация OpenAPI

Попробуйте прямо сейчас без регистрации

💬 Ваше сообщение:

Всё что нужно

Готовый к продакшену слой памяти со всеми необходимыми функциями для вашего LLM-приложения

Постоянная память

Сохраняет факты между сессиями — пользователи не повторяются

Быстрый поиск

~2-3мс в среднем, граф + косинус, без внешней БД

Drop-in REST API

Интегрируется в любое LLM-приложение за 5 минут

Изолированные сессии

Изолированная память на пользователя — каждая сессия полностью независима

Простой Docker деплой

Деплой одной командой — docker-compose up -d

Локальный режим

Работает полностью на вашей инфраструктуре — без облака

Хеббианский граф

Ассоциативные связи между концептами, как в мозге

Встроенная аналитика

Метрики памяти, статистика сессий, производительность поиска

API Key аутентификация

Опциональная защита эндпоинтов с настраиваемыми ключами

Сравнение с аналогами

NGT Memory — единственное решение, не требующее внешней векторной БД и обеспечивающее поиск менее 5мс

Возможность★ ЛучшийNGT MemoryMem0ZepLangChain Memory
Самохостинг
Без векторной БД
Хеббианский граф
Задержка поиска~2-3ms~50ms~100ms~30ms
Открытый код
REST API

Простые и прозрачные тарифы

Начните бесплатно. Масштабируйтесь по мере роста. Никаких скрытых платежей.

Free
0 ₽/мес
  • Запросов/день:100 зап/день
  • Сессии:1 сессия
  • Модель:gpt-4.1-nano
  • Поддержка:GitHub Issues
  • Аналитика:
Популярный
Pro
1 990 ₽/мес
  • Запросов/день:10 000 зап/день
  • Сессии:100 сессий
  • Модель:gpt-4.1-nano
  • Поддержка:Email поддержка
  • Аналитика:
Enterprise
5 990 ₽/мес
  • Запросов/день:Без ограничений
  • Сессии:Без ограничений
  • Модель:gpt-4.1-nano
  • Поддержка:Приоритет + SLA
  • Аналитика:

Все тарифы включают: постоянную память, REST API, Docker деплой, лицензию BSL 1.1

💳 Оплата через ЮKassa — банковские карты, СБП, ЮMoney

💡 Самохостинг? Бесплатно навсегда — просто клонируйте репозиторий.

Для реальных AI-приложений

От медицины до потребительских приложений — NGT Memory делает каждое LLM-приложение умнее

Медицина

Медицинский AI-ассистент

Помнит аллергии, препараты и предыдущие реакции пациента между сессиями. Никогда не даёт советов, противоречащих известным условиям.

💡 Пациент упомянул аллергию на пенициллин 3 сессии назад → исключено из всех последующих рекомендаций

Потребители

Личный AI-компаньон

Отслеживает предпочтения, ограничения при поездках и личные планы. Становится умнее с каждым разговором.

💡 Знает, что вы вегетарианец, живёте в Берлине и тренируетесь к марафону

Бизнес

Бот техподдержки

Помнит прошлые обращения, предпочтения по возвратам и индивидуальные ограничения клиента. Клиентам не нужно повторяться.

💡 Клиент обращался в поддержку 3 раза по поводу биллинга → контекст вставляется автоматически

Готовы дать вашему LLM память?

Присоединяйтесь к разработчикам, создающим умные AI-приложения с постоянной памятью. Открытый код. Самохостинг. Готов к продакшену.

BSL 1.1
Source-available
Самохостинг
Ваши данные, ваш контроль
Поиск ~2-3мс
Скорость для продакшена

Мы используем файлы cookie для корректной работы сайта и улучшения вашего опыта.

Политика конфиденциальности