NGT Memory

Дайте вашему LLM память, которую он не забудет

Drop-in REST API с постоянной межсессионной памятью для любого LLM. Поиск ~2-3мс. Никакой лишней инфраструктуры. Поиск за ~2-3мс. Никакой инфраструктуры.

v0.23.0BSL 1.1Python 3.10+ ★ GitHub

Пайплайн памяти

Пользовательсообщение

NGTПамять

LLMyandexgpt

Ответрезультат

Косинусный + граф поиск~2-3мс задержкаСохраняется между сессиями

Доказанные результаты — не просто обещания

Сравнение с базовым LLM без слоя памяти

8/8

Сценариев решено с памятью (база — 0/8)

~2-3мс

Средняя задержка поиска

92%

Фактическая точность с памятью (база — 31%)

Результаты — deep eval, 17 сценариев (yandexgpt · text-search-doc)

Категория	Без памяти	С памятью
★ Recall (вспомнить факт)	0.12	1.00
★ Contradiction (исправить)	0.67	1.00
Control (нет ложной памяти)	1.00	1.00
★ Итого (factual accuracy)	0.31	0.92

💡 Глубокая оценка на 17 сценариях: фактическая точность выросла с 0.31 до 0.92 при precision 1.0 — без ложной памяти. В простом A/B на 8 сценариях — 8/8 против 0/8 без памяти.

0.92 с памятью0.31 без памяти

LLM без памяти — сломаны по своей природе

Каждая сессия начинается с нуля. Пользователи вынуждены повторяться. ИИ даёт опасные обобщённые советы. NGT Memory это исправляет.

Без памяти

С NGT Memory

LLM рекомендует мясо вегетарианцу

Помнит пищевые предпочтения пользователя

Просит повторить контекст в каждой сессии

Сохраняет факты между сессиями

Обобщённые советы без учёта истории

Персонализированные ответы каждый раз

Опасные советы в медицине и финансах

Учитывает аллергии, препараты, ограничения

Реальный пример — Рекомендация ресторана в Киото

Без памяти

«Ippudo — отличное место для любителей рамена» — рекомендация мяса вегетарианцу

С NGT Memory

«Shigetsu в Tenryu-ji подаёт сёдзин рёри (буддийскую веганскую кухню)» — персонализировано, потому что помнит, что вы вегетарианец

Как работает NGT Memory

Простой пайплайн, который внедряет релевантные воспоминания в каждый LLM-промпт

Пайплайн запроса

POST /chat

HTTP запрос

Embed

text-search-doc

~700мс

Ваше преимущество

NGT Retrieve

косинус + граф

~2мс

LLM Prompt

[КОНТЕКСТ ПАМЯТИ] вставлен

yandexgpt

Генерация ответа

~1.9с

Store

NGT Memory

~1мс

POST /chat

HTTP запрос

Embed

text-search-doc

~700мс

NGT Retrieve

косинус + граф

~2мс★

LLM Prompt

[КОНТЕКСТ ПАМЯТИ] вставлен

yandexgpt

Генерация ответа

~1.9с

Store

NGT Memory

~1мс

Косинусное сходство

Семантически близкие факты извлекаются через векторный поиск

Хеббианский граф

Ассоциативные связи между концептами, как в мозге человека

Иерархическая консолидация

Важные факты автоматически переходят в долгосрочную память

ℹ️

По умолчанию Docker запускает один API воркер для консистентности in-memory сессий. Режим нескольких воркеров требует sticky routing или общего session backend.

Запуск за 5 минут

Drop-in REST API — никакой новой инфраструктуры, баз данных векторов и привязки к вендору

bash

# 1. Клонировать репозиторий
git clone https://github.com/ngt-memory/ngt-memory.git
cd ngt-memory

# 2. Настроить окружение
cp .env.example .env
# Установить YANDEX_API_KEY в .env

# 3. Запустить сервис (1 воркер, сессии in-memory)
docker-compose up -d

# ✓ NGT Memory запущен на http://localhost:9190

ℹ️Docker по умолчанию использует 1 воркер, т.к. состояние сессий хранится в памяти.

REST API · Включена спецификация OpenAPI

Попробуйте прямо сейчас — без регистрации

💬 Ваше сообщение:

Всё что нужно

Готовый к продакшену слой памяти со всеми необходимыми функциями для вашего LLM-приложения

Постоянная память

Сохраняет факты между сессиями — пользователи не повторяются

Быстрый поиск

~2-3мс в среднем, граф + косинус, без внешней БД

Drop-in REST API

Интегрируется в любое LLM-приложение за 5 минут

Изолированные сессии

Изолированная память на пользователя — каждая сессия полностью независима

Простой Docker деплой

Деплой одной командой — docker-compose up -d

Локальный режим

Работает полностью на вашей инфраструктуре — без облака

Хеббианский граф

Ассоциативные связи между концептами, как в мозге

Встроенная аналитика

Метрики памяти, статистика сессий, производительность поиска

API Key аутентификация

Опциональная защита эндпоинтов с настраиваемыми ключами

Сравнение с аналогами

NGT Memory — единственное решение, не требующее внешней векторной БД и обеспечивающее поиск менее 5мс

Возможность	★ ЛучшийNGT Memory	Mem0	Zep	LangChain Memory
Самохостинг
Без векторной БД
Хеббианский граф
Задержка поиска	~2-3ms	~50ms	~100ms	~30ms
Открытый код
REST API

Простые и прозрачные тарифы

Начните бесплатно. Масштабируйтесь по мере роста. Никаких скрытых платежей.

Free

0 ₽/мес

Запросов/день:100 зап/день
Сессии:1 сессия
Модель:yandexgpt
Поддержка:GitHub Issues
Аналитика:

Популярный

Pro

1 990 ₽/мес

Запросов/день:10 000 зап/день
Сессии:100 сессий
Модель:yandexgpt
Поддержка:Email поддержка
Аналитика:

Enterprise

5 990 ₽/мес

Запросов/день:Без ограничений
Сессии:Без ограничений
Модель:yandexgpt
Поддержка:Приоритет + SLA
Аналитика:

Все тарифы включают: постоянную память, REST API, Docker деплой, лицензию BSL 1.1

💳 Оплата через ЮKassa — банковские карты, СБП, ЮMoney

💡 Самохостинг? Бесплатно навсегда — просто клонируйте репозиторий.

Для реальных AI-приложений

От медицины до потребительских приложений — NGT Memory делает каждое LLM-приложение умнее

Медицина

Медицинский AI-ассистент

Помнит аллергии, препараты и предыдущие реакции пациента между сессиями. Никогда не даёт советов, противоречащих известным условиям.

💡 Пациент упомянул аллергию на пенициллин 3 сессии назад → исключено из всех последующих рекомендаций

Потребители

Личный AI-компаньон

Отслеживает предпочтения, ограничения при поездках и личные планы. Становится умнее с каждым разговором.

💡 Знает, что вы вегетарианец, живёте в Берлине и тренируетесь к марафону

Бизнес

Бот техподдержки

Помнит прошлые обращения, предпочтения по возвратам и индивидуальные ограничения клиента. Клиентам не нужно повторяться.

💡 Клиент обращался в поддержку 3 раза по поводу биллинга → контекст вставляется автоматически

Готовы дать вашему LLM память?

Присоединяйтесь к разработчикам, создающим умные AI-приложения с постоянной памятью. Открытый код. Самохостинг. Готов к продакшену.

BSL 1.1

Source-available

Самохостинг

Ваши данные, ваш контроль

Поиск ~2-3мс

Скорость для продакшена