HiMem

by Zhu et al. (JD.com, 2026)

System Card

OrganizationZhu et al. (JD.com, 2026)

Released2026-01

Architecturehierarchical-summary / Episode Memory + Note Memory with conflict-aware updates

DetailsTwo-tier memory: Episode Memory built via topic-aware event-surprise dual-channel segmentation, plus Note Memory from multi-stage information extraction. Hybrid + best-effort retrieval with conflict-aware updates for self-evolution.

Parameters—

Domainagent-memoryepisodic-session

Open SourceYes

PaperView Paper

CodeRepository

hierarchicalepisode-notelong-horizontopic-segmentation

Capability Profile

Benchmark Scores

6 of 14 benchmarks

Long-Context Retrieval

0/5

RULER

no data

NIAH

no data

LooGLE

no data

LongBench

no data

∞Bench

no data

Multi-Turn Recall

2/2

LoCoMo

80.789p

MemoryBank

70.720p

Cross-Session Memory

1/1

LongMemEval

78.467p

Multi-Hop QA

2/3

BABILong

no data

MultiHop-RAG

7579p

HotpotQA

78.291p

Agent Task Memory

1/1

AgentBench-Mem

7226p

Personalization

0/1

PerLTQA

no data

Factuality / Grounding

0/1

RAGAS

no data

Sources:arXiv:2601.06377 Table 1 — Overall GPT-Score; F1 34.95. Per-category: SingleHop 89.22, MultiHop 70.92, Temporal 74.77, OpenDomain 54.86 HiMem paper (arXiv:2601.06377); evaluated on AgentBench Memory Track (Tsinghua KEG, 2308)HiMem paper (arXiv:2601.06377); evaluated on LongMemEval: Benchmarking Chat Assistants on Long-Term Interactive Memory (Salesforce AI Research, 2410)HiMem paper (arXiv:2601.06377); evaluated on HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering (Stanford / CMU, 1809)HiMem paper (arXiv:2601.06377); evaluated on MemoryBank: Enhancing LLMs with Long-Term Memory (Sun Yat-sen University, 2305)HiMem paper (arXiv:2601.06377); evaluated on MultiHop-RAG: Benchmarking Retrieval-Augmented Generation for Multi-Hop Queries (HKUST, 2401)