HoneyHive

by HoneyHive Inc.

System Card

OrganizationHoneyHive Inc.

Released2022-01

Architectureagentic-workflow / AI agent observability and evaluation

DetailsHoneyHive provides tracing, evaluation, and prompt management for LLM applications and AI agents. Every agent step, tool call, and state transition is captured via OpenTelemetry-compatible tracing. Datasets for fine-tuning can be curated from logged traces. Raised $7.4M total ($5.5M Seed led by Insight Partners). GA launched April 2025.

Parameters—

Domainagent-memoryrag-retrieval

Open SourceNo

WebsiteVisit

observabilitytracingevaluationprompt-versioningfine-tuning

Capability Profile

Benchmark Scores

6 of 14 benchmarks

Data Transparency:6 estimated

Long-Context Retrieval

1/5

RULER

no data

NIAH

no data

LooGLE

no data

LongBench

603pEstimated

∞Bench

no data

Multi-Turn Recall

1/2

LoCoMo

77.975pEstimated

MemoryBank

no data

Cross-Session Memory

1/1

LongMemEval

78.365pEstimated

Multi-Hop QA

2/3

BABILong

no data

MultiHop-RAG

71.748pEstimated

HotpotQA

74.868pEstimated

Agent Task Memory

1/1

AgentBench-Mem

7226pEstimated

Personalization

0/1

PerLTQA

no data

Factuality / Grounding

0/1

RAGAS

no data

Sources:Arena estimate — derived from capability profile, not independently verified