ColPali

by illuin-tech

System Card

Organizationilluin-tech

Released2024-06

Architecturevector-rag / Multi-vector VLM page embeddings

DetailsUses PaliGemma/Qwen-VL patch outputs + linear projection + ColBERT-style late interaction to embed whole document images. Removes OCR/layout pipelines. Includes ColPali, ColQwen, ColSmol variants.

Parameters—

Domainrag-retrieval

Open SourceYes

PaperView Paper

WebsiteVisit

CodeRepository

vidoremulti-vectorcolbertvlm

Capability Profile

Benchmark Scores

5 of 14 benchmarks

Data Transparency:5 estimated

Long-Context Retrieval

2/5

RULER

66.28pEstimated

NIAH

no data

LooGLE

no data

LongBench

603pEstimated

∞Bench

no data

Multi-Turn Recall

0/2

LoCoMo

no data

MemoryBank

no data

Cross-Session Memory

0/1

LongMemEval

no data

Multi-Hop QA

2/3

BABILong

no data

MultiHop-RAG

63.919pEstimated

HotpotQA

63.324pEstimated

Agent Task Memory

0/1

AgentBench-Mem

no data

Personalization

0/1

PerLTQA

no data

Factuality / Grounding

1/1

RAGAS

6630pEstimated

Sources:Arena estimate — derived from capability profile, not independently verified