Une base vectorielle est le cœur d'un système RAG. Quatre acteurs se partagent 90 % du marché en 2024. Voici comment choisir.
Défaut recommandé : pgvector si vous êtes déjà sur Postgres, Pinecone si vous voulez zéro ops, Qdrant si vous voulez du self-hosted efficace.
pgvector (extension Postgres)
- Aucun service supplémentaire à gérer
- Transactions ACID avec vos autres données
- Performance excellente jusqu'à 10-20 M vecteurs
- Marche sur Supabase, Neon, Vercel Postgres
Pinecone (SaaS managé)
- Zéro ops, scale automatique
- API très propre
- Prix qui grimpe vite au-delà de 5 M vecteurs
- Vos données quittent votre infra (choix RGPD à cadrer)
Weaviate
- Open source + cloud managé
- Hybrid search (vector + keyword) intégré
- Bien pour du multi-modal
Qdrant
- Open source Rust, très performant
- Self-hosted facile ou cloud managé
- Excellent choix pour du volume important à coût maîtrisé
Pour 80 % des projets RAG jusqu'à 5 M vecteurs, pgvector sur votre Postgres existant est le meilleur choix.
On choisit ensemble ?
En 30 minutes on peut choisir la base vectorielle qui colle à votre volume et votre stack. Réservez un appel. À lire : RAG vs fine-tuning.