11c - 向量数据库对比
本文是《AI Agent 实战手册》第 11 章第 3 节。 上一节:11b-RAG流水线详解 | 下一节:11d-RAG系统构建教程
概述
向量数据库是 RAG 系统的核心基础设施,负责存储和检索高维向量嵌入。选择合适的向量数据库直接影响系统的查询延迟、吞吐量、运维成本和可扩展性。本节将系统对比六大主流向量数据库——Pinecone、Weaviate、Qdrant、ChromaDB、pgvector、Milvus——覆盖价格、性能基准、托管选项和推荐用例,帮助你做出最适合项目需求的技术选型。
1. 向量数据库全景概览
工具推荐
| 工具 | 用途 | 价格 | 适用场景 |
|---|---|---|---|
| Pinecone | 全托管无服务器向量数据库 | 免费层可用;Standard $50/月起(含最低消费);Enterprise $500/月起 | 零运维团队、快速上线、中小规模 RAG |
| Weaviate | 混合搜索向量数据库(向量+关键词) | 开源免费自托管;Cloud Serverless ~$25/月起 | 需要混合搜索、内置向量化、合规要求 |
| Qdrant | Rust 高性能向量数据库 | 开源免费自托管;Cloud ~$0.014/小时起(约$10/月) | 高性能过滤搜索、资源受限环境、成本敏感 |
| ChromaDB | 开发者友好的嵌入式向量数据库 | 开源免费;Cloud $0 起步($5 免费额度,按用量计费) | 原型开发、MVP、LangChain/LlamaIndex 生态 |
| pgvector | PostgreSQL 向量搜索扩展 | 免费(PostgreSQL 扩展);基础设施成本自理 | 已有 PostgreSQL 的项目、需要事务一致性 |
| Milvus | 企业级分布式向量数据库 | 开源免费自托管;Zilliz Cloud $99/月起 | 亿级向量、企业推荐系统、大规模图像搜索 |
核心维度对比总表
| 维度 | Pinecone | Weaviate | Qdrant | ChromaDB | pgvector | Milvus |
|---|---|---|---|---|---|---|
| 开源 | ❌ 闭源 | ✅ BSD | ✅ Apache 2.0 | ✅ Apache 2.0 | ✅ PostgreSQL | ✅ Apache 2.0 |
| 语言 | 闭源后端 | Go | Rust | Python | C | Go/C++ |
| 托管云 | ✅ 原生 | ✅ Weaviate Cloud | ✅ Qdrant Cloud | ✅ Chroma Cloud | ✅ 各云厂商 | ✅ Zilliz Cloud |
| 自托管 | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 最大规模 | 数十亿 | 数亿 | 数亿 | 千万级 | 千万级 | 百亿级 |
| 混合搜索 | ✅ 稀疏+稠密 | ✅ 原生支持 | ✅ 稀疏向量 | ❌ 基础过滤 | ✅ 全文+向量 | ✅ 多向量字段 |
| 索引类型 | 专有 | HNSW | HNSW | HNSW, SPANN | IVFFlat, HNSW | IVF, HNSW, DiskANN |
2. 六大数据库深度解析
2.1 Pinecone — 全托管先驱
Pinecone 是最早的全托管向量数据库服务之一,专为不想管理基础设施的团队设计。其 Serverless 架构自动扩缩容,按用量计费。
核心优势:
- 零运维:无需管理服务器、索引或集群
- 开发体验极佳:几行代码即可上手
- 自动扩缩容:Serverless 架构按需分配资源
- 99.99% SLA 保证(Enterprise 计划)
价格详情(2025 年):
| 计划 | 月费 | 存储 | 特点 |
|---|---|---|---|
| Starter | 免费 | 有限额度 | 仅 AWS us-east-1,1 个项目,2 用户 |
| Standard | $50/月最低消费 + 按用量 | $0.33/GB/月 | 多区域、更高限额 |
| Enterprise | $500/月最低消费 | 定制 | SSO、专属支持、合规认证 |
适用场景: 小团队快速上线 RAG 应用、缺乏 DevOps 资源的创业公司、需要可预测 SLA 的生产环境。
局限性: 闭源无法自托管、大规模(1 亿+向量)成本较高、Standard 计划有 $50/月最低消费门槛。
操作步骤
步骤 1:创建 Pinecone 索引
from pinecone import Pinecone
pc = Pinecone(api_key="your-api-key")
# 创建 Serverless 索引
pc.create_index(
name="rag-knowledge-base",
dimension=1536, # OpenAI text-embedding-3-small
metric="cosine",
spec={"serverless": {"cloud": "aws", "region": "us-east-1"}}
)步骤 2:写入和查询向量
index = pc.Index("rag-knowledge-base")
# 写入向量(含元数据)
index.upsert(vectors=[
{"id": "doc-001", "values": embedding, "metadata": {"source": "wiki", "topic": "RAG"}}
])
# 语义查询 + 元数据过滤
results = index.query(
vector=query_embedding,
top_k=10,
include_metadata=True,
filter={"topic": {"$eq": "RAG"}}
)2.2 Weaviate — 混合搜索专家
Weaviate 是一个开源向量数据库,以原生混合搜索(向量相似度 + 关键词匹配)为核心竞争力。内置向量化模块,可直接接收原始文本自动生成嵌入。
核心优势:
- 原生混合搜索:向量语义搜索与 BM25 关键词搜索无缝结合
- 内置向量化模块:支持 OpenAI、Cohere、Hugging Face 等,无需外部嵌入服务
- 灵活部署:开源自托管、托管云、混合部署三种模式
- GraphQL API:结构化查询体验
价格详情(2025 年):
| 计划 | 月费 | 特点 |
|---|---|---|
| 开源自托管 | 免费(基础设施自理) | 完全控制,需自行运维 |
| Serverless Cloud | ~$25/月起(按维度存储计费) | 自动扩缩,适合中小规模 |
| Enterprise Cloud | 定制报价 | 专属集群、99.95% SLA、合规支持 |
适用场景: 需要同时支持语义搜索和精确匹配的电商搜索、知识库问答、内容推荐系统。
局限性: 混合搜索增加 10-20ms 延迟、大规模部署的定价模型较复杂(AIU 单位)。
操作步骤
步骤 1:使用混合搜索查询
import weaviate
client = weaviate.Client(
url="http://localhost:8080",
additional_headers={"X-OpenAI-Api-Key": "your-key"}
)
# 混合搜索:alpha 控制向量 vs 关键词权重
result = (
client.query
.get("Document", ["title", "content", "source"])
.with_hybrid(
query="RAG 系统的检索策略",
alpha=0.5, # 0=纯关键词, 1=纯向量, 0.5=均衡
fusion_type="relativeScoreFusion"
)
.with_where({
"path": ["source"],
"operator": "Equal",
"valueString": "technical-docs"
})
.with_limit(10)
.do()
)2.3 Qdrant — Rust 驱动的性能之王
Qdrant 使用 Rust 编写,在内存安全和查询性能方面表现出色。其 payload 索引系统使得带过滤条件的向量搜索几乎不损失性能,是过滤搜索场景的最佳选择。
核心优势:
- Rust 编写:内存安全、高性能、低资源消耗
- 过滤搜索领先:复杂过滤条件下延迟几乎不增加
- 内存映射存储:支持超出 RAM 容量的数据集
- 量化压缩:标量/乘积量化大幅降低内存占用
- 自带 Web UI:方便调试和监控
价格详情(2025 年):
| 计划 | 月费 | 特点 |
|---|---|---|
| 开源自托管 | 免费(基础设施自理) | Docker 一键部署,适合开发和小规模生产 |
| Qdrant Cloud | ~$10/月起($0.014/小时最小节点) | 托管服务,自动备份 |
| Enterprise | 定制报价 | 混合云、专属支持、SLA |
适用场景: 电商产品搜索(价格+类别过滤)、高性能推荐系统、资源受限环境、成本敏感项目。
局限性: 社区规模小于 Pinecone/Weaviate、企业级功能需付费。
操作步骤
步骤 1:带复杂过滤的向量搜索
from qdrant_client import QdrantClient
from qdrant_client.models import (
Distance, VectorParams, PointStruct,
Filter, FieldCondition, MatchValue, Range
)
client = QdrantClient("localhost", port=6333)
# 创建集合
client.create_collection(
collection_name="products",
vectors_config=VectorParams(size=384, distance=Distance.COSINE)
)
# 复杂过滤搜索:语义相似 + 价格范围 + 类别匹配
results = client.search(
collection_name="products",
query_vector=query_embedding,
query_filter=Filter(
must=[
FieldCondition(key="category", match=MatchValue(value="electronics")),
FieldCondition(key="price", range=Range(gte=100, lte=500)),
FieldCondition(key="in_stock", match=MatchValue(value=True))
]
),
limit=10,
with_payload=True
)2.4 ChromaDB — 开发者的首选原型工具
ChromaDB 以”像 SQLite 一样简单”为设计哲学,默认嵌入式运行,无需启动独立服务器。是 LangChain 和 LlamaIndex 生态中最流行的向量数据库。
核心优势:
- 嵌入式模式:无需独立服务器,import 即用
- 极低学习曲线:API 设计直觉化,几分钟上手
- LLM 框架深度集成:LangChain、LlamaIndex 原生支持
- 自动嵌入:可配置自动向量化,无需手动管理嵌入
价格详情(2025 年):
| 计划 | 月费 | 特点 |
|---|---|---|
| 开源本地 | 免费 | 嵌入式运行,零基础设施成本 |
| Chroma Cloud | $0 起步($5 免费额度,按用量计费) | Serverless 托管,自动扩缩 |
| 自托管 Server | 免费(基础设施自理) | chroma-server 模式,支持网络访问 |
适用场景: 快速原型验证、MVP 开发、个人项目、教学和实验、千万级以下数据集。
局限性: 不适合亿级向量规模、写入吞吐量有限、生产级高可用需额外配置。
操作步骤
步骤 1:嵌入式模式快速上手
import chromadb
# 嵌入式模式 — 无需启动服务器
client = chromadb.PersistentClient(path="./chroma_db")
# 创建集合
collection = client.create_collection(
name="knowledge_base",
metadata={"hnsw:space": "cosine"}
)
# 直接添加文档(自动嵌入)
collection.add(
documents=["RAG 系统通过检索增强生成质量", "向量数据库存储高维嵌入"],
metadatas=[{"source": "tutorial"}, {"source": "docs"}],
ids=["doc1", "doc2"]
)
# 语义查询
results = collection.query(
query_texts=["如何提升 RAG 检索质量"],
n_results=5,
where={"source": "tutorial"}
)2.5 pgvector — PostgreSQL 用户的最佳选择
pgvector 是 PostgreSQL 的向量搜索扩展,让你在现有 PostgreSQL 数据库中直接存储和查询向量嵌入。无需引入新的数据库系统,向量数据与业务数据共享事务一致性。
核心优势:
- 零额外基础设施:在现有 PostgreSQL 中启用扩展即可
- 事务一致性:向量数据与业务数据在同一事务中操作
- SQL 原生:使用熟悉的 SQL 语法进行向量查询
- 生态成熟:所有 PostgreSQL 工具链(备份、监控、ORM)直接可用
- pgvector 0.8.0:查询性能提升 9 倍,搜索相关性提升 100 倍(AWS Aurora 基准)
价格详情(2025 年):
| 计划 | 月费 | 特点 |
|---|---|---|
| 自托管 PostgreSQL | 免费(扩展免费,基础设施自理) | 完全控制 |
| AWS RDS/Aurora | 按实例计费(约 $50-500/月) | 托管 PostgreSQL + pgvector |
| Neon / Supabase | 免费层可用;付费 ~$25/月起 | Serverless PostgreSQL + pgvector |
适用场景: 已有 PostgreSQL 的项目、需要向量+关系数据联合查询、中小规模(千万级以下)向量搜索。
局限性: 大规模(亿级)性能不如专用向量数据库、索引重建在高写入场景下有开销、缺少专用向量数据库的高级功能(如多向量字段搜索)。
操作步骤
步骤 1:启用 pgvector 并创建向量表
-- 启用扩展
CREATE EXTENSION IF NOT EXISTS vector;
-- 创建带向量列的表
CREATE TABLE documents (
id SERIAL PRIMARY KEY,
title TEXT NOT NULL,
content TEXT,
source VARCHAR(100),
embedding vector(1536) -- OpenAI embedding 维度
);
-- 创建 HNSW 索引(推荐生产使用)
CREATE INDEX ON documents
USING hnsw (embedding vector_cosine_ops)
WITH (m = 16, ef_construction = 200);步骤 2:向量搜索 + SQL 过滤
-- 语义搜索 + 传统 SQL 过滤,一条查询搞定
SELECT id, title, content,
1 - (embedding <=> '[0.1, 0.2, ...]'::vector) AS similarity
FROM documents
WHERE source = 'technical-docs'
ORDER BY embedding <=> '[0.1, 0.2, ...]'::vector
LIMIT 10;2.6 Milvus — 企业级大规模向量搜索
Milvus 是为亿级甚至百亿级向量设计的分布式向量数据库。其存储、计算、协调分离的架构允许各组件独立扩缩容,是大型企业推荐系统和图像搜索的首选。
核心优势:
- 极致规模:支持百亿级向量,分布式架构水平扩展
- 丰富索引算法:IVF_FLAT、IVF_SQ8、HNSW、DiskANN 等,可按场景精细调优
- 多向量字段搜索:同一条记录可存储多个向量字段(如文本+图像嵌入)
- GPU 加速:Zilliz Cloud 支持 GPU 加速索引构建和查询
- Milvus 2.6:IVF_RABITQ 索引将内存占用压缩至 1/32,保持 95% 召回率
价格详情(2025 年):
| 计划 | 月费 | 特点 |
|---|---|---|
| 开源自托管 | 免费(基础设施自理) | 需要 Kubernetes,运维复杂度高 |
| Zilliz Cloud Free | 免费(5GB 存储,250 万 vCU) | 适合开发测试 |
| Zilliz Cloud Standard | $99/月起 | Serverless,自动扩缩 |
| Zilliz Cloud Enterprise | 定制报价 | 专属集群、HIPAA 合规、GPU 加速 |
适用场景: 亿级向量的推荐系统、大规模图像/视频搜索、多模态检索、需要精细索引调优的场景。
局限性: 自托管需要 Kubernetes 和专业 DevOps、学习曲线较陡、小规模项目过于重量级。
操作步骤
步骤 1:创建集合并配置索引
from pymilvus import connections, Collection, FieldSchema, CollectionSchema, DataType
connections.connect("default", host="localhost", port="19530")
# 定义 Schema
fields = [
FieldSchema(name="id", dtype=DataType.INT64, is_primary=True, auto_id=True),
FieldSchema(name="text_embedding", dtype=DataType.FLOAT_VECTOR, dim=1536),
FieldSchema(name="image_embedding", dtype=DataType.FLOAT_VECTOR, dim=512),
FieldSchema(name="doc_id", dtype=DataType.VARCHAR, max_length=200)
]
schema = CollectionSchema(fields, description="多模态文档嵌入")
# 创建集合并配置 HNSW 索引
collection = Collection("multimodal_docs", schema)
collection.create_index(
field_name="text_embedding",
index_params={"metric_type": "IP", "index_type": "HNSW", "params": {"M": 16, "efConstruction": 256}}
)3. 性能基准对比
以下基准数据基于 1000 万条 768 维向量的测试场景(综合多个独立评测来源):
查询延迟(P95)
| 数据库 | 纯向量搜索 | 带过滤搜索 | 说明 |
|---|---|---|---|
| Pinecone | 45-80ms(Serverless)/ 20-40ms(Pod) | 50-100ms | 全托管,延迟稳定 |
| Weaviate | 30-70ms | 40-90ms(混合搜索 +10-20ms) | 混合搜索略增延迟 |
| Qdrant | 15-30ms(内存)/ 30-60ms(内存映射) | 20-40ms | 过滤搜索性能最优 |
| ChromaDB | 50-100ms | 60-120ms | 适合小规模数据集 |
| pgvector | 20-50ms(HNSW,索引在内存) | 30-70ms | 依赖 PostgreSQL 配置 |
| Milvus | 25-50ms | 35-70ms | 取决于索引类型和配置 |
写入吞吐量
| 数据库 | 写入速度 | 说明 |
|---|---|---|
| Milvus | ⭐⭐⭐⭐⭐ | 分布式架构,写入吞吐最高 |
| Qdrant | ⭐⭐⭐⭐ | Rust 高效写入 |
| Pinecone | ⭐⭐⭐⭐ | 托管服务自动优化 |
| Weaviate | ⭐⭐⭐ | 中等水平 |
| pgvector | ⭐⭐⭐ | 受 PostgreSQL 写入机制影响 |
| ChromaDB | ⭐⭐ | 嵌入式模式写入有限 |
提示词模板
你是一位向量数据库选型顾问。请根据以下项目需求推荐最合适的向量数据库:
项目需求:
- 向量规模:[预计向量数量,如 100 万 / 1 亿 / 10 亿]
- 查询模式:[纯语义搜索 / 混合搜索(语义+关键词) / 带复杂过滤的搜索]
- 延迟要求:[实时 <50ms / 准实时 <200ms / 批量处理]
- 团队能力:[有 DevOps 团队 / 无运维经验 / 有 PostgreSQL 经验]
- 预算范围:[月预算上限]
- 部署要求:[全托管 / 自托管 / 混合]
- 现有技术栈:[已有数据库、云平台、编程语言]
请从 Pinecone、Weaviate、Qdrant、ChromaDB、pgvector、Milvus 中推荐 1-2 个最佳选择,并说明理由。4. 选型决策框架
按项目阶段选择
原型/MVP 阶段
└─ 首选 ChromaDB(嵌入式,零配置)
└─ 备选 pgvector(如已有 PostgreSQL)
早期生产(<1000 万向量)
├─ 零运维需求 → Pinecone Serverless
├─ 需要混合搜索 → Weaviate Cloud
├─ 性能优先 + 成本敏感 → Qdrant Cloud
└─ 已有 PostgreSQL → pgvector
规模化生产(1 亿+向量)
├─ 企业级 + 有 K8s 团队 → Milvus / Zilliz Cloud
├─ 高性能过滤搜索 → Qdrant(自托管集群)
└─ 全托管 + 预算充足 → Pinecone Enterprise按团队能力选择
| 团队特征 | 推荐方案 | 理由 |
|---|---|---|
| 无 DevOps,小团队 | Pinecone | 零运维,专注业务逻辑 |
| 有 PostgreSQL 经验 | pgvector | 无需学习新系统 |
| 有 K8s 和 DevOps | Milvus 自托管 | 最大灵活性和成本控制 |
| 全栈独立开发者 | ChromaDB → Qdrant Cloud | 开发用 Chroma,生产迁移 Qdrant |
| 需要合规(GDPR/HIPAA) | Weaviate Enterprise / Zilliz Enterprise | 专属集群 + 合规认证 |
实战案例:从原型到生产的向量数据库迁移
场景描述
一个 SaaS 创业团队构建企业知识库问答系统,经历了三个阶段的向量数据库选型演进:
案例分析
第一阶段:原型验证(ChromaDB)
团队使用 ChromaDB 嵌入式模式,在 2 天内完成了 RAG 原型。数据量 5 万条文档,单机运行,验证了产品可行性。
# 原型阶段:ChromaDB 嵌入式,零配置
import chromadb
client = chromadb.PersistentClient(path="./prototype_db")
collection = client.create_collection("company_docs")第二阶段:早期生产(Qdrant Cloud)
用户增长到 500 家企业客户,文档量达到 200 万条。团队迁移到 Qdrant Cloud,获得了更好的查询性能和过滤搜索能力,月成本约 $80。
# 生产阶段:Qdrant Cloud,带过滤的多租户搜索
from qdrant_client import QdrantClient
client = QdrantClient(url="https://xxx.qdrant.io", api_key="...")
# 多租户过滤:每个企业客户只搜索自己的文档
results = client.search(
collection_name="enterprise_docs",
query_vector=query_embedding,
query_filter=Filter(must=[
FieldCondition(key="tenant_id", match=MatchValue(value="company-abc"))
]),
limit=10
)第三阶段:规模化(Milvus on K8s)
客户增长到 5000 家,文档量突破 5000 万条。团队部署 Milvus 集群到 Kubernetes,实现了水平扩展和多向量字段搜索(文本+表格嵌入)。
关键决策点:
- 原型阶段不要过度设计——ChromaDB 的零配置让团队专注于验证产品假设
- 迁移时使用抽象层——团队早期封装了
VectorStore接口,迁移时只需替换实现类 - 选型要匹配团队能力——第二阶段选 Qdrant Cloud 而非自托管 Milvus,因为团队当时没有 K8s 经验
- 成本随规模变化——同样的数据量,自托管 Milvus 比 Qdrant Cloud 便宜 40%,但需要 1 名 DevOps 工程师
迁移抽象层示例
from abc import ABC, abstractmethod
from typing import List, Dict, Optional
class VectorStore(ABC):
"""向量数据库抽象层,便于后续迁移"""
@abstractmethod
def upsert(self, vectors: List[Dict]) -> None:
pass
@abstractmethod
def search(self, vector: List[float], top_k: int,
filters: Optional[Dict] = None) -> List[Dict]:
pass
# 开发环境用 ChromaDB
class ChromaStore(VectorStore):
def __init__(self, collection_name: str):
self.client = chromadb.PersistentClient(path="./dev_db")
self.collection = self.client.get_or_create_collection(collection_name)
def upsert(self, vectors):
# ChromaDB 实现
...
def search(self, vector, top_k, filters=None):
# ChromaDB 实现
...
# 生产环境用 Qdrant
class QdrantStore(VectorStore):
def __init__(self, collection_name: str, url: str, api_key: str):
self.client = QdrantClient(url=url, api_key=api_key)
self.collection_name = collection_name
def upsert(self, vectors):
# Qdrant 实现
...
def search(self, vector, top_k, filters=None):
# Qdrant 实现
...避坑指南
❌ 常见错误
-
原型阶段就选重量级方案
- 问题:项目刚开始就部署 Milvus 集群,花了两周搭环境,产品假设还没验证
- 正确做法:原型用 ChromaDB 或 pgvector,验证可行性后再迁移
-
忽略过滤搜索的性能差异
- 问题:选型时只看纯向量搜索基准,上线后发现带过滤条件的查询延迟翻倍
- 正确做法:用真实查询模式(含过滤条件)做基准测试,Qdrant 和 Weaviate 在过滤搜索场景表现最优
-
低估托管服务的隐藏成本
- 问题:只看基础月费,忽略了嵌入生成、重排序、数据备份、出站流量等附加费用
- 正确做法:计算总拥有成本(TCO),包括嵌入 API 调用、存储增长、流量费用
-
没有建立向量数据库抽象层
- 问题:业务代码直接耦合特定数据库 SDK,迁移时需要重写大量代码
- 正确做法:从第一天就封装
VectorStore接口,LangChain/LlamaIndex 的 VectorStore 抽象也可直接使用
-
pgvector 大规模使用不做索引优化
- 问题:数据量增长后查询变慢,因为没有创建 HNSW 索引或索引参数不合理
- 正确做法:生产环境必须创建 HNSW 索引,合理设置
m和ef_construction参数,定期 REINDEX
-
忽视多租户隔离需求
- 问题:所有租户数据混在一个集合中,通过过滤实现隔离,数据量增长后性能下降
- 正确做法:评估是否需要按租户分集合(Qdrant/Milvus 支持),或使用 payload 索引优化过滤性能
✅ 最佳实践
- 用真实数据和查询模式做 POC 测试,至少加载 1 万-10 万条向量,模拟实际并发
- 从第一天就使用向量数据库抽象层(自建或 LangChain VectorStore 接口)
- 监控向量数据库的关键指标:查询延迟 P95/P99、召回率、索引构建时间、存储增长
- 定期评估成本效率——数据量翻倍时重新评估是否需要迁移方案
- 生产环境启用备份和灾备策略,向量数据重建成本高(需要重新调用嵌入 API)
相关资源与延伸阅读
- Qdrant 官方文档与教程 — 包含详细的部署指南、API 参考和性能调优建议
- Weaviate Recipes(GitHub) — Weaviate 官方示例集,涵盖 RAG、混合搜索、多模态等场景
- Milvus Bootcamp(GitHub) — Milvus 官方实战教程,包含推荐系统、图像搜索等完整项目
- pgvector GitHub 仓库 — pgvector 源码、安装指南和使用示例
- ChromaDB 官方文档 — ChromaDB 快速入门、Cloud 配置和集成指南
- Pinecone Learning Center — Pinecone 官方学习资源,涵盖向量搜索基础和 RAG 最佳实践
- ANN Benchmarks — 近似最近邻算法的独立基准测试,比较不同索引算法的性能
- Vector Database Leaderboard(Agentset) — 向量数据库综合排行榜,按部署、成本、索引类型对比
- LangChain Vector Stores 文档 — LangChain 支持的所有向量数据库集成指南
- Zilliz Cloud 文档 — Milvus 托管服务的完整文档,包含定价计算器和迁移指南
参考来源
- Vector Database Comparison 2026: Pinecone vs Weaviate vs Milvus vs Qdrant vs Chroma (2026 年 2 月)
- Vector Database Leaderboard (2026 年 2 月)
- Vector Database Comparison 2025: Pinecone vs Weaviate vs Qdrant vs Milvus vs FAISS (2025 年 10 月)
- Pinecone vs Weaviate vs Qdrant — Athenic Blog (2025 年 10 月)
- The True Cost of Pinecone — Pricing, Integration, and More (2025 年 10 月)
- Supercharging vector search performance with pgvector 0.8.0 on Amazon Aurora PostgreSQL (2025 年 5 月)
- Pgvector vs. Pinecone: Vector Database Comparison — Timescale (2025 年 12 月)
- Introducing Milvus 2.6: Affordable Vector Search at Billion Scale (2025 年 6 月)
- Zilliz Cloud Delivers Major Cost Savings and Higher Performance (2025 年 10 月)
- Qdrant Review: A highly flexible option for vector search — InfoWorld (2026 年 2 月)
- Chroma Cloud Getting Started (2025 年)
- Pinecone Pricing (2025 年)
- Weaviate Pricing (2025 年)
📖 返回 总览与导航 | 上一节:11b-RAG流水线详解 | 下一节:11d-RAG系统构建教程