11c - 向量数据库对比

本文是《AI Agent 实战手册》第 11 章第 3 节。上一节：11b-RAG流水线详解 | 下一节：11d-RAG系统构建教程

概述

向量数据库是 RAG 系统的核心基础设施，负责存储和检索高维向量嵌入。选择合适的向量数据库直接影响系统的查询延迟、吞吐量、运维成本和可扩展性。本节将系统对比六大主流向量数据库——Pinecone、Weaviate、Qdrant、ChromaDB、pgvector、Milvus——覆盖价格、性能基准、托管选项和推荐用例，帮助你做出最适合项目需求的技术选型。

1. 向量数据库全景概览

工具推荐

工具	用途	价格	适用场景
Pinecone	全托管无服务器向量数据库	免费层可用；Standard $50/月起（含最低消费）；Enterprise $500/月起	零运维团队、快速上线、中小规模 RAG
Weaviate	混合搜索向量数据库（向量+关键词）	开源免费自托管；Cloud Serverless ~$25/月起	需要混合搜索、内置向量化、合规要求
Qdrant	Rust 高性能向量数据库	开源免费自托管；Cloud ~$0.014/小时起（约$10/月）	高性能过滤搜索、资源受限环境、成本敏感
ChromaDB	开发者友好的嵌入式向量数据库	开源免费；Cloud $0 起步（$5 免费额度，按用量计费）	原型开发、MVP、LangChain/LlamaIndex 生态
pgvector	PostgreSQL 向量搜索扩展	免费（PostgreSQL 扩展）；基础设施成本自理	已有 PostgreSQL 的项目、需要事务一致性
Milvus	企业级分布式向量数据库	开源免费自托管；Zilliz Cloud $99/月起	亿级向量、企业推荐系统、大规模图像搜索

核心维度对比总表

维度	Pinecone	Weaviate	Qdrant	ChromaDB	pgvector	Milvus
开源	❌ 闭源	✅ BSD	✅ Apache 2.0	✅ Apache 2.0	✅ PostgreSQL	✅ Apache 2.0
语言	闭源后端	Go	Rust	Python	C	Go/C++
托管云	✅ 原生	✅ Weaviate Cloud	✅ Qdrant Cloud	✅ Chroma Cloud	✅ 各云厂商	✅ Zilliz Cloud
自托管	❌	✅	✅	✅	✅	✅
最大规模	数十亿	数亿	数亿	千万级	千万级	百亿级
混合搜索	✅ 稀疏+稠密	✅ 原生支持	✅ 稀疏向量	❌ 基础过滤	✅ 全文+向量	✅ 多向量字段
索引类型	专有	HNSW	HNSW	HNSW, SPANN	IVFFlat, HNSW	IVF, HNSW, DiskANN

2. 六大数据库深度解析

2.1 Pinecone — 全托管先驱

Pinecone 是最早的全托管向量数据库服务之一，专为不想管理基础设施的团队设计。其 Serverless 架构自动扩缩容，按用量计费。

核心优势：

零运维：无需管理服务器、索引或集群
开发体验极佳：几行代码即可上手
自动扩缩容：Serverless 架构按需分配资源
99.99% SLA 保证（Enterprise 计划）

价格详情（2025 年）：

计划	月费	存储	特点
Starter	免费	有限额度	仅 AWS us-east-1，1 个项目，2 用户
Standard	$50/月最低消费 + 按用量	$0.33/GB/月	多区域、更高限额
Enterprise	$500/月最低消费	定制	SSO、专属支持、合规认证

适用场景： 小团队快速上线 RAG 应用、缺乏 DevOps 资源的创业公司、需要可预测 SLA 的生产环境。

局限性： 闭源无法自托管、大规模（1 亿+向量）成本较高、Standard 计划有 $50/月最低消费门槛。

操作步骤

步骤 1：创建 Pinecone 索引


from pinecone import Pinecone
 
pc = Pinecone(api_key="your-api-key")
 
# 创建 Serverless 索引
pc.create_index(
    name="rag-knowledge-base",
    dimension=1536,        # OpenAI text-embedding-3-small
    metric="cosine",
    spec={"serverless": {"cloud": "aws", "region": "us-east-1"}}
)

步骤 2：写入和查询向量


index = pc.Index("rag-knowledge-base")
 
# 写入向量（含元数据）
index.upsert(vectors=[
    {"id": "doc-001", "values": embedding, "metadata": {"source": "wiki", "topic": "RAG"}}
])
 
# 语义查询 + 元数据过滤
results = index.query(
    vector=query_embedding,
    top_k=10,
    include_metadata=True,
    filter={"topic": {"$eq": "RAG"}}
)

2.2 Weaviate — 混合搜索专家

Weaviate 是一个开源向量数据库，以原生混合搜索（向量相似度 + 关键词匹配）为核心竞争力。内置向量化模块，可直接接收原始文本自动生成嵌入。

核心优势：

原生混合搜索：向量语义搜索与 BM25 关键词搜索无缝结合
内置向量化模块：支持 OpenAI、Cohere、Hugging Face 等，无需外部嵌入服务
灵活部署：开源自托管、托管云、混合部署三种模式
GraphQL API：结构化查询体验

价格详情（2025 年）：

计划	月费	特点
开源自托管	免费（基础设施自理）	完全控制，需自行运维
Serverless Cloud	~$25/月起（按维度存储计费）	自动扩缩，适合中小规模
Enterprise Cloud	定制报价	专属集群、99.95% SLA、合规支持

适用场景： 需要同时支持语义搜索和精确匹配的电商搜索、知识库问答、内容推荐系统。

局限性： 混合搜索增加 10-20ms 延迟、大规模部署的定价模型较复杂（AIU 单位）。

操作步骤

步骤 1：使用混合搜索查询


import weaviate
 
client = weaviate.Client(
    url="http://localhost:8080",
    additional_headers={"X-OpenAI-Api-Key": "your-key"}
)
 
# 混合搜索：alpha 控制向量 vs 关键词权重
result = (
    client.query
    .get("Document", ["title", "content", "source"])
    .with_hybrid(
        query="RAG 系统的检索策略",
        alpha=0.5,  # 0=纯关键词, 1=纯向量, 0.5=均衡
        fusion_type="relativeScoreFusion"
    )
    .with_where({
        "path": ["source"],
        "operator": "Equal",
        "valueString": "technical-docs"
    })
    .with_limit(10)
    .do()
)

2.3 Qdrant — Rust 驱动的性能之王

Qdrant 使用 Rust 编写，在内存安全和查询性能方面表现出色。其 payload 索引系统使得带过滤条件的向量搜索几乎不损失性能，是过滤搜索场景的最佳选择。

核心优势：

Rust 编写：内存安全、高性能、低资源消耗
过滤搜索领先：复杂过滤条件下延迟几乎不增加
内存映射存储：支持超出 RAM 容量的数据集
量化压缩：标量/乘积量化大幅降低内存占用
自带 Web UI：方便调试和监控

价格详情（2025 年）：

计划	月费	特点
开源自托管	免费（基础设施自理）	Docker 一键部署，适合开发和小规模生产
Qdrant Cloud	~$10/月起（$0.014/小时最小节点）	托管服务，自动备份
Enterprise	定制报价	混合云、专属支持、SLA

适用场景： 电商产品搜索（价格+类别过滤）、高性能推荐系统、资源受限环境、成本敏感项目。

局限性： 社区规模小于 Pinecone/Weaviate、企业级功能需付费。

操作步骤

步骤 1：带复杂过滤的向量搜索


from qdrant_client import QdrantClient
from qdrant_client.models import (
    Distance, VectorParams, PointStruct,
    Filter, FieldCondition, MatchValue, Range
)
 
client = QdrantClient("localhost", port=6333)
 
# 创建集合
client.create_collection(
    collection_name="products",
    vectors_config=VectorParams(size=384, distance=Distance.COSINE)
)
 
# 复杂过滤搜索：语义相似 + 价格范围 + 类别匹配
results = client.search(
    collection_name="products",
    query_vector=query_embedding,
    query_filter=Filter(
        must=[
            FieldCondition(key="category", match=MatchValue(value="electronics")),
            FieldCondition(key="price", range=Range(gte=100, lte=500)),
            FieldCondition(key="in_stock", match=MatchValue(value=True))
        ]
    ),
    limit=10,
    with_payload=True
)

2.4 ChromaDB — 开发者的首选原型工具

ChromaDB 以”像 SQLite 一样简单”为设计哲学，默认嵌入式运行，无需启动独立服务器。是 LangChain 和 LlamaIndex 生态中最流行的向量数据库。

核心优势：

嵌入式模式：无需独立服务器，import 即用
极低学习曲线：API 设计直觉化，几分钟上手
LLM 框架深度集成：LangChain、LlamaIndex 原生支持
自动嵌入：可配置自动向量化，无需手动管理嵌入

价格详情（2025 年）：

计划	月费	特点
开源本地	免费	嵌入式运行，零基础设施成本
Chroma Cloud	$0 起步（$5 免费额度，按用量计费）	Serverless 托管，自动扩缩
自托管 Server	免费（基础设施自理）	chroma-server 模式，支持网络访问

适用场景： 快速原型验证、MVP 开发、个人项目、教学和实验、千万级以下数据集。

局限性： 不适合亿级向量规模、写入吞吐量有限、生产级高可用需额外配置。

操作步骤

步骤 1：嵌入式模式快速上手


import chromadb
 
# 嵌入式模式 — 无需启动服务器
client = chromadb.PersistentClient(path="./chroma_db")
 
# 创建集合
collection = client.create_collection(
    name="knowledge_base",
    metadata={"hnsw:space": "cosine"}
)
 
# 直接添加文档（自动嵌入）
collection.add(
    documents=["RAG 系统通过检索增强生成质量", "向量数据库存储高维嵌入"],
    metadatas=[{"source": "tutorial"}, {"source": "docs"}],
    ids=["doc1", "doc2"]
)
 
# 语义查询
results = collection.query(
    query_texts=["如何提升 RAG 检索质量"],
    n_results=5,
    where={"source": "tutorial"}
)

2.5 pgvector — PostgreSQL 用户的最佳选择

pgvector 是 PostgreSQL 的向量搜索扩展，让你在现有 PostgreSQL 数据库中直接存储和查询向量嵌入。无需引入新的数据库系统，向量数据与业务数据共享事务一致性。

核心优势：

零额外基础设施：在现有 PostgreSQL 中启用扩展即可
事务一致性：向量数据与业务数据在同一事务中操作
SQL 原生：使用熟悉的 SQL 语法进行向量查询
生态成熟：所有 PostgreSQL 工具链（备份、监控、ORM）直接可用
pgvector 0.8.0：查询性能提升 9 倍，搜索相关性提升 100 倍（AWS Aurora 基准）

价格详情（2025 年）：

计划	月费	特点
自托管 PostgreSQL	免费（扩展免费，基础设施自理）	完全控制
AWS RDS/Aurora	按实例计费（约 $50-500/月）	托管 PostgreSQL + pgvector
Neon / Supabase	免费层可用；付费 ~$25/月起	Serverless PostgreSQL + pgvector

适用场景： 已有 PostgreSQL 的项目、需要向量+关系数据联合查询、中小规模（千万级以下）向量搜索。

局限性： 大规模（亿级）性能不如专用向量数据库、索引重建在高写入场景下有开销、缺少专用向量数据库的高级功能（如多向量字段搜索）。

操作步骤

步骤 1：启用 pgvector 并创建向量表


-- 启用扩展
CREATE EXTENSION IF NOT EXISTS vector;
 
-- 创建带向量列的表
CREATE TABLE documents (
    id SERIAL PRIMARY KEY,
    title TEXT NOT NULL,
    content TEXT,
    source VARCHAR(100),
    embedding vector(1536)  -- OpenAI embedding 维度
);
 
-- 创建 HNSW 索引（推荐生产使用）
CREATE INDEX ON documents
USING hnsw (embedding vector_cosine_ops)
WITH (m = 16, ef_construction = 200);

步骤 2：向量搜索 + SQL 过滤


-- 语义搜索 + 传统 SQL 过滤，一条查询搞定
SELECT id, title, content,
       1 - (embedding <=> '[0.1, 0.2, ...]'::vector) AS similarity
FROM documents
WHERE source = 'technical-docs'
ORDER BY embedding <=> '[0.1, 0.2, ...]'::vector
LIMIT 10;

2.6 Milvus — 企业级大规模向量搜索

Milvus 是为亿级甚至百亿级向量设计的分布式向量数据库。其存储、计算、协调分离的架构允许各组件独立扩缩容，是大型企业推荐系统和图像搜索的首选。

核心优势：

极致规模：支持百亿级向量，分布式架构水平扩展
丰富索引算法：IVF_FLAT、IVF_SQ8、HNSW、DiskANN 等，可按场景精细调优
多向量字段搜索：同一条记录可存储多个向量字段（如文本+图像嵌入）
GPU 加速：Zilliz Cloud 支持 GPU 加速索引构建和查询
Milvus 2.6：IVF_RABITQ 索引将内存占用压缩至 1/32，保持 95% 召回率

价格详情（2025 年）：

计划	月费	特点
开源自托管	免费（基础设施自理）	需要 Kubernetes，运维复杂度高
Zilliz Cloud Free	免费（5GB 存储，250 万 vCU）	适合开发测试
Zilliz Cloud Standard	$99/月起	Serverless，自动扩缩
Zilliz Cloud Enterprise	定制报价	专属集群、HIPAA 合规、GPU 加速

适用场景： 亿级向量的推荐系统、大规模图像/视频搜索、多模态检索、需要精细索引调优的场景。

局限性： 自托管需要 Kubernetes 和专业 DevOps、学习曲线较陡、小规模项目过于重量级。

操作步骤

步骤 1：创建集合并配置索引


from pymilvus import connections, Collection, FieldSchema, CollectionSchema, DataType
 
connections.connect("default", host="localhost", port="19530")
 
# 定义 Schema
fields = [
    FieldSchema(name="id", dtype=DataType.INT64, is_primary=True, auto_id=True),
    FieldSchema(name="text_embedding", dtype=DataType.FLOAT_VECTOR, dim=1536),
    FieldSchema(name="image_embedding", dtype=DataType.FLOAT_VECTOR, dim=512),
    FieldSchema(name="doc_id", dtype=DataType.VARCHAR, max_length=200)
]
schema = CollectionSchema(fields, description="多模态文档嵌入")
 
# 创建集合并配置 HNSW 索引
collection = Collection("multimodal_docs", schema)
collection.create_index(
    field_name="text_embedding",
    index_params={"metric_type": "IP", "index_type": "HNSW", "params": {"M": 16, "efConstruction": 256}}
)

3. 性能基准对比

以下基准数据基于 1000 万条 768 维向量的测试场景（综合多个独立评测来源）：

查询延迟（P95）

数据库	纯向量搜索	带过滤搜索	说明
Pinecone	45-80ms（Serverless）/ 20-40ms（Pod）	50-100ms	全托管，延迟稳定
Weaviate	30-70ms	40-90ms（混合搜索 +10-20ms）	混合搜索略增延迟
Qdrant	15-30ms（内存）/ 30-60ms（内存映射）	20-40ms	过滤搜索性能最优
ChromaDB	50-100ms	60-120ms	适合小规模数据集
pgvector	20-50ms（HNSW，索引在内存）	30-70ms	依赖 PostgreSQL 配置
Milvus	25-50ms	35-70ms	取决于索引类型和配置

写入吞吐量

数据库	写入速度	说明
Milvus	⭐⭐⭐⭐⭐	分布式架构，写入吞吐最高
Qdrant	⭐⭐⭐⭐	Rust 高效写入
Pinecone	⭐⭐⭐⭐	托管服务自动优化
Weaviate	⭐⭐⭐	中等水平
pgvector	⭐⭐⭐	受 PostgreSQL 写入机制影响
ChromaDB	⭐⭐	嵌入式模式写入有限

提示词模板


你是一位向量数据库选型顾问。请根据以下项目需求推荐最合适的向量数据库：

项目需求：
- 向量规模：[预计向量数量，如 100 万 / 1 亿 / 10 亿]
- 查询模式：[纯语义搜索 / 混合搜索（语义+关键词） / 带复杂过滤的搜索]
- 延迟要求：[实时 <50ms / 准实时 <200ms / 批量处理]
- 团队能力：[有 DevOps 团队 / 无运维经验 / 有 PostgreSQL 经验]
- 预算范围：[月预算上限]
- 部署要求：[全托管 / 自托管 / 混合]
- 现有技术栈：[已有数据库、云平台、编程语言]

请从 Pinecone、Weaviate、Qdrant、ChromaDB、pgvector、Milvus 中推荐 1-2 个最佳选择，并说明理由。

4. 选型决策框架

按项目阶段选择


原型/MVP 阶段
  └─ 首选 ChromaDB（嵌入式，零配置）
  └─ 备选 pgvector（如已有 PostgreSQL）

早期生产（<1000 万向量）
  ├─ 零运维需求 → Pinecone Serverless
  ├─ 需要混合搜索 → Weaviate Cloud
  ├─ 性能优先 + 成本敏感 → Qdrant Cloud
  └─ 已有 PostgreSQL → pgvector

规模化生产（1 亿+向量）
  ├─ 企业级 + 有 K8s 团队 → Milvus / Zilliz Cloud
  ├─ 高性能过滤搜索 → Qdrant（自托管集群）
  └─ 全托管 + 预算充足 → Pinecone Enterprise

按团队能力选择

团队特征	推荐方案	理由
无 DevOps，小团队	Pinecone	零运维，专注业务逻辑
有 PostgreSQL 经验	pgvector	无需学习新系统
有 K8s 和 DevOps	Milvus 自托管	最大灵活性和成本控制
全栈独立开发者	ChromaDB → Qdrant Cloud	开发用 Chroma，生产迁移 Qdrant
需要合规（GDPR/HIPAA）	Weaviate Enterprise / Zilliz Enterprise	专属集群 + 合规认证

实战案例：从原型到生产的向量数据库迁移

场景描述

一个 SaaS 创业团队构建企业知识库问答系统，经历了三个阶段的向量数据库选型演进：

案例分析

第一阶段：原型验证（ChromaDB）

团队使用 ChromaDB 嵌入式模式，在 2 天内完成了 RAG 原型。数据量 5 万条文档，单机运行，验证了产品可行性。


# 原型阶段：ChromaDB 嵌入式，零配置
import chromadb
client = chromadb.PersistentClient(path="./prototype_db")
collection = client.create_collection("company_docs")

第二阶段：早期生产（Qdrant Cloud）

用户增长到 500 家企业客户，文档量达到 200 万条。团队迁移到 Qdrant Cloud，获得了更好的查询性能和过滤搜索能力，月成本约 $80。


# 生产阶段：Qdrant Cloud，带过滤的多租户搜索
from qdrant_client import QdrantClient
client = QdrantClient(url="https://xxx.qdrant.io", api_key="...")
 
# 多租户过滤：每个企业客户只搜索自己的文档
results = client.search(
    collection_name="enterprise_docs",
    query_vector=query_embedding,
    query_filter=Filter(must=[
        FieldCondition(key="tenant_id", match=MatchValue(value="company-abc"))
    ]),
    limit=10
)

第三阶段：规模化（Milvus on K8s）

客户增长到 5000 家，文档量突破 5000 万条。团队部署 Milvus 集群到 Kubernetes，实现了水平扩展和多向量字段搜索（文本+表格嵌入）。

关键决策点：

原型阶段不要过度设计——ChromaDB 的零配置让团队专注于验证产品假设
迁移时使用抽象层——团队早期封装了 VectorStore 接口，迁移时只需替换实现类
选型要匹配团队能力——第二阶段选 Qdrant Cloud 而非自托管 Milvus，因为团队当时没有 K8s 经验
成本随规模变化——同样的数据量，自托管 Milvus 比 Qdrant Cloud 便宜 40%，但需要 1 名 DevOps 工程师

迁移抽象层示例


from abc import ABC, abstractmethod
from typing import List, Dict, Optional
 
class VectorStore(ABC):
    """向量数据库抽象层，便于后续迁移"""
 
    @abstractmethod
    def upsert(self, vectors: List[Dict]) -> None:
        pass
 
    @abstractmethod
    def search(self, vector: List[float], top_k: int,
               filters: Optional[Dict] = None) -> List[Dict]:
        pass
 
# 开发环境用 ChromaDB
class ChromaStore(VectorStore):
    def __init__(self, collection_name: str):
        self.client = chromadb.PersistentClient(path="./dev_db")
        self.collection = self.client.get_or_create_collection(collection_name)
 
    def upsert(self, vectors):
        # ChromaDB 实现
        ...
 
    def search(self, vector, top_k, filters=None):
        # ChromaDB 实现
        ...
 
# 生产环境用 Qdrant
class QdrantStore(VectorStore):
    def __init__(self, collection_name: str, url: str, api_key: str):
        self.client = QdrantClient(url=url, api_key=api_key)
        self.collection_name = collection_name
 
    def upsert(self, vectors):
        # Qdrant 实现
        ...
 
    def search(self, vector, top_k, filters=None):
        # Qdrant 实现
        ...

避坑指南

❌ 常见错误

原型阶段就选重量级方案
- 问题：项目刚开始就部署 Milvus 集群，花了两周搭环境，产品假设还没验证
- 正确做法：原型用 ChromaDB 或 pgvector，验证可行性后再迁移
忽略过滤搜索的性能差异
- 问题：选型时只看纯向量搜索基准，上线后发现带过滤条件的查询延迟翻倍
- 正确做法：用真实查询模式（含过滤条件）做基准测试，Qdrant 和 Weaviate 在过滤搜索场景表现最优
低估托管服务的隐藏成本
- 问题：只看基础月费，忽略了嵌入生成、重排序、数据备份、出站流量等附加费用
- 正确做法：计算总拥有成本（TCO），包括嵌入 API 调用、存储增长、流量费用
没有建立向量数据库抽象层
- 问题：业务代码直接耦合特定数据库 SDK，迁移时需要重写大量代码
- 正确做法：从第一天就封装 VectorStore 接口，LangChain/LlamaIndex 的 VectorStore 抽象也可直接使用
pgvector 大规模使用不做索引优化
- 问题：数据量增长后查询变慢，因为没有创建 HNSW 索引或索引参数不合理
- 正确做法：生产环境必须创建 HNSW 索引，合理设置 m 和 ef_construction 参数，定期 REINDEX
忽视多租户隔离需求
- 问题：所有租户数据混在一个集合中，通过过滤实现隔离，数据量增长后性能下降
- 正确做法：评估是否需要按租户分集合（Qdrant/Milvus 支持），或使用 payload 索引优化过滤性能

✅ 最佳实践

用真实数据和查询模式做 POC 测试，至少加载 1 万-10 万条向量，模拟实际并发
从第一天就使用向量数据库抽象层（自建或 LangChain VectorStore 接口）
监控向量数据库的关键指标：查询延迟 P95/P99、召回率、索引构建时间、存储增长
定期评估成本效率——数据量翻倍时重新评估是否需要迁移方案
生产环境启用备份和灾备策略，向量数据重建成本高（需要重新调用嵌入 API）

参考来源

Vector Database Comparison 2026: Pinecone vs Weaviate vs Milvus vs Qdrant vs Chroma （2026 年 2 月）
Vector Database Leaderboard （2026 年 2 月）
Vector Database Comparison 2025: Pinecone vs Weaviate vs Qdrant vs Milvus vs FAISS （2025 年 10 月）
Pinecone vs Weaviate vs Qdrant — Athenic Blog （2025 年 10 月）
The True Cost of Pinecone — Pricing, Integration, and More （2025 年 10 月）
Supercharging vector search performance with pgvector 0.8.0 on Amazon Aurora PostgreSQL （2025 年 5 月）
Pgvector vs. Pinecone: Vector Database Comparison — Timescale （2025 年 12 月）
Introducing Milvus 2.6: Affordable Vector Search at Billion Scale （2025 年 6 月）
Zilliz Cloud Delivers Major Cost Savings and Higher Performance （2025 年 10 月）
Qdrant Review: A highly flexible option for vector search — InfoWorld （2026 年 2 月）
Chroma Cloud Getting Started （2025 年）
Pinecone Pricing （2025 年）
Weaviate Pricing （2025 年）

📖 返回总览与导航 | 上一节：11b-RAG流水线详解 | 下一节：11d-RAG系统构建教程

11c - 向量数据库对比

概述

1. 向量数据库全景概览

工具推荐

核心维度对比总表

2. 六大数据库深度解析

2.1 Pinecone — 全托管先驱

操作步骤

步骤 1：创建 Pinecone 索引

步骤 2：写入和查询向量

2.2 Weaviate — 混合搜索专家

操作步骤

步骤 1：使用混合搜索查询

2.3 Qdrant — Rust 驱动的性能之王

操作步骤

步骤 1：带复杂过滤的向量搜索

2.4 ChromaDB — 开发者的首选原型工具

操作步骤

步骤 1：嵌入式模式快速上手

2.5 pgvector — PostgreSQL 用户的最佳选择

操作步骤

步骤 1：启用 pgvector 并创建向量表

步骤 2：向量搜索 + SQL 过滤

2.6 Milvus — 企业级大规模向量搜索

操作步骤

步骤 1：创建集合并配置索引

3. 性能基准对比

查询延迟（P95）

写入吞吐量

提示词模板

4. 选型决策框架

按项目阶段选择

按团队能力选择

实战案例：从原型到生产的向量数据库迁移

场景描述

案例分析

迁移抽象层示例

避坑指南

❌ 常见错误

✅ 最佳实践

相关资源与延伸阅读

参考来源