一图流

RAG graph LR subgraph "Query Process 💬 问答流程" direction TB Q1((用户问题)) --> Q2{{"Embedding模型🧮 向量化"}} Q2 --> Q3{"检索Retrieval🔍 计算相似度（topK）"} Q3 -.查询.-> VectorDB VectorDB -.topk个结果.-> Q3 Q3 --> Q4[["相关片段📄"]] Q4 -.注入上下文.-> Q5("增强/Augmented🔀 Prompt=问题+相关片段") Q1 -.原始问题.-> Q5 Q5 -.输入.-> Q6{{"大语言模型🤖"}} Q6 --> Q7[["最终回答💬"]] end subgraph "Index Process 🔧 离线数据准备" direction TB KB["(私有知识库📚 PDF/Word/Wiki)"] --> Chunking("切片/Chunking🔪 长文本切分成小段") Chunking --> Embedding{{"Embedding模型🧮 向量化"}} Embedding --> VectorDB["(向量数据库🗄️ VectorDB ..)"] end style KB fill:#e1f5ff,stroke:#007acc,stroke-width:2px style VectorDB fill:#e1f5ff,stroke:#007acc,stroke-width:2px style Q1 fill:#fff2cc,stroke:#d6b656,stroke-width:2px style Q7 fill:#d5e8d4,stroke:#82b366,stroke-width:2px style Embedding fill:#f0e1ff,stroke:#9673a6,stroke-width:2px style Q6 fill:#f0e1ff,stroke:#9673a6,stroke-width:2px style Q4 fill:#ffe6cc,stroke:#d79b00,stroke-width:2px MCP sequenceDiagram User->>MCP Client/IDE/Agent:User Query(今天天气怎么样？) MCP Client/IDE/Agent->>MCP Server:连接 MCP Server & Get Tools MCP Server->>MCP Client/IDE/Agent:Tools List(文件工具、天气工具...) MCP Client/IDE/Agent->>LLM:User Query(今天天气怎么样？) + Tools List(这些工具可以用) LLM->>MCP Client/IDE/Agent: 建议调用的Tool + 参数(建议使用天气工具参数:date:'20260127',city:'武汉') MCP Client/IDE/Agent->>MCP Server:使用参数调用Tool(天气工具(date, city)) MCP Server->>MCP Server:内部触发逻辑 MCP Server->>MCP Client/IDE/Agent:返回值/Error(temp:30°, weather:sunny) MCP Client/IDE/Agent->>LLM: Tool的返回值(temp:30°, weather:sunny) note over LLM: 思考、推理 LLM->>MCP Client/IDE/Agent:总结归纳后的自然语言(明日(20260127)天气为晴天，温度30°，建议穿凉爽的衣服) MCP Client/IDE/Agent->>User: 格式化结果 Agent React graph RL Input((Task/Input 任务输入)) --> Thought["Thought 思考: 分析任务，决定步骤"] subgraph ReAct_Loop ["ReAct Loop 循环"] direction TB Thought --> Action{Action 行动: 选择工具/动作} Action -- 调用工具 --> Execute["Environment/Tool 执行环境/工具"] Execute --> Observation["Observation 观察: 获取执行结果"] Observation --> Thought end Action -- 任务完成 --> Final["Final Answer 最终回答"] style Input fill:#fff2cc,stroke:#d6b656,stroke-width:2px style Final fill:#d5e8d4,stroke:#82b366,stroke-width:2px style Thought fill:#e1f5ff,stroke:#007acc,stroke-width:2px style Action fill:#f0e1ff,stroke:#9673a6,stroke-width:2px style Observation fill:#ffe6cc,stroke:#d79b00,stroke-width:2px

Lucene 核心数据结构 (单机视角) Lucene 是如何通过倒排索引实现快速搜索，以及如何解决排序和存储问题的 graph TD subgraph Lucene_Segment ["Lucene Segment (最小索引单元/不可变)"] direction TB subgraph Inverted_Index ["倒排索引 (Inverted Index) - 用于搜索"] TI["Term Index (内存)"] TD["Term Dictionary (磁盘)"] PL["Posting List (磁盘)"] TI --"前缀索引/加速定位"--> TD TD --"关联文档ID"--> PL note1["> 举例: 查找 '小白' 1. Term Index 定位大概位置 2. Dictionary 找到 '小白' 3. Posting List 得到 ID: [0, 1]"] style TI fill:#e1f5fe,stroke:#01579b style TD fill:#fff9c4,stroke:#fbc02d style PL fill:#fff9c4,stroke:#fbc02d end subgraph Storage ["数据存储"] SF["Stored Fields (行式存储)"] DV["Doc Values (列式存储)"] SF --"根据ID获取完整内容"--> Content["文档原始JSON"] DV --"用于排序/聚合"--> Sort["排序/聚合操作"] note2["> Stored Fields: 存完整数据 > Doc Values: 空间换时间，优化排序"] style SF fill:#e8f5e9,stroke:#2e7d32 style DV fill:#f3e5f5,stroke:#7b1fa2 end end Query["搜索请求"] --> TI PL -.->|"得到文档ID"| Storage Elasticsearch 在Lucene基础上的分布式架构架构图 graph Client["客户端应用"] --> Coord subgraph Cluster["Elasticsearch Cluster (集群)"] subgraph CoordLayer["协调节点(入口/分发/聚合)"] Coord["协调节点 (Coordinating)"] end subgraph MasterLayer["Master节点层(高可用选主)"] Master1["Master Node A"] Master2["Master Node B"] Master3["Master Node C"] end %% --- 核心改造：将分片物理挂载到 Data 节点下 --- subgraph DataLayer["Data节点层 (物理存储)"] subgraph Data1["Data Node 2"] P0["Primary Shard 0 (主)"] R1["Replica Shard 1 (副)"] end subgraph Data2["Data Node 1"] P1["Primary Shard 1 (主)"] R0["Replica Shard 0 (副)"] end end subgraph LuceneLayer["Lucene 底层引擎 (每个分片对应一套)"] subgraph SegP0["Segment (P0/R0 的底层)"] IIA["倒排索引-用于搜索"] TIA["Term Index-用于加速搜索"] SFA["Stored Fields-doc原始信息"] DVA["Doc Values-排序和聚合"] end subgraph SegP1["Segment (P1/R1 的底层)"] IIB["倒排索引"] TIB["Term Index"] SFB["Stored Fields"] DVB["Doc Values"] end end end %% === 连线逻辑 === %% 1. 请求流：客户端 -> 协调节点 -> 数据节点 Coord -- "1. 分发查询/写入" --> Data1 Coord -- "1. 分发查询/写入" --> Data2 %% 2. 主副分片同步（跨节点虚线） P0 -.->|"2. 数据同步"| R0 P1 -.->|"2. 数据同步"| R1 %% 3. 管理流：Master 管理 Data 节点 Master2 -.-|"集群元数据管理"| Data1 Master2 -.-|"集群元数据管理"| Data2 %% 4. 分片与底层引擎的关联 P0 -->|"读写调用"| SegP0 R0 -->|"读写调用"| SegP0 P1 -->|"读写调用"| SegP1 R1 -->|"读写调用"| SegP1 %% === 样式优化 === style Cluster fill:#f5f5f5,stroke:#333 style CoordLayer fill:#e3f2fd,stroke:#1565c0,stroke-dasharray: 5 5 style MasterLayer fill:#f3e5f5,stroke:#7b1fa2,stroke-dasharray: 5 5 style DataLayer fill:#e8f5e9,stroke:#2e7d32,stroke-dasharray: 5 5 %% 高亮主副分片颜色 style P0 fill:#ffcdd2,stroke:#b71c1c style P1 fill:#ffcdd2,stroke:#b71c1c style R0 fill:#bbdefb,stroke:#0d47a1 style R1 fill:#bbdefb,stroke:#0d47a1 style LuceneLayer fill:#fff3e0,stroke:#e65100 没有指定协调节点的时候，所有节点默认都具备协调节点功能 classDiagram class Cluster { +String cluster_name +List nodes } class Node { +String node_name +List roles +store_data() +coordinate_request() } class NodeRoles { Master Data Coordinating } note for NodeRoles "枚举类型 (Enumeration) Master: 集群管理 Data: 数据存储 Coordinating: 请求转发" class Index { +String index_name +List shards } class Shard { +int shard_id +LuceneInstance underlying_engine } class PrimaryShard { +sync_to_replica() } class ReplicaShard { +promote_to_primary() } class LuceneInstance { +List segments +merge_segments() } class Segment { +InvertedIndex +StoredFields +DocValues +is_immutable } Cluster *-- Node Node ..> NodeRoles : 扮演角色 Index *-- Shard Shard <|-- PrimaryShard Shard <|-- ReplicaShard Shard *-- LuceneInstance : 底层引擎 LuceneInstance "1" *-- "*" Segment : 包含多个 Node "1" o-- "*" Shard : 承载 note for PrimaryShard "负责写入，同步数据给副本" note for ReplicaShard "提供读能力，主分片挂掉后升级" note for Node "单节点可扩展为多节点集群 通过 Raft 类机制选主" note for LuceneInstance "写入产生新Segment 后台定期合并小Segment 以优化文件句柄和查询性能" 从 Lucene 到 Elasticsearch 的演进 Lucene 作为一个单纯的搜索库，虽然功能强大，但在面对海量数据和高并发场景时存在明显的单机局限性： ...

AI概念一图流

Elasticsearch一图流