從零構(gòu)建向量數(shù)據(jù)庫·珊瑚書
定 價:69.8 元
叢書名:圖靈原創(chuàng)
這是一本需要動手實踐的圖書,通過帶領(lǐng)大家從零構(gòu)建一款分布式向量數(shù)據(jù)庫,讓大家透徹理解向量數(shù)據(jù)庫的技術(shù)原理和實現(xiàn)細節(jié)。本書共分為三大部分,內(nèi)容由淺入深、循序漸進。第一部分 認識向量數(shù)據(jù)庫(第1~3章)是基礎(chǔ)篇,介紹向量數(shù)據(jù)庫的基礎(chǔ)知識,涵蓋向量及數(shù)據(jù)庫的基本概念、向量數(shù)據(jù)庫的發(fā)展歷程和核心功能。第二部分 構(gòu)建向量數(shù)據(jù)庫(第4~6章)是核心篇,詳細介紹如何從零開始構(gòu)建并優(yōu)化向量數(shù)據(jù)庫,巨細靡遺地展示數(shù)據(jù)庫內(nèi)核的技術(shù)實現(xiàn)細節(jié)并輔以代碼示例、技術(shù)架構(gòu)圖等,旨在讓大家真正實現(xiàn)動手寫向量數(shù)據(jù)庫。第三部分 向量數(shù)據(jù)庫的實踐與展望(第7~8章)是結(jié)束篇,通過實踐案例展示向量數(shù)據(jù)庫在AI應(yīng)用中的使用方法,并嘗試勾勒向量數(shù)據(jù)庫的未來。本書面向數(shù)據(jù)庫開發(fā)人員、數(shù)據(jù)庫管理員、數(shù)據(jù)庫架構(gòu)師等數(shù)據(jù)庫從業(yè)人員,AI從業(yè)者,及其他對向量數(shù)據(jù)庫感興趣的讀者。
1.【實操】涉及技術(shù)原理、實現(xiàn)細節(jié)和實踐應(yīng)用,涵蓋向量數(shù)據(jù)庫的方方面面2.【生動】10次版本迭代/10000行代碼;27張表/41幅圖/22個思維導(dǎo)圖輕松學(xué)3.【專業(yè)】作者羅云是騰訊云向量數(shù)據(jù)庫負責(zé)人,帶領(lǐng)團隊積累了豐富的一線經(jīng)驗4.【熱門】自制成功立馬投入實踐,帶大家結(jié)合RAG實現(xiàn)個人知識庫等大模型應(yīng)用5.【簡單】附贈隨書代碼,隨學(xué)隨查原來,構(gòu)建向量數(shù)據(jù)庫如此簡單!
羅云 騰訊云數(shù)據(jù)庫副總經(jīng)理、騰訊云創(chuàng)始團隊成員、中國通信標準化協(xié)會大數(shù)據(jù)技術(shù)標準推進委員會(CCSA TC601)數(shù)據(jù)庫與存儲工作組副組長。 十余年云計算產(chǎn)品技術(shù)專家,在復(fù)雜分布式系統(tǒng)的建設(shè)和管理上實踐多年并積累了豐富的經(jīng)驗,擅長將數(shù)據(jù)治理技術(shù)(采集、加工、存儲、檢索)和AI結(jié)合,在AI時代更好地發(fā)揮數(shù)據(jù)的價值。 領(lǐng)導(dǎo)多個平臺或產(chǎn)品完成從0到1的上線與商業(yè)化運營,達到國內(nèi)領(lǐng)先水平,其中包括: 1. 一站式 Serverless開發(fā)平臺(小程序云開發(fā)) 2. TencentDB for Redis/MongoDB/KeeWiDB、Tencent Cloud VectorDB等數(shù)據(jù)庫產(chǎn)品 3. 騰訊云數(shù)據(jù)傳輸服務(wù)(DTS)、數(shù)據(jù)庫智能管家(DBbrain)等多款數(shù)據(jù)采集和智能化應(yīng)用平臺
第 一部分 認識向量數(shù)據(jù)庫第 1章 向量數(shù)據(jù)庫基礎(chǔ) 21.1 向量 21.1.1 什么是向量 21.1.2 萬物皆可向量 41.1.3 向量間的相似度 61.1.4 相似度應(yīng)用案例 81.2 數(shù)據(jù)庫 111.2.1 什么是數(shù)據(jù)庫 111.2.2 關(guān)系型數(shù)據(jù)庫 131.2.3 非關(guān)系型數(shù)據(jù)庫 141.2.4 傳統(tǒng)數(shù)據(jù)庫的限制 151.3 為什么需要向量數(shù)據(jù)庫 161.3.1 向量數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)的差異 161.3.2 向量數(shù)據(jù)庫應(yīng)運而生 171.3.3 大模型時代的智能存儲平臺 181.4 小結(jié) 19第 2章 向量數(shù)據(jù)庫極簡史 212.1 孕育期(19802012) 212.1.1 深度神經(jīng)網(wǎng)絡(luò)的飛速發(fā)展 222.1.2 深度神經(jīng)網(wǎng)絡(luò)vs向量數(shù)據(jù)庫 232.2 誕生期(20122017) 242.3 成長期(2017年至今) 252.3.1 行業(yè)發(fā)展簡況 262.3.2 代表性產(chǎn)品能力對比 272.3.3 代表性產(chǎn)品技術(shù)架構(gòu) 282.4 小結(jié) 32第3章 向量數(shù)據(jù)庫的核心能力 333.1 基礎(chǔ)能力 333.1.1 邏輯層次 343.1.2 索引 393.1.3 關(guān)鍵指標 423.2 高階能力 433.2.1 動態(tài)schema 433.2.2 別名機制 443.2.3 向量化 453.2.4 混合查詢 463.3 小結(jié) 47第二部分 構(gòu)建向量數(shù)據(jù)庫第4章 實現(xiàn)單機向量數(shù)據(jù)庫 504.1 實現(xiàn)向量數(shù)據(jù)索引 504.1.1 FAISS核心功能 514.1.2 實現(xiàn)扁平索引 56初始版本v0.0.1 624.1.3 HNSWLib核心功能 634.1.4 實現(xiàn)HNSW索引 70版本迭代v0.0.2 734.2 實現(xiàn)混合數(shù)據(jù)索引 744.2.1 實現(xiàn)標量數(shù)據(jù)索引 744.2.2 統(tǒng)一管理入口 76版本升級v0.1 794.2.3 實現(xiàn)過濾索引 80版本迭代v0.1.1 864.3 實現(xiàn)系統(tǒng)異常恢復(fù) 874.3.1 數(shù)據(jù)日志持久化 87版本迭代v0.1.2 914.3.2 數(shù)據(jù)快照持久化 92版本升級v0.2 974.4 小結(jié) 97第5 章 實現(xiàn)分布式向量數(shù)據(jù)庫 995.1 集群數(shù)據(jù)管理 1005.1.1 認識NuRaft 1025.1.2 建立主從關(guān)系 1065.1.3 實現(xiàn)數(shù)據(jù)復(fù)制 110版本升級v0.3 1135.2 集群流量管理 1135.2.1 集群的元數(shù)據(jù)管理 1145.2.2 統(tǒng)一的流量入口 1175.2.3 讀寫分離 1215.2.4 保證讀寫一致性 122版本升級v0.4 1235.3 集群異常管理 1235.3.1 發(fā)現(xiàn)新主節(jié)點 1235.3.2 發(fā)現(xiàn)故障從節(jié)點 1255.3.3 實現(xiàn)故障切換 127版本升級v0.5 1285.4 集群的分片 1305.4.1 配置集群的分片策略 1305.4.2 根據(jù)分片策略轉(zhuǎn)發(fā)請求 132版本升級v0.6 1395.5 小結(jié) 140第6 章 優(yōu)化向量數(shù)據(jù)庫 1426.1 性能優(yōu)化 1436.1.1 利用指令集優(yōu)化向量計算 1436.1.2 優(yōu)化查詢算法 1446.1.3 優(yōu)化通信協(xié)議 1476.1.4 自定義基準測試工具 1496.2 成本優(yōu)化 1546.2.1 多模塊混合部署 1556.2.2 單節(jié)點部署 1586.3 易用性優(yōu)化 1606.3.1 SDK 1606.3.2 訪問鑒權(quán) 1626.3.3 數(shù)據(jù)備份 1696.4 小結(jié) 172第三部分 向量數(shù)據(jù)庫的實踐與展望第7 章 向量數(shù)據(jù)庫實踐案例 1767.1 搭建圖片查詢系統(tǒng) 1767.1.1 圖片向量化 1767.1.2 圖片上傳和查詢 1797.1.3 系統(tǒng)效果一覽 1817.2 搭建個人知識庫 1827.2.1 知識預(yù)處理 1827.2.2 知識向量化 1837.2.3 知識庫管理 1847.2.4 知識問答 1857.2.5 系統(tǒng)效果一覽 1867.3 小結(jié) 187第8 章 展望 1898.1 從行業(yè)演進視角看 1908.1.1 人類調(diào)度數(shù)據(jù)新范式 1908.1.2 向量數(shù)據(jù)抹平數(shù)據(jù)格式差異 1928.1.3 向量數(shù)據(jù)庫平臺化的關(guān)鍵 1938.2 從行業(yè)應(yīng)用視角看 1948.2.1 RAG 簡介 1958.2.2 降低RAG 使用門檻 1968.3 小結(jié) 197