DBMS for ANNS 一览 自 2023 年 ChatGPT 带动的大语言模型热以来,向量相似度检索得到了很多数据库系统的支持。实际上,早在 2023 年之前,就已经有很多 DBMS 支持了向量数据存储、索引、查询优化等功能。其中,最重要的功能就是提供支持近似最近邻检索(ANNS)的索引结构。在 ANN Benchmark 中,列出了许多支持 ANNS 的库或者 DBMS,并在主要的数据集上进行了性能测试。本文简 2024-03-26 数据库 > 向量数据库 #ANN #数据库 #向量数据库 #Vector Database
重学操作系统:CPU 虚拟化与进程 操作系统是每名程序员必须掌握的内容。回想大学时学习操作系统时,总是陷于一些算法方面的细节,习题则多为计算不同算法的性能指标,而忽略了从更高层面来看待和理解操作系统。因此,最近开始阅读备受好评的操作系统书籍:《操作系统导论》(英文版名称为:Operating Systems: Three Easy Pieces,OSTEP)。 OSTEP 从虚拟化、并发、持久化三大方面展开对操作系统的介绍,通 2024-03-09 操作系统 #CPU 虚拟化 #进程调度
C++ 对象模型 最近在看《深度探索 C++ 对象模型》一书,收获颇丰。如果你对 C++ 底层机制感兴趣、想知道编译器对我们的代码动了什么“手脚”,推荐阅读该书。 本文不打算整理或复述《深度探索 C++ 对象模型》一书的内容,因为这本书需要花费一定的时间心力阅读,一篇文章恐难覆盖全书内容。因此,本文仅展示部分代码及运行结果,加以必要的注释、解释等,以阐明 C++ 对象模型的部分知识点。代码在 64 位 WS 2024-02-19 编程语言 > C++ #对象模型
DB 论文阅读:Product Quantization for Nearest Neighbor Search 本文介绍论文《Product Quantization for Nearest Neighbor Search》,即 ANN 中乘积量化(Product Quantization,PQ)算法的主要内容。 1. 背景介绍 PQ 论文在 2011 年发表于 TPAMI,是针对欧式距离设计的一种 ANN 算法。当时,基于图的算法尚未提出,主流的算法包括:Euclidean Locality- 2024-01-29 数据库 > 读论文 #近似最近邻 #ANN #向量相似度检索 #K近邻 #索引
浅谈 C++ 类的拷贝控制 在 C++ 语言的学习过程中,类的拷贝控制是一个较为繁杂的知识点。虽然它的难度不是很大,但是细节很多,需要理解记忆。本文介绍 C++ 类的拷贝控制基本内容,即:拷贝构造函数、拷贝赋值运算符、移动构造函数、移动赋值运算符、析构函数这 5 个函数的写法。 为了便于介绍,我们自己实现一个简单的 string 类,命名为 String 。它只包含一个私有的数据成员:char *data , 2024-01-14 编程语言 > C++ #拷贝控制 #构造函数 #析构函数
如何实现学术论文? 译者注: 本文译自 Implementing academic papers: lessons learned from Elasticsearch and Lucene ,作者:Julie Tibshirani 。本文主要讨论了如何将学术论文中的前沿研究成果引入到实际的软件系统中,讨论了在此过程中需要注意的一些问题。 译者:arcsin2 在开发 Elasticsearch 2024-01-13 方法论 #实现学术论文
Go 语言入门 本文介绍学习 Go 语言一些学习材料,总结学习 Go 时容易理解错误的一些概念,可用于已掌握 C++、Java 等编程语言的程序员快速入门 Go。 1. 基础语法 入门 Go 语言基础语法和关键语言概念的最佳材料是 Go 语言官方提供的在线教程: 英文版:https://go.dev/tour/welcome/1 中文版:https://tour.go-zh.org/welcom 2024-01-08 编程语言 > Go #Go
DB 论文阅读:Hierarchical Navigable Small World 本文介绍向量近似最近邻(Approximate Nearest Neighbor,ANN)的另一经典算法:HNSW(Hierarchical Navigable Small World,HNSW)。HNSW 工业界使用最多的 ANN 算法之一,得到了 Milvus、Elasticsearch、Fasis、pgvector 等系统或库的广泛支持。原文: Efficient and robus 2024-01-03 数据库 > 读论文 #近似最近邻 #ANN #向量相似度检索 #K近邻 #索引
DB 论文阅读:Approximate nearest neighbor algorithm based on navigable small world graphs 本文介绍向量近似最近邻(Approximate Nearest Neighbor,ANN)的一种经典算法:NSW(Navigable Small World,NSW),原文: Approximate nearest neighbor algorithm based on navigable small world graphs 。 摘要 NSW 是一种用于度量空间的近似 K 近邻算法 2023-12-29 数据库 > 读论文 #近似最近邻 #ANN #向量相似度检索 #K近邻 #索引
DB 论文阅读:A Relational Model of Data for Large Shared Data Banks 关系模型是现代数据库的理论基础。1969 和 1970 年,Codd 的两篇论文 《Derivability, Redundancy and Consistency of Relations Stored in Large Data Banks》和《A Relational Model of Data for Large Shared Data Banks》提出了关系模型理论,为后续几十年数 2023-12-25 数据库 > 读论文 #关系模型 #关系代数