走近 bolt
发表于|更新于|学习日志
|总字数:11|阅读时长:1分钟|浏览量:


文章作者: 谈笑风生间
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 谈笑风生间!
相关推荐

2022-09-23
一文了解 LSM-Tree
什么是 LSM-TreeSSTables 的结构想要了解 LSM-Tree(Log Structured Merge Tree,日志结构合并树),我们得先了解 SSTables。SSTables 即排序字符串表(Sorted String Table),也是 LSM-Tree 里的核心数据结构。它的概念来自 Google 的 Bigtable 论文,大概的意思就是,SSTable 是一种可持久化,有序且不可变的键值存储结构,key 和 value 都可以是任意的字节数组,并且给提供了按照指定 key 查找和指定范围的 key 区间迭代遍历功能。 如下图所示,该图表示一个个日志结构存储数据段文件:为了避免最终用完磁盘空间,才将日志分为特定大小的段,对旧段文件进行压缩和合并,在新的日志文件中只保留每个键的最近更新。这种情况下,由于旧段的内容不会被修改,因此合并的段可以放入一个新的文件,旧段的合并和压缩都可以在后台线程完成,请求时仍然使用旧段处理,而完成合并后,就能直接删除旧段,使用新的合并段。 日志中稍后的值优先于日志中较早的相同键的值 怎么保证最近更新? 每个段都包含在一段时...

2022-10-29
一文了解 GoFound
GoFound 去发现,去探索全文检索的世界,一个小巧精悍的全文检索引擎,支持持久化和单机亿级数据毫秒级查找。 基础概念全文检索全文检索一般有两种方法。一是从头到尾扫描作为检索对象的文档,以此来搜索要检索的字符串,如 Unix 中的grep命令,但是文档数量越多,文档越大,检索的时间会越长,甚至超出预期上限。另一种是利用索引进行全文搜索,事先为文档建立索引,尽管建立索引可能需要不少时间,但是优点是即使文档的数量增加,检索的速度也不会大幅下降,GoFound 也是采取这种方式。 倒排索引倒排索引与词典索引类似,用一本书的倒排索引作为示例,key 存储了单词,value 存储了一个组成页数的数组,当你需要查找I search keywords in Google.这句话时,你可以很直观的看到它的单词在哪一页。 倒排索引中,每个单词都有一个引用指向属于它的一个倒排列表,倒排列表中存储了众多的倒排项,倒排项即文档 ID。取出多个单词的倒排列表后,可以根据情况进行交集处理与评分,获取到更符合预想的搜索结果。 正排索引正排索引存储了文档 id 和索引词组的映射,便于在修改索引时判断索引 t...
评论
公告
技术改变世界~




