最新 最热

SpanQuery源码学习总结

SpanScorer中包含一个Spans对象, SpanScorer把iterator()和twoPhraseIterator()方法都委托给了Spans对象. Spans类本身继承了了DocIdSetIterator, 也就是说Spans对象本身就代表了一个文档倒排表, 除了本身是一个倒排...

2022-01-24
1

全文搜索引擎技术详解之Apache Solr的使用

Solr是Lucene的Java API包装,使用Solr,就可以使用Lucene的所有功能

2022-01-22
2

大佬都在用的数据库设计规范!你不点进来看看嘛?

要是在索引中有范围查找,那么索引有序性就无法利用(WHERE a>10 ORDER BY b; 索引:a_b无法排序)

2022-01-22
0

这样学习ElasticSearch可以起飞

最近一年使用 Elasticsearch 完成亿级别日志搜索平台「ELK」,亿级别的分布式跟踪系统。在设计这些系统的过程中,底层都是采用 Elasticsearch 来做数据的存储,并且数据量都超过亿级别,甚至达到百亿级别。...

2022-01-21
1

工具的使用 | 网络空间搜索引擎Fofa的简单使用

Fofa 是白帽汇推出的一款网络空间搜索引擎,它通过进行网络空间测绘,能够帮助研究人员或者企业迅速进行网络资产匹配。例如进行漏洞影响范围分析、应用分布统计、应用流行度等。在渗透测试过程中,Fofa能帮助测试人员快速...

2022-01-19
0

开源情报收集:技术、自动化和可视化

作为一名防守者,这总是让我感兴趣,因为我想知道一个局外人可以在不接触基础设施或与内部人员接触的情况下学到什么。现在,我最常希望利用此类数据来准备内部知识的集合,我可以将其用作社会工程的基础,或者一旦进入网络,就可...

2022-01-19
0

Robots & SiteMap

索引型Sitemap:是百度的概念, 即:一个Sitemap包含了子Sitemap的地址。

2022-01-19
0

GitHub代码搜索服务发展历史

最近在做搜索相关的事情,也看到Github代码搜索的发展历程,不曾想其第一代搜索引擎上线居然是2008年(那一年刚上初一),或许是有时间的积淀与技术的进步才使得今天的我们在github上搜索代码可以如此方便。接下来我们一起来看...

2022-01-18
0

中小规模搜索引擎(ElasticSearch)典型应用场景及性能优化(三)

再说到性能优化,个人把搜索引擎的性能优化分为索引数据优化和查询流程优化两方面,这次先来聊聊索引数据优化。

2022-01-18
0

中小规模搜索引擎(ElasticSearch)典型应用场景及性能优化(二)

首先通过搜索词匹配倒排表得到一个只有id的结果集,然后通过id匹配正排索引拿到对应的文档字段,最后返回结果,这样的好处是:

2022-01-18
1