最新 最热

搜索引擎的技术架构

元搜索引擎(Meta Search Engine)。 ■ 全文搜索引擎   全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有百度(Baidu)。它们都是通过从互...

2022-04-14
0

海量数据处理 算法总结

【Bloom Filter】 Bloom Filter(BF)是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。它是一个判断元素是否存在集合的快速的概率算法。Bloom Filter有可能会出现...

2022-04-14
1

操作系统文件管理

在现代计算机系统中,要用到大量的程序和数据,因内存容量有限,且不能长期保存,故而平时总是把它们以文件的形式存放在外存中,需要时再随时将它们调入内存。如果由用户直接管理外存上的文件,不仅要求用户熟悉外存特性,了解各种...

2022-04-14
0

19期-当你在百度搜索关键字的时候,哪个网站会排在最前面?今天给大家科普一下“网站SEO”

什么是SEO呢?SEO是Search Engine Optimization,意为“搜索引擎优化”,一般简称为搜索优化。对于SEO的主要工作就是通过了解各类搜索引擎如何抓取互联网页面,如何进行索引以及如何确定其对某一个特定关键词的搜索结果排名...

2022-04-13
0

ES提交操作与原理

根据官方文档+看源码+实验总结出来的ES各种提交的作用与原理(对应版本7.2.0).

2022-04-13
1

修改ES返回字段方式提升性能

最近我们在公司内尝试用ES替换老旧的Solr, 在性能对比测试的环节, 发现ES竟然比Solr慢了非常多, 响应时间是Solr的两三倍, 然后开始各种排查, 最后发现ES的响应时间竟然随着request.size的增加呈线性增加, 这说明大部...

2022-04-13
1

ElasticSearch基础入门篇

ES 是一个开源的高扩展的分布式全文搜索引擎,是整个Elastic Stack技术栈的核心。它可以近乎实时的存储,检索数据;本身扩展性很好,可以扩展到上百台服务器,处理PB级别的数据。...

2022-04-13
1

项目实战 | Python爬虫概述与实践(一)

爬虫,又称为网络蜘蛛、网络机器人等,简单来说,就是请求网站并提取数据的自动化程序,可以代替人工在互联网上收集数据。

2022-04-11
0

又一个搜索神器

左侧默认分组有国内外常用搜索引擎,视频网站,音乐网站,学术网站,摸鱼网站等,比如使用谷歌搜索的时候点击左侧的百度进入百度搜索,不用再打开百度复制搜索。...

2022-04-11
0

又一个题外话题(不是 ECharts),两次撞见相同的网站劫持手段

几个月后的今天,我发现了单位网站中某篇文章中提到的一个域名,被腾讯网址安全检测识别为「危险-网站含有违规内容」…

2022-04-10
0