最新 最热

"轻"搜索的困局和破局之道

我应该是公司第一个专职搜索的,当时搜索所有组件只有一个ES(elasticsearch),虽然之前在干过将近两年的solr,不过主要还是以数据检索为主(类似于为hbase建一个二级索引),既然组织安排也就接下了这口锅,从基础的查询解析/数据同...

2022-01-18
0

爬虫基础

个人学习笔记,参考视频:Python超强爬虫8天速成 参考书籍 : 崔庆才《网络爬虫开发实战》

2022-01-17
0

python可以自学吗?

从零基础开始学的Python,也算是一个过来人了吧,现在看来当初我也是走了许多弯路,来给大家分享一下我的经验吧。

2022-01-15
1

4. html块标签、含样式的标签

“仅供学习,转载请注明出处”html块标签1、<div> 标签 块元素,表示一块内容,没有具体的语义。2、<span> 标签 行内元素,表示一行中的一小段内容,没有具体的语义。“编写一个示例如下:”<!DOCTYPE html><html><head> <title>...

2022-01-14
0

防止网站被恶意反向代理

比如用户访问 http://blog.ysneko.com/archives 这个页面,但blog.ysneko.com实际上并不存在这个页面,他是偷偷从另外一台服务器上取回来,然后作为自己的内容返回用户。实际上表达出来的效果就是相当于他搭建了个和目标站...

2022-01-13
0

1、让自己的网站,被百度收录!& SEO 搜索引擎优化

二:让百度去收录 网站体检_网站安全检测_站长工具_网站支持_百度搜索资源平台 (baidu.com)

2022-01-13
1

工具的使用 | Shodan的基本使用

Shodan 是一个搜索引擎,但它与 Google 这种搜索网址的搜索引擎不同,Shodan 是用来搜索网络空间中在线设备的,你可以通过 Shodan 搜索指定的设备,或者搜索特定类型的设备,其中 Shodan 上最受欢迎的搜索内容是:webcam,linksys,c...

2022-01-13
1

Python 教你3分钟用Bert搭建问答搜索引擎

鼎鼎大名的 Bert 算法相信大部分同学都听说过,它是Google推出的NLP领域“王炸级”预训练模型,其在NLP任务中刷新了多项记录,并取得state of the art的成绩。...

2022-01-10
0

【黄啊码】web3.0 指的是什么?马斯克炮轰web3.0

根据 BlockGeek 网站内容显示,早在上世纪 90 年代互联网刚刚开始普及的时候,用户与网络的互动处于非常早期的阶段,即用户只能被动地浏览文本、图片以及简单的视频内容,网站提供什么,用户查看什么。几乎没有互动可言。...

2022-01-10
0

实现自己的搜索引擎(二)

正向索引用来存储文档的各种属性,从逻辑上讲,正向索引其实就是一个大数组,数组中每个元素就是一个文档的属性集合。 如果正向索引是有Schema的,那么它其实就类似一个关系表或者说二维数组,纵轴是文档,横轴是属性;如果正向索...

2022-01-10
0