最新 最热

yyds!1w 字的 pandas 核心操作知识大全。

工作中最近常用到pandas做数据处理和分析,特意总结了以下常用内容。pandas常用速查引入依赖# 导入模块import pymysqlimport pandas as pdimport numpy as npimport time# 数据库from sqlalchemy import creat......

2022-04-12
0

Python网络爬虫之数美滑块的加密及轨迹~~动态js参数分析

其实这个问题,之前在Python黄金群也有问过【十一姐】,当时【十一姐】和【孙文】大佬也有给过思路,今天这里整理成文章,分享给大家。

2022-04-12
0

[Django基础04]创建一个模块应用

上一节内容中,我们创建了一个django项目mysite/,在项目的骨架的基础上,我们再创建基于项目的一个子模块投票模块,模块名称暂时定义为polls

2022-04-12
0

能用 AST 搞明白的正则语法,就不需要看文档

但是正则表达式的学习还是有些难度的,比如贪婪匹配、非贪婪匹配、捕获子组、非捕获子组等概念,不止初学者难理解,有很多工作几年的人都不理解。...

2022-04-12
0

如何使用truffleHog在Git库中搜索高熵字符串和敏感数据以保护代码库安全

truffleHog是一款功能强大的数据挖掘工具,该工具可以帮助广大研究人员轻松从目标Git库中搜索出搜索高熵字符串和敏感数据,我们就可以根据这些信息来提升自己代码库的安全性了。该工具可以通过深入分析目标Git库的提交历...

2022-04-11
0

一把王者的时间,我就学会了 Nginx!

Nginx("engine x")是一个高性能的 HTTP 和反向代理服务器,特点是占有内存少,并发能力强,事实上 nginx 的并发能力确实在同类型的网页服务器中表现较好,中国大陆使用 nginx 网站用户有:百度、京东、新浪、网易、腾讯、 淘...

2022-04-11
0

借助OCR和正则表达式,复旦博士用130行代码核查核酸报告,800份只需要2分钟!

大数据文摘出品 作者:Caleb 上海尚未解封。 4月9日,在上海市疫情防控工作新闻发布会上,上海市副市长、市疫情防控工作领导小组副组长宗明表示,3月1日以来,上海市已持续开展了多轮次核酸筛查或抗原检测。 自4月4日上海宣布...

2022-04-11
1

爆肝 50 道 Python 面试题 (下)

鸭子类型是动态类型语言判断一个对象是不是某种类型时使用的方法,也叫做鸭子判定法。简单的说,鸭子类型是指判断一只鸟是不是鸭子,我们只关心它游泳像不像鸭子、叫起来像不像鸭子、走路像不像鸭子就足够了。换言之,如果对...

2022-04-08
0

R tips:使用glmnet进行正则化广义线性模型回归

线性模型的建模为了提高模型的泛化能力,一般会进行正则化处理,也就是在损失函数的构造上加上正则化项,如L1正则化项或者L2正则化项,L1正则化也就是常说的Lasso回归,将损失函数加上了L1范数,L2正则化就是Ridge回归,损失函数加...

2022-04-08
1

强大的Xpath:你不能不知道的爬虫数据解析库

之前在爬虫解析数据的时候,自己几乎都是用正则表达式,Python中自带的re模块来解析数据。利用正则表达式解析数据的确很强大,但是表达式写起来很麻烦,有时候需要多次尝试;而且速度相对较慢。以后会专门写一篇关于Python正则...

2022-04-08
0