最新 最热

一文入门XPath

之前学会了使用re模块通过正则表达式从网页中提取出来想要的信息,但是效率上很低;内容越复杂,构造正则表达式的时间也就越多了。而且,有些时候网页中的内容并不是完全一样的规律,导致提取到的信息会不完整。...

2020-10-30
0

大数据入行建议:零基础如何开始大数据学习

大数据热度居高不下,基于大数据的发展,越来越多的企业开始布局相关业务,组建数据团队,这使得大数据人才需求持续上升。当然,也有越来越多的小伙伴看好大数据的前景,想要入行,今天我们就来讲讲,零基础如何开始大数据学习。...

2020-10-29
0

Python中有几个关键字

Python中关键词有多少个?Python中关键词目前有31个,可以利用Python的内置的keyword模块进行输出查看。

2020-10-29
0

150亿参数大杀器!Facebook开源机器翻译新模型,同传人员或失业

当把中文翻译成法文时,以前最好的多语种模型的方式是把中文翻译成英文,把英文翻译成法文,因为英语的训练数据是最多的。

2020-10-29
1

一文入门MySQL数据库

本文中介绍的结构型数据库MySQL的基本知识,能够让你快速入门MySQL,具体内容包含:

2020-10-29
0

一文搞定pandas的数据合并

在实际处理数据业务需求中,我们经常会遇到这样的需求:将多个表连接起来再进行数据的处理和分析,类似SQL中的连接查询功能。

2020-10-29
0

关于数据仓库的架构及3大类组件工具选型

关于数据仓库的概念、原理、建设方法论,网上已经有很多内容了,也有很多的经典书籍,本文更想聊聊企业数据仓库项目上的架构和组件工具问题。

2020-10-28
0

都已经开始挖掘空间单细胞转录组数据了

也就是说,大概率上你感兴趣的疾病都会有现成的公共数据,你完全可以选择从你感兴趣的角度来对它进行分析。而不是跑一下各个标准代码,得到一个唾手可得的结论糊弄大家。科研的科研,教程是教程!...

2020-10-26
0

SAS or R:谁更适合你?(二)

本期开始大猫将直奔主题,从“语法灵活性(Syntax)”、“性能与并行计算(Performance & Parallel Computation)”、“商业/社区支持(Support)”三个方面比较不同统计软件。本期主题是“语法灵活性(Syntax)”,首先总结我们平时做的...

2020-10-23
1

FastSpar | 用更快的 SparCC 进行微生物组相关性分析

对于 OTU 矩阵这样稀疏的组成数据,我们往往会用专门的统计方法来计算其相关性,进行网络分析,一般最常用的就是 SparCC,但其性能限制了高维数据集交互网络的计算。FastSpar 在 SparCC 算法的基础上进行改进,用 C++ 将算法重...

2020-10-23
0