最新 最热

Hive Query生命周期 —— 钩子(Hook)函数篇

无论你通过哪种方式连接Hive(如Hive Cli、HiveServer2),一个HQL语句都要经过Driver的解析和执行,主要涉及HQL解析、编译、优化器处理、执行器执行四个方面。...

2020-08-10
0

如何查看JVM运行的堆内存情况

《不可不知的7个JDK命令》介绍了些jdk自带的问题排查工具,机器出现CPU飙升的情况,此时就可以借助工具,排查应用端是否存在一些潜在问题。

2020-07-24
0

Nature: 泛癌突变特征,错过了TCGA但别错过它!

大家好,今天跟大家分享的是2020年发表在Nature(IF:43.07)杂志上的一篇文章:The repertoire of mutational signatures in human cancer.内外因素一直驱动着肿瘤基因组发生体细胞突变,在这一过程中形成了具有特征性的突变标...

2020-07-21
0

Elasticsearch Analyzer原理分析并实现中文分词

首先,我们知道倒排索引的原理,我们需要构建一个单词词典,但是这个词典里面的数据怎么来呢?我们需要对输入的东西进行分词。这个ES已经考虑过了,所以它内置了一些分词器,但是中国文化,博大精深,有时候自己断句都会有误差,所以我...

2020-07-21
1

Nature: 泛癌突变特征,错过了TCGA但别错过它!

大家好,今天跟大家分享的是2020年发表在Nature(IF:43.07)杂志上的一篇文章:The repertoire of mutational signatures in human cancer.内外因素一直驱动着肿瘤基因组发生体细胞突变,在这一过程中形成了具有特征性的突变标...

2020-07-21
0

Elasticsearch(三)

在 ES 中,全文搜索与 Analysis 部分密不可分。我们为什么能够通过一个简单的词条就搜索到整个文本?因为 Analyzer 分析器的存在,其作用简而言之就是把整个文本按照某个规则拆分成一个一个独立的字或词,然后基于此建立倒排...

2020-07-17
0

大数据工具:IKAnalyzer分词工具介绍与使用

为什么要分词呢,当大数据处理中要提取语句的特征值,进行向量计算。所有我们要用开源分词工具把语句中的关键词提取出来。

2020-07-13
1

018.Elasticsearch分词器原理及使用

默认分词器:按照非字母和非数字字符进行分隔,单词转为小写 测试文本:a*B!c d4e 5f 7-h 分词结果:a、b、c、d4e、5f、7、h

2020-07-06
1

Elasticsearch从入门到放弃:分词器初印象

Elasticsearch 系列回来了,先给因为这个系列关注我的同学说声抱歉,拖了这么久才回来,这个系列虽然叫「Elasticsearch 从入门到放弃」,但只有三篇就放弃还是有点过分的,所以还是回来继续更新。...

2020-07-03
1

System Generator从入门到放弃(二)-Digital Filter

System Generator是Xilinx公司进行数字信号处理开发的一种设计工具,它通过将Xilinx开发的一些模块嵌入到Simulink的库中,可以在Simulink中进行定点仿真,可以设置定点信号的类型,这样就可以比较定点仿真与浮点仿真的区别。...

2020-06-30
0