最新 最热

用Python进行简单的文本相似度分析

以下doc0-doc7是几个最简单的文档,我们可以称之为目标文档,本文就是分析doc_test(测试文档)与以上8个文档的相似度。

2020-01-13
0

R语言数据挖掘实战系列(3)

通过检验数据集的数据质量、绘制图表、计算某些特征量等手段,对样本数据集的结构和规律进行分析的过程就是数据探索。

2020-01-08
0

浅谈simhash及其python实现

一直想写个总结来回顾simhash,一直没抽出时间,现在还是好好写写总结一下。作者随笔,废话有点多,不喜勿喷,欢迎指教。

2020-01-07
0

数据工程师必须掌握的7个大数据实战项目

作为一名电影爱好者,我阅片无数,有些片子还经常翻来覆去看个好几遍。小时候因为这事儿,没少被我妈抓耳朵,“看过的片子为啥还要倒二遍?”我也说不上来,就是单纯的爱看。...

2019-12-31
0

NLP面试宝典:38个最常见NLP问题答案一文get

自然语言处理(Natural Language Processing,NLP)是指帮助机器理解和分析自然语言;它是利用机器学习算法从数据中提取所需信息的一个自动化的过程。

2019-12-30
0

一个基因引发的血案

大家好,我是老米,学习生信一个月,这是我的第二篇Markdown。不知道多少人还记得我的第一个作品:原来一个星期真的可以零基础入门TCGA数据挖掘,甚至markdown写作公众号投稿 (感兴趣的自己点击查看哦)...

2019-12-30
0

把 Android App 逆向分为几步?三步

逆向在很多领域都有应用,比如如今爬虫技术已经遍地走,甚至不用写代码都可以爬取数据,导致前端开发的反爬意识也逐步提升。因此 JS、Android 等领域的逆向,已经成为爬虫开发者必备的技能之一。...

2019-12-27
1

求职 | 想转行数据科学,收好岗位选择指南与技能图谱分析!

在大数据和人工智能行业,有众多与数据相关的岗位,名目繁多:数据分析师、数据产品经理、数据挖掘工程师、大数据工程师、数据开发工程师、机器学习工程师、算法工程师、NLP算法工程师、数据科学家等等。很多应届生或准备...

2019-12-26
1

ML学习笔记之TF-IDF原理及使用

TF-IDF(Term Frequency-Inverse Document Frequency, 词频-逆文件频率).

2019-12-24
0

大数据的定义与概念

来源 | https://www.leiue.com/big-data-definitions-and-concepts

2019-12-23
0