最新 最热

结巴分词原理及使用「建议收藏」

目前常用的分词工具很多,包括盘古分词、Yaha分词、Jieba分词、清华THULAC等,现在项目使用的分词方法是结巴分词,本次来介绍一下。

2022-07-04
0

2020互联网行业术语

一般指的是互联网企业,是指以计算机网络技术为基础,利用网络平台提供服务并因此获得收入的企业。其业务范围通常覆盖全国甚至全球,注册用户通常达到千万级以上,用户活跃度也非常高,经常在同一时间点出现请求并行的情况...

2022-07-02
0

python 中文文本分类[通俗易懂]

即已经分好类的文本资料(例如:语料库里是一系列txt文章,这些文章按照主题归入到不同分类的目录中,如 .art21.txt) 推荐语料库:复旦中文文本分类语料库,下载链接:http://download.csdn.net/detail/github_36326955/9747927...

2022-07-01
0

大数据建模与数据模型工具[通俗易懂]

1. 容量(Volume):数据量大,数据量的大小决定所考虑的数据的价值和潜在的信息;

2022-07-01
0

CMU提出NLP新范式—重构预训练,高考英语交出134高分

每天给你送来NLP技术干货!----来源 | 机器之心排版 | PaperWeekly本文提出的重构预训练(reStructured Pre-training,RST),不仅在各种 NLP 任务上表现亮眼,在高考英语上,也交出了一份满意的成绩。我们存储数据的方式正在发...

2022-06-29
0

职业问诊 | 面试时被问到职业规划该怎么回答?

Q2: 被问到职业规划时,该怎么回答?http://mpvideo.qpic.cn/

2022-06-28
0

为什么 bulk RNA-seq 差异表达在单细胞世界中不是最有用的

最近学徒在复现文献图表的时候接触到了一个难搞的单细胞转录组项目,降维聚类分群结果非常糟糕,我看了看其dotplot发现主要是部分基因无处不在导致很多单细胞亚群特异性基因变得不特异了。所以推荐大家使用我前些天在讲...

2022-06-27
0

往前一步是优秀,退后一步是懵懂

我们的生信入门班和数据挖掘线上直播课程已经有了三年多的历史,培养了一波又一波优秀的生信人才。前面提到R语言授课时的超纲练习题,已经分享过两位优秀学员的答案。...

2022-06-27
0

抓出那些重复的基因

我们的生信入门班和数据挖掘线上直播课程已经有了三年多的历史,培养了一波又一波优秀的生信人才。课堂上设置的练习题代表着以目前学到的知识所能完成实战,学员们对待练习题的认真程度非常值得学习。虽然有基础的人来看...

2022-06-27
0

系统学习+主动探索,是最舒适的入门学习方式!

我们的生信入门班和数据挖掘线上直播课程已经有了三年多的历史,培养了一波又一波优秀的生信人才。本期分享的内容不是课堂上讲的,而是给了踮一踮脚能做出来的超纲练习题,启发学员主动学习,而不是一味等待投喂。...

2022-06-27
0