随着计算机在生活中的应用逐渐增加,网络技术和通信技术在企业运营所占比重也在增加。这些都使得企业在运营过程中会产生大量的数据,而如何规划和分析这些数据,对于企业的长期发展也十分重要。...
这里分享一篇利用数据挖掘+实验的文章,这篇文章发表在BMC Cancer上,IF为3.28。
首先要知道最近正在上映的电影的名称、评分、评论数等等,这些都可以在豆瓣上找得到,因此本次数据挖掘对象就确定为豆瓣电影官网。
首先,在这里先跟大家说声对不起,技术团队最近一直在做课程开发,本着宁缺毋滥的原则,我们的微信文章一再搁置,在编辑部催了无数遍之后,终于可以把课程放出来给大家了。...
不管是医生,还是研究生,只要你想毕业,想评职称,都不得不踏入科研道路。然而,一旦开始做科研,我们就开始了无止境的做细胞、养老鼠的生涯,再加上头顶发文章的大山,可谓压力颇大,每天都惶惶不可终日。想发一篇SCI文章,别说5分以上...
众所周知,GEO里面大部分是表达谱数据,而表达谱的数据挖掘涉及众多的分析方法和繁琐的分析步骤,这里给大家做了一个大致的流程图,以便大家有一个整体而全面的认知。简而言之,GEO的数据分析就分为两大步骤:(1)从原始数据到基因...
随着大数据技术的不断更新和迭代,数据管理工具得到了飞速的发展,相关概念如雨后春笋一般应运而生,如从最初决策支持系统(DSS)到商业智能(BI)、数据仓库、数据湖、数据中台等,这些概念特别容易混淆,本文对这些名词术语及内...
在上一期的推文 GEO数据库挖掘(1)--SCI文章速成 ,我们讲解了关于GEO数据库的背景知识,想必大家也了解了GEO是一个非常实用和权威的基因表达谱数据库。那么如何检索自己想要的数据呢?...
最近这段时间,相信好多人都在忙着写国自然标书,一晃2019年的2月份已经过去,今年只剩下10个月了,留给我们的时间不多啦(像不像导师或者主任开会时的讲话啊...
TCGA是一个综合性的多组学肿瘤基因组数据库,除包含DNA测序之外,还包含了RNA测序、拷贝数、蛋白谱、甲基化等多个组学的数据,但是在TCGA的官方网站GDC Data Portal (https://portal.gdc.cancer.gov/)...