Day3 100天生信/数据科学自我挑战
不断有新的小伙伴加入100天生信/数据科学自我挑战,所以有些小伙伴是挑战的第三天,也有些可能还没开始。请大家记住起点和进度都不重要,因为自我挑战本来就是一件自己的事儿,不管从哪一天开始,100天只要坚持下去相信一半以上的人都能够养成终身学习的习惯。
这个挑战中,没有人会push大家更新, 这里只是push大家给自己立一个flag,通过创造舆论压力来鞭策自己。希望大家都能够通过这种舆论压力,坚持把自己学过的内容归档,每周,每月,每个季度都有可以回头总结和升华,做到查漏补缺,慢慢形成知识体系。也希望大家通过100天持续不断的分享记录能够遇到同伴,一起讨论、互相帮助,然后将来不管是求职还是升学中有一个可以向未来老板展示的Projects。100天每天至少5分钟,看似简单,但是坚持100天会很难。
有些小伙伴问我学习的内容和形式,请大家根据自己的需求自己选择自己想学习的内容和更新的方式。主要是大家自我学习,与其余任何人都无关的。在选题和进度安排上,找自己最需要的,按照自己的节奏来,日积月累养成习惯是最重要的。
发起这个活动的初衷是:
1. 加入的每个小伙伴都有强烈的学习欲望,有些小伙伴已经知道自己需要的学习内容,即便有些人不知道希望通过大家的公开更新为别人指引方向。
2. 加入的大多数小伙伴,自己一个人学习的话,都坚持不了多少天(别问我咋知道的)。
3. 如果公开立个Flag,至少一部分小伙伴可能能坚持下去。
所以我的目的很简单,让我自己先做到(希望不要自己被打脸,PI以后真的事情很杂),然后100天后找到一群身怀绝技的优秀小伙伴。
Conda分类
Conda分Minicoda和Anaconda,二者区别在于Minicoda是个阉割版本,少了很多Anaconda带有的软件包,所以占用空间小,网速慢或者在公共服务器上每个user分配disk space有限的时候容易装上。被阉割的软件包,后期有需求可以重新在装上。
Conda安装
安装其实很简单,去conda主页,下载自己系统对应的installer ,follow instruction就可以了。比如在mac上下载了以后会得到一个Miniconda3-latest-MacOSX-x86_64.sh,直接在terminal运行
代码语言:javascript复制bash Miniconda3-latest-MacOSX-x86_64.sh
按提示操作就可以了(也就是一路按Yes)。
Conda安装软件
Day 1提到如果想装 samtools
代码语言:javascript复制Conda install samtools
就可以了,不光是生信类,R 语言python语言软件包,都可以 。
代码语言:javascript复制Conda install bedtools # 生信软件
Conda install hisat2 # RNA seq 比对软件
Conda install pandas # python packages
代码语言:javascript复制Conda install r-data.table # R packages
所以说conda是几乎一行代码搞定常用8000个左右的生信软件和R 语言呢和Python语言的包安装,免去大家从头下载编译的烦恼,真的很香。
Conda环境配置
Day1提到,Conda一个非常方便之处就是解决环境冲突,(举个假想的例子加入我们日常常用两个软件A和B,他们都依赖于hisat。但是A软件依赖于hisat软件的2.1.0版本,B软件依赖于C软件的2.2.0版本,无论我装hisat的哪个版本我都无法同时使用A和B)。这个时候会建立两个环境,
代码语言:javascript复制Conda env create -name test_env1 -f env1.yaml
test_env1 为环境名,env1.yaml 为配置文件,配置文件的内容如下
channels: - conda-forge
depedencies:
- hisat2=2.1.0
安装完成后我们通过
代码语言:javascript复制Conda activate test_env1
以后就可以使用hisat 2.1.0版本。
同样的我们可以通过
代码语言:javascript复制Conda env create -name test_env2 -f env2.yaml
test_env2 为第二个环境名,env2.yaml 为配置文件,配置文件内容如下
channels: - conda-forge
depedencies:
- hisat2=2.2.0
区别只是,改了hisat的版本,安装完成后我们通过
代码语言:javascript复制Conda activate test_env2
以后就可以使用hisat 2.2.0版本。
如果想切换,简单的通过
代码语言:javascript复制Conda activate 环境名
就可以在两个软件版本之间切换了。
了解了conda分类,安装、配置环境,明天我们了解下conda的channel 和配置机制,以及conda的工作原理。
上期回顾
0. 成为更好的自己之 << 100天生信/数据科学自我挑战>>
1. Day 1-100天生信/数据科学自我挑战(如何制定一个强有力的入门进阶计划)
2. Day 2 # 100天生信/数据科学自我挑战# -- Conda 入门到精通之初识Conda
如果你还不熟悉 <<100天生信/数据科学自我挑战>>
不管你是想入门生信/数据科学的初学者,还是想进阶生信/数据科学技能的从业者,可能都有不知如何下手或者坚持了几天就因为各种原因放弃了的经历。如果是这样,那么这个100天生信/数据科学自我挑战就是为你而设计的(超简单、纯免费,自虐升级,无广告和付费内容,详情见下文)。
大家好,我是山石,山西农业大学(本)、天津大学(硕)、瑞典乌普萨拉大学(博),瑞典农业科学大学(博士后)。在生命科学领域学习工作了15年,目前为瑞典农业大学生物大数据分析Research Fellow。2020年年底以来我在自己的社交账号上开始分享从生命科学湿实验硕士,转型生物信息学的博士以后的学习科研和经历,至今收到了各个平台大概10000名小伙伴的关注。也收到了很多朋友的私信问题,新手如何入门生物信息学和数据科学,入门成为调包侠之后感觉遇到了瓶颈,如何才能进阶?其实这个问题同样困惑了我很久。回顾学习的过程,就像上台阶一样,往往登上一个台阶之后需要很久才有可能进阶,也或许很久都止步不前(比如我现在)。究其原因就是找不到合适的方法,有时候即便找到了合适的方法,很难在学习新东西和做Projects之间找到一个平衡,无法长久坚持下去,养成终身学习的习惯。而这个行业的进步又很快,每周都有新的方法和软件出来,为了避免被后浪早早拍死,凉透了,我发起这个和大家一起进步的自我挑战。
<< 100天生信/数据科学自我挑战>>是什么
今天我发起一个100天生信/数据科学自我挑战。这个挑战其实很简单,只包括两个内容。第一,参与者每天至少花5分钟去学习生信或者数据科学的知识; 第二把学习的过程分享到自己的社交媒体中,任何社交媒体都可以,比如微博,知乎,B站或者微信(记得加入话题# 100天生信/数据科学自我挑战# 哦)。请大家转发这条动态,让更多的小伙伴加入进来共同进步。
<< 100天生信/数据科学自我挑战>>为什么
学习是一种习惯,终身学习的习惯一旦养成,将很难改变,日积月累简单的一个好习惯,会让大家终身受益。英国的一份统计调查显示,养成一个习惯的平均时间是66天。我们每天学习至少5分钟,100天自我挑战。看似不长,只要坚持下去我相信一半以上的人都能够养成终身学习的习惯。在自媒体分享的原因有三个,其一,给自己立一个flag,创造舆论压力来鞭策自己,其二,把自己学过的内容归档,每周,每月,每个季度都有可以回头总结和升华,做到查漏补缺,慢慢形成知识体系。其三,通过100天持续不断的分享记录自己的学习过程,能够遇到很多同伴,一起讨论相互帮助。最后,这个学习过程和做Project的过程可能会让大家敲开心仪的公司的实习offer和心仪导师的升学offer。我们抱怨行业内卷,想躺平,但是试想像一下如果一位申请者拿了过去365天每天不间断的学习笔记来求职,面试官会不会拒而不见。一个人的处境只会因为这个人做了什么而改变,而不是这个人身上的标签。所以请大家转发这条动态,让更多的小伙伴加入进来共同进步。
<< 100天生信/数据科学自我挑战>>怎么做
学习的内容不需要很复杂。如果你是一位初学者,可以是一些学科的基本概念和技术。例如什么是二代测序,Python 编程基础,什么是回归分析,什么是聚类等等。我的自媒体有很多相关内容(生信基础、linux,一二三代测序、RNA seq、 Variant calling等等),相信大家也关注了很多自媒体公众号,我关注的一些公众号有很多教程,如果实在不知道从哪里开始的欢迎私信我讨论(联系方式见文末)。如果你已经有一定的基础,期望进阶学习,可以用公共数据重复文章中的内容,做一个RNA seq,Single cell sequencing 的课题,也可以去kaggle,Github上去学习一个解决具体实践问题的小project。挑战赛的参与方式非常简单,大家只需要根据自己的情况,列一个提纲,每天循序渐进的学习一点点,记录在自己的社交媒体上,如果遇到合适的伙伴,可以一起积极交流互动。请大家转发这条动态,让更多的小伙伴加入进来共同进步。
对于我自己来说,过去的半年我一直在梳理自己学习过程的一些基本概念和基础知识,我会继续完成生信,R,Python编程,统计,GWAS,多组学整合,基因组选育的内容,并在我的自媒体上更新。之后我计划在学科前沿,Web Developing和 App Developing努努力。如果能把自己科研中的一些实用结果做成App和网站,能让科研成果触及更多的同行。
Document Your Journey To A Better Version Of Yourself
我创建了一个微信群,不好意思在自己自媒体天天更新的小伙伴,欢迎入群哈(私信我15934076136,我拉大家入群)。不愿意入群的小伙伴,我在知乎提了一个问题” 100天生信/数据科学自我挑战,记录成为更好的自己?”。大家也可以匿名更新,希望我们有足够多的朋友在一起更新,相互见证彼此的成长。最后再次请大家转发这条动态,让更多的小伙伴加入进来共同进步。
期待100天后大家都成为更好的自己, 有一群优秀的小伙伴在100天后等你。