数据和代码公开的论文~藻类的群体遗传、叶绿体基因组和线粒体基因组

2021-07-12 16:04:27 浏览数 (1)

文章题目

whole genome genotyping reveals discrete genetic diversity in north-east Atlantic maeral beds

image.png

期刊、发表时间等等

Evolutionary Applications

4.013

二区

University of Exeter 英国

本地文件名 eva.13219.pdf

主要研究内容

maeral beds 是个啥暂时还不知道

Phymatolithon calcareum, a maerl-forming red algal species

红藻的一个种

二代测序,组装了基因组,然后检测snp,做群体结果

还分析了叶绿体和线粒体基因组

数据和分析用的代码都是公开的,很好的学习素材

github的链接是

GitHub - Tom-Jenkins/maerl_genomics: Data and code from Jenkins et al. 2021

论文里写道有一个线粒体组装成环状的了,Tre04,

我按照他提供的脚本组装试一下

首先是下载测序数据

代码语言:javascript复制
conda activate download_raw_data
prefetch SRR13356850 -O ./

数据不大,很快就下载好了 转换成fastq格式

代码语言:javascript复制
fasterq-dump --split-files SRR13356850.sra -p
提取属于线粒体中的测序数据reads

使用到的工具是 GetOrganelle

下载种子序列

KF808323 MH281621

代码语言:javascript复制
conda activate chloroplast
get_organelle_from_reads.py -1 SRR13356850.sra_1.fastq -2 SRR13356850.sra_2.fastq -o output_dir -s MH281621.fasta,KF808323.fasta -F embplant_mt,embplant_mt -t 16 -R 50 --no-spades

这个结果没有内容,暂时不知道什么原因

论文中组装用到的是Unicycler这个程序

接下来我试了一下NOVOplasty这个程序组装得到了环状结果,最终长度是28066 bp 结果和文章中的一致

image.png

还涉及到了基因渗入分析,这部分内容得好好看一下

还有一个图是关于地图添加饼状图的,抽时间重复一下代码

image.png

这里还有种群结构分析,就是structure 然后多少个k那个,这个也得好好看看

欢迎大家关注我的公众号

小明的数据分析笔记本

小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!

0 人点赞