前面给大家介绍了
【R语言】获取基因组上某个区域内的SNP信息
我们经常会从一些文献或者数据库里得到一些与疾病相关的SNP信息。如下图所示,这里只有SNP的rs号,和染色体号,并没有具体的坐标信息,那么我们怎么得到具体的坐标位置呢?
今天小编就继续使用biomaRt这个R包来给大家演示一下如何通过SNP的rs号来得到具体的染色体上的坐标位置
代码语言:javascript复制#安装biomaRt包
BiocManager::install("biomaRt")
#加载biomaRt包
library(biomaRt)
#选择数据库和数据集
snp_mart = useMart("ENSEMBL_MART_SNP",
dataset="hsapiens_snp"
)
#从文件中读取SNP的rs号
snp_ids = read.table("SNP_list.txt",stringsAsFactors = F)[[1]]
#attributes设置需要显示的SNP信息,包括rs号,染色体号和起始位点
snp_attributes = c("refsnp_id", "chr_name", "chrom_start")
#获取snp的相关坐标信息
snp_locations = getBM(attributes=snp_attributes, filters="snp_filter",
values=snp_ids, mart=snp_mart)
#输出结果
snp_locations
你会得到如下信息:
SNP_list.txt的信息如下
代码语言:javascript复制rs12735723
rs28936676
rs28936677
rs28937588
rs28939710
rs701753
rs28937893
rs1799945
rs1800562
rs2435322
rs28937907
rs1050828
rs28941774
rs28941775
rs28931595
rs28942074
rs28942075
rs28942076
rs28938175
rs34197769
rs40433