【R语言】如何利用SNP的rs号提取坐标信息

2022-09-21 17:45:34 浏览数 (1)

前面给大家介绍了

【R语言】获取基因组上某个区域内的SNP信息

我们经常会从一些文献或者数据库里得到一些与疾病相关的SNP信息。如下图所示,这里只有SNP的rs号,和染色体号,并没有具体的坐标信息,那么我们怎么得到具体的坐标位置呢?

今天小编就继续使用biomaRt这个R包来给大家演示一下如何通过SNP的rs号来得到具体的染色体上的坐标位置

代码语言:javascript复制
#安装biomaRt包
BiocManager::install("biomaRt")

#加载biomaRt包
library(biomaRt) 

#选择数据库和数据集
snp_mart = useMart("ENSEMBL_MART_SNP", 
                   dataset="hsapiens_snp"
                   )

#从文件中读取SNP的rs号
snp_ids = read.table("SNP_list.txt",stringsAsFactors = F)[[1]]
#attributes设置需要显示的SNP信息,包括rs号,染色体号和起始位点
snp_attributes = c("refsnp_id", "chr_name", "chrom_start")

#获取snp的相关坐标信息
snp_locations = getBM(attributes=snp_attributes, filters="snp_filter", 
                      values=snp_ids, mart=snp_mart)
#输出结果
snp_locations

你会得到如下信息:

SNP_list.txt的信息如下

代码语言:javascript复制
rs12735723
rs28936676
rs28936677
rs28937588
rs28939710
rs701753
rs28937893
rs1799945
rs1800562
rs2435322
rs28937907
rs1050828
rs28941774
rs28941775
rs28931595
rs28942074
rs28942075
rs28942076
rs28938175
rs34197769
rs40433

0 人点赞