NAR | 整合药用植物组学平台 IMP 功能概览 1

2023-11-08 15:09:43 浏览数 (1)

IMP: bridging the gap for medicinal plant genomics

药用植物因其潜在的抗肿瘤、抗炎和抗氧化特性,在民族医学和传统医学中引起了极大的关注。基因组测序和合成生物学的最新进展重新激发了人们对这些天然产物的兴趣。尽管有很多药用植物的基因组和转录组测序数据,但缺乏可公开访问的基因注释和表格格式的基因表达数据,这不利于它们的有效利用。为了解决这一紧迫问题,我们开发了IMP (Integrated Medicinal Plantomics)整合药用植物组学平台(https://www.bic.ac.cn/IMP)。IMP收录了84个高质量的基因组(预期收录所有植物的基因组),整理了848,565,672个基因,以及2,158个转录组测序样本,涵盖了多个器官、组织、发育阶段和胁迫刺激。通过集成的10个分析模块,用户可以简单地在IMP中探索基因的注释、序列、功能、分布和表达。IMP的开发和使用将会从基础数据层面促进药用植物分子代谢途径的解析,进而在推动合成生物学的发展、促进药物发现和药物生产的天然来源的探索方面发挥重要作用。

具体见 NAR | 中医科学院陈同等开发整合药用植物组学平台 IMP 具体见 NAR | 中医科学院陈同等开发整合药用植物组学平台 IMP

首页信息

数据平台访问地址https://www.bic.ac.cn/IMP/。首页采用平面组合布局,分为导航、网站描述、统计信息和功能展示 4 个部分。

  • Logo 设计体现药物特色,药葫芦 DNA 双螺旋体现药用植物分子信息,辅以祥云标识,展示中国特色;
  • 轮播图和文字描述网站特色; 首页的搜索为全局检索,用户输入基因名字、通路信息或任意基因功能相关单词即可搜索目标基因,开启网站的探索之旅;
  • 右侧 2 个视频图标可以跳转当前页面可用功能的具体描述: 国内跳转 B 站,国外跳转 YouTube 平台。
  • 中间 4 个图标列出数据库收录数据的统计信息: 基因数目、基因碱基数、样品数和物种数目。
  • 下面 12 个模式图列出网站的主要功能和功能跳转。
  • 最后是网站的更新日志(最近新增的模块,功能还在完善中)。

基于功能描述、注释或基因名字的全局搜索

在首页的全局搜索框中输入基因的名字、基因的功能描述或基因的 GO 注释/KEGG通路注释的信息,即输入任何文字都可以去匹配出关注的基因(当然也有一些文字什么都匹配不出来)。比如默认选中的物种是穿心莲,默认输入的文字是cytochrome p450,我们需要做的就是点击Submit 提交一下,新标签页会出现搜索结果。

如果碰到页面不出来的情况下,请看下浏览器最上部菜单栏下面是否有窗口被拦截的提示。

搜索结果页面的标识条,会用红字标记搜索的文字信息, 蓝字标记选择的物种信息。下面的表格列出所有的搜索结果,分页展示:

  1. 可以选择一页展示的条目数增减搜索结果的数目,也可以选择展示所有条目。
  2. 可以在右上角搜索框进行二次检索,进一步聚焦要关注的基因。
  3. 右上角也可以调节表格中展示哪些列,默认只有 2 列信息,可加列。

独特的 Send to 快捷操作 很多物种的基因名字都是 ID 类似的编号,通常记不住。IMP 可以通过文字或序列的方式搜索出一系列相关基因,选择后,点击Send to 就可以把这些目标基因集发送到对应的功能模块,实现免输入 Gene ID的快速操作。比如查看搜索出的 CYP450 的整体表达信息、基因组的分布信息、批量序列提取、引物设计和多序列比对等。

以单基因为中心的详情页面展示

页面分为 3 个部分:

  1. 第一部分展示基因的基本信息,包括名字信息、功能描述信息和序列信息。
  1. 第二部分展示基因在不同数据集的表达图谱信息。
  • 用户可以选择数据的预处理方式、图形的布局、箱体的排序、数据集来调整展示的内容。
  • 同时可以通过padding调整图的左、下、右的空间,以免发生文字溢出。
  • 最终的截图图可导出SVG格式,用于文章组图。
  • SVG 图也可以在 BIChttps://www.bic.ac.cn/BIC/ 的 SVGEdit 平台进行简单编辑 http://www.ehbio.com/SVGEdit/editor/。
  1. 第三部分展示基因的结构(内含子、外显子、UTR 等信息)和蛋白功能域信息。

多基因表达图谱

可以自己按页面选择物种、数据集、样品(非必选的选项如果不选,默认是全选)、输入基因,也可以从搜索结果中直接带过来基因列表。

模糊搜索:支持根据基因的功能描述关键词进行模糊搜索,获取基因名,用于研究一类基因的表达图谱。

提交后获得基因表达图谱展示。

  1. 用户可以跳转图形的 padding 信息和高度信息
  2. 可视化结果可以导出 SVG 格式
  3. 作图数据可以下载,导入 ImageGP/BIC平台进行再次分析

Gene fishing 调取表达模式相近的基因

选择物种、Assay type、匹配模式,输入基因名(可以通过Send to功能从其它页面发送过来),提交后获得一个相关性网络图和对应的结果数据。

GO/KEGG 富集分析 {#gokegg}

用户选择物种,输入基因名字,即可进行GO/KEGG富集分析。阅读推文https://mp.weixin.qq.com/s/BCB16M4yI5Qa1tKyZy7WMg或查看视频https://www.bilibili.com/video/BV1rD4y1272a?p=4了解 GO/KEGG 富集分析的基本原理。

点击后,可调整富集分析结果的配色方案、选择富集的条目进行展示。也可以下载表格文件,到高颜值免费在线绘图平台 ImageGP/BIC https://www.bic.ac.cn/BIC进行自由绘制。

GSEA 富集分析

GSEA 富集分析的输入会麻烦一些,目前只支持包含一列基因和一列排序值的 2 列矩阵格式;排序值可以是常见的log2(fold change)p-value或也可以是其他定量值。

阅读推文https://mp.weixin.qq.com/s/WiYUUALSmb9v5gYVxmjwjA或查看视频https://www.bilibili.com/video/BV1rD4y1272a?p=5了解 GSEA富集分析的输入数据、原理和结果解读。

默认绘制最富集的 2 条通路在一张图上,可以自己选择绘制哪些通路,也可以将通路绘制在多张图上。

0 人点赞