热点:Nature最新前沿,Python深度学习基因组学助力您发高分文章!

2022-11-11 18:57:36 浏览数 (1)

培训背景

基因组学(genomics)是对生物体所有基因进行集体表征、定量研究及不同基因组比较研究的一门交叉生物学学科,基因组学的目的是对一个生物体所有基因进行集体表征和量化,并研究它们之间的相互关系及对生物体的影响 。机器学习已经被广泛应用于基因组学研究中,利用已知的训练集对数据的类型和应答结果进行预测,深度学习,可以进行预测和降维分析。深度学习模型的能力更强且更灵活,在适当的训练数据下,深度学习可以在较少人工参与的情况下自动学习特征和规律。调控基因组学,变异检测,致病性评分成功应用。深度学习可以提高基因组数据的可解释性,并将基因组数据转化为可操作的临床信息。改善疾病诊断方案,了解应该使用哪些药物和给谁服用药物,最大限度的减少副作用,最大限度的提高疗效,所有这些都要求从基因组原始数据开始进行分析。这将是一项非常耗时的过程,因为涉及到的变量太多了,而深度学习恰恰能帮助缩短这一过程,近两年国内外顶尖课题组MIT、Harvard University、UPenn、清华大学、复旦大学等都在从事深度学习基因组学的研究,这一研究成果更是多次发表在Nature Reviews Genetics、Nature Methods、Science Advances、Cancer Cell、Nature Biotechnology 等知名国际顶刊上,为我们发表顶刊鉴定了基础。

“单细胞多组学技术”和“空间转录组技术”先后在2019年和2020年被Nature Methods评为年度技术方法。时间和空间维度多维研究技术结合,将以全新研究思路出发,既能够获得单个细胞间异质性,又能获得细胞在组织空间上的结构位置信息,发现更多未知且精细化结果。总而言之,单细胞测序 空间转录组测序:优势互补,同时获得细胞类型群体,以及基因表达和细胞的空间位置信息。

空间转录组能够定位和区分功能基因在特定组织区域内的活跃表达,为研究和诊断提供宝贵见解。10x Visium 的推出使空间转录组成为了新的研究热点,受到广大研究者的青睐,其不仅可以提供研究对象的转录组等数据信息,同时还能定位其在组织中的空间位置,这对于癌症发病机制、神经科学、发育生物学等众多领域的研究都有重要意义。

CADD(Computer Aided Drug Design):计算机辅助药物设计,依据生物化学、酶学、分子生物学以及遗传学等生命科学的研究成果,针对这些基础研究中所揭示的包括酶、受体、离子通道及核酸等潜在的药物设计靶点,并参考其它类源性配体或天然产物的化学结构特征,以计算机化学为基础,通过计算机的模拟、计算和预算药物与受体生物大分子之间的相互作用,考察药物与靶点的结构互补、性质互补等,设计出合理的药物分子。它是设计和优化先导化合物的方法,特别是在食品、生物、化学、医药、植物、疾病方面应用广泛。

然而如何对单细胞及空间转录组数据进行分析并结合生物学背景挖掘到更多有效信息也是困扰很多科研人员的一大难题以及深度学习在基因组学和计算机辅助药物设计领域发展缓慢,学习平台文献资料较少,培训学习迫在眉睫, 应广大科研人员要求,本单位经过数月调研,决定联合专家举办“深度学习基因组学 单细胞及空间转录组设计 计算机辅助药物设计”专题线上培训班,本单位已经举办十期培训,参会人员800余人,对于培训安排和培训质量一致评价极高 ,精心设计了具有前沿性、实用性和针对性强的理论学习和上机实操,培训请一定要认准我们!

培训对象

全国各大高校、企业、科研院所从事人工智能、生命科学、代谢工程、有机合成、抗体工程、酶工程、天然产物、蛋白质、药物、生物信息学、植物学,动物学、食品、化学化工,医学、疾病、机器学习、基因组学、农业科学、植物学、动物学,临床医学、食品科学与工程、植物基因组、动物传染病、肿瘤免疫与靶向治疗、 全基因组泛癌分析、人黏连蛋白折叠基因组机、有机合成、生物化学、病毒检测、高通量测序、分子生物学、功能基因组、遗传图谱、基因挖掘变异、代谢组学、蛋白质组学、转录组学、生物医学、转化研究、蛋白质、癌症、核酸、毒物学研究、生物信息、生物计算、生命科学、生态、肿瘤、遗传、基因改造、细胞分化、微生物、生物医学大数据分析与挖掘、数学类专业、计算机科学、医学、疾病等研究的科研人员以及人工智能爱好者 。

培训目标(完全适合零基础)

深入学习与了解深度学习基本框架与逻辑,同时掌握基本的生物信息学软件(Linux、R、python等)的使用,让学员能更好的应对基因组数据,挖掘出超越已有知识的新知识。而构建好的深度学习模型去探求新的研究思路和寻找新的潜在生物学机制,更好的服务于自身的科学研究和探索的过程中。同时,学习已经发表的高分文章结构和数据,掌握深度学习和基因组学之间的关联关系和分析思路及方法技巧,在多组学数据的基础上,熟练应用深度学习算法和应用,让学员能够在学习理论知识的同时熟悉代码实操,帮助科研工作者利用已有公共数据库挖掘数据,独自完成自己的课题研究项目。

深度进行单细胞及空间转录组学的讲解和实操,让学员能够掌握单细胞及空间组学深度的课题设计思路及分析流程,系统学习理论知识及熟悉软件代码实操,数据挖掘、文章的复现,学会单细胞及空间组学数据的细胞鉴定、差异分析、功能富集、转录因子、拟时序分析、细胞通讯、双细胞鉴定、CNV推断等,熟练掌握这些分析模块的分析软件和参数使用等。

CADD计算机辅助药物设计设计流程:让学员能够掌握包括PDB数据库、靶点蛋白、蛋白质-配体、蛋白-配体小分子、蛋白-配体结构、notepad的介绍和使用、分子对接、蛋白-配体对接、虚拟筛选、蛋白-蛋白对接、蛋白-多糖分子对接、蛋白-水合对接、Linux安装、gromacs分子动力学全程实操、溶剂化分子动力学模拟等

助力学员发表Nature、Science、Cell等正刊及子刊杂志!

培训特色

1、课程特色--全面的课程技术应用、原理流程、实例联系全贯穿

2、学习模式--理论知识与上机操作相结合,让零基础学员快速熟练掌握

3、课程服务答疑--主讲老师将为您实际工作中遇到的问题提供专业解答

培训讲师

主讲老师来自国内高校陈老师授课。在国内外学术刊物发表论文数篇,包括Nature Communication, Cell Regeneration等知名期刊,研究方向为生物信息学,发育生物学和遗传学等。利用多组学数据,通过深度学习算法进行数据分析和挖掘,包括ChIP-seq,ATAC-seq,RNA-seq,CNV等。

主讲老师来自知名985高校,在Nature、Cell等系列杂志发表SCI论文60余篇,在肿瘤、发育、免疫、神经等多领域均有高分文章发表,知识不可谓不渊博,因此可为各研究方向老师提供有效的课题建议和分析方案。承担国家科技部、国家自然基金委和重点研发计划等多项课题。目前与多位国内院士团队和国外顶级实验室合作,已培训学员数千名,成功带领大家系统学习单细胞、空间、表观组学及基因组学等生信知识和技能,并指导多位学员发表CNS系列文章。

课表内容

(一)深度学习在基因组学应用专题培训

第一天

深度学习基础

理论部分

深度学习基础

1.有监督学习中主要的神经网络算法

1.1全连接网络

1.2深度卷积

1.3循环卷积

1.4图卷积

2.多任务学习

3.多模态学习

4.迁移学习

5.非监督学习方法:自动编码器和生成对抗网络

实操内容

1.R语言基础

2.R(4.1.3)和Rstudio的安装

3.R包安装和环境搭建

4.数据结构和数据类型

第二天

深度学习在基因组学中的应用

理论部分

1.深度学习在基因组学中的应用

2.决策树算法

3.随机森林算法

4.支持向量机(SVM)算法简介

5.朴素贝叶斯

6.Xgboost

7.主成分分析PCA算法

8.聚类算法

9.DBSCAN算法

10.层次聚类算法

实操内容

1.Linux操作系统

1.1 Linux操作系统的安装与设置

1.2 网络配置与服务进程管理

1.3 Linux的远程登录管理

1.4 常用的Linux命令

1.5 在Linux下获取基因数据

1.6 利用Linux 探索基因组区域

1.7 Shell script与Vim编辑器

1.8 基因组文件下载与上传

1.9 Linux权限管理

2.文件的身份

3.修改文件的所有者和所属组

4.修改文件权限

第三天

1.卷积神经网络在基因组中的应用

2.循环神经网络在基因组中的应用

理论部分

1.功能基因组

2.结构基因组

3.表观基因组

4.基因组数据库

5.基因表达

实操内容

1.基因组环境搭建

2.Jupyter notebook的使用

3.Python语言基础

4.卷积神经网络在基因组中的应用

5.循环神经网络在基因组中的应用

第四天

(Nature等顶刊复现)

1.DNA甲基化预测

2.RNA结合预测

3.RNA二级结构预测

4.肿瘤RNA表达水平预测

理论部分

1.数据表示

2.张量运算

3.神经网络中的“层”

4.由层构成的模型

5.损失函数与优化器

6.数据集分配

7.过拟合与欠拟合

8.基因组常用深度学习框架

9.Keras

9.1 Tensorflow

9.2 PyTorch

9.3 Caffe

9.4 Theano

9.5 CNTK

9.6 MXNet

9.7 PaddlePaddle

9.8 Deeplearning4j

9.9 ONNX

实操内容

1.DNA甲基化预测

2.RNA结合预测

3.RNA二级结构预测

4.肿瘤RNA表达水平预测

5.Pre-mRNA的m6A修饰预测

6.蛋白亚细胞定位预测

(实操通过复现多篇Nature等顶刊 讲解代码,跑代码,助力学员发高分文献)

(二) 单细胞及空间转录组设计与分析课表内容

第一天

单细胞测序技术与应用

理论内容:

1.单细胞组学技术的发展和原理。

2.单细胞在各个科研领域的应用。

3.单细胞高分文章分析思路解析(细胞群鉴定、拟时序分析、差异表达、功能富集、转录因子、细胞通讯等)。

4.单细胞组学分析常用数据库介绍及使用。

实操内容:

1. 常规基础Linux命令入门讲解及实操训练。

2. R语言简介及安装,RStudio的安装及使用说明。

3. R语言语法介绍及常用命令。

4. 数据处理功能及统计应用。

5. R语言画图实操:小提琴图,箱型图,火山图,热图,网络图,GO、KEGG富集图,GSEA等图形绘制。

第二天

单细胞转录组数据分析思路及流程以及数据分析实操

理论内容:

1. 单细胞实验处理、建库及测序。

2. 单细胞转录组比对、定量、分群及拟时间分析等分析思路。

3. 单细胞转录组转录因子及功能通路解析。

4. 单细胞组学技术在癌症、发育、免疫及在植物、微生物等领域的研究内容及思路。

实操内容:

1. 10X官方单细胞软件Cellranger讲解及实操。

2.从基因表达矩阵开始到marker基因筛选全过程讲解及实操。

3.单细胞数据质控、归一化处理、PCA降维、聚类、tSNE、UMAP可视化。

4.单细胞转录组细胞类型鉴定及功能分析。

5.单细胞转录组差异分析。

6. 通过Seurat 合并多样本及消除样本异质性。

第三天

单细胞转录组轨迹、通路、转录因子等分析及绘图实操

实操内容:

1. 通过Monocle软件进行单细胞转录组拟时间分析。

2. 通过DAVID及metascape网站进行通路富集分析。

3. 通过GSVA计算细胞通路得分信号等。

4. 通过cellphonedb进行细胞互作分析。

5. 通过infercnv推断染色体拷贝数变异。

6. 通过SCENIC软件进行转录因子预测分析。

理论内容:

1. 空间转录组技术发展历程和原理介绍。

2. 空间转录组技术在科研领域的应用。

3. 近年空间转录组CNS文章思路解析。

4. 空间转录组文章常见图表解读。

5. 空间转录组技术在癌症、发育、神经科学及在植物等领域的研究内容及思路。

第四天

1.空间转录组数据比对、降维及聚类等分析2.空间转录组多样本及与单细胞数据关联分析

实操内容:

1. 10x Visium 组织优化及文库制备。

2. 10x Visium官方分析软件Space Ranger讲解及实操。

3. Space Ranger输出结果解读。

4. Loupe Browser软件安装及使用。

5. 通过Seurat软件进行降维、聚类和可视化。

6. 通过Seurat进行基因表达可视化。

理论 实操内容

1. 通过Seurat进行空间变量特征的识别。

2. 与单细胞数据关联分析(空间细胞类型定义)

3. 通过Seurat处理多个切片。

4. 单细胞及空间转录组数据分析总结。

5. 归纳总结零成本单细胞和空间转录组数据挖掘思路。

6. 单细胞及空间转录组基金申请思路、准备内容及注意事项等。

部分案例图片:

(三)CADD计算机辅助药物设计课表内容

第一天

上午

背景与理论知识以及工具准备

1.PDB数据库的介绍和使用

1.1数据库简介

1.2靶点蛋白的结构查询与选取

1.3靶点蛋白的结构序列下载

1.4靶点蛋白的下载与预处理

1.5批量下载蛋白晶体结构

2.Pymol的介绍与使用

2.1软件基本操作及基本知识介绍

2.2蛋白质-配体相互作用图解

2.3蛋白-配体小分子表面图、静电势表示

2.4蛋白-配体结构叠加与比对

2.5绘制相互作用力

3.notepad的介绍和使用

3.1 优势及主要功能介绍

3.2 界面和基本操作介绍

3.3插件安装使用

下午

一般的蛋白-配体分子对接讲解

1.对接的相关理论介绍

1.1分子对接的概念及基本原理

1.2分子对接的基本方法

1.3分子对接的常用软件

1.4分子对接的一般流程

2.常规的蛋白-配体对接

2.1收集受体与配体分子

2.2复合体预构象的处理

2.3准备受体、配体分子

2.4蛋白-配体对接

2.5对接结果的分析

以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例

第二天

虚拟筛选

1.小分子数据库的介绍与下载

2.相关程序的介绍

2.1 openbabel的介绍和使用

2.2 chemdraw的介绍与使用

3.虚拟筛选的前处理

4.虚拟筛选的流程及实战演示

案例:筛选新冠病毒主蛋白酶抑制剂

5.结果分析与作图

6.药物ADME预测

6.1ADME概念介绍

6.2预测相关网站及软件介绍

6.3预测结果的分析

第三天

拓展对接的使用方法

1.蛋白-蛋白对接

1.1蛋白-蛋白对接的应用场景

1.2相关程序的介绍

1.3目标蛋白的收集以及预处理

1.4使用算例进行运算

1.5关键残基的预设

1.6结果的获取与文件类型

1.7结果的分析

以目前火热的靶点PD-1/PD-L1等为例。

2.涉及金属酶蛋白的对接

2.1 金属酶蛋白-配体的背景介绍

2.2蛋白与配体分子的收集与预处理

2.3金属离子的处理

2.4金属辅酶蛋白-配体的对接

2.5结果分析

以人类法尼基转移酶及其抑制剂为例

3.蛋白-多糖分子对接

4.1蛋白-多糖相互作用

4.2对接处理的要点

4.3蛋白-多糖分子对接的流程

4.4蛋白-多糖分子对接

4.5相关结果分析

以α-糖苷转移酶和多糖分子对接为例

4.核酸-小分子对接

4.1核酸-小分子的应用现状

4.2相关的程序介绍

4.3核酸-小分子的结合种类

4.4核酸-小分子对接

4.5相关结果的分析

以人端粒g -四链和配体分子对接为例。

操作流程介绍及实战演示

第四天

拓展对接的使用方法

1.柔性对接

1.1柔性对接的使用场景介绍

1.2柔性对接的优势

1.3蛋白-配体的柔性对接

重点:柔性残基的设置方法

1.4相关结果的分析

以周期蛋白依赖性激酶2(CDK2)与配体1CK为例

2.共价对接

2.1两种共价对接方法的介绍

2.1.1柔性侧链法

2.1.2两点吸引子法

2.2蛋白和配体的收集以及预处理

2.3共价药物分子与靶蛋白的共价对接

2.4结果的对比

以目前火热的新冠共价药物为例。

3.蛋白-水合对接

3.1水合作用在蛋白-配体相互作用中的意义及方法介绍

3.2蛋白和配体的收集以及预处理

3.3对接相关参数的准备

重点:水分子的加入和处理

3.4蛋白-水分子-配体对接

3.5结果分析

以乙酰胆碱结合蛋白(AChBP)与尼古丁复合物为例

第五天

分子动力学模拟(linux与gromacs使用安装)

1. linux系统的介绍和简单使用

1.1 linux常用命令行

1.2 linux上的常用程序安装

1.3 体验:如何在linux上进行虚拟筛选

2.分子动力学的理论介绍

2.1分子动力学模拟的原理

2.2分子动力学模拟的方法及相关程序

2.3相关力场的介绍

3.gromacs使用及介绍

重点:主要命令及参数的介绍

4.origin介绍及使用

第六天

溶剂化分子动力学模拟的执行

1.一般的溶剂化蛋白的处理流程

2.蛋白晶体的准备

3.结构的能量最小化

4.对体系的预平衡

5.无限制的分子动力学模拟

6.分子动力学结果展示与解读

以水中的溶菌酶为例

第七天

蛋白-配体分子动力学模拟的执行

1.蛋白-配体在分子动力学模拟的处理流程

2.蛋白晶体的准备

3.蛋白-配体模拟初始构象的准备

4.配体分子力场拓扑文件的准备

4.1 高斯的简要介绍

4.2 ambertool的简要介绍

4.3生成小分子的力场参数文件

5.对复合物体系温度和压力分别限制的预平衡

6.无限制的分子动力学模拟

7.分子动力学结果展示与解读

8.轨迹后处理及分析

以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例

部分模型案例图片

授课时间地点

深度学习在基因组学应用专题培训

2022.10.22-2022.10.23 全天授课(上午09.00-11.30 下午13.30-17.00)

2022.10.29-2022.10.30 全天授课(上午09.00-11.30 下午13.30-17.00)

单细胞及空间转录组设计与分析培训

2022.10.27-2022.10.28晚上授课(晚上19.00-22.00)

2022.10.29-2022.10.30全天授课(上午09.00-11.30 下午13.30-17.00)

2022.11.1-2022.11.2(晚上19.00-22.00)

CADD计算机辅助药物设计专题培训班

2022.10.22 -----2022.10.23 全天授课(上午09.00-11.30 下午13.30-17.00)

2022.10.25-----2022.10.28 晚上授课(晚上19.00-22.00)

2022.10.29-----2022.10.30全天授课(上午09.00-11.30 下午13.30-17.00)

2022.10.31 -----2022.11.01晚上授课 (晚上19.00-22.00)

腾讯会议直播上课

报名费用

深度学习基因组学和单细胞及空间转录组设计与分析

公费价:每人每班¥4680元 (含报名费、培训费、资料费)

自费价:每人每班¥4280元 (含报名费、培训费、资料费)

(同时报名深度学习基因组学 单细胞及空间转录组设计与分析价格为:8680元)

CADD计算机辅助药物设计培训费用

公费价:每人每班¥5880元 (含报名费、培训费、资料费)

自费价:每人每班¥5480元 (含报名费、培训费、资料费)

优惠

优惠1:提前报名缴费学员 转发到朋友圈或者到学术交流群可享受每人300元优惠(仅限15名)

优惠2:同时报名两个班免费赠送一个班(单细胞及空间转录组、深度学习基因组学、计算机辅助药物设计三个课任意报两班免费赠送一个班学习)

优惠3: 报名五个培训班以上,免费赠送三个培训名额

证书:参加培训并通过考试的学员,可以申请获得工业和信息化部工业文化发展中心颁发的“工业强国建设素质素养提升尚工行动”岗位能力适应评测证书。该证书可在中心官网查询,可作为能力评价,考核和任职的重要依据。评测证书查询网址:www.miit-icdc.org(自愿申请,须另行缴纳考试费500元/人)

培训福利

报名缴费成功赠送报名班型全套预习视频,课后学习完毕提供全程录像视频回放,针对与培训课程内容进行长期答疑,微信解疑群永不解散,参加本次课程的学员可免费再参加一次本单位后期组织的相同的专题培训班(任意一期都可以)

授课方式

通过腾讯会议线上直播,理论 实操的授课模式,老师手把手带着操作,从零基础开始讲解800余页电子PPT和教程 预习视频开课前一周提前发送给学员,所有培训使用软件都会发送给学员,有什么疑问采取开麦共享屏幕和微信群解疑,学员和老师交流、学员与学员交流,培训完毕后老师长期解疑,培训群不解散,往期培训学员对于培训质量和授课方式一致评价极高

腾讯会议问题实时解答

报名咨询请扫描下方微信二维码

电子邮箱:y13838281574@163.com

QQ:3541871068

报名电话/微信13838281574

对此内容感兴趣可点击关注公众号!长期发布各种科研培训,及前沿资讯!

十、往期参会单位

有来自中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所)、中山大学、北京大学第一医院、中国医学科学院北京协和医院、西北民族大学、西南大学、山东大学、加州伯克利大学、启元实验室、中国人民解放军总医院第一医学中心、河南师范大学、南京工业大学、南方科技大学、南京大学、中国医学科学院基础医学研究所、青海省农林科学院、天津中医药大学第一附属医院、山东大学、黑龙江八一农垦大学、University of Bristol (布里斯托大学)、南昌大学第二附属医院、台州市中心医院(台州学院附属医院)、宁波大学附属人民医院、新疆农业大学、北京林业大学、广西医科大学、湖南文理学院、滨州医学院、滨州医学院烟台附属医院、华南师范大学、中国环境科学研究院、云南师范大学、昆明理工大学、湖北医药学院、苏州大学、福州大学、南方医院、南昌大学第二附属医院、深圳市中医院、湖南文理学院、河南科技学院、福建省立医院、中南大学湘雅医院、深圳市中医院、省立同德医院、内蒙古科技大学包头师范学院、乌鲁木齐市疾病预防控制中心、中国林业科学研究院林业研究所、中国农业科学院兰州畜牧与兽药研究所、鲁东大学、河北工程大学、南方医科大学珠江医院、首都医科大学附属北京妇产医院、重庆医科大学附属第二医院、北京普利智诚生物技术有限公司、复旦大学上海医学院、陕西中医药大学附属医院、中国医学科学院血液病医院(中国医学科学院血液学研究所)、滨州康达欣医疗器械有限公司、深圳北京大学香港科技大学医学中心、天津市肿瘤医院、陆军特色医学中心、空军军医大学第一附属医院、江南大学、中国科学院深圳先进技术研究院、中国科学院上海营养与健康研究所、北京阅众时刻文化传媒有限公司、北京慧康健怡医疗器械有限公司、杭州奥明基因科技有限公司、亦欣生物科技无锡有限公司、广州市肖悦生物科技有限公司、张家口泽涵生物科技有限公司、平安科技。感谢对我们培训的认可!还有许多因为时间冲突无法参加。这次我们诚挚邀请您来参加!

报名参会流程

引用往期参会学员的一句话:

发现真的是脚踏实地的同时 需要偶尔仰望星空

非常感谢各位对我们培训的认可! 祝愿各位学业事业有成!

0 人点赞