简单介绍
耶鲁大学Krishnaswamy Lab 致力于计算机科学、应用数学、计算生物学和信号处理的交叉应用,开发能够从大型生物医学数据集中进行探索性分析、科学推理和预测的表征学习和深度学习方法。已经在各种生物、细胞和疾病系统的单细胞RNA测序、fMRI和电子健康记录生成的数据集上验证了他们的方法。我们的技术通常将来自图谱理论、manifold learning、信号处理和拓扑的数学先验融入到机器学习和深度学习框架中,以便忠实地对底层系统进行去噪和建模,以获得预测性的洞察力。目前,我们的方法被广泛应用于数据去噪、可视化、建模、动力学等领域。
关于课程
本研讨会的目的是揭开单细胞分析背后的复杂性。学员将学习分析单细胞数据集的实用技能,并对每种方法背后的机器学习基础有一个概念性的理解。学员还将了解单细胞分析领域的新兴趋势,如深度学习。
每天,学员都会听到具有开发和应用单细胞方法经验的教师的讲课,然后以 10:1 的学生:讲师比例进行强化动手实验室课程。在这些实验环节中,参与者将以小组形式分析真实的单细胞数据集。研讨会将包括自带数据课程,学生们将有机会带来他们自己的实验数据集(或使用我们提供的数据集),并与学生和教师就他们的项目进行合作。
课程结束时,学生将:
- 了解单细胞实验的常见工作流程
- 能够应用常用的机器学习方法分析单细胞数据
- 把握方法选择和参数选择对分析的影响
- 为探索单细胞文献奠定基础
课程格式
2021年1月的研讨会将完全使用Zoom和Slack在线授课。 课程持续两周以上,每天以讲座开始,然后分成两组,在小组中,将学习如何应用机器学习方法来分析真实的单细胞数据。为了课程顺利,将利用Slack和Zoom授课,并配备有经验的助教。
教学大纲
注明
课程链接:https://www.krishnaswamylab.org/workshop 。不过目前这个课程的申请注册目前已经结束,但是完整的课件在:https://github.com/KrishnaswamyLab/SingleCellWorkshop 大家感兴趣的话可以自行访问,跟着这份教材学习。
写在最后
其实资料很多,关键是要静下心来打好编程基础。不要还没入门就想着做高级分析。所以我们一再强调生物信息学数据分析学习过程的计算机基础知识的打磨,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理:
- 《生信分析人员如何系统入门R(2019更新版)》
- 《生信分析人员如何系统入门Linux(2019更新版)》
把R的知识点路线图搞定,如下:
- 了解常量和变量概念
- 加减乘除等运算(计算器)
- 多种数据类型(数值,字符,逻辑,因子)
- 多种数据结构(向量,矩阵,数组,数据框,列表)
- 文件读取和写出
- 简单统计可视化
- 无限量函数学习
Linux的6个阶段也跨越过去 ,一般来说,每个阶段都需要至少一天以上的学习:
- 第1阶段:把linux系统玩得跟Windows或者MacOS那样的桌面操作系统一样顺畅,主要目的就是去可视化,熟悉黑白命令行界面,可以仅仅以键盘交互模式完成常规文件夹及文件管理工作。
- 第2阶段:做到文本文件的表格化处理,类似于以键盘交互模式完成Excel表格的排序、计数、筛选、去冗余,查找,切割,替换,合并,补齐,熟练掌握awk,sed,grep这文本处理的三驾马车。
- 第3阶段:元字符,通配符及shell中的各种扩展,从此linux操作不再神秘!
- 第4阶段:高级目录管理:软硬链接,绝对路径和相对路径,环境变量。
- 第5阶段:任务提交及批处理,脚本编写解放你的双手。
- 第6阶段:软件安装及conda管理,让linux系统实用性放飞自我。