选择小众技术做同样的课题(事半功倍)

2023-09-04 16:06:42 浏览数 (1)

昨天我们diss了肿瘤外显子技术,很容易设计课题,任意肿瘤对象招募病人集齐样品送给公司进行肿瘤外显子测序即可,公司一般来说也会给出来somatic突变信息,包括SNV和CNV,甚至给出来发表级别的图表。详见:几乎不提供任何有用信息的肿瘤外显子你还做吗

实际上更应该diss的应该是单细胞技术,早期大家也是任意肿瘤对象招募病人集齐样品送给公司进行单细胞转录组,就是一个全新的 图谱研究,划时代的意义。中期就需要选择不同分级分期或者不同亚型的肿瘤或者不同疾病进展阶段的样品去试图找关键细胞亚群,晚期就更卷了,各种治疗前后各种复杂样品组成都需要慢慢的探索。而实际上这样的实验设计并没有任何新颖之处,都是两百年前老一辈生物学家玩剩下的的,唯一的创新点就是单细胞转录组技术,新瓶装旧酒。。。。

但是, 如果你手上还有的就是这样的朴实无华实验设计下的单细胞转录组,或者你时至今日还想着去单细胞转录组领域分一杯羹,我劝你还是放弃了,还不如选择小众技术做同样的课题(事半功倍),比如2022的文章:《CAMTA1 gene affects the ischemia-reperfusion injury by regulating CCND1

只需要一个简单的2分组甲基化芯片差异即可:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE197080

代码语言:javascript复制
GSM5908184 genomic DNA from healthy people 1 [ZXJ]
GSM5908185 genomic DNA from healthy people 2 [YXG]
GSM5908186 genomic DNA from healthy people 3 [ZSS]
GSM5908187 genomic DNA from ischemic stroke patients 1 [RWH]
GSM5908188 genomic DNA from ischemic stroke patients 2 [HM]
GSM5908189 genomic DNA from ischemic stroke patients 3 [ZM]

首先就是差异分析,然后从成百上千个差异位点里面挑选最重要的,然后再次纳入病人作为验证队列,这样的课题就结束了:

  • we used human methylation 850K BeadChip to analyze the differences in gene methylation status in the peripheral blood samples from two groups (3 IS patients vs. 3 healthy controls).
  • According to their bioinformatics profiling, we found 278 genes with significantly different methylation levels.
  • Seven genes with the most significant methylation modifications were validated in two expanded groups (100 IS patients vs. 100 healthy controls).

因为是朴实无华的差异分析,所以展现差异分析后的热图即可:

差异分析后的热图

当然了,因为作者定位到了CAMTA1这个基因 ,因为 CAMTA1 gene was the most highly methylated in patients compared to the controls.

所以又顺理成章做了一个转录组测序数据(RNA seq in wild-type and CAMTA1 KO cells),RNA seq in CAMTA1 KO SH-SY5Y以及HEK293T两个细胞系 ,也是很简单的差异分析 富集分析啦。

这个文章的数据有点多,GSE197080, GSE197081, and GSE205687,但是都是很容易理解的。

  • https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE197081
  • https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE205687

甲基化技术里面,whole-genome bisulfite conversion (WGBS) 是金标准,但是价格昂贵,数据处理消耗计算资源,而Reduced- representation bisulfite sequencing (RRBS) 和Methylated DNA Immunoprecipitation Sequencing (MeDIP-Seq),都是片面的,只有 MC Seq 克服了它们其它这些技术的缺点:

  • lower genome coverage (Infinium 450K或者850K),
  • high cost and processing time (WGBS),
  • overrepre- sentation of repeated (RRBS)
  • methylated regions (MeDIP- Seq).

甲基化芯片数据处理我是有视频课程的

首先需要阅读我在生信技能树的甲基化系列教程,目录如下

  • 01-甲基化的一些基础知识.pdf
  • 02-甲基化芯片的一般分析流程.pdf
  • 03-甲基化芯片数据下载的多种技巧.pdf
  • 04-甲基化芯片数据下载如何读入到R里面.pdf
  • 05-甲基化芯片数据的一些质控指标.pdf
  • 06-甲基化信号值矩阵差异分析哪家强.pdf
  • 07-甲基化芯片信号值矩阵差异分析的标准代码.pdf
  • 08-TCGA数据库的各个癌症甲基化芯片数据重新分析.pdf
  • 09-TCGA数据库的癌症甲基化芯片数据重分析.pdf
  • 10-TCGA数据辅助甲基化区域的功能研究.pdf
  • 11-按基因在染色体上的顺序画差异甲基化热图.pdf
  • 850K甲基化芯片数据的分析.pdf
  • 使用DSS包多种方式检验差异甲基化信号区域.pdf

然后就可以看我在B站免费分享的视频课程《甲基化芯片(450K或者850K)数据处理 》

  • 教学视频免费在:https://www.bilibili.com/video/BV177411U7oj
  • 课程配套思维导图:https://mubu.com/doc/1cwlFgcXMg

值得一提的是,现在甲基化芯片850K也升级为了935k,如果大家要选择这方面小众技术,就需要擦亮眼睛了哈, 因为小众所以很难找的好口碑或者说很难沟通到擅长这方面科研服务的公司。。。

其它小众技术:蛋白质组

比如甘肃农业大学的课题组,选取了健康奶牛(C组)和患乳腺炎奶牛的乳腺组织(HM组)然后进行蛋白质组后看差异,在Frontiers in Veterinary Science、Animals、International Journal of Molecular Sciences、Antioxidants、International Journal of Molecular Sciences上连发5篇文章。。。。

虽然是同一个数据集,蛋白质组定量和差异分析,通过设置参数FC>1.50、FDR<0.05,总共筛选出3739个差异富集蛋白(DEPs),其中2718个DEPs显著上调,1021个DEPs显著下调。

但是针对差异富集蛋白(DEPs)的解释,也就是生物学功能数据库注释(富集到GO和KEGG数据库中进行功能注释)后作者在不同的机制层面做文章:

  • 乳腺炎出血症状的分子机制(文章一)2022 Aug 8. doi:10.3389/fvets.2022.980963
  • 炎症反应与硫/H2S代谢的潜在联系(文章二)2022 Jun 4. doi:10.3390/ani12111451
  • 病原菌入侵宿主的感染致病过程(文章三) 2022 Sep 14. doi:10.3390/ijms231810717
  • 炎症反应与铁凋亡反应的潜在联系(文章四) 2022 Nov 11. doi:10.3390/antiox11112221
  • CTH/H2S Regulates LPS-Induced Inflammation through IL-8 Signaling in MAC-T Cells(文章五) 2022 Oct 5. doi:10.3390/ijms231911822

小众技术的缺点是几乎很难发CNS

当然了,这个缺点对绝大部分小伙伴来说都不是事情,因为对大家来说终其一生发CNS的可能性微乎其微了。但是对很多国际大计划来说,cns就跟大白菜一样的批发,比如TCGA计划,GTEX计划, 还有最近(2023年07月)的人类生物分子图谱计划(Human BioMolecular Atlas Program,HuBMAP),利用单细胞RNA测序、质谱分析、空间转录组学三维成像和人工智能等技术,对细胞结构进行了多维度观察。一下子就解析了肠道、肾脏与胎盘三个器官的单细胞与空间图谱,9篇齐发,Nature封面刊登。。。。

  • https://www.nature.com/articles/d41586-023-02348-4
  • https://www.nature.com/articles/s41586-023-05915-x
  • https://www.nature.com/articles/s41586-023-06298-9
  • https://www.nature.com/articles/s41586-023-05769-3
  • https://www.nature.com/articles/s41556-023-01194-w
  • https://www.nature.com/articles/s42003-023-04848-5
  • https://www.nature.com/articles/s41467-023-38975-8
  • https://www.nature.com/articles/s41592-022-01651-8
  • https://www.nature.com/articles/d41586-023-01817-0

如果你也想试水一些小众技术

除了转录组、基因组、蛋白质组和代谢组,还有一些偏小众的生物信息学数据产出技术,它们在特定研究领域或特殊实验设计中发挥着重要的作用。以下是一些偏小众的生物信息学数据产出技术:

  1. 脂质组学(Lipidomics): 脂质组学研究细胞和生物体内脂质分子的组成、结构和功能,揭示脂质代谢在生理和病理过程中的作用。通过质谱等技术,可以获得大量脂质分子的定量和定性信息。
  2. 甲基化组学(Methylomics): 甲基化组学研究DNA上的甲基化修饰,揭示DNA甲基化在基因表达调控和疾病发生中的作用。通过甲基化芯片或测序技术,可以获得DNA甲基化的全基因组分布信息。
  3. RNA修饰组学(Epitranscriptomics): RNA修饰组学研究RNA分子上的化学修饰,如甲基化、乙酰化等,探究RNA修饰在基因表达调控和疾病中的功能。通过高通量测序技术,可以获得全转录组的RNA修饰信息。
  4. 糖组学(Glycomics): 糖组学研究生物体内糖分子的结构、组成和功能,探究糖在生理和病理过程中的重要作用。通过质谱和色谱等技术,可以获得大量糖分子的定量和结构信息。
  5. 环状RNA组学(Circular RNAomics): 环状RNA组学研究环状RNA分子在细胞和组织中的表达和功能,揭示环状RNA在调控基因表达和细胞过程中的作用。通过高通量测序技术,可以获得全转录组的环状RNA信息。
  6. 小RNA组学(Small RNAomics): 小RNA组学研究细胞中的小RNA分子,如miRNA和siRNA,探究小RNA在基因调控和疾病发生中的功能。通过高通量测序技术,可以获得小RNA的表达谱和定量信息。

0 人点赞