测序过程和原理:测序的世界
知识框架
- 测序原理
- 早期测序方法:基于逐个“数”碱基的方法。
- Sanger测序法:利用双脱氧核苷酸ddNTPs中断DNA合成。
- 二代测序技术
- Illumina平台:基于边合成边测序的原理。
- 测序过程:包括DNA文库构建、桥式PCR扩增、测序和数据产出。
- 数据处理:重要性及其在生物信息学中的应用。
- 技术发展
- 从Sanger测序到二代测序:技术进步和应用范围的扩大。
- 未来发展:测序技术的潜在发展方向和应用。
思考点
- 测序技术的演变:从早期的Sanger测序到现代的二代测序技术,这些技术是如何演变的?
- 数据处理的重要性:在生物信息学中,为什么正确处理和解读测序数据如此重要?
- 未来发展:测序技术未来可能的发展方向是什么?
引文总结1:测序技术原理及常用数据格式简介
一代测序技术
- 发明年份:1977年
- 原理:使用双脱氧核苷酸末端终止法
- 特点:
- 读长长(1000 bp)
- 准确性高(99.999%)
- 通量低
二代测序技术
- 发展背景:为满足更高效率和低成本的需求而发展
- 代表技术:
- Roche的454技术
- Illumina的Solexa技术
- Life technologies的SOLiD技术
- 原理:边合成边测序(Sequencing by Synthesis)
- 特点:
- 通量高
- 时间短
- 读长短
三代测序技术
- 主流技术:
- Pacific Biosciences的SMRT技术
- Oxford Nanopore Technologies的纳米孔单分子技术
- 原理:
- SMRT技术:边合成边测序,使用4色荧光标记碱基
- 纳米孔技术:电信号检测
- 特点:
- 无需PCR扩增
- 读长长
- 无视GC含量的影响
常用数据格式介绍
- Fastq格式:包含序列ID、碱基序列、质量评价等信息
- Fasta格式:以“u003e”开头,包含序列ID、描述、碱基序列
- 转换方法:
- Linux命令
- 法1:
sed '/^@/!d;s//>/;N' your.fastq > your.fasta
- 法2:
seqtk seq -A input.fastq > output.fasta
- 法1:
- FASTX-Toolkit
- Linux命令
- GenBank和EMBL格式:两种主要的序列数据库格式
引文总结2:DNA 测序技术的发展:第三代测序法
第三代测序技术的多样性
- 第三代测序技术发展方向多样,难以用一个简单的名称概括。
- 目标包括提高测序效率、通量、准确率,避免PCR扩增和荧光检测。
具体技术和方法
- PacBio 实时单分子测序
- 边合成边测序方法。
- 使用四种荧光标记的dNTPs。
- 通过荧光变化判断碱基类型。
- 零模波导纳米孔用于单一链合成反应。
- Complete Genomics 的复合探针-锚定连接技术 (cPAL)
- 类似于升级版的SOLiD系统,更复杂。
- 一次性结合9个碱基,第五个碱基确定为A、T、C或G。
- Oxford Nanopore 纳米孔单分子测序技术
- 电信号检测,非荧光信号。
- 设计允许单个碱基通过的蛋白纳米通道。
- Ion Torrent 电子流检测技术
- 不使用荧光检测。
- 检测合成过程中释放的离子流。
第三代测序技术的未来前景
- 朝着单分子测序发展,目标是小规模化、精准化、高效化。
- 基因组测序成本降至1000美元以下时,将迎来解密基因的时代。
思考点
- 技术创新:第三代测序技术相比前两代的技术创新。
- 应用前景:第三代测序技术在未来医学和生物学研究的变革。
- 成本效益:基因组测序成本降低对科学研究和临床应用的影响。