还在使用GenomeStudio /APTtools在转换微阵列芯片原始数据格式?Linux全自动化方案——gtc2vcf

2022-03-08 13:54:18 浏览数 (1)

Illumina刚开始的时候 很多东西是在windows下开发的,Linux下的软件一开始并不那么成熟(比如bcl2fastq早期是使用perl生成makefile,然后makefile调用核心程序make -j n来实现多进程并行任务)。

在Illumina收购Solexa之前,SNParray其实是Illumina早期的看家技术。SNParray数据下机是idat格式,需要在windows平台上导入GenomeStudio软件,做Genotyping,转换成基因型的格式,可选导出vcf格式,然后再导入Linux平台下做一系列的转换和注释,最终用于科研、临床或DtoC基因检测应用等领域。

bcf/vcf是工业标准的点突变存储格式,但绝大部分操作这个格式的工具是运行在Linux系统下的。为了解决需要在不同操作系统之间导数据的烦恼,国外友人开发了一个不错的解决方案,用这个方案我们就可直接把原始数据从iScan扫描仪拷贝/传输到服务器上,所有数据处理就可在一个操作系统平台上运行。

github地址:https://github.com/freeseek/gtc2vcf

有了这个工具后,SNParray数据转格式、方向转换、过滤、注释、导入数据库等操作就可全流程自动化,让您的SNParray数据分析更加工业化。值得一提的是这个工具还支持Affymetrix平台的数据转换,Affymetrix平台的小伙伴们也可受益。

本人已亲测可用,过程比较复杂,欢迎一起探讨

0 人点赞