ZINC

2021-02-04 11:18:53 浏览数 (1)

介绍

>ZINC数据库,虚拟筛选必备数据库之一。分为ZINC12和ZINC15,这次以ZINC15版为例进行介绍。这是一个免费的商业化合物虚拟筛选数据库。ZINC包含超过7.5亿种可购买的化合物,其中,2.3亿化合物是即下即用的3D格式文件。ZINC由加州大学旧金山分校(UCSF)药物化学系的Irwin和Shoichet实验室提供和维护支持。网址:http://zinc15.docking.org/

看法:

>根据上面所述,ZINC是一个优秀的虚拟筛选化合物库,其主要是商家化合物库的集合,这样就在一定程度上避免了药物无法购买的状况。但是只是一定程度,因为,为ZINC中的商业化合物库是国外商家的库的集合,所以国内的话还是会有一些药物无法购买。同时他提供的3D格式分子文件下载,可以为虚拟筛选提供很大的便利,但同时也要注意,3D格式文件中包含着多少冗余,化合物盐合形式等等。

如何下载:

>别的功能先放在一边,毕竟大家的第一目的就是下载化合物库进行虚拟筛选的。所以,这次主要讲讲如何下载ZINC的化合物库,其余功能有时间再更新。

(1)这是ZINC15的主界面

(2)点击红框里面的Tranches

需要注意的大体上是这三个按钮

(3)下载一个Drug_like库,点击9宫格一样的按钮,点击Drug-Like

然后点击9宫格旁边的那个下载的按钮

这个按钮是选择下载的不同格式,SMI,2D,3D,看需下载, 因为我这次是介绍,我选择SMILES格式。

Raw URLs是选择下载的不同的方式。里面有各种方式URL,cURL,WGET,Powershell。一般到这里就方了,别急,一个一个来。

首先,我把这些全部下载下载。

重点: 先介绍我的系统,win10,如果win下不能下载,我会直接上linux。

(1)curl 文本内容:linux下我就直接sh了,win下的话,在你电脑上有curl的前提下,把这个文件的后缀名改为bat,然后双击运行就是这么简单。

代码语言:javascript复制
curl --remote-time --fail -o BAAA.smi http://files.docking.org/2D/BA/BAAA.smi
curl --remote-time --fail -o BAAB.smi http://files.docking.org/2D/BA/BAAB.smi
curl --remote-time --fail -o BAAC.smi http://files.docking.org/2D/BA/BAAC.smi
curl --remote-time --fail -o BAAD.smi http://files.docking.org/2D/BA/BAAD.smi
curl --remote-time --fail -o BABA.smi http://files.docking.org/2D/BA/BABA.smi
curl --remote-time --fail -o BABB.smi http://files.docking.org/2D/BA/BABB.smi
curl --remote-time --fail -o BABC.smi http://files.docking.org/2D/BA/BABC.smi
curl --remote-time --fail -o BABD.smi http://files.docking.org/2D/BA/BABD.smi

效果;

(2)powershell 文本内容:

代码语言:javascript复制
Invoke-WebRequest http://files.docking.org/2D/BA/BAAA.smi -OutFile BA/BAAA.smi
Invoke-WebRequest http://files.docking.org/2D/BA/BAAB.smi -OutFile BA/BAAB.smi
Invoke-WebRequest http://files.docking.org/2D/BA/BAAC.smi -OutFile BA/BAAC.smi
Invoke-WebRequest http://files.docking.org/2D/BA/BAAD.smi -OutFile BA/BAAD.smi
Invoke-WebRequest http://files.docking.org/2D/BA/BABA.smi -OutFile BA/BABA.smi

下载:这个使我最不喜欢的方式,下载步骤太多。打开powershell,将后缀为powershell的文件重命名为ps

1.然后再powershell模式下启动,命令行为

代码语言:javascript复制
.ZINC-downloader-2D-smi_test.ps1 

然后开始下载

(3)wget 文本内容:linux下我就直接sh了,win下的话,在你安装好wget的前提下,把这个文件的后缀名改为bat,然后双击运行就是这么简单。

代码语言:javascript复制
wget http://files.docking.org/2D/BA/BAAA.smi -O BAAA.smi
wget http://files.docking.org/2D/BA/BAAB.smi -O BAAB.smi
wget http://files.docking.org/2D/BA/BAAC.smi -O BAAC.smi
wget http://files.docking.org/2D/BA/BAAD.smi -O BAAD.smi
wget http://files.docking.org/2D/BA/BABA.smi -O BABA.smi
wget http://files.docking.org/2D/BA/BABB.smi -O BABB.smi
wget http://files.docking.org/2D/BA/BABC.smi -O BABC.smi
wget http://files.docking.org/2D/BA/BABD.smi -O BABD.smi
wget http://files.docking.org/2D/BA/BACA.smi -O BACA.smi

效果:下了一部分就被我掐了。

(4)url 文件内容:

代码语言:javascript复制
http://files.docking.org/2D/BA/BAAA.smi
http://files.docking.org/2D/BA/BAAB.smi
http://files.docking.org/2D/BA/BAAC.smi
http://files.docking.org/2D/BA/BAAD.smi
http://files.docking.org/2D/BA/BABA.smi
http://files.docking.org/2D/BA/BABB.smi
http://files.docking.org/2D/BA/BABC.smi
http://files.docking.org/2D/BA/BABD.smi
http://files.docking.org/2D/BA/BACA.smi

下载方式:你随便复制一个,粘贴到浏览器,就可以下载。

(5)database_index就是一个序列号,可能爬虫的话,可以按照这种方式下载。太麻烦,弃掉 文件内容:

代码语言:javascript复制
BA/BAAA.smi
BA/BAAB.smi
BA/BAAC.smi
BA/BAAD.smi

0 人点赞