well,我们很多基本的操作都属于I/O流
假设你只是一个黑盒子用户的话,大概只需要调取参数,获取自己所需的文件然后进行下一步操作即可
我们现在就来看下python的I/O流
1.读取一个文件
我们以1stp.pdb这个蛋白为例
下载地址在这里:http://www.rcsb.org/structure/1STP
代码语言:javascript复制# 我们可以直接使用python自带的函数打开In [1]: f = open('1stp.pdb','r')
其基本形式为
代码语言:javascript复制 f = open(文件名,打开模式)
各个参数的细节如下: - 文件名:文件名是一个字符串值。 - 打开模式:只读(r),写入(w),追加(w )等。
这里有一份来源于菜鸟教程的,使用不同模式打开文件的说明
当然,你并不需要全文背诵,只需要知道几个常用值就好:
模式 | 描述 |
---|---|
t | 文本模式 (默认)。 |
x | 写模式,新建一个文件,如果该文件已存在则会报错。 |
b | 二进制模式。 |
| 打开一个文件进行更新(可读可写)。 |
U | 通用换行模式(Python 3 不支持)。 |
r | 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 |
rb | 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。 |
r | 打开一个文件用于读写。文件指针将会放在文件的开头。 |
rb | 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。 |
w | 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb | 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
w | 打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb | 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
a | 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
ab | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
a | 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。 |
ab | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。 |
在我们打开文本对象之后,下一步该做的就是提取字符串
代码语言:javascript复制In [4]: f_str = f.read()In [5]: f_str[:300]Out[5]: 'HEADER BIOTIN BINDING PROTEIN 12-MAR-92 1STP nTITLE STRUCTURAL ORIGINS OF HIGH-AFFINITY BIOTIN BINDING TO STREPTAVIDIN nCOMPND MOL_ID: 1; nCOMPND 2 MOLECULE: STREPTAVIDIN COMPLEX WITH BIOTIN; '
当执行完成操作之后记得要关闭此对象
代码语言:javascript复制In [6]: f.close()
此时,你便获取了一部分文字
现在就可以对其进行编辑,增加删除,然后输出
此时,我们需要再次打开一个写入对象
代码语言:javascript复制In [6]: f_new = open('out.pdb','w')
In [7]: f_new.write(f_str)Out[7]: 119232 # 关闭对象In [9]: f_new.close()
当然file对象也有很多其余的常用函数
仍然是来源于菜鸟教程
序号 | 方法及描述 |
---|---|
1 | file.close()关闭文件。关闭后文件不能再进行读写操作。 |
2 | file.flush()刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。 |
3 | file.fileno()返回一个整型的文件描述符(file descriptor FD 整型), 可以用在如os模块的read方法等一些底层操作上。 |
4 | file.isatty()如果文件连接到一个终端设备返回 True,否则返回 False。 |
5 | file.next()Python 3 中的 File 对象不支持 next() 方法。返回文件下一行。 |
6 | file.read([size])从文件读取指定的字节数,如果未给定或为负则读取所有。 |
7 | file.readline([size])读取整行,包括 "n" 字符。 |
8 | file.readlines([sizeint])读取所有行并返回列表,若给定sizeint>0,返回总和大约为sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。 |
9 | file.seek(offset[, whence])移动文件读取指针到指定位置 |
10 | file.tell()返回文件当前位置。 |
11 | file.truncate([size])从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;截断之后后面的所有字符被删除,其中 windows 系统下的换行代表2个字符大小。 |
12 | file.write(str)将字符串写入文件,返回的是写入的字符长度。 |
13 | file.writelines(sequence)向文件写入一个序列字符串列表,如果需要换行则要自己加入每行的换行符。 |