文件操作(上篇)
文件概念
磁盘(硬盘)上的⽂件是文件。
如果没有⽂件,我们写的程序的数据是存储在电脑的内存中,如果程序退出,内存回收,数据就丢失了,等再次运⾏程序,是看不到上次程序的数据的,如果要将数据进⾏持久化的保存,我们可以使⽤⽂件。
文件分类
在程序设计中,我们⼀般谈的⽂件有两种:程序⽂件、数据⽂件(从⽂件功能的⻆度来分类的)。
程序文件
程序⽂件包括源程序⽂件(后缀为.c),⽬标⽂件(windows环境后缀为.obj),可执⾏程序(windows 环境后缀为.exe)。
数据文件
⽂件的内容不⼀定是程序,⽽是程序运⾏时读写的数据,⽐如程序运⾏需要从中读取数据的⽂件,或者输出内容的⽂件。
本篇我们讨论的是数据文件
在大多数处理数据的输⼊输出都是以终端为对象的,即从终端的键盘输⼊数据,运⾏结果显⽰到显⽰器上。 其实有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使⽤,这⾥处理的就是磁盘上⽂件。
根据数据的组织形式,数据⽂件被称为⽂本⽂件或者⼆进制⽂件。
二进制文件
数据在内存中以⼆进制的形式存储,如果不加转换的输出到外存的⽂件中,就是⼆进制⽂件。
文本文件
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的⽂件就是⽂本⽂件
⼀个数据在⽂件中是怎么存储的呢? 字符⼀律以ASCII形式存储,数值型数据既可以⽤ASCII形式存储,也可以使⽤⼆进制形式存储。
如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占⽤5个字节(每个字符⼀个字节),⽽ ⼆进制形式输出,则在磁盘上只占4个字节。
文件路径
这里介绍的都是Windows系统下的
绝对路径
绝对路径,是从盘符开始的
使用反斜杠
例如data.txt是存放在C:codeday1的目录下的,那这个文件的绝对路径就是C:codeday1data.txt
相对路径
使用正斜杠/
对于data.txt:
- 向上一级目录指向:
- ./表示当前路径,./相当于C:codeday1,例如file文件和data位于同一目录下,通过data文件要引用file就可以用./file.txt(可以省略不写./)
../
表示当前路径的上一级路径,../
相当于C:code .../
../
表示当前路径上上一级路径,相当于C:
- 向下一级目录指向
- ./data表示当前路径的下一级路径,相当于C:codeday1data,例如我们要表示data文件夹里的file文件,就可以用./data/file.txt
- ./data/xxx,表示的就是下下一级路径
文件打开和关闭
流和标准流
- 流
我们程序的数据需要输出到各种外部设备,也需要从外部设备获取数据,不同的外部设备的输⼊输出操作各不相同,为了⽅便程序员对各种设备进⾏⽅便的操作,我们抽象出了流的概念我们可以把流想象成流淌着字符的河。 C程序针对⽂件、画⾯、键盘等的数据输⼊输出操作都是通过流操作的。
⼀般情况下,我们要想向流⾥写数据,或者从流中读取数据,都是要打开流,然后操作。
其实就是不同外部设备写入和读取数据操作不一样,就创建了一个中介,这就是流,我们程序员只需要关注如何向流中读取和写入,至于流怎么通过不同方式和外部设备建立联系我们不用关心 对于之后向文件中写入或者从文件中读取数据都是指对于流的操作
- 标准流
那为什么我们从键盘输⼊数据,向屏幕上输出数据,并没有打开流呢? 那是因为C语⾔程序在启动的时候,默认打开了3个流:
- stdin-标准输⼊流,在⼤多数的环境中从键盘输⼊,scanf函数就是从标准输⼊流中读取数据。
- stdout-标准输出流,⼤多数的环境中输出⾄显⽰器界⾯,printf函数就是将信息输出到标准输出 流中。
- stderr-标准错误流,⼤多数环境中输出到显⽰器界⾯。
这是默认打开了这三个流,我们使⽤scanf、printf等函数就可以直接进⾏输⼊输出操作的。 stdin、stdout、stderr三个流的类型是: FILE*
,通常称为⽂件指针。 C语⾔中,就是通过 FILE*
的⽂件指针来维护流的各种操作的
文件指针
缓冲⽂件系统中,关键的概念是“⽂件类型指针”,简称“⽂件指针”。
每个被使⽤的⽂件都在内存中开辟了⼀个相应的⽂件信息区,⽤来存放⽂件的相关信息(如⽂件的名字,⽂件状态及⽂件当前的位置等)。这些信息是保存在⼀个结构体变量中的。该结构体类型是由系统声明的,取名FILE.
每当打开⼀个⽂件的时候,系统会根据⽂件的情况⾃动创建⼀个FILE结构的变量,并填充其中的信息,使⽤者不必关⼼细节。
⼀般都是通过⼀个FILE的指针来维护这个FILE结构的变量,这样使⽤起来更加⽅便。
代码语言:javascript复制FILE* pf;//⽂件指针变量
定义pf是⼀个指向FILE类型数据的指针变量。可以使pf指向某个⽂件的⽂件信息区(是⼀个结构体变量)。通过该⽂件信息区中的信息就能够访问该⽂件。也就是说,通过⽂件指针变量能够间接找到与它关联的⽂件。
打开文件和关闭文件
⽂件在读写之前应该先打开⽂件,在使⽤结束之后应该关闭⽂件。
在编写程序的时候,在打开⽂件的同时,都会返回⼀个FILE*的指针变量指向该⽂件,也相当于建⽴了指针和⽂件的关系。
ANSIC规定使⽤ fopen
函数来打开⽂件, fclose
来关闭⽂件。
//打开⽂件
FILE * fopen ( const char * filename, const char * mode );
//关闭⽂件
int fclose ( FILE * stream );
mode表⽰⽂件的打开模式,下⾯都是⽂件的打开模式:
都是英文单词缩写,很好记的
- 注意:如果不写路径只写名字,默认是在当前程序文件(.c文件)所在目录下打开或创建,若果需要在其他路径下,就需要使用相对路径或者绝对路径
- 在使用绝对路径时用
\
,这是防止转义字符
FILE *fp = fopen("C:\User\Desktop\data.txt","r"); // 路径名称要正确
代码语言:javascript复制/* fopen fclose example */
#include <stdio.h>
int main ()
{
FILE * pFile;
//打开⽂件
pFile = fopen ("myfile.txt","w");
//⽂件操作
if (pFile!=NULL)
{
fputs ("fopen example",pFile);
//关闭⽂件
fclose (pFile);
}
return 0;
}
文件的顺序读写
fputc和fgetc
- 其实就是比putchar和getchar的对象从标准输入输出流多了个文件的输入输出流,其他例如返回值类型等都是一样的,就是参数多了个流
- 读取或写入成功返回字符ASCII码,否则返回EOF
int main()
{
int ch = fgetc(stdin);//从键盘(标准输入流)上读取
fputc(ch, stdout);//将字符输出(写)到屏幕(标准输出流)
return 0;
}
- 向文件中写字符
int main()
{
FILE*pf = fopen("test.txt", "w");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//写文件
int i = 0;
for (i = 'a'; i <= 'z'; i )
{
fputc(i, pf);
}
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
- 从文件中读字符
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//读文件
int ch = fgetc(pf);
printf("%cn", ch);
ch = fgetc(pf);
printf("%cn", ch);
ch = fgetc(pf);
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
//循环直至遇到文件末尾
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//读文件
int ch = 0;
while ((ch = fgetc(pf)) != EOF)
{
printf("%c ", ch);
}
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
文件拷贝
下面用fgetc和fputc来实现文件的拷贝:
代码语言:javascript复制int main()
{
//打开文件
FILE* pfread = fopen("test1.txt", "r");
if (pfread == NULL)
{
perror("fopenn");
return 1;
}
FILE* pfwrite = fopen("test2.txt", "w");
if (pfwrite == NULL)
{
perror("fopenn");
fclose(pfread);
return 1;
}
//读/写文件
int ch = 0;
while ((ch = fgetc(pfread)) != EOF)
{
fputc(ch, pfwrite);
}
//关闭文件
fclose(pfread);
pfread = NULL;
fclose(pfwrite);
pfwrite = NULL;
return 0;
}
fgets和fputs
从读取写入字符提升到字符串,是文本行读取函数,遇到换行符读取后就停止了,不会读下一行!!!
- fgets
- 从流中读取num长度的字符串(真实读到的只有num-1个,末尾会放一个
'
- 从流中读取num长度的字符串(真实读到的只有num-1个,末尾会放一个