1、第10章 对文件的输入输出,10.1 文件的有关基本知识 10.2 打开与关闭文件 10.3 顺序读写数据文件 10.4 随机读写数据文件 10.5 文件读写的出错检测,10.1 文件的有关基本知识,10.1.1 什么是文件 10.1.2 文件名 10.1.3 文件的分类 10.1.4 文件缓冲区 10.1.5 文件类型指针,10.1.1 什么是文件,文件有不同的类型,在程序设计中,主要用到两种文件: (1) 程序文件。包括源程序文件(后缀为.c)、目标文件(后缀为.obj)、可执行文件(后缀为.exe)等。这种文件的内容是程序代码。,10.1.1 什么是文件,文件有不同的类型,在程序设计中,
2、主要用到两种文件: (2) 数据文件。文件的内容不是程序,而是供程序运行时读写的数据,如在程序运行过程中输出到磁盘(或其他外部设备)的数据,或在程序运行过程中供读入的数据。如一批学生的成绩数据,或货物交易的数据等。 本章主要讨论的是数据文件,10.1.1 什么是文件,在以前各章中所处理的数据的输入和输出,从终端的键盘输入数据,运行结果输出到终端显示器上 常常需要将一些数据输出到磁盘上保存起来,以后使用 这就要用到磁盘文件,10.1.1 什么是文件,操作系统把各种设备都统一作为文件处理 从操作系统的角度看,每一个与主机相联的输入输出设备都看作是文件。例如, 终端键盘是输入文件 显示屏和打印机是输
3、出文件,10.1.1 什么是文件,“文件”指存储在外部介质上数据的集合 一批数据是以文件的形式存放在外部介质上的 操作系统是以文件为单位对数据进行管理 想找存放在外部介质上的数据,先按文件名找到所指定的文件,然后再从该文件读数据 要向外部介质上存储数据也必须先建立一个文件(以文件名作为标志),才能向它输出数据,10.1.1 什么是文件,输入输出是数据传送的过程,数据如流水一样从一处流向另一处,因此常将输入输出形象地称为流(stream),即数据流。流表示了信息从源到目的端的流动。,10.1.1 什么是文件,输入操作时,数据从文件流向计算机内存 输出操作时,数据从计算机流向文件 无论是用Word
4、打开或保存文件,还是C程序中的输入输出都是通过操作系统进行的 “流”是一个传输通道,数据可以从运行环境流入程序中,或从程序流至运行环境,10.1.1 什么是文件,从C程序的观点来看,无论程序一次读写一个字符,或一行文字,或一个指定的数据区,作为输入输出的各种文件或设备都是统一以逻辑数据流的方式出现的。语言把文件看作是一个字符(或字节)的序列。一个输入输出流就是一个字符流或字节(内容为二进制数据)流。,10.1.1 什么是文件,的数据文件由一连串的字符(或字节)组成,而不考虑行的界限,两行数据间不会自动加分隔符,对文件的存取是以字符(字节)为单位的。输入输出数据流的开始和结束仅受程序控制而不受物
5、理符号(如回车换行符)控制,这就增加了处理的灵活性。这种文件称为流式文件。,10.1.2 文件名,文件要有一个唯一的文件标识,以便用户识别和引用。 文件标识包括三部分: (1)文件路径 (2)文件名主干 (3)文件后缀,10.1.2 文件名,文件路径表示文件在外部存储设备中的位置。如:D: CCtempfile1.dat 表示file1.dat文件存放在D盘中的CC目录下的temp子目录下面,文件路径,文件名主干,文件后缀,10.1.2 文件名,文件路径表示文件在外部存储设备中的位置。如:D: CCtempfile1.dat 表示file1.dat文件存放在D盘中的CC目录下的temp子目录下
6、面,文件名,10.1.2 文件名,文件路径表示文件在外部存储设备中的位置。如:D: CCtempfile1.dat 表示file1.dat文件存放在D盘中的CC目录下的temp子目录下面,命名规则遵循标识符的命名规则,10.1.2 文件名,文件路径表示文件在外部存储设备中的位置。如:D: CCtempfile1.dat 表示file1.dat文件存放在D盘中的CC目录下的temp子目录下面,一般不超过3个字母(doc、txt、dat、c、cpp、obj、exe、ppt、bmp等),10.1.3 文件的分类,根据数据的组织形式,数据文件可分为ASCII文件和二进制文件。 数据在内存中是以二进制形
7、式存储的,如果不加转换地输出到外存,就是二进制文件 如果要求在外存上以ASCII代码形式存储,则需要在存储前进行转换 ASCII文件又称文本文件,每一个字节放一个字符的ASCII代码,10.1.3 文件的分类,字符一律以ASCII形式存储 数值型数据既可以用ASCII形式存储,也可以用二进制形式存储 如有整数10000,如果用ASCII码形式输出到磁盘,则在磁盘中占个字节(每一个字符占一个字节),而用二进制形式输出,则在磁盘上只占4个字节(用VC+ C时),10.1.3 文件的分类,(1),(0),(0),(0),(0),ASCII形式,二进制形式,(10000),10.1.4 文件缓冲区,A
8、NSI C标准采用“缓冲文件系统”处理数据文件 所谓缓冲文件系统是指系统自动地在内存区为程序中每一个正在使用的文件开辟一个文件缓冲区,10.1.4 文件缓冲区,从内存向磁盘输出数据必须先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘去 如果从磁盘向计算机读入数据,则一次从磁盘文件将一批数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(给程序变量),10.1.4 文件缓冲区,程序数据区,输出文件缓冲区,输入文件缓冲区,磁盘,从内存向磁盘输出数据,装满缓冲区,10.1.4 文件缓冲区,程序数据区,输出文件缓冲区,输入文件缓冲区,磁盘,从磁盘向计算机读入数据,充满缓冲区,
9、10.1.5 文件类型指针,缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针” 每个被使用的文件都在内存中开辟一个相应的文件信息区,用来存放文件的有关信息(如文件的名字、文件状态及文件当前位置等) 这些信息是保存在一个结构体变量中的。该结构体类型是由系统声明的,取名为FILE,10.1.5 文件类型指针,声明FILE结构体类型的信息包含在头文件“stdio.h”中 一般设置一个指向FILE类型变量的指针变量,然后通过它来引用这些FILE类型变量,10.1.5 文件类型指针,FILE *fp1,*fp2,*fp3;,文件f1的 文件信息区,fp1,文件f2的 文件信息区,fp2,文件
10、f3的 文件信息区,fp3,10.2 打开与关闭文件,10.2.1 用fopen函数打开数据文件 10.2.2 用fclose函数关闭数据文件,10.2.1 用fopen函数打开数据文件,对文件读写之前应该“打开”该文件,在使用结束之后应“关闭”该文件。 所谓“打开”是指为文件建立相应的信息区(用来存放有关文件的信息)和文件缓冲区(用来暂时存放输入输出的数据)。,10.2.1 用fopen函数打开数据文件,在编写程序时,在打开文件的同时,一般都指定一个指针变量指向该文件,也就是建立起指针变量与文件之间的联系,这样就可以通过该指针变量对文件进行读写 所谓“关闭”是指撤销文件信息区和文件缓冲区,1
11、0.2.1 用fopen函数打开数据文件,fopen函数的调用方式为: fopen(文件名,使用文件方式); 例如: fopen(“a1”,”r”); 表示要打开名为“a1”的文件,使用文件方式为“读入” fopen函数的返回值是指向a1文件的指针,10.2.1 用fopen函数打开数据文件,通常将fopen函数的返回值赋给一个指向文件的指针变量。如: FILE *fp; fp=fopen(“a1”,”r”); fp和文件a1相联系,fp指向了a1文件,10.2.1 用fopen函数打开数据文件,在打开一个文件时,通知编译系统以下3个信息: 需要访问的文件的名字 使用文件的方式(“读”还是“写
12、”等) 让哪一个指针变量指向被打开的文件 使用文件方式参见教材表10.1。,说明: (1) 用“r”方式打开的文件只能用于向计算机输入而不能用作向该文件输出数据,而且该文件应该已经存在,并存有数据,这样程序才能从文件中读数据。 不能用“r”方式打开一个并不存在的文件,否则出错。,说明: (2) 用“w”方式打开的文件只能用于向该文件写数据(即输出文件),而不能用来向计算机输入。 如果原来不存在该文件,则在打开文件前新建立一个以指定的名字命名的文件。 如果原来已存在一个以该文件名命名的文件,则在打开文件前先将该文件删去,然后重新建立一个新文件。,说明: (3) 如果希望向文件末尾添加新的数据(不
13、希望删除原有数据),则应该用“a”方式打开 但此时应保证该文件已存在;否则将得到出错信息。 打开文件时,文件读写标记移到文件末尾,说明: (4) 用r+、w+、a+方式打开的文件既可以用来输入数据,也可以用来输出数据。 用r+方式时该文件应该已经存在。 用w+方式则新建立一个文件,先向此文件写数据,然后可以读此文件中的数据。 用a+方式打开的文件,原来的文件不被删去,文件读写位置标记移到文件末尾,可以添加,也可以读。,说明: (5) 如果打开失败,fopen函数将会带回一个出错信息。fopen函数将带回一个空指针值NULL 常用下面的方法打开一个文件:if (fp=fopen(“file1”,
14、r)=NULL)printf(“cannot open this filen”);exit(0);,终止正在执行的程序,说明: (6) C标准建议用表10.1列出的文件使用方式打开文本文件或二进制文件,但目前使用的有些C编译系统可能不完全提供所有这些功能,说明: (7) 计算机输从ASCII文件读入字符时,遇到回车换行符,系统把它转换为一个换行符,在输出时把换行符转换成为回车和换行两个字符。在用二进制文件时,不进行这种转换,在内存中的数据形式与输出到外部文件中的数据形式完全一致,一一对应。,说明: (8) 程序中可以使用3个标准的流文件:标准输入流、标准输出流、标准出错输出流。 系统已对这3个
15、文件指定了与终端的对应关系 标准输入流是从终端的输入 标准输出流是向终端的输出 标准出错输出流是当程序出错时将出错信息发送到终端,程序开始运行时系统自动打开这3个标准流文件。因此,程序编写者不需要在程序中用fopen函数打开它们。所以以前我们用到的从终端输入或输出到终端都不需要打开终端文件。,10.2.2 用fclose函数关闭数据文件,关闭文件用fclose函数。fclose函数调用的一般形式为 fclose(文件指针); 例如: fclose (fp); 如果不关闭文件将会丢失数据。,10.3 顺序读写数据文件,在顺序写时,先写入的数据存放在文件中前面,后写入的数据存放在文件中后面 在顺序
16、读时,先读文件中前面的数据,后读文件中后面的数据 对顺序读写来说,对文件读写数据的顺序和数据在文件中的物理顺序是一致的 顺序读写需要用库函数实现,10.3 顺序读写数据文件,10.3.1 怎样向文件读写字符 10.3.2 怎样向文件读写一个字符串 10.3.3 用格式化的方式读写文件 10.3.4 用二进制方式向文件读写一组数据,10.3.1 怎样向文件读写字符,读写一个字符的函数,例10.1 从键盘输入一些字符,逐个把它们送到磁盘上去,直到用户输入一个“”为止。 解题思路:用fgetc函数从键盘逐个输入字符,然后用fputc函数写到磁盘文件即可。,#include #include int
17、main() FILE *fp;char ch,filename10;printf(“请输入所用的文件名:“);scanf(“%s“,filename);if(fp=fopen(filename,“w”)=NULL) printf(“无法打开此文件n“); exit(0); ch=getchar( );,接收最后输入的回车符,输入文件名,只写,用exit函数时加,printf(“请输入一个字符串(以#结束):“);ch=getchar( ); while(ch!=#) fputc(ch,fp); putchar(ch); ch=getchar(); fclose(fp); putchar(10
18、); return 0; ,例10.2 将一个磁盘文件中的信息复制到另一个磁盘文件中。 今要求将上例建立的file1.dat文件中的内容复制到另一个磁盘文件file2.dat中。 解题思路:处理此问题的算法是:从file1.dat文件中逐个读入字符,然后逐个输出到file2.dat中。,#include #include int main( ) FILE *in,*out; char ch,infile10,outfile10; printf(“输入读入文件的名字:“);scanf(“%s“,infile); printf(“输入输出文件的名字:“);scanf(“%s”,outfile);
19、if(in=fopen(infile,“r”)=NULL) printf(“无法打开此文件n“); exit(0);if(out=fopen(outfile,“w”)=NULL) printf(“无法打开此文件n“); exit(0); ,改为rb和wb,则复制一个二进制文件,改为rb和wb,则复制一个二进制文件,while(!feof(in) ch=fgetc(in); fputc(ch,out); putchar(ch); putchar(10); fclose(in); fclose(out); return 0; ,检查当前读写位置是否移到文件末尾,10.3.2 怎样向文件读写一个字符
20、串,读写一个字符串的函数,说明: fgets函数的函数原型为:char *fgets (char *str,int n,FILE *fp); 其作用是从文件读入一个字符串 调用时可以写成:fgets(str,n,fp);,说明: fgets(str,n,fp);中n是要求得到的字符个数,但实际上只读n-1个字符,然后在最后加一个0字符,这样得到的字符串共有n个字符,把它们放到字符数组str中 如果在读完n-1个字符之前遇到换行符“n”或文件结束符EOF,读入即结束,但将所遇到的换行符“n”也作为一个字符读入 执行fgets成功,返回str数组首地址,如果一开始就遇到文件尾或读数据错,返回NUL
21、L,说明: fputs函数的函数原型为:int fputs (char *str, FILE *fp); str指向的字符串输出到fp所指向的文件中 调用时可以写成: fputs(China”,fp); fputs函数中第一个参数可以是字符串常量、字符数组名或字符型指针 字符串末尾的0不输出 输出成功,函数值为;失败,函数值为EOF,例10.3 从键盘读入若干个字符串,对它们按字母大小的顺序排序,然后把排好序的字符串送到磁盘文件中保存。 解题思路:为解决问题,可分为三个步骤: 从键盘读入n个字符串,存放在一个二维字符数组中,每一个一维数组存放一个字符串; 对字符数组中的n个字符串按字母顺序排序
22、,排好序的字符串仍存放在字符数组中; 将字符数组中的字符串顺序输出。,#include #include #include int main() FILE *fp;char str310,temp10; int i,j,k,n=3;printf(“Enter strings:n”); for(i=0;in;i+) gets(stri);,for(i=0;i0) k=j;if(k!=i) strcpy(temp,stri); strcpy(stri,strk);strcpy(strk,temp);,if(fp=fopen(“D:CCstring.dat”,“w”)=NULL) printf(“c
23、ant open file!n“); exit(0);printf(“nThe new sequence:n“);for(i=0;in;i+) fputs(stri,fp);fputs(“n”,fp); printf(“%sn”,stri); return 0; ,人为地输出一个n,思考: 从文件string.dat中读回字符串,并在屏幕上显示,应如何编写程序?,#include #include int main() FILE *fp; char str310; int i=0;if(fp=fopen(“D:CCstring.dat”,“r”)=NULL) printf(“cant open
24、 file!n“);exit(0);while(fgets(stri,10,fp)!=NULL) printf(“%s“,stri); i+; fclose (fp);return 0; ,不用人为地输出n,10.3.3用格式化的方式读写文件,一般调用方式为: fprintf(文件指针,格式字符串,输出表列); fscanf (文件指针,格式字符串,输入表列); 如: fprintf (fp,”%d,%6.2f”,i,f); fscanf (fp,”%d,%f”,10.3.4 用二进制方式向文件读写一组数据,一般调用形式为: fread(buffer,size,count,fp); fwrit
25、e(buffer,size,count,fp);,10.3.4 用二进制方式向文件读写一组数据,buffer:是一个地址 对fread来说,它是用来存放从文件读入的数据的存储区的地址 对fwrite来说,是要把此地址开始的存储区中的数据向文件输出 size:要读写的字节数 count:要读写多少个数据项 fp:FILE类型指针,例10.4 从键盘输入10个学生的有关数据,然后把它们转存到磁盘文件上去。 解题思路: 定义有10个元素的结构体数组,用来存放10个学生的数据 从main函数输入10个学生的数据 用save函数实现向磁盘输出学生数据 用fwrite函数一次输出一个学生的数据,#incl
26、ude #define SIZE 10 struct Student_type char name10;int num;int age;char addr15;studSIZE;,void save( ) FILE *fp; int i;if(fp=fopen(“stu.dat“,“wb“)=NULL) printf(“cannot open filen“);return;for(i=0;iSIZE;i+)if(fwrite( ,10+4+4+15=33,实际上开辟36字节,是4的倍数,当前路径下的文件,int main() int i;printf(“enter data of studen
27、ts:n“);for(i=0;iSIZE;i+) scanf(“%s%d%d%s“,studi.name, ,为了验证在磁盘文件“stu.dat”中是否已存在此数据,可以用以下程序从“stu.dat”文件中读入数据,然后在屏幕上输出。,#include #include #define SIZE 10 struct Student_type char name10;int num;int age;char addr15; studSIZE;,int main( ) int i; FILE *fp;if(fp=fopen(“stu.dat“,“rb“)=NULL)printf(“cannot o
28、pen filen“); exit(0); for(i=0;iSIZE;i+)fread ( ,如果修改例10.4:从已有的二进制文件“stu.list”中,读入数据并输出到“stu.dat”文件中,应如何修改程序? 解题思路: 编写load函数 main函数中再调用load函数,void load( ) FILE *fp; int i; if(fp=fopen(“stu_list“,“rb“)=NULL) printf(“cannot open infilen“); return;for(i=0;iSIZE;i+)if(fread( ,int main() load();save(); re
29、turn 0; ,10.4 随机读写数据文件,对文件进行顺序读写比较容易理解,也容易操作,但有时效率不高 随机访问不是按数据在文件中的物理位置次序进行读写,而是可以对任何位置上的数据进行访问,显然这种方法比顺序访问效率高得多,10.4 随机读写数据文件,10.4.1 文件位置标记及其定位 10.4.2 随机读写,10.4.1 文件位置标记及其定位,1.文件位置标记 为了对读写进行控制,系统为每个文件设置了一个文件读写位置标记(简称文件标记),用来指示“接下来要读写的下一个字符的位置”,10.4.1 文件位置标记及其定位,文件指针,读写当前位置,文件尾,1.文件位置标记,文件头,10.4.1 文
30、件位置标记及其定位,1.文件位置标记 一般情况下,在对字符文件进行顺序读写时,文件标记指向文件开头,进行读的操作时,就读第一个字符,然后文件标记向后移一个位置,在下一次读操作时,就将位置标记指向的第二个字符读入。依此类推,直到遇文件尾,结束,10.4.1 文件位置标记及其定位,1.文件位置标记 如果是顺序写文件,则每写完一个数据后,文件标记顺序向后移一个位置,然后在下一次执行写操作时把数据写入指针所指的位置。直到把全部数据写完,此时文件位置标记在最后一个数据之后,10.4.1 文件位置标记及其定位,1.文件位置标记 可以根据读写的需要,人为地移动了文件标记的位置。文件标记可以向前移、向后移,移
31、到文件头或文件尾,然后对该位置进行读写随机读写 随机读写可以在任何位置写入数据,在任何位置读取数据,10.4.1 文件位置标记及其定位,2. 文件位置标记的定位 可以强制使文件位置标记指向指定的位置 可以用以下函数实现: (1)用rewind函数使文件标记指向文件开头rewind函数的作用是使文件标记重新返回文件的开头,此函数没有返回值。,例10.5 有一个磁盘文件,内有一些信息。要求第一次将它的内容显示在屏幕上,第二次把它复制到另一文件上。,解题思路: 因为在第一次读入完文件内容后,文件标记已指到文件的末尾,如果再接着读数据,就遇到文件结束标志,feof函数的值等于1(真),无法再读数据 必
32、须在程序中用rewind函数使位置指针返回文件的开头,#include int main() FILE *fp1,*fp2;fp1=fopen(“file1.dat”,“r”); fp2=fopen(“file2.dat”,“w”); while(!feof(fp1) putchar(getc(fp1); putchar(10); rewind(fp1); while(!feof(fp1) putc(getc(fp1),fp2); fclose(fp1); fclose(fp2);return 0; ,10.4.1 文件位置标记及其定位,2. 文件位置标记的定位 可以强制使文件标记指向指定的位
33、置 可以用以下函数实现: (2) 用fseek函数改变文件标记 fseek函数的调用形式为: fseek(文件类型指针,位移量,起始点) 起始点0代表“文件开始位置”,1为“当前位置”,2为“文件末尾位置”,标准指定的名字,位移量指以起始点为基点,向前移动的字节数。位移量应是long型数据(在数字的末尾加一个字母L)。 fseek函数一般用于二进制文件。下面是fseek函数调用的几个例子: fseek (fp,100L,0); fseek (fp,50L,1); fseek (fp,-10L,2);,10.4.1 文件位置标记及其定位,2. 文件位置标记的定位 可以强制使文件位置标记指向指定的
34、位置 可以用以下函数实现: (3) 用ftell函数测定文件位置标记的当前位置 ftell函数的作用是得到流式文件中文件位置标记的当前位置。,由于文件中的文件位置标记经常移动,人们往往不容易知道其当前位置,所以常用ftell函数得到当前位置,用相对于文件开头的位移量来表示。如果调用函数时出错(如不存在fp指向的文件),ftell函数返回值为-1L。例如: i=ftell(fp); if(i=-1L) printf(“errorn”);,10.4.2 随机读写,例10.6 在磁盘文件上存有10个学生的数据。要求将第1,3,5,7,9个学生数据输入计算机,并在屏幕上显示出来。 要求:从例10.4中
35、建立的“stu.dat”中读入数据,10.4.2 随机读写,解题思路: 按二进制只读方式打开文件 将文件位置标记指向文件的开头,读入一个学生的信息,并把它显示在屏幕上 再将文件标记指向文件中第3,5,7,9个学生的数据区的开头,读入相应学生的信息,并把它显示在屏幕上 关闭文件,#include #include struct St char name10;int num;int age;char addr15; stud10;,int main() int i; FILE *fp; if(fp=fopen(“stu.dat”,“rb”)=NULL) printf(“can not open f
36、ilen“); exit(0); for(i=0;i10;i+=2) fseek(fp,i*sizeof(struct St),0); fread( ,10.5 文件读写的出错检测,1.ferror函数 ferror函数的一般调用形式为ferror(fp); 如果返回值为0,表示未出错,否则表示出错 每次调用输入输出函数,都产生新的ferror函数值,因此调用输入输出函数后立即检查 调用fopen时,ferror的初始值自动置为0,10.5 文件读写的出错检测,2. clearerr函数 作用是使文件错误标志和文件结束标志置为0 调用一个输入输出函数时出现错误(ferror值为非零值),立即调用clearerr(fp),使ferror(fp)值变0,以便再进行下一次检测 只要出现文件读写错误标志,它就一直保留,直到对同一文件调用clearerr函数或rewind函数,或任何其他一个输入输出函数,