1、C 语言程序设计基础之文件(1)育龙网 WWW.CHINA-B.C0M 2009 年 08 月 21 日 来源:互联网育龙网核心提示: 所谓“文件”是指一组相关的有序集合。 这个集有一个名称,叫做文件名。 实际上在前面的各章中我们已经多次使用了文件,例如源程序文件所谓“文件”是指一组相关的有序集合。 这个集有一个名称,叫做文件名。 实际上在前面的各章中我们已经多次使用了文件,例如源程序文件、目标文件、可执行文件、库文件 等。文件通常是驻留在外部介质上的, 在使用时才调入内存中来。从不同的角度可对文件作不同的分类。从用户的角度看,文件可分为普通文件和设备文件两种。 普通文件是指驻留在磁盘或其它外
2、部介质上的一个有序集,可以是源文件、目标文件、可执行程序; 也可以是一组待输入处理的原始,或者是一组输出的结果。对于源文件、目标文件、 可执行程序可以称作程序文件,对输入输出可称作文件。 设备文件是指与主机相联的各种外部设备,如显示器、打印机、键盘等。在操作系统中,把外部设备也看作是一个文件来进行管理,把它们的输入、输出等同于对磁盘文件的读和写。 通常把显示器定义为标准输出文件, 一般情况下在屏幕上显示有关信息就是向标准输出文件输出。如前面经常使用的 printf,putchar 函数就是这类输出。键盘通常被指定标准的输入文件, 从键盘上输入就意味着从标准输入文件上输入。scanf,getch
3、ar函数就属于这类输入。 从文件编码的方式来看,文件可分为 ASCII 码文件和二进制码文件两种。 ASCII 文件也称为文本文件,这种文件在磁盘中存放时每个字符对应一个字节,用于存放对应的 ASCII 码。例如,数 5678 的存储形式为: ASC 码: 00110101 00110110 00110111 00111000 十进制码: 5678 共占用 4 个字节。ASCII 码文件可在屏幕上按字符显示, 例如源程序文件就是 ASCII 文件,用 DOS 命令 TYPE 可显示文件的内容。 由于是按字符显示,因此能读懂文件内容。 二进制文件是按二进制的编码方式来存放文件的。 例如, 数 5
4、678 的存储形式为: 00010110 00101110 只占二个字节。二进制文件虽然也可在屏幕上显示, 但其内容无法读懂。C 系统在处理这些文件时,并不区分类型,都看成是字符流,按字节进行处理。 输入输出字符流的开始和结束只由程序控制而不受物理符号的控制。 因此也把这种文件称作“流式文件”。 本章讨论流式文件的打开、关闭、读、写、 定位等各种操作。文件指针在 C 语言中用一个指针变量指向一个文件, 这个指针称为文件指针。通过文件指针就可对它所指的文件进行各种操作。 定义说明文件指针的一般形式为: FILE* 指针变量标识符; 其中FILE 应为大写,它实际上是由系统定义的一个结构, 该结构
5、中含有文件名、文件状态和文件当前位置等信息。 在编写源程序时不必关心 FILE 结构的细节。例如:FILE *fp; 表示 fp 是指向 FILE 结构的指针变量,通过 fp 即可找存放某个文件信息的结构变量,然后按结构变量提供的信息找到该文件, 实施对文件的操作。习惯上也笼统地把 fp 称为指向一个文件的指针。文件的打开与关闭文件在进行读写操作之前要先打开,使用完毕要关闭。所谓打开文件,实际上是建立文件的各种有关信息, 并使文件指针指向该文件,以便进行其它操作。关闭文件则断开指针与文件之间的联系,也就禁止再对该文件进行操作。 在 C 语言中,文件操作都是由库函数来完成的。 在本章内将介绍主要
6、的文件操作函数。 文件打开函数 fopen fopen 函数用来打开一个文件,其调用的一般形式为: 文件指针名=fopen 其中,“文件指针名”必须是被说明为 FILE 类型的指针变量,“文件名”是被打开文件的文件名。 “使用文件方式”是指文件的类型和操作要求。“文件名”是字符串常量或字符串数组。例如: FILE *fp; fp=; 其意义是在当前目录下打开文件 file a, 只允许进行“读”操作,并使 fp 指向该文件。 又如: FILE *fphzk fphzk= 其意义是打开 C 驱动器磁盘的根目录下的文件 hzk16, 这是一个二进制文件,只允许按二进制方式进行读操作。两个反斜线“
7、”中的第一个表示转义字符,第二个表示根目录。使用文件的方式共有 12 种,下面给出了它们的符号和意义。 文件使用方式 意 义 “rt”只读打开一个文本文件,只允许读 “wt”只写打开或建立一个文本文件,只允许写 “at”追加打开一个文本文件,并在文件末尾写 “rb”只读打开一个二进制文件,只允许读 “wb” 只写打开或建立一个二进制文件,只允许写 “ab”追加打开一个二进制文件,并在文件末尾写 “rt+” 读写打开一个文本文件,允许读和写 “wt+” 读写打开或建立一个文本文件,允许读写 “at+” 读写打开一个文本文件,允许读,或在文件末追加数 据 “rb+” 读写打开一个二进制文件,允许读
8、和写 “wb+” 读写打开或建立一个二进制文件,允许读和写 “ab+” 读写打开一个二进制文件,允许读,或在文件末追加 对于文件使用方式有以下几点说明: 1. 文件使用方式由 r,w,a,t,b,+六个字符拼成,各字符的含义是: r: 读 w: 写 a: 追加 t: 文本文件,可省略不写 b: 二进制文件 +: 读和写 2. 凡用“r”打开一个文件时,该文件必须已经存在, 且只能从该文件读出。 3. 用“w”打开的文件只能向该文件写入。 若打开的文件不存在,则以指定的文件名建立该文件,若打开的文件已经存在,则将该文件删去,重建一个新文件。 4. 若要向一个已存在的文件追加新的信息,只能用“a
9、”方式打开文件。但此时该文件必须是存在的,否则将会出错。 5. 在打开一个文件时,如果出错,fopen 将返回一个空指针值 NULL。在程序中可以用这一信息来判别是否完成打开文件的工作,并作相应的处理。因此常用以下程序段打开文件: ifNULL) 这段程序的意义是,如果返回的指针为空,表示不能打开 C 盘根目录下的 hzk16 文件,则给出提示信息“error on open c:“ hzk16file!”,下一行 getch 的功能是从键盘输入一个字符,但不在屏幕上显示。在这里,该行的作用是等待, 只有当用户从键盘敲任一键时,程序才继续执行, 因此用户可利用这个等待时间阅读出错提示。敲键后执
10、行 exit 退出程序。 6. 把一个文本文件读入内存时,要将 ASCII 码转换成二进制码, 而把文件以文本方式写入磁盘时,也要把二进制码转换成 ASCII 码,因此文本文件的读写要花费较多的转换时间。对二进制文件的读写不存在这种转换。 7. 标准输入文件,标准输出文件,标准出错输出是由系统打开的,可直接使用。文件关闭函数C文件一旦使用完毕,应用关闭文件函数把文件关闭, 以避免文件的丢失等错误。 fclose 函数 调用的一般形式是: fclose; 例如: fclose; 正常完成关闭文件操作时,fclose 函数返回值为 0。如返回非零值则表示有错误发生。文件的读写对文件的读和写是最常用
11、的文件操作。 在 C 语言中提供了多种文件读写的函数: 字符读写函数 :fgetc 和 fputc 字符串读写函数:fgets 和 fputs 块读写函数:freed 和 fwrite 格式化读写函数:fscanf 和 fprinf 下面分别予以介绍。使用以上函数都要求包含头文件 stdio.h。字符读写函数C 和C 字符读写函数是以字符为单位的读写函数。 每次可从文件读出或向文件写入一个字符。 一、读字符函数 fgetc fgetc 函数的功能是从指定的文件中读一个字符,函数调用的形式为: 字符变量=fgetc; 例如:ch=fgetc;其意义是从打开的文件 fp 中读取一个字符并送入 ch
12、 中。 对于 fgetc 函数的使用有以下几点说明: 1. 在 fgetc 函数调用中,读取的文件必须是以读或读写方式打开的。 2. 读取字符的结果也可以不向字符变量赋值,例如:fgetc;但是读出的字符不能保存。 3. 在文件内部有一个位置指针。用来指向文件的当前读写字节。在文件打开时,该指针总是指向文件的第一个字节。使用 fgetc 函数后, 该位置指针将向后移动一个字节。因此可连续多次使用 fgetc 函数,读取多个字符。 应注意文件指针和文件内部的位置指针不是一回事。文件指针是指向整个文件的,须在程序中定义说明,只要不重新赋值,文件指针的值是不变的。文件内部的位置指针用以指示文件内部的
13、当前读写位置,每读写一次,该指针均向后移动,它不需在程序中定义说明,而是由系统设置的。 例 10.1读入文件 e10-1.c,在屏幕上输出。 #includestdio.h main ch=fgetc; while fclose; 本例程序的功能是从文件中逐个读取字符,在屏幕上显示。 程序定义了文件指针fp,以读文本文件方式打开文件“e10_1.c”, 并使 fp 指向该文件。如打开文件出错, 给出提示并退出程序。程序第 12 行先读出一个字符,然后进入循环, 只要读出的字符不是文件结束标志就把该字符显示在屏幕上,再读入下一字符。每读一次,文件内部的位置指针向后移动一个字符,文件结束时,该指针
14、指向 EOF。执行本程序将显示整个文件。 二、写字符函数 fputc fputc 函数的功能是把一个字符写入指定的文件中,函数调用的 形式为: fputc; 其中,待写入的字符量可以是字符常量或变量,例如:fputc;其意义是把字符 a 写入 fp 所指向的文件中。 对于 fputc 函数的使用也要说明几点: 1. 被写入的文件可以用、写、读写,追加方式打开,用写或读写方式打开一个已存在的文件时将清除原有的文件内容,写入字符从文件首开始。如需保留原有文件内容,希望写入的字符以文件末开始存放,必须以追加方式打开文件。被写入的文件若不存在,则创建该文件。 2. 每写入一个字符,文件内部位置指针向后
15、移动一个字节。 3. fputc 函数有一个返回值,如写入成功则返回写入的字符, 否则返回一个 EOF。可用此来判断写入是否成功。 例 10.2从键盘输入一行字符,写入一个文件, 再把该文件内容读出显示在屏幕上。#includestdio.h main printf; ch=getchar; while rewind; ch=fgetc; while printf; fclose; 程序中第 6 行以读写文本文件方式打开文件 string。程序第 13 行从键盘读入一个字符后进入循环,当读入字符不为回车符时, 则把该字符写入文件之中,然后继续从键盘读入下一字符。 每输入一个字符,文件内部位置指
16、针向后移动一个字节。写入完毕, 该指针已指向文件末。如要把文件从头读出,须把指针移向文件头, 程序第 19 行 rewind 函数用于把 fp 所指文件的内部位置指针移到文件头。 第 20 至 25 行用于读出文件中的一行内容。 例 10.3把命令行参数中的前一个文件名标识的文件, 复制到后一个文件名标识的文件中, 如命令行中只有一个文件名则把该文件写到标准输出文件中。 #includestdio.h main if)NULL) if fp2=stdout; else if)NULL) while)!=EOF) fputc; fclose; fclose; 本程序为带参的 main 函数。程序
17、中定义了两个文件指针 fp1 和 fp2,分别指向命令行参数中给出的文件。如命令行参数中没有给出文件名,则给出提示信息。程序第 18 行表示如果只给出一个文件名,则使 fp2 指向标准输出文件。程序第 25 行至 28 行用循环语句逐个读出文件 1 中的字符再送到文件 2 中。再次运行时,给出了一个文件名, 故输出给标准输出文件 stdout,即在显示器上显示文件内容。第三次运行,给出了二个文件名,因此把 string 中的内容读出,写入到 OK 之中。可用 DOS 命令 type 显示 OK 的内容: 字符串读写函数 fgets 和 fputs 一、读字符串函数 fgets 函数的功能是从指
18、定的文件中读一个字符串到字符数组中,函数调用的形式为: fgets; 其中的 n 是一个正整数。表示从文件中读出的字符串不超过 n-1 个字符。在读入的最后一个字符后加上串结束标志“0。例如:fgets;的意义是从fp 所指的文件中读出 n-1 个字符送入字符数组 str 中。 例 10.4从 e10_1.c 文件中读入一个含 10 个字符的字符串。 #includestdio.h main fgets; printf; fclose; 本例定义了一个字符数组 str 共 11 个字节,在以读文本文件方式打开文件 e101.c 后,从中读出 10 个字符送入 str 数组,在数组最后一个单元内
19、将加上“0,然后在屏幕上显示输出 str 数组。输出的十个字符正是例 10.1 程序的前十个字符。 对 fgets 函数有两点说明: 1. 在读出 n-1 个字符之前,如遇到了换行符或 EOF,则读出结束。 2. fgets 函数也有返回值,其返回值是字符数组的首地址。 二、写字符串函数 fputs fputs 函数的功能是向指定的文件写入一个字符串,其调用形式为: fputs 其中字符串可以是字符串常量,也可以是字符数组名, 或指针 变量,例如: fputs; 其意义是把字符串“abcd”写入 fp 所指的文件之中。例 10.5在例 10.2 中建立的文件 string 中追加一个字符串。 #includestdio.h main printf; scanf; fputs; rewind; ch=fgetc; while printf; fclose; 本例要求在 string 文件末加写字符串,因此,在程序第 6 行以追加读写文本文件的方式打开文件 string 。 然后输入字符串, 并用 fputs 函数把该串写入文件 string。在程序 15 行用 rewind 函数把文件内部位置指针移到文件首。 再进入循环逐个显示当前文件中的全部内容。