【Linux】基础IO_文件操作
环境:centos7.6,腾讯云服务器
Linux文章都放在了专栏:【Linux】欢迎支持订阅相关文章推荐:
【Linux】冯.诺依曼体系结构与操作系统
【C/进阶】如何对文件进行读写(含二进制)操作?
预备知识
在C语言阶段,我们学习过相关文件操作,但是,我们真的了解文件操作吗?
- 答案是并不了解,因为我们之前所学习的C语言文件操作,都是属于语言层面的操作,我们只是知道了fopen,fclose这些函数是怎么用,但是具体的底层原理并没有涉及接触。实际上,当涉及到文件操作的原理时,就不再是简单的语言问题,而是属于系统问题。
是否只有我们的C/C++才可以对文件进行操作呢?
- 答案也是否定的,其它比如JAVA、Python等语言也支持相关文件操作,只是不同语言的实现方法(语言级别)不同罢了,但是底层(系统级别)都会涉及到系统层面的相关操作。
如何看待文件?
- 文件=内容+属性,对文件的相关操作--->对内容/属性的相关操作
- 文件存放在磁盘中,只有当我们打开文件进行相关操作时,文件的属性会被加载到内存(冯诺伊曼体系结构决定,CPU只与内存交互)
- 对于大量被打开的文件,OS会进行管理,OS会创建struct file结构体,该结构体内包含对应文件的属性(先描述),然后通过某种数据结构,将各个文件对应的结构体连接起来(再组织)。对被打开文件的管理--->对该数据结构的增删查改。
文件是怎么打开的?由谁打开?
- 由用户通过创建进程(写代码,编译运行),底层会通过系统调用,从而让OS打开文件。
- 本章所讨论的文件操作都是针对被打开的文件。
文件操作
语言级别的文件操作(C)
文件的打开
FILE *fopen(const char *path, const char *mode);
对于该函数path表示打开或创建的目标文件(默认会在当前路径下创建/打开),mode表示文件的打开方式。对于mode来说,这里就简单介绍以下几种(更多的在前文:点击跳转):
打开方式 | 含义 | 假如文件不存在 |
---|---|---|
"w"(只写) | 为了输出数据,打开一个文本文件 | 自动创建该文件,并且在写入前会清空原文件 |
"r"(只读) |
为了输入数据,打开一个已经存在的文件 |
打开失败 |
"a"(追加) | 向文本文件尾添加数据 | 自动创建该文件,追加前不会清空原文件 |
FILE* fp1=fopen("./TEST/log.txt", "w");//只写,文件不存在在,在./TEST/下创建该文件
FILE* fp2=fopen("log.txt","a");//追加,文件不存在,在当前路径下创建该文件
FILE* fp3=fopen("log.txt","r");//只读,同一个文件可以被打开多次
文件的关闭
int fclose(FILE *fp);//对已打开的文件进行关闭。
对于一个被打开的文件,最后一定要关闭该文件。这就好比我们malloc出来的空间一定要free一样。fclose与fopen配套使用。
fclose(fp1);
fclose(fp2);
fclose(fp3);
文件的写入
C语言提供的写函数一共有以下几种:
函数 | 功能 | 适用于 |
---|---|---|
fputc | 以一个字符为单位进行写入 | 所有输出流 |
fputs | 以一行为单位进行写入 | 所有输出流 |
fwrite | 二进制写入 | 文件 |
fprintf | 格式化写入 | 所有输出流 |
snprintf | 格式化写入 | 所有输出流 |
对于上面的大多数函数,这里就不做过多讲解,可以自行前去观看,这里讲一下snprintf。snprintf是fprintf的优化版本,相较于fprintf,可以对写入数据进行长度控制,会更加安全。
int snprintf(char *str, size_t size, const char *format, ...);
- str:表示要写入的缓冲区的地址
- size:表示该缓冲区的大小
- format:格式化可变参数(比如:"%d:%s\\n",x,y )
演示代码如下:
#include<stdio.h>#include<stdlib.h>#define SIZE 128int main(){FILE* fp=fopen("log.txt","w");//写//打开失败返回空if(fp==NULL){perror("fopen fail\\n");exit(-1);}char buffer[SIZE];int cnt=10;const char* st="hello world!";while(cnt){//格式化写入到buffer数组snprintf(buffer,sizeof(buffer),"%d:%s\\n",cnt,st);//再将数组内容写到文件 fputs(buffer,fp);--cnt;}//关闭文件fclose(fp);return 0;}
文件的读取
对于文件的读取,C提供的函数与上面一一对应,用法也是如此
文件读取演示:
#include<stdio.h>#include<stdlib.h>#include<string.h>#define SIZE 128//文件的读取int main(){FILE* fp=fopen("log.txt","r");//读方式打开if(fp == NULL){perror("fopen fail\\n");exit(-1);}//按行来读取文件while(1){//从文件流中按行读取内容,读到tmp中char tmp[SIZE];if(fgets(tmp,sizeof(tmp),fp)==NULL){break;}//打印tmpprintf("%s",tmp); }//关闭文件fclose(fp);return 0;}
系统级别的文件操作
以上都是语言级别的文件相关操作。至此往下将讲解系统级别的相关文件操作。
文件的打开
对于文件的打开,我们采用open系统调用函数。如下:
//头文件
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>//系统调用函数open
int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode);
对于该函数,有如下理解:
- 返回值:打开成功,返回一个int类型的整数->文件描述符(下一章将重点讲解),失败返回-1。
- 参数pathname:打开或创建的目标文件(默认在当前路径打开/创建)。
- 参数flags:多参数选项,用一个整形来实现多个选项的传递。以下为flags对应的参数选项,通常用或位运算来表示一个或多个参数。
对于多参数选项flags:
参数选项 | 含义 |
---|---|
O_RDONLY | 只读 |
O_WRONLY | 只写 |
O_CREAT | 若文件不存在则创建该文件,与open的第三个参数mode(设置权限)配套使用 |
O_APPEND | 追加 |
O_TRUNC | 打开文件前清空原文件 |
多参数传递实际上采用的就是位图的方式来实现,一个整形一共32个比特位,每一个比特位都可以用来表示一个参数,用|运算符则可以实现一个整形传递多个参数选项。
我们可以利用此特点来自己实现一个小demo,如下图所示:
参数flags便是利用此特点来实现一个整形多个参数选项。与我们的C语言对应关系如下;
- 参数mode:创建文件时给文件一个权限
文件的关闭
通过系统调用函数close来关闭一个文件,该函数如下:
#include <unistd.h>int close(int fd);
其中这里的fd就是文件描述符,也就是open函数返回的那个整形。具体含义将在下一篇详细讲解。
文件写入
通过函数write来实现文件的写入操作
#include <unistd.h>ssize_t write(int fd, const void *buf, size_t count);
对于该函数:
- 返回值:写入成功,会返回写入的内容的大小(单位:字节)失败返回-1
- 参数fd:文件描述符即open函数的返回值
- 参数buf:缓冲区的地址
- 参数count:表示写入的文件的大小
具体案例操作:
#include<stdio.h>#include<stdlib.h>#include<string.h>#include<unistd.h>#include<sys/types.h>#include<sys/stat.h>#include<fcntl.h>#define SIZE 128int main(){umask(0);//设置umask为0int fd=open("log.txt",O_CREAT|O_WRONLY|O_TRUNC,0666);//以写的方式打开文件,文件不存在则创建,打开之前会清空原文件,创建时文件权限为0666//打开失败if(fd == -1){perror("open fail\\n");exit(-1);}char buffer[SIZE];//充当缓冲区的buffer数组const char* str="hello world";int cnt=10;//利用snprintf进行格式化写入到缓冲区,再写入到文件while(cnt) {snprintf(buffer,sizeof(buffer),"%d:%s\\n",cnt,str);--cnt;ssize_t n=write(fd,buffer,strlen(buffer));//这里我们不需要将/0计算在内,因为/0是C语言规定的字符串结尾,此时我们处于系统级别printf("成功写入%lu个字节内容\\n",n);//%lu:无符号整型//间隔1秒写入一次 sleep(1);}//关闭文件close(fd);return 0;}
运行结果如下:
文件的读取
对于文件的读取,提供了函数read
#include <unistd.h>ssize_t read(int fd, void *buf, size_t count);
对于该函数:
- 返回值:读取成功,返回读取的内容的大小,失败返回-1
- 参数fd:文件描述符
- 参数buf:缓冲区地址,用来存放读到的数据
- count:一次读取字符的大小到缓冲区buf
具体操作如下:
#include<stdio.h>#include<stdlib.h>#include<string.h>#include<unistd.h>#include<sys/types.h>#include<sys/stat.h>#include<fcntl.h>#define SIZE 128//文件读取int main(){int fd=open("log.txt",O_RDONLY);//读方式打开文件if(fd== -1){perror("open fail\\n");exit(-1); }char buffer[SIZE];//读到的内容放进buffer数组//注意处理\\0ssize_t n=read(fd,buffer,sizeof(buffer)-1);//读取成功if(n>0){buffer[n]='\\0';printf("%s共读取%lu字节的内容\\n",buffer,n);//字符串结尾的标志\\0(这里我们用printf打印,属于C语言级别,所以得考虑\\0的存在)}//关闭文件close(fd);return 0;}
运行结果如下:
语言操作与系统级别的文件操作区别
实际上,我们所有的语言级别的文件操作都是对系统调用的封装,比如我们使用的fclose,fopen等函数,他们的底层实际上都会调用对应的系统级别的函数,比如close、open等。也就是说,语言级别的文件操作的底层,并不会直接跳过OS,而是一层一层往下进行。
end.
生活原本沉闷,但跑起来就会有风!🌹