前置博客基础IO

为什么有缓冲

因为磁盘的读写与内存的读写操作速度相比，磁盘的读写是相差数量级的慢，所以为了提高内存多次，频繁读写磁盘文件的效率，缓冲区被投入使用。尤其是内存内容写入磁盘时，常常先写入内存级缓冲区，再在特定规则下一次性将缓冲区的内容写入磁盘

**本文以C语言提供的用户级缓冲区为例介绍缓冲区

缓冲区的刷新规则

首先当一个进程正常退出时，会先刷新缓冲区再关闭文件,此时必定有一次刷新

而当进程运行时缓冲区的刷新策略主要有以下三种

无缓冲 内容直接写入文件
行缓冲 输入一般内容不刷新，遇到\n时刷新一次缓冲区
全缓冲 缓冲区有容量限制，满了之后就刷新

认识一下C语言的缓冲区

这里的系统环境是Linux

刷新规则

运行如下代码

#include <stdio.h>
#include <unistd.h>

int main()
{
    FILE* pfile = fopen("file.txt","w");//打开空文件

    fprintf(stdout,"stdout");//向标准输出输出
    fprintf(stderr,"strerr");//向标准错误输出输出
    fprintf(pfile,"file");//向文件输出
    _exit(0);//不刷新缓冲区，直接退出
    return ;
}

终端和文件的内容为:

stderr

可以看到只有标准错误输出有实际的输出,而标准输出和文件输出都没有输出

目前可以得出：

标准错误输出是无缓冲的刷新规则

因此我们再运行如下代码，再输出内容后面加上\n换行

#include <stdio.h>
#include <unistd.h>

int main()
{
    FILE* pfile = fopen("file.txt","w");//打开空文件

    fprintf(stdout,"stdout\n");//向标准输出输出
    fprintf(pfile,"file\n");//向文件输出
    _exit(0);
    return ;
}

终端输出内容为

1
2

stdout

而文件依然为空

由此可得:

标准输出遵循行缓冲的刷新规则
文件输出遵循全缓冲的刷新规则

缓冲区在fork中的行为

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>

int main()
{
    printf("hello1 ");//父进程向标准输出打印一句话
    fprintf(stdout,"hello2 ");//父进程向标准输出打印一句话

    fork();
    return 0;
}

上段代码的输出内容为

1	hello1 hello2 hello1 hello2

可见fork前的缓冲区内容被打印了两次（父子进程各一次），所以fork也会复制缓冲区的内容

实际上缓冲区属于进程的一部分，且fork时遵循写时拷贝

模拟封装Linux下C语言的文件接口（包括缓冲区）

主要目标

采用Mystdio.h声明，Mystdio.c实现的方式，封装read,write,close系统调用接口。并提供用户级缓冲区和缓冲区的刷新等功能

声明结构体和接口

我们先把主要的接口和主要的内容做出来看看封装效果

#ifndef __MYSTDIO_H__ //利用预编译防止头文件被重复编译
#define __MYSTDIO_H__

#include <string.h>

//声明文件结构体
typedef struct IO_FILE{
    int fileno;
}_FILE;

_FILE * _fopen(const char *filename,const char *flag);
int _fwrite(_FILE* fp,const char*s, int len);
void _fclose(_FILE* fp);

#endif

实现无缓冲区的接口

实现的部分由Mystdio.c完成

头文件

这里的头文件要能够提供使用系统调用接口,以及调用堆区的接口,所以头文件如下:

#include "Mystdio.h"
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <stdlib.h>
#include <unistd.h>

_fopen函数

我们先模拟实现fopen函数的主要功能，主要实现"w"``"a"``"r"的打开模式

#define FILE_MODE 0666 //设置默认的文件权限

_FILE * _fopen(const char *filename,const char *flag)
{
    int f = 0;//准备空位图
    int fd = -1;
    if(strcmp(flag,"w") == 0)
    {
        f = (O_CREAT|O_WRONLY|O_TRUNC);
        fd = open(filename,f,FILE_MODE);//打开文件
    }
    else if(strcmp(flag,"a") == 0)
    {
        f = (O_CREAT|O_WRONLY|O_APPEND);
        fd = open(filename,f,FILE_MODE);//打开文件
    }
    else if(strcmp(flag,"w") == 0)
    {
        f = O_RDONLY;
        fd = open(filename,f);//打开文件
    }
    else return NULL;//非法的打开模式

    if(fd == -1) return NULL;//打开失败
    
    _FILE *fp = (_FILE*)malloc(sizeof(_FILE));//创建_FILE结构体
    fp->fileno = fp;//设置_FILE结构体
    return fp;
}

_fwrite函数 ————无缓冲区

然后是先简单地写一个没有缓冲区的_fwrite

带缓冲区版本的稍后添加

int _fwrite(_FILE *fp,const char* s,int len)
{
    return wrtie(fp->fileno,s,len);//无缓冲区的写入版本
}

_fclose函数 ————不刷新缓冲区

这里也是先写个没缓冲区的

void _fclose(_FILE* fp)
{
    if(fp == NULL) return;//防止空指针
    close(fp->fileno);//关闭文件
    free(fp);//释放资源
}

为接口适配缓冲区

为`_FILE`结构体添加输入输出缓冲区

缓冲区和刷新规则标志声明在结构体中，使每个打开的文件都有独立的用户级缓冲区和刷新规则

#define SIZE 1024 //定义缓冲区大小
#define FLUSH_NONE 0 //无缓冲
#define FLUSH_LINE 1 //行缓冲
#define FLUSH_ALL 2 //全缓冲

typedef struct IO_FILE{
    int fileno;//文件描述符
    int flag; //刷新规则标志
    char inbuffer[SIZE];//输入缓冲区
    int in_pos;//输入缓冲区指针
    char outbuffer[SIZE];//输出缓冲区
    int out_pos;//输出缓冲区指针
}_FILE;

fopen添加语句

fopen仅需添加几句用于初始化的代码

//_FILE *fp = (_FILE*)malloc(sizeof(_FILE)); //申该语句之前都不变
fp->fileno = fd;//储存文件描述符
fp->flag = FLUSH_LINE;//设置为行刷新
fp->in_pos = 0;//指针置0
fp->out_pos = 0;//指针置0
//return fp;  //这句也不变

fwrite重写

fwrite要根据不同的刷新方式进行写入

int _fwrite(_FILE *fp,const char* s,int len)
{
    memcpy(&(fp->outbuffer[fp->out_pos]),s,len);//将内容拷贝至缓冲区指定位置
    fp->out_pos +=len;//简易偏移out_pos
    if(fp->fileno == FLUSH_NONE)
    {
        write(fp->fileno,s,fp->out_pos);//无缓冲区的写入版本
    }
    else if(fp->flag == FLUSH_LINE)
    {
        if(fp->outbuffer[fp->out_pos-1] == '\n')
        {
            write(fp->fileno,s,fp->out_pos);//立即刷新
            fp->out_pos = 0;
        }
        else{
            return len;
        }
    }
    else if(fp->flag == FLUSH_ALL)
    {
        if(fp->out_pos == SIZE)
        {
            write(fp->fileno,s,fp->out_pos);//立即刷新
            fp->out_pos = 0;
        }
        else{
            return len;
        }
    }
}

添加`_fflush`和修改`_fclose`

void _fflush(_FILE* fp)
{
    if(fp->out_pos > 0)
    {
        write(fp->fileno,fp->outbuffer,fp->out_pos);//立即刷新
        fp->out_pos = 0;
    }
}

void _fclose(_FILE* fp)
{
    if(fp == NULL) return;//防止空指针
    _fflush(fp);//刷新缓冲区
    close(fp->fileno);//关闭文件
    free(fp);//释放资源
}

小结

至此,我们已经封装了基本的写入功能,更多的细节可自行完善

戳我去github仓库🔗 查看源文件