C、C++一次将整个文件读入内存

转自:http://blog.csdn.net/cashey1991/article/details/6769038

@1.问题描述:

        C和C++的初学者经常采用一行一行读入文件的办法对文件数据进行处理。但是经常会有一些情况需要将一个文件整体一次读入内存处理。而C和C++库中并没有提供直接一次读入文件全部数据的函数。

 

@2.解决方法:

        目前给出C和C++的解决方案,下面两个程序只是用于演示,不过这些代码已经很容易改写成想要的函数了。

        解决这个问题的思路是:

        1.由于要将文件完整读入,所以必须使用二进制方式打开(若文本方式打开,文件流中会把一些非字符的数据过滤掉,我们将读取不到那些内容)。

        2.打开文件后,我们首先获取文件的大小,然后在内存中分配足够的空间,再把文件拷贝到内存空间中。之后使用内存空间进行数据处理,演示程序中没有真正的处理,我们只是简单将其输出。

@3.代码:

C实现

 

#include <stdio.h>
#include <stdlib.h>

int main ()
{
FILE * pFile;
long lSize;
char * buffer;
size_t result;

/* 若要一个byte不漏地读入整个文件,只能采用二进制方式打开 */
pFile = fopen ("test.txt", "rb" );
if (pFile==NULL)
{
fputs ("File error",stderr);
exit (1);
}

/* 获取文件大小 */
fseek (pFile , 0 , SEEK_END);
lSize = ftell (pFile);
rewind (pFile);

/* 分配内存存储整个文件 */
buffer = (char*) malloc (sizeof(char)*lSize);
if (buffer == NULL)
{
fputs ("Memory error",stderr);
exit (2);
}

/* 将文件拷贝到buffer中 */
result = fread (buffer,1,lSize,pFile);
if (result != lSize)
{
fputs ("Reading error",stderr);
exit (3);
}
/* 现在整个文件已经在buffer中,可由标准输出打印内容 */
printf("%s", buffer);

/* 结束演示,关闭文件并释放内存 */
fclose (pFile);
free (buffer);
return 0;
}

 

C++实现

#include <iostream>
#include <fstream>
using namespace std;

int main () {
filebuf *pbuf;
ifstream filestr;
long size;
char * buffer;
// 要读入整个文件,必须采用二进制打开
filestr.open ("test.txt", ios::binary);
// 获取filestr对应buffer对象的指针
pbuf=filestr.rdbuf();

// 调用buffer对象方法获取文件大小
size=pbuf->pubseekoff (0,ios::end,ios::in);
pbuf->pubseekpos (0,ios::in);

// 分配内存空间
buffer=new char[size];

// 获取文件内容
pbuf->sgetn (buffer,size);

filestr.close();
// 输出到标准输出
cout.write (buffer,size);

delete []buffer;
return 0;
}

 

@4.注意的问题:

 

        在这个演示程序中,如果采用文本方式打开会如何呢?即把C实现中的文件打开改为pFile = fopen ("test.txt","r" ),C++中的文件打开改为filestr.open ("test.txt")

        虽然这个用于测试的文件本身是一个文本文件,文本内容为:

test.txt

 

[plain] view plaincopy
 
  1. abcdefghijklm  
  2.   
  3. abcdefghijklm  
  4.   
  5. ppdsbd  

 

 

        但是如果采用文本模式打开仍会出现问题,测试中的“C实现”代码的程序会输出:

[cpp] view plaincopy
 
  1. Reading error  

        原因是有一些字符被文件流处理掉了,这造成fread函数讲到的字符数少于文件大小lSize,返回值result不等于lSize于是程序输出Reading error后退出了。

        同样的情况在C++实现的代码中也有,但是C++程序并没有退出,但它的输出结果不对,内容如下(仅为本机测试结果,因时因机器而异)

 

[plain] view plaincopy
 
  1. abcdefghijklm  
  2.   
  3. abcdefghijklm  
  4.   
  5. ppdsbdes\M  

        很明显末尾多出了"es\M"四个无效字符,很明显文件的末尾的字符串终止符(‘\0‘)被处理掉了,它并没有被写入buffer中,以致输出时多输出了四个无效字符。

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。