C++ 判断读取文件尾
在程序调试过程中发现,有一个程序一直死循环在文件的读取中。http://tuhao.blogbus.com/logs/21306687.html 从这边文章了解到了相关信息
主要在于eof()不只是读取文件的最后一个字符,它会接着往后读取,如果此函数返回ture时,则此时返回的文件结束符0xFF才是真正的结尾。
具体内容如下:
在使用C/C++读文件的时候,一定都使用过eof()这个函数来判断文件是否为空或者是否读到文件结尾了,也会在使用这个函数的过程中遇到一些问题,如不能准确的判断是否为空或者是否到了文件尾,以至于有些人可能还会怀疑这个函数是不是本身在设计上就有问题。
先来看看如下这段代码:
#include <iostream>
#include <fstream>
using
namespace std;
int main()
{
char ch = ‘x‘;
ifstream fin("test.txt" /*,
ios::binary*/);
if (fin.eof())
{
cout << "file
is
empty."<<endl;
return
0;
}
while (!fin.eof())
{
fin.get(ch);
cout << ch;
}
system("pause");
return 0;
}
编译并运行以上代码,
如果test.txt不存在,程序会形成死循环,fin.eof()永远返回false,
如果test.txt为空,程序打印出一个x字符,
当test.txt中存在一字符串“abcd”且没有换行时,程序打印出“abcdd”,
当存在以上字符串并且有一新的空行时,程序打印出“abcd”加上一空行。
这种现象可能让很多人很迷惑,程序运行的结果似乎很不稳定,时对时错。使用binary模式读时结果一样。在这里,大家可能有一个误区,认为eof()返回true时是读到文件的最后一个字符,其实不然,eof()返回true时是读到文件结束符0xFF,而文件结束符是最后一个字符的下一个字符。如下图所示:
因此,当读到最后一个字符时,程序会多读一次(编译器会让指针停留在最后一个字符那里,然后重复读取一次,这也就是就上面最后一个字符会输出两次的原因。至于是不是所有的编译器都这样处理我就不太清楚了,我使用的VC6,VC8似乎都是这样的)
问题出来了,就要找出对应的解决之道,要解决以上的问题,只需要调整一下条件语句即可:
fin.peek() ==
EOF 或 fin.get(ch)
再来看一下另外一种情况:
#include <iostream>
#include
<fstream>
#include <string>
using namespace std;
int
main()
{
string str;
ifstream fin("test.txt"/*,
ios::binary*/);
if (fin.peek() == EOF)
{
cout
<< "file is empty."<<endl;
return
0;
}
while (!fin.eof())
{
fin
>> str;
cout <<
str;
}
system("pause");
return
0;
}
上述代码在VC8下编译运行,发现,当文件结尾没有空行时,结果正确,当结尾有空行时,最后一个字符串将被重复输出一次, 而VC6的情况则有所不同,没有重复输出,但输出了一个空行。
因此,为了保证在不同的编译器下得到一致的我们期望的结果,将条件语句做一下修改:
fin >>
str
综上所述,我们可以得到以下结论:
1.
判断文件是否为空时使用peek函数,若peek返回EOF则文件为空;
2.
读取文件过程中,读取非char型时,使用peek判断文件尾将不再适用,循环判断条件应改用>>操作符进行读取,若读入char型缓冲区,peek函数会表现得很好。
郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。