Python按行读文件 高级

1. 最基本的读文件方法:

file = open("sample.txt") 
while 1:
    line = file.readline()
    if not line:
        break
    pass # do something

  一行一行得从文件读数据,显然比较慢;不过很省内存。

  在我的机器上读10M的sample.txt文件,每秒大约读32000行

2. 用fileinput模块

import fileinput 
for line in fileinput.input("sample.txt"):
    pass

  写法简单一些,不过测试以后发现每秒只能读13000行数据,效率比上一种方法慢了两倍多……

3. 带缓存的文件读取(最优)

file = open("sample.txt")
 
while 1:
    lines = file.readlines(100000)
    if not lines:
        break
    for line in lines:
        pass # do something

  这个方法真的更好吗?事实证明,用同样的数据测试,它每秒可以读96900行数据!效率是第一种方法的3倍,第二种方法的7倍!

————————————————————————————————————————————————————————————

4.readlines读取

file = open("sample.txt")
for line in file.readlines()
    pass #do somthing

此方法容易造成line溢出

 感谢http://www.cnblogs.com/xuxn/archive/2011/07/27/read-a-file-with-python.html

 

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。