码迷,mamicode.com
首页 > 其他好文 > 详细

读取文本文件每一行(转)

时间:2021-06-02 13:20:33      阅读:0      评论:0      收藏:0      [点我收藏+]

标签:字节顺序   字符串数组   整数   删掉   微软   遍历   文件   ber   强制转换   

有人问到一个问题:

一个文本里有多行,如:
geafd1
bragd2
beree3
beaee4
dfefa/
fdasf5
feafd/
..
..
怎么把结尾是“/”的行删掉?

 

其实,解决思路很简单,将文本逐行读取到数组中,再遍历数组判断即可。于是,某个项目中常用方法:

方法一:

 

 

这也是微软提供的示例,在实际使用中发现,有时候,该方法的缺陷在于不能读取完整地读取文件所有行。怀疑是缓冲区过小。查MSDN说明:

StringReader      . ReadLine 方法将行定义为后面跟有下列符号的字符序列:换行符(“/n”)、回车符(“/r”)或后跟换行符的回车符(“/r/n”)。 所产生的字符串不包含终止回车符和/或换行符。 如果已到达基础字符串的结尾,则返回值为 null     。
http://msdn.microsoft.com/zh-cn/library/system.io.streamreader.readline.aspx

我的理解:如果由于编码的问题,导致读取异常,也就是无法读取行标志时,可能会认为已到文件结尾而中断下行的读取。这也解释了为什么会有时读取不完整的原因。


 

如何避免这个问题呢?可以使用方法二:

方法二:

 

 

这里使用 StreamReader的Peek()方法,依据MSDN的说明,

Peek 方法返回一个整数值以便确定是否到达文件末尾,或发生其他错误。 这样一来,用户在将返回值强制转换为 Char 类型之前就可以首先检查该值是否为 -1。

换句话说,它不需要先转换字符,即可返回是否达到文件末尾。

http://msdn.microsoft.com/zh-cn/library/system.io.streamreader.peek.aspx

 

其实还可以用第三种方法: File的       ReadAllLines 方法 (String)

方法三:


MSDN说明:

此方法打开一个文件,读取文件的每一行,然后将每一行添加为字符串数组的一个元素。 然后它关闭文件。 根据定义,一行就是一个后面跟有下列符号的字符序列:回车符(“/r”)、换行符(“/n”)或回车符后紧跟一个换行符。 所产生的字符串不包含终止回车符和/或换行符。

此方法尝试根据现存的字节顺序标记来自动检测文件的编码。 可检测到编码格式 UTF-8 和 UTF-32(包括 big-endian 和 little-endian)。

 

http://msdn.microsoft.com/zh-cn/library/s2tte0y1.aspx
方法三也可能存在与方法一类似的缺陷。
————————————————
版权声明:本文为CSDN博主「downmoon」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/downmoon/article/details/5820129

读取文本文件每一行(转)

标签:字节顺序   字符串数组   整数   删掉   微软   遍历   文件   ber   强制转换   

原文地址:https://www.cnblogs.com/mcyushao/p/14819177.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!