读取文本文件每一行（转）

时间：2021-06-02 13:20:33 阅读：0 评论：0 收藏：0 [点我收藏+]

有人问到一个问题：

一个文本里有多行，如：
geafd1
bragd2
beree3
beaee4
dfefa/
fdasf5
feafd/
..
..
怎么把结尾是“/”的行删掉?

其实，解决思路很简单，将文本逐行读取到数组中，再遍历数组判断即可。于是，某个项目中常用方法：

方法一：

这也是微软提供的示例，在实际使用中发现，有时候，该方法的缺陷在于不能读取完整地读取文件所有行。怀疑是缓冲区过小。查MSDN说明：

StringReader . ReadLine 方法将行定义为后面跟有下列符号的字符序列：换行符（“/n”）、回车符（“/r”）或后跟换行符的回车符（“/r/n”）。所产生的字符串不包含终止回车符和/或换行符。如果已到达基础字符串的结尾，则返回值为 null 。
http://msdn.microsoft.com/zh-cn/library/system.io.streamreader.readline.aspx

我的理解：如果由于编码的问题，导致读取异常，也就是无法读取行标志时，可能会认为已到文件结尾而中断下行的读取。这也解释了为什么会有时读取不完整的原因。

如何避免这个问题呢？可以使用方法二：

方法二：

这里使用 StreamReader的Peek()方法，依据MSDN的说明，

Peek 方法返回一个整数值以便确定是否到达文件末尾，或发生其他错误。这样一来，用户在将返回值强制转换为 Char 类型之前就可以首先检查该值是否为 -1。

换句话说，它不需要先转换字符，即可返回是否达到文件末尾。

http://msdn.microsoft.com/zh-cn/library/system.io.streamreader.peek.aspx

其实还可以用第三种方法： File的 ReadAllLines 方法 (String)

方法三：

MSDN说明：

此方法打开一个文件，读取文件的每一行，然后将每一行添加为字符串数组的一个元素。然后它关闭文件。根据定义，一行就是一个后面跟有下列符号的字符序列：回车符（“/r”）、换行符（“/n”）或回车符后紧跟一个换行符。所产生的字符串不包含终止回车符和/或换行符。

此方法尝试根据现存的字节顺序标记来自动检测文件的编码。可检测到编码格式 UTF-8 和 UTF-32（包括 big-endian 和 little-endian）。

http://msdn.microsoft.com/zh-cn/library/s2tte0y1.aspx
方法三也可能存在与方法一类似的缺陷。
————————————————
版权声明：本文为CSDN博主「downmoon」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/downmoon/article/details/5820129

读取文本文件每一行（转）

标签：字节顺序字符串数组整数删掉微软遍历文件 ber 强制转换

原文地址：https://www.cnblogs.com/mcyushao/p/14819177.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行