标签:
一、问题
回顾上一篇,讲到了如何用Linq写一个超大的Xml,而不至于内存溢出,但是用Linq始终有一个限制,那就是必须要安装.net Framework 3.5,如果部署环境上没有安装3.5的,那该如何是好?
二、设置目标
把目标设置得与前一篇相同,也是把某目录下的所有文件和目录输出到一个xml里面去,这里就不再重复了。
三、分析
来分析一下,首先没有3.5框架,就不要指望XStremingElement了,然后排出DOM和其他In-Memory方式,这些方式无法写一个超大Xml并且内存不溢出。
先来看看msdn上关于Xml的处理,不难看到一篇关于XmlWriter的文章。对了,XmlWriter就是今天的主角,不过,XmlWriter是个抽象类,如何获得实例哪?ms是推荐使用XmlWriter.Create方法。
msdn里面的原话是:
虽然 Microsoft .NET Framework 包括 XmlTextWriter 类(该类是 XmlWriter 类的具体实现),但是在 2.0 版中的推荐做法是使用 Create 方法创建 XmlWriter 实例。
四、尝试与实现
1. 先来看看XmlWriter怎么使用吧
a. 先来个最简单的:这个Xml中包含一个root节点,内容为test
using (var writer = XmlWriter.Create(Console.Out)) { writer.WriteStartDocument(); writer.WriteElementString("root", "test"); writer.WriteEndDocument(); } //输出结果 <?xml version="1.0" encoding="gb2312"?><root>test</root>
b. 再来个稍微复杂点的
using (var writer = XmlWriter.Create(Console.Out)) { writer.WriteStartDocument(); writer.WriteStartElement("root"); writer.WriteString("test"); writer.WriteEndElement(); writer.WriteEndDocument(); }
运行结果完全一样。不过,你还可以看另一个方法,WriteFullEndElement。
using (var writer = XmlWriter.Create(Console.Out)) { writer.WriteStartDocument(); writer.WriteStartElement("root"); writer.WriteString("test"); writer.WriteFullEndElement(); writer.WriteEndDocument(); }
运行的结果,与使用WriteEndElement没有区别,两者真的没有区别吗?
c. WriteFullEndElement和WriteEndElement的区别
其实还是有一些小区别的,做下面一个试验,当去掉Element中间的内容时,也就是:
使用WriteEndElement:
using (var writer = XmlWriter.Create(Console.Out)) { writer.WriteStartDocument(); writer.WriteStartElement("root"); writer.WriteEndElement(); writer.WriteEndDocument(); } //结果 <?xml version="1.0" encoding="gb2312"?><root />
使用WriteFullEndElement
using (var writer = XmlWriter.Create(Console.Out)) { writer.WriteStartDocument(); writer.WriteStartElement("root"); writer.WriteFullEndElement(); writer.WriteEndDocument(); } //结果: <?xml version="1.0" encoding="gb2312"?><root></root>
区别:使用WriteEndElement会自动将没有内容的节点用Xml节点的缩写方式,而WriteFullEndElement则强制使用Xml节点的完整写法。
2. 实现
a. 基本实现
回到我们的目标,需求是写出目录和文件。为了完成这个目标,需要这样一个方法:
private static void GetFolderContent(XmlWriter writer, DirectoryInfo di) { writer.WriteStartElement("folder"); writer.WriteAttributeString("name", di.Name); foreach (var subDir in di.GetDirectories()) { GetFolderContent(writer, subDir); } foreach (var file in di.GetFiles()) { writer.WriteStartElement("file"); writer.WriteAttributeString("name", file.Name); writer.WriteEndElement(); } writer.WriteFullEndElement(); }
入口函数:
using (var writer = XmlWriter.Create(Console.Out)) { writer.WriteStartDocument(); var di = new DirectoryInfo(@"d:\sourcecode"); GetFolderContent(writer, di); writer.WriteEndDocument(); }
来看看输出结果:
<?xml version="1.0" encoding="gb2312"?><folder name="bin"><folder name="Debug"><file name="ConsoleApplication6.exe" /><file name="ConsoleApplication6.exe.config" /><file name="ConsoleApplication6.pdb" /><file name="ConsoleApplication6.vshost.exe" /><file name="ConsoleApplication6.vshost.exe.config" /><file name="ConsoleApplication6.vshost.exe.manifest" /></folder><folder name="Release"><file name="ConsoleApplication6.exe" /><file name="ConsoleApplication6.exe.config" /><filename="ConsoleApplication6.pdb" /><file name="ConsoleApplication6.vshost.exe" /><file name="ConsoleApplication6.vshost.exe.config" /><file name="ConsoleApplication6.vshost.exe.manifest" /></folder></folder>
Oh,no! 一坨Xml,根本没法看,这是因为XmlWriter默认配置是产生一个最小的Xml,而不是一个可读的Xml。
b. 改进,产生格式化的Xml
我们需要做的修改就是加一个Setting,看代码:
using (var writer = XmlWriter.Create(Console.Out, new XmlWriterSettings { Indent = true })) { writer.WriteStartDocument(); var di = new DirectoryInfo(@"E:\PDF"); GetFolderContent(writer, di); writer.WriteEndDocument(); }
结果:
<?xml version="1.0" encoding="gb2312"?> <folder name="bin"> <folder name="Debug"> <file name="ConsoleApplication6.exe" /> <file name="ConsoleApplication6.exe.config" /> <file name="ConsoleApplication6.pdb" /> <file name="ConsoleApplication6.vshost.exe" /> <file name="ConsoleApplication6.vshost.exe.config" /> <file name="ConsoleApplication6.vshost.exe.manifest" /> </folder> <folder name="Release"> <file name="ConsoleApplication6.exe" /> <file name="ConsoleApplication6.exe.config" /> <file name="ConsoleApplication6.pdb" /> <file name="ConsoleApplication6.vshost.exe" /> <file name="ConsoleApplication6.vshost.exe.config" /> <file name="ConsoleApplication6.vshost.exe.manifest" /> </folder> </folder>
c. 继续改进
看到文件/目录一排一排的出来,当然在短暂的停留时,可以看到节点写到一半的情况,在使用XStreamingElement也一样有这样的情况,当然XStreamingElement要解决这个问题比较麻烦,不过,XmlWriter则可以很简单的解决这个问题,只需要对GetFolderContent方法做一个小修改就可以了:
static void GetFolderContent(XmlWriter writer, DirectoryInfo di) { writer.WriteStartElement("folder"); writer.WriteAttributeString("name", di.Name); foreach (var subDir in di.GetDirectories()) { GetFolderContent(writer, subDir); } foreach (var fi in di.GetFiles()) { writer.WriteStartElement("file"); writer.WriteAttributeString("name", fi.Name); writer.WriteEndElement(); } writer.WriteFullEndElement(); writer.Flush(); }
就加了个Flush的调用,再看看输出效果,当然如果太快的话,也可以用Ctrl+C去中断程序执行,也可以发现基本上每次输出都是到一个Folder的完结的地方。
标签:
原文地址:http://www.cnblogs.com/sunshineground/p/4580802.html