码迷,mamicode.com
首页 > Windows程序 > 详细

C#操作XML(五)

时间:2015-06-16 16:15:30      阅读:153      评论:0      收藏:0      [点我收藏+]

标签:

 一、问题

  回顾上一篇,讲到了如何用Linq写一个超大的Xml,而不至于内存溢出,但是用Linq始终有一个限制,那就是必须要安装.net Framework 3.5,如果部署环境上没有安装3.5的,那该如何是好?

二、设置目标

  把目标设置得与前一篇相同,也是把某目录下的所有文件和目录输出到一个xml里面去,这里就不再重复了。

三、分析

  来分析一下,首先没有3.5框架,就不要指望XStremingElement了,然后排出DOM和其他In-Memory方式,这些方式无法写一个超大Xml并且内存不溢出。

  先来看看msdn上关于Xml的处理,不难看到一篇关于XmlWriter的文章。对了,XmlWriter就是今天的主角,不过,XmlWriter是个抽象类,如何获得实例哪?ms是推荐使用XmlWriter.Create方法。

  msdn里面的原话是:

    虽然 Microsoft .NET Framework 包括 XmlTextWriter 类(该类是 XmlWriter 类的具体实现),但是在 2.0 版中的推荐做法是使用 Create 方法创建 XmlWriter 实例。

四、尝试与实现

1. 先来看看XmlWriter怎么使用吧

  a. 先来个最简单的:这个Xml中包含一个root节点,内容为test 

using (var writer = XmlWriter.Create(Console.Out))
{
     writer.WriteStartDocument();
     writer.WriteElementString("root", "test");
     writer.WriteEndDocument();      
}

//输出结果
<?xml version="1.0" encoding="gb2312"?><root>test</root> 

  b. 再来个稍微复杂点的

using (var writer = XmlWriter.Create(Console.Out))
{
     writer.WriteStartDocument();
     writer.WriteStartElement("root");
     writer.WriteString("test");
     writer.WriteEndElement();
     writer.WriteEndDocument();      
}

  运行结果完全一样。不过,你还可以看另一个方法,WriteFullEndElement。

using (var writer = XmlWriter.Create(Console.Out))
{
    writer.WriteStartDocument();
    writer.WriteStartElement("root");
    writer.WriteString("test");
    writer.WriteFullEndElement();
    writer.WriteEndDocument();
}

  运行的结果,与使用WriteEndElement没有区别,两者真的没有区别吗?

  c. WriteFullEndElement和WriteEndElement的区别

   其实还是有一些小区别的,做下面一个试验,当去掉Element中间的内容时,也就是:

  使用WriteEndElement:

using (var writer = XmlWriter.Create(Console.Out))
{
    writer.WriteStartDocument();
    writer.WriteStartElement("root");
    writer.WriteEndElement();
    writer.WriteEndDocument();
}

//结果
<?xml version="1.0" encoding="gb2312"?><root />

  使用WriteFullEndElement

using (var writer = XmlWriter.Create(Console.Out))
{
    writer.WriteStartDocument();
    writer.WriteStartElement("root");
    writer.WriteFullEndElement();
    writer.WriteEndDocument();
}

//结果:
<?xml version="1.0" encoding="gb2312"?><root></root>

  区别:使用WriteEndElement会自动将没有内容的节点用Xml节点的缩写方式,而WriteFullEndElement则强制使用Xml节点的完整写法。 

 2. 实现

  a. 基本实现

  回到我们的目标,需求是写出目录和文件。为了完成这个目标,需要这样一个方法:    

private static void GetFolderContent(XmlWriter writer, DirectoryInfo di)
{
    writer.WriteStartElement("folder");
    writer.WriteAttributeString("name", di.Name);
    foreach (var subDir in di.GetDirectories())
    {
        GetFolderContent(writer, subDir);
    }
    foreach (var file in di.GetFiles())
    {
        writer.WriteStartElement("file");
        writer.WriteAttributeString("name", file.Name);
        writer.WriteEndElement();
    }
    writer.WriteFullEndElement();
}

  入口函数:

using (var writer = XmlWriter.Create(Console.Out))
{
    writer.WriteStartDocument();
    var di = new DirectoryInfo(@"d:\sourcecode");
    GetFolderContent(writer, di);
    writer.WriteEndDocument();
}

  来看看输出结果:

<?xml version="1.0" encoding="gb2312"?><folder name="bin"><folder name="Debug"><file name="ConsoleApplication6.exe" /><file name="ConsoleApplication6.exe.config" /><file name="ConsoleApplication6.pdb" /><file name="ConsoleApplication6.vshost.exe" /><file name="ConsoleApplication6.vshost.exe.config" /><file name="ConsoleApplication6.vshost.exe.manifest" /></folder><folder name="Release"><file name="ConsoleApplication6.exe" /><file name="ConsoleApplication6.exe.config" /><filename="ConsoleApplication6.pdb" /><file name="ConsoleApplication6.vshost.exe" /><file name="ConsoleApplication6.vshost.exe.config" /><file name="ConsoleApplication6.vshost.exe.manifest" /></folder></folder>

  Oh,no! 一坨Xml,根本没法看,这是因为XmlWriter默认配置是产生一个最小的Xml,而不是一个可读的Xml。

  b. 改进,产生格式化的Xml

  我们需要做的修改就是加一个Setting,看代码:  

using (var writer = XmlWriter.Create(Console.Out, new XmlWriterSettings { Indent = true }))
{
    writer.WriteStartDocument();
    var di = new DirectoryInfo(@"E:\PDF");
    GetFolderContent(writer, di);
    writer.WriteEndDocument();
}

  结果:

<?xml version="1.0" encoding="gb2312"?>
<folder name="bin">
  <folder name="Debug">
    <file name="ConsoleApplication6.exe" />
    <file name="ConsoleApplication6.exe.config" />
    <file name="ConsoleApplication6.pdb" />
    <file name="ConsoleApplication6.vshost.exe" />
    <file name="ConsoleApplication6.vshost.exe.config" />
    <file name="ConsoleApplication6.vshost.exe.manifest" />
  </folder>
  <folder name="Release">
    <file name="ConsoleApplication6.exe" />
    <file name="ConsoleApplication6.exe.config" />
    <file name="ConsoleApplication6.pdb" />
    <file name="ConsoleApplication6.vshost.exe" />
    <file name="ConsoleApplication6.vshost.exe.config" />
    <file name="ConsoleApplication6.vshost.exe.manifest" />
  </folder>
</folder>

  c. 继续改进

  看到文件/目录一排一排的出来,当然在短暂的停留时,可以看到节点写到一半的情况,在使用XStreamingElement也一样有这样的情况,当然XStreamingElement要解决这个问题比较麻烦,不过,XmlWriter则可以很简单的解决这个问题,只需要对GetFolderContent方法做一个小修改就可以了:  

static void GetFolderContent(XmlWriter writer, DirectoryInfo di)
{
    writer.WriteStartElement("folder");
    writer.WriteAttributeString("name", di.Name);
    foreach (var subDir in di.GetDirectories())
    {
        GetFolderContent(writer, subDir);
    }
    foreach (var fi in di.GetFiles())
    {
        writer.WriteStartElement("file");
        writer.WriteAttributeString("name", fi.Name);
        writer.WriteEndElement();
    }
    writer.WriteFullEndElement();
    writer.Flush();
}

  就加了个Flush的调用,再看看输出效果,当然如果太快的话,也可以用Ctrl+C去中断程序执行,也可以发现基本上每次输出都是到一个Folder的完结的地方。

C#操作XML(五)

标签:

原文地址:http://www.cnblogs.com/sunshineground/p/4580802.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!