码迷,mamicode.com
首页 > Windows程序 > 详细

Windows 8.1 重复数据删除——规划部署(二)

时间:2015-04-21 01:56:05      阅读:412      评论:0      收藏:0      [点我收藏+]

标签:重复数据删除   microsoft-windows-vdsinterop-package   win8重复数据删除   enable-dedupvolume   get-dedupvolume   

一、规划部署目标
   Windows 8.1&Server 2012 的重复数据删除设计为安装到主要数据卷上,而无需添加任何附加的专用硬件。这意味着你可以安装和使用该功能,而不会影响服务器上的主要工作负载。默认设置为非侵入性的,因为它们允许在处理特定文件之前数据“存留时间”达到五天,默认的最小文件大小为 32 KB。该实现是为低内存和 CPU 利用率而设计的。如果内存利用率变高,则重复数据删除功能将等待可用的资源。管理员可以根据所涉及数据的类型以及该卷或特定文件类型的更改频率和更改量,来计划更加积极的重复数据删除。
重复数据删除的理想工作负载包括
常规文件共享:组内容发布和共享、用户主页文件夹和配置文件重定向(脱机文件)
软件部署共享:软件二进制文件、映像和更新
VHD 库:要设置到虚拟机监控程序的虚拟硬盘 (VHD) 文件存储

二、确定作为重复数据删除候选的卷
   重复数据删除在优化存储和减少磁盘空间占用方面可以达到很好的效果:如果应用于适当的数据,将减少多达 50% 到 90% 的空间占用。选择待进行重复数据删除的数据时,应评估以下三点注意事项:
1.数据中是否存在重复现象

承载用户文档的文件共享或服务器、软件部署二进制文件或虚拟硬盘文件往往存在大量的重复数据,因此重复数据删除将节省大量空间。下表主要显示了各种内容类型的典型的重复数据删除节省情况。结果将因数据类型、混合和大小情况而异。在启用重复数据删除之前,最好先针对数据样本进行评估。

技术分享

2.数据访问模式是否允许足够的时间进行重复数据删除

经常更改或者由用户或应用程序不断访问的文件不是进行重复数据删除的好候选。不断访问和更改数据可能会抵消重复数据删除带来的任何优化成效,而且重复数据删除可能无法处理这些文件。

  • 重复数据删除好的候选包括承载用户文档的文件共享、虚拟文件或软件部署文件,这些文件包含不常修改但经常读取的数据。

  • 重复数据删除不好的候选包括不断装入并运行虚拟机的 SQL Server 数据库,以及实时 Exchange Server 数据库。

好的候选有足够时间来删除文件中的重复数据。可以应用文件存留时间策略来控制删除文件中重复数据的时间,以防对仍有可能进行大量修改的文件执行过早或频繁的重复数据删除。

3.服务器是否具有足够的资源和时间运行重复数据删除

重复数据删除需要读取、处理和写入大量的数据。这将占用服务器资源,在规划部署时必须考虑该情况。服务器通常有高峰活动期间,也有资源利用率较低的时候。重复数据删除可在资源空闲时完成大部分工作。始终以最大容量运行的服务器不是重复数据删除的好候选,即便重复数据删除进程可以使用后台优化作业来优化某些文件也是如此。

基于观测到的节省和典型资源利用情况,对重复数据删除部署候选评定的级别如下:

  • 极佳的重复数据删除候选:文件夹重定向服务器;虚拟化 depot 或设置库;软件部署共享;SQL Server 和 Exchange Server 备份卷;

  • 应基于以下内容进行评估:业务线服务器;静态内容提供程序;Web 服务器;高性能计算 (HPC);

  • 重复数据删除的不佳候选:Hyper-V 主机;VDI VHD;WSUS;运行 SQL Server 或 Exchange Server 的服务器;大小接近或大于 1 TB 的文件;


三、重复数据删除的服务器和卷要求
服务器:
有关重复数据删除的服务器要求,请参阅下面的列表:
服务器硬件应满足运行 Windows 8.1&Server 2012 的最低要求重复数据删除功能设计为支持最低配置,如配有 4 GB RAM 和一个 SATA 硬盘驱动器的单处理器系统。
如果计划在同一服务器的多个卷上支持重复数据删除,你将需要为系统计划适当的大小,以确保系统可以处理数据。通常,服务器需要 1 个 CPU 内核和 350 MB 可用内存,以在单个卷上运行重复数据删除作业;该作业每小时可以处理约 100 GB 数据,或者每天可以处理约 2 TB 数据。重复数据删除功能使用额外的 CPU 内核处理器和可用内存进行伸缩以允许对多个卷进行并行处理。
重复数据删除功能一次支持多达 90 个卷,但是,该功能除了允许每个物理 CPU 内核处理器一次处理一个卷外,还可以额外再处理一个卷。超线程不会对此造成影响,因为只有物理内核处理器才可用于处理卷。配有 16 个 CPU 内核处理器和 90 个卷的系统一次将处理 17 个卷,直到所有 90 个卷全部处理完成,但前提是有足够的内存。
虚拟服务器实例应遵循与关于服务器资源的物理硬件相同的指导。
卷 :
作为重复数据删除候选的卷必须符合下列要求:
不能是系统卷或引导卷。重复数据删除在操作系统卷上不受支持。
可以按主启动记录 (MBR) 或 GUID 分区表 (GPT) 进行分区,而且必须使用 NTFS 文件系统格式化。
可以驻留在共享存储上,如使用光纤通道或 SAS 阵列的存储,或完全支持 iSCSI SAN 和 Windows 故障转移群集时。
不依赖群集共享卷 (CSV)。如果将支持重复数据删除的卷转换为 CSV,你可以访问数据,但不能继续对文件进行重复数据删除处理。
不依赖 Microsoft 复原文件系统 (ReFS)。
必须以不可移动驱动器形式向操作系统公开。远程映射驱动器不受支持。
 备注
具有扩展属性的文件、加密文件、小于 32 KB 的文件和重解析点文件不会被重复数据删除功能进行处理。


windows 8.1启用重复数据删除功能:

1.准备cab文件(因官方下载地址总是提示您访问的网页出错了!推荐本人下载位置:http://pan.baidu.com/s/1o6xEI9s  本例以F盘为准);

  • Microsoft-Windows-Dedup-Package~31bf3856ad364e35~amd64~~6.3.9600.16384

  • Microsoft-Windows-Dedup-Package~31bf3856ad364e35~amd64~en-US~6.3.9600.16384

  • Microsoft-Windows-FileServer-Package~31bf3856ad364e35~amd64~~6.3.9600.16384

  • Microsoft-Windows-FileServer-Package~31bf3856ad364e35~amd64~en-US~6.3.9600.16384

  • Microsoft-Windows-VdsInterop-Package~31bf3856ad364e35~amd64~~6.3.9600.16384

  • Microsoft-Windows-VdsInterop-Package~31bf3856ad364e35~amd64~en-US~6.3.9600.16384

技术分享

2.管理员DOS命令下执行Dism命令:

  • dism /online /add-package /packagepath:Microsoft-Windows-VdsInterop-Package~31bf3856ad364e35~amd64~~6.3.9600.16384.cab /packagepath:Microsoft-Windows-VdsInterop-Package~31bf3856ad364e35~amd64~en-US~6.3.9600.16384.cab /packagepath:Microsoft-Windows-FileServer-Package~31bf3856ad364e35~amd64~~6.3.9600.16384.cab /packagepath:Microsoft-Windows-FileServer-Package~31bf3856ad364e35~amd64~en-US~6.3.9600.16384.cab /packagepath:Microsoft-Windows-Dedup-Package~31bf3856ad364e35~amd64~~6.3.9600.16384.cab /packagepath:Microsoft-Windows-Dedup-Package~31bf3856ad364e35~amd64~en-US~6.3.9600.16384.cab

  • dism /online /enable-feature /featurename:Dedup-Core /all

技术分享

3.使用 Windows PowerShell 启用重复数据删除:

 1)、若要在卷上启用重复数据删除,请在服务器上运行以下 Windows PowerShell 命令。在此示例中,卷 F 上启用了重复数据删除。

  PSC:\> Enable-DedupVolume F:

 2)、作为另一种选择,使用以下命令,设置文件进行重复数据删除前,应保留的最少天数。

  PSC:\> Set-Dedupvolume F: -MinimumFileAgeDays 10

 3)、查看已启用重复数据删除的卷

  PSC:\> Get-DedupVolume                             \\返回摘要信息

  PSC:\> Get-DedupVolume | format-list         \\返回有关卷重复数据删除设置的详细信息

技术分享

注:如果将 MinimumFileAgeDays 设为 0,那么重复数据删除将处理所有文件,不论其留存时间有多久。这适合于测试环境,在这种环境中你想要进行最大限度的重复数据删除。但是,在生产环境中,最好是等待几天(默认为 5 天),因为在更改率减缓前,文件往往会在短时间内改变很多。这允许对服务器资源进行最有效的使用。

4.设置重复数据删除优化作业:

重复数据删除功能带有内置作业,可定期地自动启动并优化指定的卷。优化作业根据策略设置在卷上删除重复数据,并压缩文件区块。初始优化完成之后,优化作业根据你配置的作业日程表或产品附带的默认作业日程表,在策略中包含的文件上运行。

  Start-DedupJob cmdlet   触发优化作业

   PSC:\> Start-DedupJob –Volume F: –Type Optimization                \\立即返回作业异步启动

   PSC:\> Start-DedupJob F: –Type Optimization -Wait                      \\稍后完成作业异步启动

  Get-DedupJob cmdlet    查询作业的进度

   PSC:\> Get-DedupJob

  Get-DedupJob                显示当前正在运行或排队等待运行的作业

  Get-DedupStatus cmdlet         查询包括在卷上获得的节省在内的关键状态统计

   PSC:\> Get-DedupStatus | f1

技术分享

  Get-DedupStatus                     显示可用空间、节省的空间、优化的文件、InPolicyfiles(基于定义的文件留存时间、大小、类型和位置条件,属于卷重复数据删除策略的文件数量)以及相关的驱动器标识符

数据清理作业:

   PSC:\> Start-DedupJob F: –Type Scrubbing                        \\这创建一个作业,尝试修复所有记录到重复数据删除内部损坏日志中(I/O 期间被记录到重复数据删除文件中)的损坏;

   PSC:\> Start-DedupJob F: –Type Scrubbing -full                 \\-full 参数将清理整个已删除重复的数据集合,并查找所有导致数据访问失败的损坏;

技术分享

垃圾回收作业:

   PS C:\> Start-DedupJob F: –Type GarbageCollection            \\删除不访问的区块,并压缩具有 5% 以上不访问数据的容器;

   PS C:\> Start-DedupJob F: –Type GarbageCollection -full     \\将所有容器压缩到可能的最大限度

相关信息参照官网。祝大家生活愉快!

本文出自 “听闻” 博客,请务必保留此出处http://wenzhongxiang.blog.51cto.com/6370734/1636286

Windows 8.1 重复数据删除——规划部署(二)

标签:重复数据删除   microsoft-windows-vdsinterop-package   win8重复数据删除   enable-dedupvolume   get-dedupvolume   

原文地址:http://wenzhongxiang.blog.51cto.com/6370734/1636286

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!