Exchange 的数据管理

Exchange 的数据管理 - 操作系统 - 电脑教程网

Exchange 的数据管理

日期:2007-08-06   荐:
导读:随着电子邮件越来越多和越来越大,你已经无法回避如何有效管理Exchange数据的重要性。Exchange邮箱有大小限制,无法满足用户希望保留更多邮件在服务器上的要求,应该鼓励用户使用PST文件来解决问题吗?本文将从问题的根源为您对比、分析和作答。

要实现有效的Exchange Server数据管理不是一件容易的事情。尤其是要在用户需求和Exchange性能及稳定性之间找到平衡点则更是难上加难。如今,电子邮件服务日益成为各个公司和组织的关键应用,而此时管理员们也逐渐陷入一种两难的境地。要进行有效的Exchange数据管理,你需要一个由多种技术方法组合起来的方案,包括明文规定的用户守则和适当的技术(例如:存储硬件、监视和报表工具、数据管理应用程序)。那么现在应该从哪里入手呢?

首先,我需要澄清我所谓的有效的数据管理是什么。我认为有效的数据管理就是:在向用户提供所需数据访问服务的同时,安全、并且最优化的Exchange数据存储。我建议最佳切入点就是从检验你公司的财务、技术和法规约束开始。这些因素将在很大程度上影响你如何决定存储组(SGs)、数据库、用户邮箱(包括离线文件夹—OSTs,以及个人文件夹—PSTs)等Exchange数据在备份、恢复和归档时的功能。

译者注:
OST脱机文件夹文件:用于在本地计算机上保存Exchange Server邮箱的本地副本,当连接可用时OST文件中的项目与服务器同步。

各种约束
任何管理Exchange数据的管理员都会面临一些如何进行平衡的相互矛盾的需求。当你在市场上寻找数据管理解决方案时,有三个事项你会特别考虑。你会首先考虑该方案的花费、该方案在技术上的限制、以及公司需要遵守的法律规章。

财务约束。随着电子邮件数据的持续增长(包括数量的增长和大小的增长)以及越来越多的企业决定将电子邮件保存在Exchange数据库或者其它可回溯的离线存储中,也就是说,企业数据存储的需求增强了——相应的,所需投入的资金也需要增加。财务方面的考虑除了包括购买额外磁盘的费用,还要考虑存储基础设施(例如:额外的存储阵列、备份设备、存储区域网络——SANs)以及管理此存储的人员花费。这些费用将根据你企业的规模和需求不同而不同。小型企业可能只需购买一些磁盘就可以满足几百个用户增长的存储需求,而对于一些大型企业,拥有数以千计的用户可能就不会那么简单了。

如果存储的需求超过了你能够支付的预算,那么你可能就需要实施更严格的备份策略,限制哪些数据可以进行备份,将那些重要性低的,不活动的数据排除在外,或者采用归档方案。采用这种方法通常要比购买存储设备以满足存储需求的方案节约很多。

技术约束。即使你的企业有能力,也愿意为购买更多的存储空间付出资金,但是不受控制的数据增长有可能损害你在维护有效备份和快速恢复数据的能力。虽然磁带机技术在不断发展,但是增长的数据必然导致不断变长的备份和恢复时间。所以,在我们尽力满足一个需求的时候(例如:快速的数据访问)有可能因此无法满足其它一些需求(例如:快速的数据恢复)。

所以不妨评估一些折中这些需求的方案。这些折中方案一般由在线的Exchange数据管理和离线的归档方案结合而成。类似的方案吸引人之处在于,它允许你指定一个Exchange存储增长的最高限值,并且根据策略将关键数据归档,但仍然保持这些数据易于被搜索和访问。

规章约束。很多企业都实施一些强制电子邮件通信归档的规章制度。那些实施了邮件归档的公司,大多都是为了达到企业内部管理制度的要求(而不是外部的要求)。一个完善的,满足各项规定的系统应该能够帮助企业回溯所有入站、出站或者中继的电子邮件。当你实施了这样一个系统之后,你便能够保证任何出入你系统的信息都可以被找回,无论它位于PSTs文件中还是在手持设备中。

当你了解了那些约束会影响你的企业之后,就可以开始对分别位于Exchange Server上的数据库文件、Outlook的缓存文件(OSTs)、PSTs文件指定不同的策略。你还需要决定那种备份、恢复、归档方案最适合你的环境。

管理基于服务器的数据
Exchange将电子邮件数据保存在Exchange Server的数据库中。一般而言,将数据存储在Exchange服务器上要比存放在PSTs文件中更易于访问和管理。共享信息的最佳位置就是使用Exchange公用文件夹数据库。一个Exchange Server 2003或Exchange 2000 Server最多可以支持4个SGs,而每个SG最多可以支持5个数据库。所以,一个服务器最多可以支持多达20个数据库。根据Exchange数据库的最佳实践表明,当数据库大小不超过40GB时,备份和恢复所需时间仍然保持在可接受的范围。

存储限制决定了每个Exchange系统可以支持的最大用户数。Exchange存储子系统必须能够应付它所支持用户所产生的I/O数据量。微软知识库文章“优化Exchange Server2003的存储”(http://www.microsoft.com/downloads/details.aspx?FamilyID=c6084d20-9730-4ffc-805d-b957327604c6&DisplayLang=zh-cn,中文版)建议在规划Exchange服务器时,按照每秒每用户平均0.75的I/Os为最佳。这对于大多数的系统—包括那些高端SAN平台——该建议书提出每服务器支持4000位用户是最大限度。

你需要遵循这些数据库大小和支持用户数量的限制,还有其它的一些性能参数(例如:事务日志的大小)、服务器的硬件水平、分配的存储区域和设定邮箱的大小。如图1显示了一个典型的数据表工具,用于计算存储需求。例如,一台设置邮箱大小为200MB的服务器支持4000个用户是比较合适的。

除了可以通过限制邮箱大小(你既可以为一个数据库中的所有邮箱作限制,也可以针对某些用户)管理基于Exchange的数据之外,还可以使用组策略和Exchange邮箱管理器,删除用户邮箱中过期,或者特别巨大的电子邮件。这种办法有助于防止用户邮箱很快超过限额。如果你担心用户常常会误删除邮件,那么Exchange的“恢复已删除邮件”功能非常有用。当启用该功能之后,用户可以直接在他们已经清空的已删除邮件中恢复。这个功能可以很好的解决用户删除邮件后又需要恢复的需求,否则只能通过管理员进行耗时耗力从备份磁带中恢复。但是仍然要注意因此会导致的数据库增长,我们有充分证据表明将删除项目的保留时间设置为7天,数据库会因此增长10%-30%。

管理基于用户的数据
用户通常使用OST或者PST格式将电子邮件保存在本地桌面或者笔记本电脑上,这可谓是最难以管理的Exchange数据,因为这些文件通常都是分散的,无法访问的(从系统管理的角度)。OST文件要稍好一些,因为它总是Exchange数据的一个副本。如果使用Outlook 2003缓存Exchange模式,该OST文件则是在线Exchange邮箱完全一致的副本,但对于非缓存模式(或者早期版本的Outlook),本地OST保存了服务器上邮箱数据的一个子集。

PST则完全不同。由于每个电子邮箱都有大小限制,这样就迫使用户将一些重要的邮件保存到PST文件中,所以这些文件通常都很大(几百兆甚至更大),通常都保存在本地硬盘——也就是说这些重要的信息都没有得到备份。有的用户会将PST文件放在服务器的私密共享区域,至少这比分散存放在用户计算机中要好一些。因为服务器的每日备份会包含这些保存在服务器上的PST文件,但是如果没有一个机制去检测PST文件的大小和增长速度,仍然可能成为问题。所以对比这两种情况,将电子邮件转移到PST文件有些得不偿失。而且,PST文件在安全性方面存在很大隐患。用户可以选择加密PST文件,但是解密PST的工具可以说是唾手可得。如果用户使用PST保存敏感信息,一旦笔记本或者数据丢失,那么该信息被窃取将是无法挽回的。即使PST保存在服务器共享,防止未经授权的访问也是必需的。最后,如果法律顾问要求公司实施电子邮件归档和回溯机制,那么这些无法管理的PST将给你带来无尽的烦恼。

更好的备份和恢复
在选择备份和恢复解决方案时,最重要的因素取决于你需要处理的数据量和处理速度。对基于服务器端的数据,很多企业按照在一小时内恢复的速度为标准进行选择(该标准根据你公司的服务等级备忘录而定)。例如,要满足一小时恢复40GB数据的要求,那么相应的磁带机必须能够提供不低于每秒10MBps的速度。目前很多备份方案都提供在数据真正写入磁带之前转移到中间媒介的功能,所以备份和恢复速度与常规的备份至磁带相比要快得多。

采用SAN的系统通常拥有更高的恢复速度;一般每小时在100GB到140GB都比较常见。这种高速度当然有利于你如何设计数据库。在固定时间内能够备份和恢复越多的数据,就赋予你在系统设计时更多的灵活性,你既可以提高每个邮箱的大小限制,也可以增加每服务器支持的用户数。

Windows Server 2003的卷影复制(Volume Shadow Copy Services,VSS)功能与Exchange 2003一道能够提供在秒钟内为Exchange数据库作多个连续的快照。但是请注意,该快照只是原始数据库在磁盘上的瞬时映像,所以如果一旦源物理卷损坏,这些快照就完全失效了(虽然很多存储供应商正在致力解决此难题)。所以,即使对数据作了快照,仍然需要进行磁带备份。但快照的数据将能够在极短的时间内恢复。所以支持VSS的存储应用能够大幅度提高备份和恢复的速度,你的数据存储构架也会因此得到极大的提高,但是在部署至生产环境之前需要仔细测试。

Exchange 2003(特别是SP1)提供一个新的称为恢复存储组(Recovery Storage Group,RSG)的功能。它的概念十分简单:当一个SG中的某个数据库失败,而需要从备份中恢复时,一个空的恢复数据库可以供受影响的用户暂时使用。虽然在恢复过程中用户无法访问原来数据库中的电子邮件,但是恢复存储组提供了收发新邮件的基本功能。当损坏的数据库恢复完成后,恢复存储组(保存了一些新近收发的邮件)能够与老数据库进行合并。并且SP1中新的恢复邮箱数据向导(Recover Mailbox Data Wizard)简化了两个数据库的合并过程。

至于备份基于用户的数据,例如PST文件,仍然是个挑战。如果希望对用户本地硬盘上的PST文件进行备份,那几乎是不可能的,因为我们很难控制用户在他们工作站上的行为。对于存放在网络共享上的PST文件能够被集中备份,但是与把数据存放在Exchange数据库中相比并没有多大的优势。

严格地说,归档解决方案与符合法规(Regulatory-Compliance)解决方案主要存在以下几点不同:
· 归档通常由用户发起,并且用户可以自主决定如何将信息从他们的Exchange邮箱转移到归档存储。
· 专有归档系统通常采用基于策略的内容过期时间等一些硬性指标,把内容转移到归档存储。
· 一般的归档解决方案都无法做到对所有由系统创建,或者经由系统处理过的出入站的电子邮件完整记录。

虽然Outlook提供了一个非常基本的存档功能,允许用户设置当邮箱中存储的消息超过所设定的阈值,就将其转移至一个PST文件或者删除。但是该功能仅支持有限的转移,而且不支持归档到一个专用的、受保护的归档设备中,所以对于我们所讨论的归档特性,Outlook无法为我们提供什么。

市场上已有不少成熟的解决方案可用,例如来自VERITAS公司的KVS Enterprise Vault,能够提供用户发起与策略结合,将消息归档至一个第二层(或者更高)数据位置的功能。这些解决方案都十分有效,因为在电子邮件以及附件归档时,在用户的Exchange邮箱中保留一个电子邮件存根(Stub)。如果用户需要访问被归档的邮件,只需点击该邮件存根。这样Exchange存储的效率能够得到增强,因为一些大的附件都可以通过这种方式转移到归档存储,从而为Exchange腾出更多可用空间。

这种类型的归档方案一般都集成了Exchange的消息日志(Journaling)功能,可以提供截取和跟踪经由该Exchange服务器的电子邮件。但是如果电子邮件数量越来越大,以及符合法规成为必须,即使是集成了Exchange的消息日志功能的归档方案也无法满足要求(那些提供了无法改写、无法删除、只读的归档存储解决方案),就会有更高级的技术加以取代。

这种类型的技术包括EMC Centera和HP公司的 Reference Information Storage System(RISS)。这些解决方案允许你将电子邮件存储为静态内容,一种无法修改的格式,通常保存在与RAID类似的磁盘上,来保证数据的一致性和内容的完整性,包括数字签名和时间戳等等。这些解决方案除了提供内容检索和可取回的功能之外,都应用了分层存储管理(Hierarchical Storage Management,HSM)。HSM对于大型企业而言非常重要,例如平均每天每用户会发送20封电子邮件,每封邮件平均大小为25KB。在一个拥有10,000个用户的企业中,相应的每天就会产生大约200,000封电子邮件——也就是每天4.7GB,而每年1.7TB。如果你还需要对入站邮件归档,那么存储的要求还会大大增加。当然,这只是平均水平,根据我的经验,在一个拥有9,400个用户的企业中,一个用户每月大概会收到120GB到150GB的电子邮件。

大多数企业之所以实施归档,一般都是开始迁移Exchange系统的前奏。因为这项技术能够明显减少需要迁移的数据量,可以加快迁移进程。

译者注:
EMC Centera是一种网络存储系统,它是专门为存储和快速而方便地存取固定内容而设计的。Centera 的突出优势是WORM(一次写入多次读取)属性中的不可重写性和不可擦除性,磁盘的性能和TCO。http://china.emc.com/products/systems/centera_ce.jsp

HP公司的Reference Information Storage System(RISS)参考信息存储系统:http://www.hp.com.cn/storage/mo_jukebox/RISS/default.asp

分层存储管理(Hierarchical Storage Management,HSM)就是将用户拥有的所有存储资源(磁带机、磁带库、NAS、中低端盘阵、高端存储系统等等)统一管理,提高每种存储设备的利用率,节约成本。根据存放数据的价值,合理利用在线、近线与离线存储的存储资源。

着手开始
随着电子邮件数据的持续增长(包括数量的增长和大小的增长),你已经无法回避如何有效管理Exchange数据的重要性。用户将会不断要求保留更多的数据在服务器上,这对你在短时间内快速恢复大量数据造成难题。作为一名系统管理员,你必须在综合考虑企业的实际情况、财务状况、技术和法规问题的情况下,尽最大可能满足不断增长的需求。幸运的是,目前市场上已经有很多可供选择的解决方案:邮箱限额、存储技术和归档解决方案等等。要评估和了解更多这些解决方案的信息,请参考附文“在现实环境中考虑Exchange的数据管理”和“数据管理的挑战:为什么需要数据管理?”。

译者注:
可以参考微软官方文档《Exchange Server 2003性能和可伸缩性指南》(中文):
http://www.microsoft.com/downloads/ThankYou.aspx?familyId=62fb1297-4c6b-4d84-84cc-060989f2f305&displayLang=zh-cn

关于作者
Kieran McCorry,目前居住在爱尔兰,HP公司高级技术顾问,《Microsoft Exchange 2000 Infrastructure Design》(Digital Press)一书的作者之一,您可以通过[email protected]和他联系。
标签: