用事实说话,我们的数据库应选择 RAID 几?
日期:2007-08-12 荐:
公司的新产品研发进入攻坚阶段,一个技术障碍横亘在面前无法回避。你搜寻了好久,终于在某网上商城寻找到了一本稀缺的专业书——答案似乎就在那里!兴奋的你通过在线交易系统下了订单。新品上市的日期迫近,可是一周后还没有收到那本书。你打电话过去,商城说他们的服务器出了问题,需要你等系统回复后重新下订单!
你无可奈何地放下电话,打算再整理一下手头的技术资料。结果,同事小张垂头丧气的跑进来说:“昨天实验室的服务器一下子坏了2块盘,尽管补救了一些数据,但是一些重要文档还是丢了!”
结束了一天的劳累,你在家门口的信箱里看到了银行寄来的帐单。“买个手机怎么会花16000呢?一定搞错了!”你打开电脑打算核实一下消费记录,结果银行网站显示:系统繁忙,请稍后登陆。
多么糟糕的一天!
如果网络商城的客户数据及时做了备份,如果实验室的服务器用了更高级的备份方案,如果银行的查询系统效率更高?
虽然这样倒霉的日子并不多见,不过我们还是需要认真考虑一下墨菲定律!换句话说,就是“不怕一万,就怕万一。”
其实,上述场景中相关的服务器如果采用了合宜的RAID方案,情况或许就不会那么糟糕了。对于规避风险的企业用户而言,RAID是个不错的选择!
选择何种RAID
RAID是英文Redundant Array of Inexpensive Disks的缩写,翻译过来即:廉价磁盘冗余阵列。RAID对计算机管理和访问大容量数据存储的方法进行了革命性的变革。RAID可以充分发挥出多块硬盘的优势,实现远远超出任何一块单独硬盘的速度和吞吐量。同时RAID还可以提供良好的容错能力。
目前约有一半左右的服务器客户在选购服务器的时候会选择RAID配置。不同的RAID可以提供不同的速度,安全性和性价比。
笔者认为,在选择服务器RAID配置时,可以着重考虑如下两个因素:
1、判断存储数据的重要级别,以权衡投入的成本
2、读写效率对公司业务的影响
目前服务器中常见的RAID类型主要是:
RAID 0:读写速度快,硬盘利用率为100%,成本低,但是不具备备份及容错能力,可靠度最差。
RAID 1:完全容错,可靠性高,但是硬盘利用率仅仅为50%。
RAID 5:读写速度高于RAID1,而当一个硬盘驱动器出现故障可以通过校验信息恢复数据,空间利用率为(n-1)/n,成本相对经济,也是目前使用最广泛的是RAID技术。
可是随着硬盘容量和密度的增加,当一块硬盘损坏后,数据重建的时间在延长甚至非常困难,而此过程中第二块硬盘出错风险增大。因此,RAID6技术在今年开始呈现上升趋势。
权衡RAID6
RAID6是对RAID5的扩展。它在磁盘阵列中增加了第二个独立的奇偶校验信息块,两个独立的奇偶系统使用不同的算法,所以需要N 2个磁盘。这样即使两块磁盘同时失效,也不会影响数据的使用。
RAID6的磁盘利用率、读取性能和容错能力要优于RAID5,但因为要在每硬盘上写入两组校验,因此写入性能比较差,加之相对较高的价格,因此这项技术一直没有大规模的使用。
加之前文中提到的硬盘容量增大导致的重建时间延长带来的风险,因此可以相信对于追求低风险、低成本的服务器用户而言,RAID6配合RAID6加速技术不失为一种理想的解决方案。
那么什么情况下用RAID6更经济呢?回到本文开头所给出的那些场景:
如果网络商城的服务器用了RAID6技术,就可以更快的接收到客户下的订单,并在服务器硬盘系统出现故障时尽快回复客户的交易信息。
如果实验室的服务器采用了RAID6技术,那么就是同时坏了2块硬盘也不会丢失重要的研发资料。
如果银行的服务器查询系统采用了RAID6加速技术,那么客户的满意度一定会大幅度提升。
因此,我们的结论是,对于进行大交易量的数据库应用而言,RAID6是个不错的选择。
标签: