Eason

咸鱼咯

GPFS文件系统简介

内容提要:

AIX上的并行文件系统 (GPFS)允许使用者共享分布在多个节点和多个磁盘上的文件。它允许并行的应用程序同时从GPFS 节点组(nodeset)中的任何节点访问相同或不同的文件(节点组 nodeset 被定义为一组运行相同版本GPFS的节点). GPFS文件系统的设计目标是使数据分布在一个集群中的所有节点上,允许应用程序通过标准的UNIX文件系统接口来访问数据。大多数的UNIX文件系统被设计在单一服务器环境下使用,在这一环境下, 增加文件服务器也不会提高特定的文件存取的性能。 GPFS 被设计成通过将I/O分布在多个硬盘提高性能,通过日志和复制的方式提高可靠性,和通过增加节点的方式提高系统的可扩展性。

说明:

AIX上的并行文件系统 (GPFS)允许使用者共享分布在多个节点和多个磁盘上的文件。它允许并行的应用程序同时从GPFS 节点组(nodeset)中的任何节点访问相同或不同的文件(节点组 nodeset 被定义为一组运行相同版本GPFS的节点). GPFS文件系统的设计目标是使数据分布在一个集群中的所有节点上,允许应用程序通过标准的UNIX文件系统接口来访问数据。大多数的UNIX文件系统被设计在单一服务器环境下使用,在这一环境下, 增加文件服务器也不会提高特定的文件存取的性能。 GPFS 被设计成通过将I/O分布在多个硬盘提高性能,通过日志和复制的方式提高可靠性,和通过增加节点的方式提高系统的可扩展性。

GPFS的特性

GPFS通过高性能的,共享磁盘的文件系统提供对于IBM UNIX服务器群集中的快速的数据访问。平行的和串行的应用程序能够容易地使用标准的UNIX文件系统接口,如open(), close()等存取文件。

GPFS通过将I/O分布在多个硬盘提高性能,通过日志和复制的方式提高数据的可靠性,通过增加节点和在节点之间由SP Switch互联提高系统的可扩展性.

大多数UNIX下的文件系统被设计来应用于单一服务器的典型环境。增加新的文件服务器并不能提高文件存取性能。GPFS 遵从UNIX的文件标准,其设计目标是通过多节点的文件系统提供可扩展的性能和系统失效恢复的能力。

除了已有的AIX管理文件系统的命令, GPFS还提供 简化多节点管理的功能。一个GPFS多节点命令能作用于集群中所有的节点,并且可以从群集中的任何节点上操作。这些命令以现有的AIX文件系统命令为基础, 并进行了扩充。

GPFS支持X/Open 4.0的文件系统标准,大多数的AIX和 UNIX操作系统的应用程序不需要修改,就可以访问GPFS文件系统上的数据。这些特性使得GPFS文件系统可以替代其他的UNIX文件系统。

GPFS的高性能和可扩展性

通过将文件分布在多个节点和磁盘上,GPFS可以超越单一节点和单一文件系统的性能极限。文件系统能够跨越多个节点和多组磁盘,这些磁盘可以是使用 SSA 技术在HACMP群集里面直接地连接到每个节点上进行物理共享。也可以是由IBM的VSD(Virtual Shared Disk)和SP Switch技术使经过软件进行共享。 

GPFS还通过以下技术提高性能:

  •  用户端的数据缓存
  •  大的文件页的支持 (16 kB- 1024 kB)
  •  文件预读和延迟写的功能。

通过以上这些技术GPFS的性能超过网络文件系统 (NFS),分布式文件系统(DFS)和日志文件系统 (JFS)。与这些文件系统不同,GPFS文件系统可以通过在群集或SP系统中增加节点的方式提高性能。

GPFS的高可用性与可恢复性

GPFS能容忍许多系统和I/O的失效。GPFS 使用(PSSP)或HACMP的Group Services技术去检测系统中部件的失效,并能够从以下几种失效中恢复:

  •  节点失效
  •  磁盘连接失效
  •  磁盘适配卡失效

GPFS从以上几种失效中恢复对用户来说是透明的。

GPFS 可以进行数据复制, 更进一步减少当存储介质失效时数据丢失的可能性。并且GPFS是一个日志的文件系统,当节点失效时可以较快的恢复整个文件系统的结构。GPFS还可以mount多个文件系统,每个文件系统可以定义自己的失效恢复策略。

GPFS在SP环境下

gpfs001

GPFS在HACMP环境下:

gpfs002

Comments are currently closed.