IBM开发网的内容还是很丰富的。
这次听这个讲座的主要目的是想看看他们是怎么讲集群的,对我以后讲述这方面有什么样的帮助作用。
课程大约1个小时,其中讲IBM自己的集群技术大约占了一半的时间,其他都是说一些概念,似乎对销售人员和售前技术支持比较有用,但是对于售后的培训可能用处不大。
因为既然已经是到售后这个环节了,比如是用户已经购买了集群软件了,也就是意味着他们或多或少的知道了集群的一些概念,原理等,此时他们要听到的恐怕是现在购买的这款集群软件的配置,使用,管理,故障处理等方面的内容。
还好,售前的活我也接着要干了,应该这个讲座可以帮到我一些。 下面是我听这个讲座的一些笔记。贴出来和大家共享:
Linux集群(IBM)
- 分类 o 高可用集群(High Availability)–提供冗余和高可用的资源) o 负载均衡/水平扩展集群(Load Balancing/Horizontal Scaling)–提供和节点个数成正比的负载能力) o 高性能计算(High Performance Computing)–提供比单台计算机更强的计算能力
- 什么是Linux集群 o 由一组通过网络互联的计算机组成 o 作为一个整体向用户提供一组网络资源 o 运行于开放的Linux系统
- Linux集群解决方案概览 o 高可用性集群
- Kimberlite Clustering(OpenSource)
- Linux-HA heartbeat(OpenSource)
- RedFlag HA Cluster
- IBM Tivoli System Automation
- SuSe Heartbeat
- RedHat Cluster Manager
- TurboLinux HA
- Steeleye Lifekeeper
- ………. o 负载均衡集群
- LVS(Linux Virtual Server)(OpenSource)
- RedHat IP Load Balancing
- RedFlag Load Balancing
- TurboLinux Cluster Server
- ……… o 高性能计算集权
- IBM 1350集群解决方案
- 联想深腾、曙光、方正….
- Linux高可用性解决解决方案 o Linux高可用对应用系统的重要性 + o + - Linux高可用性集群的功能
- 满足关键应用的高可用性要求
- 实现系统宕机时的自动恢复,保证系统提供不间断的服务
- 由两个以上节点组成,节点共享存储介质
- 用户数据存放于共享存储设备上
- 通过集群节点间的间歇通信信号(心跳信号),在系统之间进行周期性的握手,来监控检测各节点运行状态
- 系统出现故障时,由备份节点接替原系统工作,实现容错 o Linux高可用性集群相关技术
- 心跳通信路径
套接字(socket)
RS-232串行口(tty)
网卡
共享磁盘
- 心跳通信路径
- 共享存储模式
共享磁盘–RAID Array,SCSI,FC
网络附加存储(NAS)
- 共享存储模式
- Network Attached Storage
- NFS,GFS,File Server,etc
存储区域网络(SAN)
o Linux高可用性集群配置方式
- 双节点
主从模式(Active-Passive)
对等模式(Active-Active)
- 双节点
- 多节点配置
一对一模式(one to one)
一对多模式(one to many)
多对一模式(many to one)
多对多模式(many to many)
- 多节点配置
- Linux负载均衡集群解决方案 o + - Linux负载均衡集群功能
- 通过集群实现负载的均衡处理
- 提高系统的性能和处理能力
- 改善网络拥塞问题
- 为用户提供更好的访问质量
- 提高服务器响应速度
- 提高服务器及其其他资源的利用效率
- 避免了网络关键部位出现单点失效 o + - Linux负载均衡集群节点类型
- 管理节点(Cluster Manager)
接受用户的请求
根据一定的负载调度策略将用户的请求分发给集群节点
可以使用HA容错机制避免单点失效
运行应用代理程序查询每一个节点的服务状态
如果探测到故障,可以通知管理员
- 管理节点(Cluster Manager)
- 集群节点(Cluster Nodes)
处理服务请求,执行具体网络服务
o + - 关于负载均衡调度策略
- 集群节点(Cluster Nodes)
- 轮循调度(round-robin)
每一个请求轮流分配给内部中的每台服务器,从1至N然后重新开始
适合服务器具有相同的软硬件配置,平均服务请求相对均衡的情况
- 加权轮循调度(weighted round-robin)
在轮循调度基础上,按照权值分配服务器请求
- 最小连接调度(Least-connection)
记录服务器当前正在处理的连接数量
把新请求分配给连接数最少的服务器
适合长时间处理的请求服务,比如FTP
- 最小连接调度(Least-connection)
- 其他策略
加权最小连接调度(weighted least-connection)
基于局部性的最少链接(locality-based least connection)
目标地址散列调度(destination hashing)
源地址散列调度(source hashing)
o + - 负载均衡集群工作原理 +
- 其他策略
- Linux高性能计算集群解决方案 o + - 应用领域 + o + - 架构
- Beowulf集群架构
Beowulf是一种系统结构,似的多个计算机组成的系统能够用于并行计算
Beowulf系统通常有一个管理节点和多个计算节点构成
管理节点监控计算节点,通常也是计算节点的网关和控制终端
他们通过以太网(或其他网络)连接
Beowulf系统通常由最常见的硬件设备组成–PC,以太网卡,以太网交换机等
Beowulf系统最初采取那些广为传播的软件–Linux,消息传递接口(MPI)
o + - 概览
- Beowulf集群架构
- 每一个节点有独立的CPU,内存,磁盘和完整的操作系统,根据功能不同分为计算节点,管理节点和存储节点
- 各节点之间通过网络方式连接,实现信息的交互和数据的共享
- 通过管理软件实现系统的单点控制
- 采用作业调度软件协助作业的提交和分发 o 面临的挑战
- 硬件部件来自不同的厂商
compute system vendors
network vendors
managment component vendors
- 硬件部件来自不同的厂商
- 软件来自不同厂家
Operating System(Linux)
network drivers
science libraries
compiler
MPI libraries
- 软件来自不同厂家
- 不同软硬件的兼容性测试问题