Linux|系统管理|WEB开发

关注Linux,系统管理,WEB开发以及开源世界

听IBM的Linux集群解决方案的一些笔记

| Comments

IBM开发网的内容还是很丰富的。 这次听这个讲座的主要目的是想看看他们是怎么讲集群的,对我以后讲述这方面有什么样的帮助作用。
课程大约1个小时,其中讲IBM自己的集群技术大约占了一半的时间,其他都是说一些概念,似乎对销售人员和售前技术支持比较有用,但是对于售后的培训可能用处不大。 因为既然已经是到售后这个环节了,比如是用户已经购买了集群软件了,也就是意味着他们或多或少的知道了集群的一些概念,原理等,此时他们要听到的恐怕是现在购买的这款集群软件的配置,使用,管理,故障处理等方面的内容。

还好,售前的活我也接着要干了,应该这个讲座可以帮到我一些。 下面是我听这个讲座的一些笔记。贴出来和大家共享:

Linux集群(IBM)

      • 分类 o 高可用集群(High Availability)–提供冗余和高可用的资源) o 负载均衡/水平扩展集群(Load Balancing/Horizontal Scaling)–提供和节点个数成正比的负载能力) o 高性能计算(High Performance Computing)–提供比单台计算机更强的计算能力
      • 什么是Linux集群 o 由一组通过网络互联的计算机组成 o 作为一个整体向用户提供一组网络资源 o 运行于开放的Linux系统
      • Linux集群解决方案概览 o 高可用性集群
  • Kimberlite Clustering(OpenSource)
  • Linux-HA heartbeat(OpenSource)
  • RedFlag HA Cluster
  • IBM Tivoli System Automation
  • SuSe Heartbeat
  • RedHat Cluster Manager
  • TurboLinux HA
  • Steeleye Lifekeeper
  • ………. o 负载均衡集群
  • LVS(Linux Virtual Server)(OpenSource)
  • RedHat IP Load Balancing
  • RedFlag Load Balancing
  • TurboLinux Cluster Server
  • ……… o 高性能计算集权
  • IBM 1350集群解决方案
  • 联想深腾、曙光、方正….
      • Linux高可用性解决解决方案 o Linux高可用对应用系统的重要性 + o + - Linux高可用性集群的功能
  • 满足关键应用的高可用性要求
  • 实现系统宕机时的自动恢复,保证系统提供不间断的服务
  • 由两个以上节点组成,节点共享存储介质
  • 用户数据存放于共享存储设备上
  • 通过集群节点间的间歇通信信号(心跳信号),在系统之间进行周期性的握手,来监控检测各节点运行状态
  • 系统出现故障时,由备份节点接替原系统工作,实现容错 o Linux高可用性集群相关技术
      • 心跳通信路径

        套接字(socket)

        RS-232串行口(tty)

        网卡

        共享磁盘

      • 共享存储模式

        共享磁盘–RAID Array,SCSI,FC

        网络附加存储(NAS)

  • Network Attached Storage
  • NFS,GFS,File Server,etc

    存储区域网络(SAN)

    o Linux高可用性集群配置方式

      • 双节点

        主从模式(Active-Passive)

        对等模式(Active-Active)

      • 多节点配置

        一对一模式(one to one)

        一对多模式(one to many)

        多对一模式(many to one)

        多对多模式(many to many)

      • Linux负载均衡集群解决方案 o + - Linux负载均衡集群功能
  • 通过集群实现负载的均衡处理
  • 提高系统的性能和处理能力
  • 改善网络拥塞问题
  • 为用户提供更好的访问质量
  • 提高服务器响应速度
  • 提高服务器及其其他资源的利用效率
  • 避免了网络关键部位出现单点失效 o + - Linux负载均衡集群节点类型
      • 管理节点(Cluster Manager)

        接受用户的请求

        根据一定的负载调度策略将用户的请求分发给集群节点

        可以使用HA容错机制避免单点失效

        运行应用代理程序查询每一个节点的服务状态

        如果探测到故障,可以通知管理员

      • 集群节点(Cluster Nodes)

        处理服务请求,执行具体网络服务

        o + - 关于负载均衡调度策略

  • 轮循调度(round-robin)

    每一个请求轮流分配给内部中的每台服务器,从1至N然后重新开始

    适合服务器具有相同的软硬件配置,平均服务请求相对均衡的情况

  • 加权轮循调度(weighted round-robin)

    在轮循调度基础上,按照权值分配服务器请求

      • 最小连接调度(Least-connection)

        记录服务器当前正在处理的连接数量

        把新请求分配给连接数最少的服务器

        适合长时间处理的请求服务,比如FTP

      • 其他策略

        加权最小连接调度(weighted least-connection)

        基于局部性的最少链接(locality-based least connection)

        目标地址散列调度(destination hashing)

        源地址散列调度(source hashing)

        o + - 负载均衡集群工作原理 +

  • Linux高性能计算集群解决方案 o + - 应用领域 + o + - 架构
      • Beowulf集群架构

        Beowulf是一种系统结构,似的多个计算机组成的系统能够用于并行计算

        Beowulf系统通常有一个管理节点和多个计算节点构成

        管理节点监控计算节点,通常也是计算节点的网关和控制终端

        他们通过以太网(或其他网络)连接

        Beowulf系统通常由最常见的硬件设备组成–PC,以太网卡,以太网交换机等

        Beowulf系统最初采取那些广为传播的软件–Linux,消息传递接口(MPI)

        o + - 概览

  • 每一个节点有独立的CPU,内存,磁盘和完整的操作系统,根据功能不同分为计算节点,管理节点和存储节点
  • 各节点之间通过网络方式连接,实现信息的交互和数据的共享
  • 通过管理软件实现系统的单点控制
  • 采用作业调度软件协助作业的提交和分发 o 面临的挑战
      • 硬件部件来自不同的厂商

        compute system vendors

        network vendors

        managment component vendors

      • 软件来自不同厂家

        Operating System(Linux)

        network drivers

        science libraries

        compiler

        MPI libraries

  • 不同软硬件的兼容性测试问题

Comments