中国联通公司
企QB/CU 070-2013 业标
准
中国联通IaaS计算设备技术规范
(V1.0)
China Unicom Infrastructure as a Service Computing Technical Specification
(V1.0)
2013-01-18发布 中国联通公司发布 2013-01-18实施
目 录
目 录 ................................................................ 中国联通IaaS计算设备技术规范 .......................................... 1 范围 .................................................................. 2 规范性引用文件........................................................ 3 术语及缩略语..........................................................
3.1 术语 ............................................................ 3.2 缩略语 .......................................................... 4 IaaS计算设备 .........................................................
4.1 概述 ............................................................ 4.2 总体技术架构 .................................................... 5 服务器硬件要求........................................................
5.1 总体要求 ........................................................
5.1.1 系统总体要求 ............................................... 5.1.2 CPU ........................................................ 5.1.3 内存 .......................................................
5.1.4 硬盘 ....................................................... 5.1.5 网络 ....................................................... 5.2 分类分级要求 ....................................................
5.2.1 接入服务器指标 ............................................. 5.2.2 计算型服务器指标 ........................................... 5.2.3 高性能计算型服务器指标 ..................................... 5.2.4 存储型服务器指标 ........................................... 5.3 可用性要求 ...................................................... 5.4 可管理性要求 ....................................................
5.4.1 管理硬件要求 ............................................... 5.4.2 管理功能要求 ............................................... 5.5 管理接口要求 .................................................... 5.6 安全性要求 ...................................................... 6 服务器虚拟化功能要求 .................................................
6.1 总体要求 ........................................................ 6.2 基本要求 ........................................................
6.2.1 虚拟机部署 ................................................. 6.2.2 虚拟机操作 ................................................. 6.2.3 虚拟机的快照创建和恢复 ..................................... 6.2.4 虚拟机备份和容灾 ........................................... 6.2.5 虚拟机模板 ................................................. 6.2.6 虚拟机克隆 ................................................. 6.2.7 虚拟机网络 ................................................. 6.3 管理功能要求 ....................................................
6.3.1 P2V/V2V .................................................... 6.3.2 资源按需分配 ............................................... 6.3.3 实时资源调整 ............................................... 6.3.4 工作负载动态调整 ........................................... 6.3.5 虚拟机迁移 ................................................. 6.3.6 网络IO控制 ................................................ 6.3.7 存储IO控制 ................................................
7 非功能性要求..........................................................
7.1 性能需求 ........................................................
7.1.1 虚拟机损耗 ................................................. 7.1.2 虚拟机整体性能需求 ......................................... 7.1.3 虚拟机迁移性能 ............................................. 7.1.4 虚拟机快照性能要求 ......................................... 7.2 可用性要求 ......................................................
7.2.1 集群支持 ................................................... 7.2.2 网络冗余连接 ............................................... 7.2.3 存储可用性支持 ............................................. 7.2.4 虚拟机HA ................................................... 7.2.5 虚拟机故障隔离 ............................................. 7.3 可管理性要求 ....................................................
7.3.1 虚拟化系统补丁统一升级 ..................................... 7.3.2 虚拟机操作系统软件统一升级 ................................. 7.3.3 故障管理 ................................................... 7.3.4 脚本自动化管理 .............................................
7.3.5 运维监控管理 ............................................... 7.3.6 拓扑管理 ................................................... 7.3.7 状态监控管理 ............................................... 7.3.8 历史记录管理 ............................................... 7.4 安全性要求 ......................................................
7.4.1 防病毒能力 ................................................. 7.4.2 敏感数据保护(可选) .........................................
8 接口功能描述..........................................................
前 言
随着云计算技术的成熟,中国联通基于云计算的内部支撑系统建设也在逐步推进。为更好地指导中国联通云计算基础设施的建设,承接项目落地和实施,本规范对中国联通的云基础设施资源提出了全面的要求。
针对中国联通公司的云计算项目和发展需求,通过充分调研云计算相关的标准、技术发展现状和发展趋势,结合中国联通的发展现状,本标准阐述了IaaS计算设备的总体架构、服务器硬件要求、服务器虚拟化功能要求以及非功能要求。在IaaS计算设备的硬件方面,对CPU、内存、硬盘和网络提出了功能要求。在虚拟化方面,提出了虚拟机功能要求和管理要求。在非功能方面,提出了性能要求、可用性要求、可管理性要求以及安全性要求。随着业务需求和技术发展,本标准将不断进行补充和完善。
本技术适用于指导中国联通未来基于云计算基础设施的建设需求而制定。中国联通在此之前的文件与本技术不一致的,应以本次技术要求为准,并在相关的具体规范发布后废止。
本标准由中国联通公司技术部提出。 本标准由中国联通公司技术部归口。
本标准负责起草单位:中国联通公司技术部、中国联通公司研究院
本标准主要起草人:裴小燕、贾川、张云勇、房秉毅、徐雷、王淑玲、陈清金、魏进武、李卫、李素粉、王志明
本规范修改和解释权属中国联合网络通信有限公司。
中国联通IaaS计算设备技术规范
1 范围
本规范规定了IaaS计算设备的硬件、分类分级、可用性、可管理性、安全性等技术要求,并规定了服务器虚拟化基本要求、管理功能要求、性能要求、可用性、可管理性、安全性要求和接口功能描述,供中国联通集团和省公司选择IaaS计算设备使用。
除非专门说明,本规范中所指的“计算设备”特指支持虚拟化功能的X86架构服务器。
2 规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
序号 标准编号 标准名称 [1] QB/CU 191-2012 中国联通云计算技术v1.0
3 术语及缩略语 3.1 术语
名称 解释 底层物理设备与虚拟机之间的控制层,实现底层物理资Hypervisor 源的抽象化和资源隔离,并对上层虚拟机运行进行控制。 在线迁移,指虚拟机在不中断运行的情况下,从一个物Live Migration 理服务器迁移到另外一台物理服务器 3.2 缩略语
缩写 英文全称 解释 CIFS Common Internet File System 通用Internet文件系统 CLI command-line interface 命令行界面 ECC Error Correcting Code 错误检查和纠正
EPT Extended Page Table 扩展页表 FCoE Fibre Channel over Ethernet 以太网光纤通道 GE Gigabit Ethernet 千兆以太网 HA High Availability 高可用。系统的可用性定义为系统正常运行时间占总运行时间的比例。为确保系统HA,需要采取措施尽可能确保系统正常运行,减少宕机时间。 IPMI Intelligent Platform IPMI是智能型平台管理接口,开放的免费标准。管理基于 Intel结构的企业系统中所使用的外围设备采用的一种工业标准,用户可以利用IPMI监视服务器的物理健康特征,如温度、电压、风扇工作状态、电源状态等。 Management Interface Internet Small Computer iSCSI System Interface,Internet 小型计算机系统接口。将现有SCSI接口与以太网络
(Ethernet)技术结合,使服务器可与使用IP网络的储存装置互相交换资料的存储技术。 网络附属存储。一种特殊的专用数据存储服务器,包括存储器件NAS Network Attached Storage 和内嵌系统软件,可提供跨平台文件共享功能。 NFS Network File System 网络文件系统 OVF Open Virtual Machine Format 开放虚拟机格式 PXE Preboot Execute Environment 通过网络启动引导安装 磁盘阵列。利用数组方式来作磁Redundant RAID Inexpensive Disks 计,提升数据的安全性。 Arrays of 盘组,配合数据分散排列的设存储局域网络,通过光纤(FC)SAN Storage Area Network 将不同的数据存储设备连接到服务器的快速、专门的网络。
Serial Advanced Technology 串行高级技术附件,一种基于行SATA Attachment 业标准的串行硬件驱动器接口 SAS是SCSI技术,采用串行技术SAS Serial Attached SCSI 以获得更高的传输速度,并通过缩短连结线改善内部空间等。 Simple Network Management SNMP Protocol 简单网络管理协议 一种适合服务器虚拟化的虚拟化概念,通过 PCI-Special Single-Root SR-IOV Virtualization 建,在单根复杂实例中提供设备虚拟化。 I/O Interest Group 或 PCI-SIG 创TCP卸载引擎,旨在使用网卡上TOE TCP Offload Engine 专用处理器来完成一些或所有数据包的处理任务。 VLAN Virtual Local Area Network 虚拟局域网,是一种将局域网设备从逻辑上划分成一个个网段,
从而实现虚拟工作组的数据交换技术。 虚拟机,是物理服务器的软件模拟,通过Hypervisor的支持,VM Virtual Machine 为上层操作系统和应用程序提供运行环境。 VMS Virtualization Management 虚拟化管理系统 System 虚拟机监视器,在本文中含义与VMM Virtual Machine Monitor Hypervisor相同。 恢复时间目标,即恢复需要的时RTO Recoverty Time Objective 间 恢复点目标,即恢复时可容忍的RPO Recovery Point Objective 数据丢失时间间隔 4 IaaS计算设备 4.1 概述
本规范重点规定计算设备在硬件和虚拟化两个方面的要求。
1. 硬件要求
IaaS计算设备的主要部件包含CPU、内存、硬盘、芯片组、网络/存储IO接口、电源、风扇等组件。规范规定了针对不同使用场景下,对上述硬件组件的要求。规范同时规定了硬件可用性、可管理性、安全性方面的要求。
2. 虚拟化要求
服务器虚拟化功能是IaaS计算设备重要功能。计算设备虚拟化是一种对服务器计算资源的抽象,它在物理服务器的基础上构建多个相互的虚拟机,从而将CPU、内存、I/O等服务器物理资源转化为一组统一管理,可灵活调度、动态分配的逻辑资源。
规范规定了服务器虚拟化各种功能要求,包括虚拟机创建和运行、虚拟机调度、虚拟机管理,以及虚拟机性能要求。规范同时规定了计算设备虚拟化的可用性、可管理性、安全性方面的要求。 4.2 总体技术架构
服务器虚拟化系统的逻辑架构如所示,主要包括以下几个部分: 1. 虚拟化控制器(Hypervisor)
底层物理设备与虚拟机之间的控制层,实现底层物理资源的抽象化和资源隔离,并对上层虚拟机运行进行控制。
在虚拟机运行过程中,Hypervisor将对虚拟机的磁盘映象进行读写操作。
2. 虚拟机(Virtual Machine,VM)
指对通过各种虚拟化技术,为用户提供的与原有物理服务器不同的操作系统和应用程序运行环境的统称。虚拟机通常使用物理服务器的部分资源,在用户看来它与物理服务器的使用完全相同。
3. 物理存储
虚拟化环境中支持不同存储设备和存储协议组成的物理存储,通常包括FC-SAN、iSCSI、NAS等集中存储方式、分布式存储系统、以及物理服务器本地磁盘存储。
4. 虚拟化管理系统(VMS)
由运行在虚拟化管理服务器上的管理软件和对应的管理客户端、外部Web门户等部分构成。对系统中的各类物理或虚拟资源进行统一管理,实现资源发现、资源调配、批量部署、HA和自动迁移以及其它基于策略的高级控制功能,并对外提供管理接口。
5. 物理设备(Server)
物理设备即x86服务器,为虚拟机提供物理资源,主要包含用于支撑计算的CPU和内存,支撑存储的硬盘和支撑网络的网络接口。
图1 服务器虚拟化逻辑架构
5 服务器硬件要求 5.1 总体要求
本规范主要是针对云计算的IaaS服务的硬件设备规范定义及其上虚拟化技术规范定义,以方便于云计算及IaaS平台的有效实现。
在IaaS平台中硬件可以形成类似资源池,相同资源池内的资源可以方便地实现资源共享、分配、使用、回收等能力。
在IaaS资源池中,相同类型的的CPU要归入同一资源池或数据区,以便支持虚拟机在其上可以在线迁移,HA失败切换,同时可以支持资源平衡策略定义。
在IaaS资源池中,可以包括四类服务器类型:接入型服务器,计算型服务器,高性能计算型服务器和存储型服务器。
IaaS平台下资源具有自动发现、自动分配、按需使用、删除后自动归还能力。 5.1.1 系统总体要求
计算设备作为云计算平台中计算资源的提供者,是整个云计算环境中的重要组成部分,应满足云计算平台对硬件系统的如下总体要求:
(1)支持多种操作系统:支持Windows,Redhat、Suse等Linux操作系统; (2)支持多种虚拟化系统:支持多种计算资源虚拟化方式,系统可运行VMWare、XenServer、Xen、KVM、微软Hyper-V等虚拟化系统;
(3)网络接口:支持千兆及万兆以太网技术;
(4)存储接口:支持FC SAN、NAS、iSCSI等存储设备,建议支持FCoE接口; (5)供电:支持直流电源/交流电源,其中直流电支持-48v和240v高压直流; (6)节能减排:符合中国环境标志认证和中国节能标志认证。 5.1.2 CPU
为满足云计算平台中计算资源的需求,云计算基础设施设备的CPU要求如下: (1)支持基于Intel VT /AMD-V以上X86指令集架构的处理器;
(2)板内扩展能力:在同一主板上支持多个CPU插槽,且在提供多个CPU插槽的同时支持用户选配CPU个数; 5.1.3 内存
为了匹配云计算IaaS计算设备的计算能力,云计算基础设施的内存要求如下 (1)服务器的内存需要支持ECC纠错能力。可以使用UDIMM/RDIMM/LRDIMM三种类型;单条内存容量为:4GB、8GB、16GB、32GB;可选通用接口标准:DDR3。
(2)频率和接口标准是衡量内存性能的主要指标。常见的有DDR3-1066、DDR3-1333、DDR3-1600,分别以1066MHz频率、1333MHz频率、1600MHz频率运行的DDR3接口内存。频率越高,速度更快。
(3)云计算和虚拟化应用情况下,更多的内存有利于系统性能的提高。物理服务器中设定的虚拟机数量越多,需要的内存越多。
(4)支持内存的EPT(Extended Page Table)技术。 (5)支持内存复用、内存交换技术。 5.1.4 硬盘
硬盘作为服务器存储数据的重要组件,对性能、可用性等要求均较高,目前的分类方式各不相同,主要包括以下方式:
(1)以存储介质类型区分:可分为磁介质硬盘和固态硬盘两种,固态硬盘的随机读写性能和响应延时优于磁介质硬盘,但是目前的单盘容量小于磁介质硬盘。
(2)以硬盘尺寸区分:磁介质硬盘尺寸有2.5和3.5英寸两种尺寸,固态硬盘只有2.5英寸一种。
(3)以硬盘接口类型区分:目前硬盘采用SAS和SATA两种接口标准。在理论上,SAS接口硬盘的速度是SATA接口硬盘的两倍。根据对性能和稳定性的不同需求,选择采用SATA或者SAS的硬盘接口。
硬盘要求如下:
(1)必须支持SATA或SAS等硬盘接口:硬盘控制器应为集成单通道SAS控制器或存储速度在每秒300M以上的控制器;服务器,特别是存储密集型服务器的实配硬盘个数应在2个以上,硬盘配置应在300GB/10000转以上,硬盘种类建议应为SAS硬盘,从而保证服务器的磁盘性能。
(2)支持RAID卡(内置或外插)可将硬盘组织为冗余磁盘阵列,提高服务器可用性。配置缓存的RAID卡可同时提高冗余磁盘阵列性能。支持RAID 0/1/5/6/10,缓存容量512M以上,支持电池保护或超级电容保护。
(3)支持Boot On SAN的硬盘引导技术,可以集中管理硬盘引导文件,达到OS及云计算平台与云节点服务器的硬件无关的目标,便于系统横向扩展及维护。 5.1.5 网络
网络是云计算环境中进行数据交互的重要基础设施,承载着所有云计算节点间的数据传输,包括计算节点、存储节点以及云计算用户之间的基本数据交换。
服务器的网络设备应支持而不局限于以下功能: (1)支持1Gbps/10Gbps带宽;
(2)支持基于网络芯片硬件的数据传输或交换加速功能,例如TOE、SR-IOV等技术;
(3)网络端口聚合功能,满足系统对于网络带宽的需求,同时可以提高系统可用性;
(4)网络端口故障切换功能,满足系统高可用性需要。 5.2 分类分级要求
根据服务器的设计方式和运算能力等方面的差别,针对云计算及虚拟化计算环境对系统性能、可用性、可扩展性的需求,将服务器分为不同的级别,目前分为:
接入服务器,计算服务器,高级计算服务器和存储服务器。不同类别的服务器有不同的特性和应用场景。
接入服务器:适合对单机性能要求较低、对密度和横向扩展能力要求较高的场合使用,可以用来搭建较低成本的云计算基础设施集群,对于单台服务器的扩展性和可用性等级并没有太多的要求。
计算型服务器:适合对服务器单机性能及横向扩展性要求较高的场合使用,拥有较高的服务器单机可扩展性和可管理性,也能够适合云计算平台对系统横向扩展性能的需求,适合多种应用场景。
高性能计算型服务器:是云计算平台节点中较高端的产品,拥有最高的单节点处理能力和扩展能力,适合计算密集型的应用场景,例如虚拟化资源池的搭建、对纵向扩展能力要求较高的场合。
存储型服务器:是云计算平台节点中较高端的产品,拥有强大的本地存储能力,适合作为云计算的存储节点或者存储密集型应用系统。
RAID技术主要包含RAID 0,1,5,10等数个规范,他们的比较如下,对RAID技术的选择,除了考虑最小配置之外还需要根据具体的应用要求决定。
项目 RAID0 RAID1 RAID10 RAID5 最小配1 2 4 3
置 性能 Highest Lowest RAID5 接入服务器主要处理Web HTTP 请求,它对计算性能和存储性能要求较低,对网络性能要求较高。因此标配1路中低端CPU 即可,内存推荐16G,2个GE网卡。设备形态以机架服务器为主,也可配置为低端刀片。此类服务器一般不做虚拟化。 5.2.2 计算型服务器指标 主要处理各种应用程序, 需要较强的计算能力和内存能力。配置双路CPU,内存推荐48G,4个GE网卡。存储方面通过8G FC与FC SAN相连或者GE iSCSI与IP SAN相连。机架服务器在内存,存储和网络方面具有更好的扩展性,刀片服务器具有更高的密度,根据数据中心的实际情况进行部署。 5.2.3 高性能计算型服务器指标 对于性能要求高的应用程序或者ERP,数据库等应用,需要配置4路以上CPU的高端服务处理,内存推荐96G,4个GE网卡。存储方面通过8G FC通道与FC SAN 相连或者GE iSCSI 与 IP SAN 相连。机架服务器在内存,存储和网络方面具有更好的扩展性, 刀片服务器具有更高的密度, 根据数据中心的实际情况进行部署。 5.2.4 存储型服务器指标 存储服务器主要用于分布式存储系统平台。分布式存储通过分布式文件系统(如HDFS) 或其他应用系统支持,采用多台服务器及服务器自身提供的多个大容量廉价磁盘来搭建,从而取代传统的集中部署的式磁盘阵列系统,主要用于数据挖掘、搜索引擎、日志分析等多类应用。配置12个以上SATA/SAS 3.5寸盘。对CPU 和内存的需求较低,配置中低端CPU即可,内存推荐32G,4个GE网卡。对于产品形态, 建议采用2U机架服务器。 5.3 可用性要求 (1)服务器磁盘应支持冗余、热插拔,应可以支持RAID 0/1/5/6,并可以插入缓存进行扩展。 (2)服务器及刀片服务器机框的电源应支持冗余,两路及以上CPU服务器、刀片服务器机框还应支持电源模块的热插拔功能。 (3)所有服务器的网卡支持冗余、热备份功能,系统能够在不中断业务的条件下完成网卡切换。 (4)所有服务器支持风扇冗余功能,两路及以上CPU服务器、刀片服务器支持风扇热插拔功能。 (5)所有服务器风扇转速具备自动调节功能,当发生风扇故障或CPU利用率变化时,风扇转速应相应的调节。 (6)刀片服务器机框应支持双背板的冗余保护机制或背板支持双路设计,每一个刀片服务器都支持热插拔。 (7)同一个刀片服务器机框中的刀片服务器,应能够将两个刀片服务器设置为主备关系,能够完成热切换。 (8)对于多路CPU机型,单路CPU故障可以自动重启并屏蔽,不影响其它CPU及整机的正常运行。 5.4 可管理性要求 5.4.1 管理硬件要求 (1)设备应既能支持本地维护管理,又能够以远程网络管理形式进行操作、维护、管理、配置等工作。 (2)设备应具备专用的远程控制网络端口,可以不依赖操作系统对设备进行远程控制和管理(包括远程关机,重新启动,远程操作系统控制、远程配置等操作)。 (3)设备应确保在远程监视和控制时对资源的有效控制以及远程管理功能具有相对高的优先级等功能。 (4)设备应能以脱机、在线两种方式进行相关的硬件系统及管理配置,包括对系统配置进行加载、修改以及删除等操作。当在线修改或补充数据时,应不影响设备的正常工作。 (5)设备应具有将设备中的数据输出至外部存储器备份的功能,当系统中断或在必要时能重新装载使用。另外,当新数据输入后,原数据应能予以保留,新数据只有在输入测试完成后才能运行。系统应具有恢复原数据运行的功能。在确认新数据使用稳定后,原数据才可以删除。 (6)设备应提供图形和命令行两种界面和接口,接口包括本地终端和远程维护中心等多种接口方式,所有操作、维护、管理功能均应能通过上述界面和接口方式进行。 5.4.2 管理功能要求 1. 资产管理 (1)服务器提供资产管理软件,可以通过该软件进行服务器资产状况的管理和维护,包含但不限于: • 服务器型号及序列号; • 服务器配置信息; • 服务器固件版本管理。 2. 远程控制 (1)管理员应可以通过标准的网页浏览器在任何时间和地点来控制x86服务器系统,与操作系统无关。 (2)管理员能够通过网页浏览器来接入和管理系统。 (3)管理能力应涵盖虚拟KVM、虚拟介质、健康状况监测、日志查询等功能。 3. 故障管理 (1)服务器系统应在前面板、服务器内部分别提供工作状况指示灯,指示服务器各个部件的工作情况。通过观察指示灯的不同颜色或状态,可以清楚地了解到服务器各个硬件部件的工作情况。包括: • 电源指示灯; • 整机健康状况指示灯; • 电源模块工作及健康状况指示灯; • 硬盘工作及健康状况指示灯。 4. 其他 (1)支持IPMI管理规范,提供远程开关机、复位、日志、硬件监控等管理功能; 5.5 管理接口要求 (1)提供IPMI管理接口; (2)提供CLI/HTTP管理接口; (3)提供SNMP管理接口; (4)提供可编程管理接口。 5.6 安全性要求 服务器系统应该具有良好的安全防范手段,保证系统在运行时的系统安全及数据安全。服务器根据实际使用场景,应提供但不限于下列防范措施: (1)服务器通过WEB方式进行远程控制应支持HTTPs协议,HTTPs端口可配置; (2)服务器通过WEB方式进行远程控制应支持sshv2远程访问协议; (3)服务器支持基于BIOS登录口令的开机控制; (4)服务器管理可以支持多级用户分级安全管理; (5)管理系统可以支持域管理认证; (6)服务器远程控制时支持关闭不安全协议(如FTP,Telnet)。 6 服务器虚拟化功能要求 6.1 总体要求 1. Hypervisor要求 Hypervisor是一种运行在基础物理服务器和操作系统之间的中间软件层,可允许多个操作系统和应用共享硬件,可访问服务器上包括磁盘和内存在内的所有物理设备。Hypervisor不仅协调着这些硬件资源的访问,也同时在各个虚拟机之间施加防护。当服务器启动并执行Hypervisor时,它会加载所有虚拟机客户端的操作系统,同时会分配给每一台虚拟机适量的内存、CPU、网络和磁盘。 Hypervisor要求包括但不局限于如下几条: (1)支持在一台物理服务器中创建多个相互的虚拟机服务器,每个虚拟机各自拥有计算、存储和网络等资源,运行各自的操作系统和应用。 (2)从安装各种应用系统、通过网络访问、满足用户对服务器不同使用需求的角度来看,虚拟机的用户体验与物理服务器几乎没有差别。 (3)支持通过Hypervisor软件功能,将物理服务器中的CPU、内存、I/O等资源进行抽象化,使得服务器资源不再与具体物理设备以及上层应用绑定,将原先与具体物理服务器和物理设备绑定的资源转化为可以统一分配和管理的一组逻辑资源,实现资源的共享和灵活分配。 (4)支持不同的资源划分粒度,以CPU资源为例,应支持以下粒度: • 一台虚拟机可以使用相当于单个物理CPU(核)的处理能力; • 一台虚拟机可以使用相当于多个物理CPU(核)的处理能力; • 一台虚拟机可以与其它虚拟机共享CPU资源,每台虚拟机的虚拟CPU仅使用相当于单个物理CPU(核)部分或全部处理能力的计算资源。 (5)物理服务器的网卡等I/O设备,也支持类似的资源抽象和共享能力,使物理服务器可以划分的虚拟机个数与物理资源数量无关。 2. 32位/位支持 为了使虚拟机能够充分满足企业现有IT系统的应用需求,同时提供较强的扩展能力,虚拟化产品应支持在旧有32位物理服务器上运行32位虚拟机,以及在新的位物理服务器上运行32位或位虚拟机的不同能力。 3. 操作系统兼容要求 物理服务器所支持的各种操作系统类型及版本,在对该物理服务器进行虚拟化后,也能够在创建的虚拟机中安装并正常运行。 在将物理服务器所支持的操作系统安装到虚拟机的过程中,无须对操作系统进行任何修改。出于提高虚拟机性能的需要对操作系统进行特定优化时,也应通过可选安装组件的方式进行,而无须更换现有操作系统版本。 X86架构的虚拟机应支持市场主流的Windows服务器版本,以及Redhat、SuSe、CentOS等多个发行版本的Linux操作系统。 安装了所支持的、不同类型及版本操作系统的多个虚拟机,必须能够在同一物理服务器上同时运行,相互之间没有影响。 4. 服务器兼容要求 服务器虚拟化产品需提供广泛的物理服务器硬件设备兼容性支持,X86服务器虚拟化产品必须支持市场上主流设备厂商提供的服务器。 虚拟化产品功能的实现,不得依赖于特殊的服务器硬件设备。 5. 存储兼容要求 虚拟化产品使用存储设备保存的自身映象或者应用数据,因而存储设备需要满足以下要求: (1)支持物理服务器本地磁盘存储和通过网络(IP或SAN网络)访问的共享存储。 (2)支持文件系统(NFS、CIFS等)、块设备等不同存储类型;特别的,虚拟机磁盘映象,支持以文件方式映射到物理存储设备,也支持以逻辑卷(Logical Volume, LV)方式映射到物理存储设备。 (3)支持主流厂商提供的不同FC SAN、iSCSI和NAS等存储设备。 6.2 基本要求 6.2.1 虚拟机部署 虚拟机的部署是指在Hypervisor主机上安装虚拟机的过程。虚拟机的部署应当满足以下功能: (1)支持多种灵活的部署方式,包括与物理机安装类似的基于系统安装介质(光盘,移动存储)的安装部署和基于虚拟机镜像文件(如OVF格式文件)的免安装部。 (2)支持基于模板的部署,可以通过模板快速批量部署虚拟机。管理员可以根据需求安装一台虚拟机,并做好相应的系统配置。然后将此虚拟机转换为模板。通过模板可以快速地大规模部署虚拟机。部署的时候可以定制虚拟机的软硬件配置。 (3)Hypervisor在物理服务器上安装完成后,支持用户通过命令行或者图形界面的方式在Hypervisor上创建虚拟机。 (4)创建过程需提供用户交互界面,引导用户设定虚拟机名称、资源类型和数量、操作系统类型、网络设置等配置参数。 (5)虚拟机创建成功后,支持从本地启动或网络启动(PXE)的方式,引导进行虚拟机操作系统的安装,并支持从光盘、ISO映像、本地存储或者共享存储中载入程序安装包。 (6)支持通过第三方工具或者编写脚本等方式,实现虚拟机、操作系统和应用的自动化安装和配置,并支持远程操作。 (7) 在服务器主流配置下(2路或者4路服务器,每CPU配置GB内存到96GB内存)服务器虚拟化整合比(单台物理主机的VM数)建议在5-10左右,可根据对安全性、可靠性或者资源利用率要求不同进行调整。 6.2.2 虚拟机操作 虚拟机的整个生命周期都应当可以监控和管理。 在虚拟机的生命周期中,虚拟化软件应当提供完整的图形化监控和管理。管理员可以在管理界面上方便地选择创建、启动、关闭、暂停、挂起、恢复、重启、删除等虚拟机操作,并在界面上有相应的运行状态提示。 管理员可以同时对多台虚拟机进行管理操作,例如安装系统补丁。此类操作应当显示在虚拟机界面之内,使得在线的虚拟机用户得到通知。(1)虚拟机创建是指根据用户的配置要求,在资源池内新增一个该配置的虚拟机。虚拟机的创建过程 需提供用户交互方式,引导用户设定虚拟机名称、资源类型和数量、操作系统类型、网络设置等配置参数。 (2)虚拟机启动是指将关闭状态中的虚拟机置于开机状态(通常情况下,新创建的虚拟机默认为关闭状态)。 (3)虚拟机关闭是指将运行中的虚拟机关机。 (4)虚拟机重启是指将运行中的虚拟机重新启动。 (5)虚拟机暂停是指将虚拟机当前的工作环境保存到内存中,然后关闭CPU等其他虚拟机硬件电源,仅对内存供电,当恢复虚拟机时,能够迅速回到虚拟机暂停前的工作环境。 (6)虚拟机挂起是指将虚拟机当前的工作环境保存到磁盘空间,然后关闭所有虚拟机硬件电源, 当恢复虚拟机时,能够迅速回到虚拟机挂起前的工作环境。暂停和挂起虚拟机,均不会丢失虚拟机的任何状态信息,并且可以在任意时刻恢复该虚拟机。被挂起的虚拟机在挂起期间应当释放其对主机资源的占用。 (7)虚拟机恢复是指将暂停或者挂起的虚拟机,恢复到虚拟机暂停或者挂起之前的工作环境。 (8)虚拟机删除是指将用户的虚拟机移除出资源池,并将存储上相应的虚拟机文件删除的操作。删除的过程是不可逆的,删除的虚拟机将无法恢复。 6.2.3 虚拟机的快照创建和恢复 虚拟机快照是指虚拟机在某一特定时间点的状态副本。快照可以用来将虚拟机恢复到过去某一时刻的状态,即创建快照时刻的状态。 快照分为离线快照和在线快照两种。离线快照是对离线的虚拟机创建快照,在线快照是对在线的虚拟机创建快照。在线快照应当支持将内存状态纳入快照之中。 虚拟机快照的创建和恢复应当满足以下功能: (1)可以在任意时间点对离线或者在线的虚拟机创建快照,并且创建快照的过程应当尽可能的短暂,以免对系统产生影响。 (2)用户可以创建大量快照,并且虚拟机系统不应当随着快照数量的增多导致性能下降。 (3)快照之间应当相互,任意快照的删除操作不会对其他快照和整个虚拟机系统有任何影响。 (4)创建快照支持采用节省磁盘空间的方式,创建的快照不会显着增大虚拟机所占用的磁盘空间。 (5)用户可以使用任意快照来恢复到快照时的系统状态。快照应当包含包括内存在内的所有系统状态。快照的恢复时间应当尽可能的短暂。 6.2.4 虚拟机备份和容灾 虚拟机的备份是指在任意时间点对虚拟机按预定策略进行自动或者手动的数据提取和保存,并在需要的时候进行恢复,以保障系统的数据安全。其应当满足以下功能: (1)Hypervisor软件供应商应当提供开放的备份应用编程接口(API),使得与主流的第三方备份软件平台兼容。同时,也应当提供一体化的备份解决方案,使得即使在不依赖第三方备份软件的情况下,仅依靠平台自身也可以备份及恢复。 (2)提供设置自动备份时间、备份方式等的功能,按日历或者工作周方式设置备份策略运行时间。 (3)支持全备份和增量备份等多种备份方式。 (4)支持虚拟机的在线备份功能,即备份过程中虚拟机可继续运行,并且备份过程不应对虚拟机或者运行Hypervisor的主机产生任何显着的性能影响。 (5)备份必须保证数据的一致性。不仅对虚拟机本身的操作系统,而且对虚拟机上运行的任何应用程序,备份都必须是有效且数据一致的。 (6)备份数据流应当支持IP网络或者存储区域网络(SAN),备份的目的介质可以是磁盘或者磁带。 容灾是指当发生大范围的技术故障或者自然灾害导致本地的虚拟机无法正常运行的情况下,虚拟机可以自动迁移到远程的主机上继续运行的技术。其应当满足以下功能: (1)有完整的技术解决方案和管理平台,可以同时对本地以及多个远程的数据中心的主机进行监控,当灾难发生时,可以采取迅速有效的响应机制,进行不需要人工干预的虚拟机自动切换。 (2)支持1对1和1对多的容灾部署,支持多地数据中心互为灾难备份。 (3)支持同步或者异步的数据复制传输,使得灾备方案可以跨越广域网。并且应当提供可靠的基于软件的数据复制方式,同时也应当支持主流的硬件磁盘阵列的数据复制方式。 (4)提供的容灾方案可以在不影响生产环境的情况下进行可靠性测试,以验证系统的RTO和RPO。 6.2.5 虚拟机模板 虚拟机模板是指可以用来创建其他虚拟机的虚拟机镜像文件。虚拟机模板包括操作系统,一系列应用程序以及一整套虚拟机配置选项。 模板应既能支持各种操作系统,又能支持系统软件或应用软件,具体内容包括: (1)虚拟机的配置,如CPU、内存、硬盘; (2)虚拟机的操作系统环境,如操作系统类型、版本; (3)虚拟机的应用软件环境,如软件安装包路径、安装参数; (4)应用软件的部署与配置流程,用于生成虚拟机时软件的安装与设置。 虚拟机模板应当支持以下功能: (1)模板的创建。模板应当支持多种创建方式,包括从一台现有虚拟机创建模板,以及从一个现有模板中复制另一个模板。 (2)模板的更新和升级。模板创建成功后应当可以修改,包括修改模板中包含的应用程序和配置信息。 (3)支持通过模板快速、批量部署虚拟机,除必要的参数配置以外,通过模板创建虚拟机的过程可以自动化进行。 (4)基于模板的大规模部署,应当支持共享的方式,使得克隆得到的虚拟机可以共享磁盘上相同的文件(例如操作系统文件),以达到节省磁盘空间的效果。 6.2.6 虚拟机克隆 虚拟机克隆是指从一台现有虚拟机创建新虚拟机的过程。 虚拟机克隆应当支持以下功能: (1)支持离线或者在线的虚拟机克隆。 (2)克隆完成后,应当提供向导,对新生成的虚拟机进行定制。定制应当包括对虚拟机运行的软件以及虚拟机本身配置的修改,以避免软件授权违规或者虚拟机网络IP地址冲突。 (3)克隆的虚拟机可以采用与原有虚拟机不同的磁盘部署方式。 6.2.7 虚拟机网络 虚拟机网络是指虚拟机之间以及虚拟机和外部物理机之间的网络连接及其属性。虚拟机网络应当支持以下功能: (1)支持虚拟交换机。虚拟交换机用以支持虚拟机内部的网络通信,以及虚拟机和外部物理机之间的网络通信。虚拟交换机应当可以跨越多台物理hypervisor主机,使得虚拟机在主机之间迁移时网络属性得以保留。 (2)虚拟交换机应当支持对虚拟机的网络控制,包括流量控制和安全控制。 (3)虚拟交换机支持以端口组为单位的网络属性配置以及修改。 (4)虚拟交换机支持主机物理网络的负载均衡以及网卡错误切换。其中负载均衡应包括基于MAC地址或者IP地址的负载均衡算法。 (5)虚拟交换机支持划分虚拟局域网(VLAN)以实现对虚拟机的安全隔离。 (6)虚拟机须提供对网卡的虚拟化支持,虚拟网卡和虚拟交换机通过物理网络设备接入物理网络。 (7)为了提高通信效率,减少对物理网络设备的压力,虚拟机之间的通信可配置为通过虚拟网卡以及虚拟交换机的方式进行,无须通过物理网卡。 (8)虚拟机的虚拟网卡可支持划分VLAN。 (9)虚拟机支持多块虚拟网卡,虚拟机网卡共享底层网卡。 (10)网络支持巨帧类型,支持多种MTU大小。 (11)每个网络类型支持至少两块网卡bonding实现冗余网络路径。 对虚拟交换机的支持主要有两种方式。一种是采用纯软件的方式,用主机的CPU资源来处理网络流量。另一种是尽可能利用物理网卡和物理交换机的功能,如802.1Qbg,802.Br,SR-IOV等技术,来实现网络交换。后者可以减轻主机负载,并且达到更高的虚拟网络外部可见性。Hypervisor软件应当支持上述两种方式。 6.3 管理功能要求 6.3.1 P2V/V2V 1. P2V转换 可以离线或者在线地将物理服务器上的操作系统(Windows/Linux)转换到虚拟环境。支持DMTF的OVF格式,方便支持各种类型的虚拟化hypervisor。转换之前可以实现设置好虚拟机的硬件资源,被转换的操作系统在转换结束之前应该能自动检测并替换原有的硬件驱动以保证转换结束后能够在虚拟环境下正常启动。 P2V转换可以有两种方式: (1)在线进行:物理服务器上的应用系统在正常运行的过程中实现P2V转换,转换完成后切换到虚拟机继续提供服务。在线P2V转换应保证中断时间尽量小。 (2)离线进行:P2V转换在物理服务器关机、应用系统离线情况下进行,转换完成后启动虚拟机并开始提供服务。 P2V转换后,原有系统无须更改即可正常运行,并保证数据不丢失。 2. V2V转换 支持将其他主流虚拟化的虚拟机转换到自己的虚拟化环境,可以自动检测并替换原有的虚拟硬件设备以保证虚拟机在转换后的正常运行。支持从不同厂商的虚拟化环境导出为OVF格式,再从OVF格式直接导入到新的虚拟化平台。 应该具有图形操作界面方便管理员操作,整个操作过程要求简便易行。并且转换过程有详细的日志记录。转换过程不应对源物理机或虚拟机产生任何改动。虚拟机产品需支持两种不同方式实现V2V转换: (1)通过自带工具或者第三方工具,将一种虚拟机转换为另外一种格式的虚拟机,例如在VMWare、Hyper-V和Xen之间的相互转换。转换成功后虚拟机能够正常运行,数据不丢失。 (2)不经过转换,Hypervisor直接识别并使用另外一种虚拟机。 6.3.2 资源按需分配 资源按需分配是指虚拟机运行时所占用的资源并不是在虚拟机启动的过程中一次性的分配给虚拟机的。虚拟机只需要向主机申请维持其当前正常运行状态和性能的资源(包括CPU,内存,磁盘和网络带宽等),只有当其性能无法满足时,才会继续向主机申请额外的资源,以避免主机资源的浪费。多个虚拟机的可使用资源的总和可以大于物理服务器所能提供的资源,即允许存在一定的 “资源复用”情况。虚拟机资源按需分配需要支持以下功能: (1)资源的动态分配;Hypervisor支持对虚拟机性能的监控,并且会按照预定义的策略和优先级响应虚拟机的资源请求。 (2)资源的动态回收;Hypervisor可以根据预定义的策略回收已经分配给任意虚拟机的资源,以满足整个系统的资源调度。 (3)分配策略的制定;用户应当可以指定每台虚拟机对资源使用和申请的优先级。当多个虚拟机共享CPU、内存和I/O等资源,特别是存在“资源复用”的情况时,级别高的虚拟机能够优先分配到资源,以体现不同的服务水平协议(SLA)。 6.3.3 实时资源调整 为提高资源分配的灵活性,满足业务量变化时对资源的不同需求,在物理服务器可用资源允许的范围内,应支持虚拟机的资源实时动态调整。 虚拟化应支持基于手动的方式或者预先配置的策略,实现: (1)支持动态增加虚拟网络设备; (2)支持动态增加虚拟存储资源; (3)建议支持动态增加虚拟机CPU资源;(可选) (4)建议支持动态增加虚拟机内存资源。(可选) 在资源动态增加的过程中,虚拟机无须关闭重启、业务不应中断运行。 6.3.4 工作负载动态调整 工作负载动态调整是指通过在主机之间在线迁移虚拟机达到主机之间的负载均衡。 负载动态调整的范围是资源池。资源池由CPU架构/功能一致或相似的主机集群组成。动态调整通过在主机之间迁移虚拟机,将虚拟机由高负载的主机迁至低负载的主机,以达到资源池内的主机之间负载均衡的目的。 虚拟机自身的资源调度,或者虚拟机在不同物理服务器之间的迁移可以由管理员手动进行,也可以按照事先设置的策略自动进行。通过策略可以实现虚拟机资源配置的自动化和智能化,提高设备资源利用率和系统可用性。资源调度策略的触发方式应支持: (1)定时:在预先设定的时间触发资源调度或迁移。 (2)资源利用率阈值:当某个物理服务器的资源利用率达到预先设定的阈值时,触发对虚拟机在线迁移。 在触发自动迁移过程时,系统能够自动发现满足资源需求的物理服务器,并根据预先设定的策略自动选择合适的目标物理服务器完成迁移。 Hypervisor应当监控物理服务器的运行状态,对无法满足性能需求的虚拟机,可以将其自动迁移。包括: (1)如果是主机计算资源无法满足要求,可以将虚拟机迁移到更高性能的主机上。 (2)如果是存储资源无法满足要求,可以将虚拟机迁移到更大或者更高I/O吞吐量的存储上。 6.3.5 虚拟机迁移 虚拟机迁移是指虚拟机由一台物理服务器转移到另外一台物理服务器的过程。虚拟机在迁移的过程中仍然能够正常运行并继续提供服务,要求在迁移的过程中有较好的数据传输策略来达到较低的网络带宽占用。通常是在配合资源调度策略时系统会根据负载动态迁移虚拟机。 虚拟机存储迁移是指虚拟机的存储数据由一台存储设备迁移到另一台存储设备,迁移前后虚拟机的运行状态保持连续性和一致性。存储的迁移过程中应不会导致虚拟机的业务中断。 虚拟机迁移需支持离线迁移和在线迁移两种不同的迁移形式: 1. 离线迁移 虚拟服务器停止运行后,通过共享存储或者存储复制等方式,迁移到另外一台物理服务器上重新启动。 在相同类型或兼容的Hypervisor支持下,两台物理服务器配置不同、存储方式不同、或者CPU类型和架构(Intel或AMD)也不同的时候,仍然可以进行离线迁移。 2. 在线迁移 如果两台物理服务器使用同类CPU、不绑定特定硬件,并采用网络共享存储,能够支持在业务不中断的情况下,实现虚拟服务器从一台物理服务器迁移到另一台物理服务器,即在线迁移(LiveMigration)。 在线迁移应当允许并发迁移。管理员可以选择多台虚拟机同时进行迁移操作。虚拟化软件应当支持对迁移数据流量的QoS,包括使用专有网络进行迁移的能力。 QoS,即服务质量(qulaity of service),可以通过多种手段实现网络的QoS,包括使用IEEE 802.1p 协议对数据迁移网络流量打上QoS标签;或者通过虚拟网络流量控制技术,对迁移数据流量提供高优先级的带宽等。 6.3.6 网络IO控制 Hypervisor软件应当提供虚拟交换机以实现对虚拟机的网络IO控制功能。 (1)网络IO的控制力度应当包括对峰值流量大小的以及对单位时间平均流量大小的。此类应当可以通过图形化界面对以虚拟机为单位进行配置。 (2)网络IO控制的指标应当可以以多种方式来灵活地指定。即可以指定具体的流量数据,也可按照百分比的方式来指定,还可以按照虚拟机之间的优先级来指定网络流量控制。 (3)网络IO控制还应包括对点对点流量的控制,以及针对协议的流量控制。 6.3.7 存储IO控制 存储IO控制是指针对虚拟机对存储访问的。 (1)对于共享存储的访问,应当可以指定不同的优先级,以满足不同级别虚拟机的要求。 (2)存储IO的控制力度应支持对峰值吞吐能力的。 (3)存储IO控制的指标应当可以以多种方式来灵活地指定。即可以指定具体的流量数据,也可按照百分比的方式来指定,还可以按照虚拟机之间的优先级来指定存储流量控制。 7 非功能性要求 7.1 性能需求 7.1.1 虚拟机损耗 服务器虚拟化通过特殊的软件(包括硬件辅助)实现对底层物理设备资源访问指令的转换,将资源抽象化并支持多个虚拟机之间的资源调度、管理功能,而这一功能本身也需要消耗部分服务器的部分资源,不可避免地带来一些性能损失。 服务器虚拟化产品必须尽量减少虚拟软件本身的性能损耗,使虚拟机提供与同等资源配置的物理服务器相当的处理能力。 对服务器性能的度量可以采用两类指标: (1)单类资源处理性能:如CPU计算能力、网络通信能力和磁盘I/O能力等; (2)综合处理性能:根据服务器的典型应用,比如Web服务、Java应用等; 与物理服务器相比,采用不同指标度量的虚拟机的损耗如下: (1)CPU损耗小于5% (2)磁盘IO损耗小于10% (3)网络IO损耗小于10% 通常情况下虚拟化的损耗可以用相同配置的物理机和虚拟机进行比较。 应当测量主机虚拟化软件自身对系统资源的占用。此项占用应尽可能的小以达到低虚拟化损耗的目的。 7.1.2 虚拟机整体性能需求 虚拟机的整体性能需求包括:虚拟机的性能稳定性和虚拟化的最大处理能力。 1. 虚拟机性能稳定性 虚拟机的性能由所分配的CPU、内存、网络等资源的数量和类型决定。一旦资源分配方案确定后,虚拟机的性能应该具有稳定性。 当物理服务器资源能够满足多个虚拟机的资源需求,即不存在“资源复用”和“资源竞争”的情况时,虚拟机的最高性能在以下情况下应保持稳定: (1)虚拟机的最高性能与其所处的物理位置无关。在相同的硬件条件下和相同的负载情况下,则两个虚拟机的性能应该相同; (2)虚拟机的最高性能与物理服务器中同时运行的虚拟机的数量无关。例如,在物理服务器上新增一个或多个虚拟机,对原有虚拟机的性能没有影响; (3)虚拟机的最高性能与其它虚拟机的负载情况无关。当各虚拟机资源分配确定后,无论其它虚拟机是忙或闲,都不影响本虚拟机的性能。 2. 虚拟化最大处理能力 服务器虚拟化应该能够提供较高的处理能力支持,以满足不同应用的使用需求。服务器虚拟化处理能力包括虚拟机单机处理能力和集群处理能力: (1)在物理服务器能够满足资源需求的情况下,X86平台上的一台虚拟机支持32颗虚拟CPU核、1T内存和2TB的虚拟磁盘的能力。物理主机支持128颗物理CPU核与2TB物理内存,支持最大TB的物理卷,支持16块千兆网卡或者8块万兆网卡。 (2)单套虚拟化管理系统能够统一管理不少于1000个物理服务器节点和10000个虚拟机节点。 (3)集群内物理主机至少支持8台 7.1.3 虚拟机迁移性能 虚拟机迁移性能主要衡量指标为迁移时间。 (1)虚拟机的迁移时间与网络带宽、虚拟机活跃度和虚拟机迁移算法有关。 (2)网络带宽是同时迁移虚拟机数量的关键因素。一般单个千兆网卡可以支持4台虚拟机的同时迁移,单个万兆网卡可以支持8台虚拟机的同时迁移。 (3)虚拟机迁移中由于涉及到对内存的复制,所以虚拟机迁移时间随虚拟机内存的增加而有所增加。另外,虚拟机的活跃程度对迁移时间也有影响,对内存操作越频繁的虚拟机迁移时间越长,所以需要比较相同负载下虚拟机的迁移时间。 (4)虚拟化服务器在线迁移完成时,服务将从源虚拟机切换到迁移的目标虚拟机中,在迁移完成的最后一瞬间,也即虚拟机切换的最后一瞬间,服务不可用的时间应该低于秒级。 7.1.4 虚拟机快照性能要求 通过虚拟化平台提供的快照技术,可以对虚拟机存储数据进行在线存储快照,当虚拟机需要恢复时可以基于快照进行快速恢复,可衡量的指标包括: (1)创建快照的时间 (2)快照恢复虚拟机的时间 应当保证在存在一定数量快照的情况下,继续创建快照的时间不会下降。即快照的性能应当与快照数量不相关。此项指标可以通过在一定的时间间隔内创建多次快照来比较每次快照的时间没有明显的变化。 7.2 可用性要求 7.2.1 集群支持 虚拟化HA集群为一定数量的同构CPU的物理服务器集合,集群内物理服务器之间保持“心跳”通信,通过对集群内物理服务器故障的自动化监测,使出现故障 的物理服务器上的所有虚拟机在集群内其他节点上自动重新启动,从而实现整个虚拟化系统的高可用。 7.2.2 网络冗余连接 网络冗余连接是指Hypervisor虚拟化软件应当识别并支持主机上的多网卡设置,并且可以将故障网卡上的虚拟机流量自动引导到健康网卡的能力。 同样的原理,当网络出现故障,例如交换机故障、链路故障时,虚拟化软件也应当自动识别错误并将虚拟机流量引导到健康的网络链路上,且这一过程应当对虚拟机是透明的。 网络冗余还应包括对多网卡的bond支持。数据流量可以在多个主机的物理网卡之间同时传输,以达到带宽利用率最大化。主机还应当在冗余链路之间支持负载均衡。均衡算法应当支持MAC地址,IP地址为规则的设置。 当原故障网络恢复时,主机应当自动识别并响应。 7.2.3 存储可用性支持 存储可用性包括对存储多路径的支持。存储多路径需要主机Hypervisor软件,网络和存储设备的统一协作。 主机Hypervisor应当自动识别故障路径并进行自动切换。 虚拟化软件应当提供认证平台,对主流的存储阵列进行可用性的认证。 7.2.4 虚拟机HA 在对物理服务器和虚拟机的运行状态进行监控的过程中,一旦虚拟机本身或者虚拟机所在物理服务器发生故障时,能够在集群内以以下几种方式进行故障切换: (1)如果仅仅是虚拟机出现故障而物理服务器仍然正常运行,支持在本地重新启动故障虚拟机,承担原有工作负载; (2)在其它正常运行的物理服务器上,重新加载和启动发生故障的虚拟机,承担原有的工作负载; 服务器虚拟化故障切换过程中,应该尽量减少服务中断的时间,检测到故障发生后应该立即按照预先设定的方式开始执行故障切换操作。 在故障切换过程中,能够正确选择合理的目标服务器,避免给其它物理服务器或虚拟机造成过大压力。如果当前系统中没有可用资源,应该能够进行故障告警。 7.2.5 虚拟机故障隔离 故障隔离是指虚拟机能够避免外部软硬件故障对系统可用性的影响,仍然保持虚拟机的正常运行。在一个虚拟机内的任何操作,不对同一台物理服务器上的其它虚拟机和Hypervisor自身的可用性产生危害。即使虚拟机的运行出现故障,比如操作系统崩溃、应用程序错误导致死机等情况,同一物理服务器上的Hypervisor以及其它虚拟机仍然可以正常运行。 7.3 可管理性要求 7.3.1 虚拟化系统补丁统一升级 系统补丁升级需要支持: (1)联机在线自动查找、发现和报告Hypervisor、虚拟化管理系统存在的系统漏洞,及时进行更新和补丁安装; (2)补丁安装或升级从网络在线下载安装或从本地安装,并可以通过脚本或工具自动批量进行。安装补丁或更新时,虚拟机可以运行或不运行。 (3)Hypervisor软件的升级应当不影响虚拟机上业务的正常运行。 (4)系统升级应当支持回滚操作,并有完整的升级日志。 (5)应当有统一的管理界面对多台主机进行升级的管理和控制。 7.3.2 虚拟机操作系统软件统一升级 提供虚拟机操作系统软件的统一升级功能,包括: (1)支持联机在线自动查找、发现和报告虚拟机操作系统存在的系统漏洞,及时进行更新和补丁安装; (2)补丁安装或升级支持从网络在线下载安装或从本地安装,并可以通过脚本或工具自动批量进行。安装补丁或更新时,虚拟机可以运行或不运行(离线安装)。 (3)虚拟化软件应当避免每台虚拟机需要单独升级的传统方式,可以通过统一的管理界面,实现对多台虚拟机的升级管理,以达到节省网络流量和带宽的目的。 (4)虚拟化软件应当监控并记录每台虚拟机的系统状态以及操作系统信息,并且根据预定义的策略进行升级和管理。 7.3.3 故障管理 为了能够更加便捷地对虚拟化平台进行维护管理,特别是对多台物理和虚拟机进行统一管理,虚拟化平台应该提供通过脚本或流程编排的方式,支持对虚拟化服务器进行远程、自动化操作和管理。 虚拟化的管理模块支持实时监测网络中各物理服务器和虚拟机的运行状态变化情况,针对可能引发潜在性问题的配置更改、资源不足、设备故障等故障情况,提供友好的告警界面和信息,通过Email、Log、短信或相关网管接口等方式提醒相关人员,以便及时进行处理。其功能应支持: (1)故障定位:要能够自动搜集Guest OS、VMM的故障定位信息。自动搜集到的故障定位信息应完整,能够支撑类似Windows蓝屏、Linux Panic等严重问题的定位。 (2)故障上报:异常时要能够自动上报告警。 7.3.4 脚本自动化管理 为了能够更加便捷地对虚拟化平台进行维护管理,特别是对多台物理和虚拟机进行统一管理,虚拟化平台应该提供通过脚本或流程编排的方式,支持对虚拟化服务器进行远程、自动化操作和管理。 7.3.5 运维监控管理 为了能够支撑资源管理平台对资源信息的运维监控上报.需要支持相关数据的采集,包括: (1)物理机上报内容信息(物理机的版本型号、配置信息(CPU,内存,硬盘,网卡个数)、资源状态); (2)网络上报内容信息(存储空间总量(GB)、IP和虚拟防火墙总量(个)、已用存储空间量(GB)和已使用IP和虚拟防火墙(个)) 7.3.6 拓扑管理 虚拟化的管理模块需提供网络内部各种软硬件资源的统一管理,包括: (1)物理服务器:编号、名称、IP地址等; (2)虚拟机:编号、名称、操作系统、IP地址等; (3)存储及网络设备:编号、名称、类型等。 支持通过图标或树形分支图等形式可视化直观展示软硬件资源的拓扑关系视图。 当系统组网架构发生变化后,支持拓扑关系的动态发现和更新。 7.3.7 状态监控管理 支持对物理服务器和各个虚拟机的运行状态进行实时的监控,记录详细的数据,进行图形化展示。 运行状态监控涉及的性能指标包括: (1)CPU利用率 (2)内存利用率 (3)磁盘I/O读写速率 (4)网络I/O通信速率 (5)存储使用量:虚拟机占用物理磁盘空间,虚拟机实际使用大小 虚拟化管理模块支持对监控的各种资源的利用率等指标进行统计分析,并生成多分析维度的报表和报告。 7.3.8 历史记录管理 虚拟化的管理模块提供用户对虚拟化系统的各类操作、系统中自动产生的事件和告警信息等的详细log记录,并支持对历史记录的方便的查询。包括虚拟机动作,物理机状态与动作,存储及网络动作等。 为确保对系统操作的有据可查,历史记录可配置保存时间,在此期间不允许删除或修改。 7.4 安全性要求 虚拟机访问控制 虚拟机访问控制是指Hypervisor软件应当对虚拟机的系统和数据安全有完整的端到端的解决方案。既包括物理安全和软件层面的安全,又包括数据层面和网络层面的安全。具体含义有: (1)虚拟网卡设定VLAN。 (2)虚拟机间禁止进行内存间的直接数据交换。 (3)在未经授权的情况下,虚拟机内禁止查看、读取宿主服务器上其它虚拟机的虚拟化数据。如虚拟磁盘文件、虚拟机配置文件等。 (4)同一物理服务器上的虚拟机隔离。同一物理机服务器上资源隔离,包括CPU、内存、内部网络隔离、磁盘I/O必须进行有效的隔离,不会因为某一个虚拟机被攻击而导致其他同一物理服务器上的虚拟机被影响。(是否是资源绑定) (5)数据中心内部虚拟机访问隔离。要能提供虚拟防火墙,如安全组功能,确保不同租户的虚拟机之间的网络隔离(包括同一个物理主机内的不同虚拟机)。针对每个安全组可以定义ACL规则,如对外开放某个具体的服务或端口,允许外部某个IP地址访问虚拟机的某个端口,也可安全组之间相互授权访问。 (6)恶意VM预防。要能防止同一个物理主机内VM能嗅探到其它VM的数据包。要有能力防止恶意虚拟机的IP欺骗和ARP地址欺骗,虚拟机只能发送本机地址的报文。(如何测试) (7)网络组网支持管理、业务、存储网络三网进行分离;控制不同网络用户使用虚拟机权限. (8)平台能记录用户对虚拟机操作日志,便于审计。 7.4.1 防病毒能力 支持虚拟机通过代理客户端软件,实现集中杀毒,而无须每个虚拟机都安装杀毒软件。 虚拟化软件应当提供区别与传统物理机查杀病毒的防病毒方式。具体应当满足以下需求: (1)Hypervisor软件应当提供应用编程接口(API)使得可以与市场主流的第三方的防病毒软件协同工作。 (2)应当避免使用传统的在每一台虚拟机中安装杀毒代理的方式来查杀病毒,并且应当避免由此产生的病毒查杀风暴。 (3)应当有完整的病毒查杀日志以满足法律合规性要求。 7.4.2 敏感数据保护(可选) 对虚拟机上的敏感数据,虚拟化软件应当提供满足法律合规性要求的保护机制。具体要求如下: (1)用户可以通过统一的管理界面定义敏感数据的类型和范围。管理界面还应当提供基于行业和法规的数据模板 (2)虚拟化软件可以在不影响虚拟机性能的情况下,对虚拟机数据流量进行扫描,并鉴定其中的敏感数据。并对违规事件按照预先定义的规则进行响应。 (3)应当有完整的日志记录以满足法律合规性要求。 8 接口功能描述 计算设备向资源管理平台提供虚拟机管理、虚拟机运行控制、快照管理、模板管理、资源监控、物理机管理和网络管理,便于将相关计算设备整合到云计算管理平台。 接口 接口名称 分类 接口具体要求 属性 虚拟机管创建虚拟机 理 基于模板创建虚拟机实例,并指定虚拟机规格(CPU、内存、硬盘空间)、名称、描述、必选 IP地址、VLANid、初始密码等 接口 接口名称 分类 接口具体要求 属性 删除指定的虚拟机并释放CPU、内存和磁盘镜删除虚拟机 像等资源 必选 获取所有或指定的虚拟机编号、名称、IP地获取虚拟机信址、模板、所在物理机、描述等信息,以及必选 息 CPU、内存、硬盘空间、网络带宽等资源配置 更改虚拟机规更改指定虚拟机CPU数量、内存数量等资源配必选 格 置(在虚拟机关闭状态下进行) 获取虚拟机运获取指定虚拟机的运行状态,例如运行中、必选 行状态 暂停中或关闭中 启动虚拟机 虚拟机运行控关闭(Shut 通过Hypervisor控制虚拟机启动运行 必选 通过操作系统命令关闭虚拟机 Down)虚拟机 必选 接口 接口名称 分类 接口具体要求 属性 制 虚拟机下电通过Hypervisor对虚拟机进行强行关闭(类必选 (Power off) 似于物理机拔掉电源) 重启虚拟机 通过操作系统命令控制虚拟机重新启动 必选 暂停(挂起)虚暂时停止(挂起)虚拟机运行 拟机 必选 恢复虚拟机 从挂起状态恢复虚拟机运行 必选 创建快照 创建指定虚拟机的磁盘快照 必选 删除快照 快照管理 快照恢复 删除指定的虚拟机磁盘快照 必选 基于指定的虚拟机磁盘快照恢复虚拟机 必选 查询虚拟机快获取快照列表及快照相关信息 照信息 必选 接口 接口名称 分类 接口具体要求 属性 从虚拟机创建基于已有的虚拟机实例(关机状态下)创建必选 模板 模板 删除虚拟机模删除指定的虚拟机模板文件 板文件 必选 注册虚拟机模将指定模板纳入到虚拟化管理 板 模板管理 注销虚拟机模从虚拟化管理中移除指定模板 板 必选 必选 获取虚拟机模获取模板列表,以及模板名称、描述、操作必选 板信息 系统等信息 模板批量创建基于指定模板,批量同时创建多个虚拟机 虚拟机 必选 接口 接口名称 分类 接口具体要求 属性 获取指定虚拟机的资源利用信息,包括CPU、监控虚拟机资内存利用率和I/O性能,以及虚拟机本地硬盘必选 源利用率 利用率等 资源监控 获取指定物理机的资源利用信息,包括CPU、监控物理机资内存利用率和I/O性能,以及本地硬盘利用率必选 源利用率 等 将指定的安装有Hypervisor的物理机加入注册物理机 VMS统一管理 物理注销物理机 机管理 启动物理机 控制指定物理机启动运行 必选 从VMS管理中移除指定的物理机 必选 必选 关闭物理机 关闭指定物理机(及其上运行的所有虚拟机) 必选 接口 接口名称 分类 接口具体要求 属性 获取指定物理机编号、名称、Hypervisor类获取物理机信型、IP地址等基本信息,以及CPU、内存、磁必选 息 盘、网络等硬件配置信息 获取物理机上获取指定物理机上运行的虚拟机数量、编号、必选 的虚拟机信息 名称、运行状态等信息 获取物理机状获取物理机运行中或关闭等当前状态信息 态 必选 IP地址配置 网络管理 配置指定虚拟机的IP地址参数 必选 配置防火墙规配置指定虚拟机的防火墙参数,包括IP和端必选 则 口等 计算设备接口描述参见“xxx接口技术规范”。
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- baijiahaobaidu.com 版权所有 湘ICP备2023023988号-9
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务