广州睿东网络科技有限公司是国内最专业的香港空间,云主机,香港VPS,香港服务器租用提供商,专注为国内站长提供高速且稳定的香港空间,云主机,香港VPS,香港服务器租用,欢迎您的选购!
当前位置:首页 -> 香港主机 -> 独立IP空间

从AWS X1说起:为什么公有云也用四路服务器?

云服务器 34℃ 1882评论

互联网IT技术与传统IT技术正走向深度融合,但绝非像大多数人所想的那样——互联网技术单方面取代早已“陈旧”的传统IT技术,而是两者相互借鉴,正逐步融合。诚然,源自互联网的分布式技术正在企业IT环境中应用越来越成熟。传统企业IT技术在互联网行业的应用似乎案例较少,但随着大型传统企业应用开始“试水”公有云,这种情形正在发生改变。例如,AWS今年早些时候推出的X1实例,就基于英特尔至强E7-8880 v3处理器。


AWS将X1实例命名为“内存优化型”,采用四颗至强E7-8880 v3处理器,单实例最大可用128 vCPU,与2TB内存。单颗E7-8880 v3处理器实际上有18个物理核心,加上超线程技术,总共144颗逻辑核心(即vCPU),显然在X1实例中,还有16颗逻辑核心用于底层Hypervisor或其他系统开销

对于大多数人的印象而言,互联网公司似乎能使用双路E5(典型为双路服务器,但也有四路服务器),就绝不会使用四路E7,毕竟成本不在一个数量级。而且单对比处理器核心数量来看,E5 v3和E7 v3处理器几乎没有差距。比如单颗E5-4669 v3处理器拥有18颗物理核心,而E7-8880 v3的物理核心也是18,当然主频略高。从内存的支持数量来看,四路E5最大支持到6TB(单条128GB),四路E7则最大可到12TB(单条128GB)。从AWS X1实例的2TB内存配置来看,四路E5也能支撑,但为何选用了四路E7?很不“互联网”……

X1之所以提供2TB内存,这应该使用的是单条32GB容量的内存条,这是目前最具性价比的方案。尽管四路E5理论上可以支持到6TB,但使用的是单条128GB内存,成本高。虽然E7成本高于E5,但相较提升内存容量产生的成本,还是低了很多。况且,如果四路E5每个内存通道都用满的话,内存反而降频,性能和经济性都不好。AWS选用E7是为了满足客户应用的需求,互联网巨头“精打细算”的优良传统一点儿也没有丢。

参数并不代表一切,从架构设计来看,四路E5的性能就很难超越四路E7,哪怕其他配置一样,甚至E5配置略高,都不行。


四路服务器中,E7处理器和E5处理器的互联架构拓扑图。最大的区别有两处:一,单颗E7处理器具有3条QPI,可以直接与另外三颗E7 CPU进行互联,类似“点对点”连接,具有架构优越性。另外一个不同则是,四路E7支持更大的内存容量

从AWS EC2 X1实例的介绍来看,其主要面向SAP HANA、Apache Spark或者Presto等应用场景,都属于典型的大内存应用场景。Scale up能很好解决的问题,就没必要去Scale out。互联网较少用四路,更多的是因为经济性问题,如果性价比合适,为什么不用?这里可以借鉴Google的研究成果:


Google在2009年发布的《The Datacenter as a Computer》中很重要的一个观点:“强核理论”(编者注:强核与弱核是相对的。例如x86处理器相对ARM是强核,所以少有Google关于ARM的消息)。简单说来,在一个集群之中,单节点的性能越好,整个集群在通信上耗费的总体资源比例越低,整体利用率更好。比如,一个由较高性能服务器(单节点128核心)组成的集群,对比一个由较普通性能服务器(单节点4核心)组成的集群,集群总核心数量相同情况下,前者的总性能几乎是后者的10倍以上,后者在通信上效率也远不如前者。详见《The Datacenter as a Computer》33-36页

在SAP HANA方面,四路E7是世界纪录的保持者,例如在SAP BW Advanced Mixed Load(BW AML)Standard Application Benchmark(增强混合负载标准应用基准测试)中,在20亿条纪录查询中,最新的纪录保持者——Dell PowerEdge R930,就是采用至强E7 v4处理器的四路服务器。


在SAP BW AML标准应用基准测试中的最新纪录,由Dell Power Edge R930刷新,有兴趣的童鞋可以在SAP官网查看详细测试报告

百闻不如一见,摆事实讲道理再多,都不如亲手摸一摸。在之前不久,戴尔公司送测了一台PowerEdge R930服务器,配备四颗至强E7-8880 v3处理器(恰好是AWS X1实例使用的同款CPU),也是E7v3家族中排名第二的顶配处理器(18core,2.3GHz),配备512GB内存。详细硬件配置可见《先睹!最高配4路服务器拆给你看:戴尔PowerEdge R930速览》

一般而言,高端四路服务器通常都是用于支撑企业关键业务负载,满足企业关键业务提出的高性能、高可用、高可靠以及易维护等需求。最为常见的企业关键应用莫过于数据库应用,所以本次测试在R930四路服务器上使用Oracle Linux+Oracle 12c(包括Grid与Database)来构建一个真实的数据库应用场景。测试环境如下表:


整个测试环境完全基于真实应用场景构建,在这之上创建一个测试数据库,以用于测试

通过Swingbench测试软件,向测试数据库中写入200GB测试数据,数据写入完成之后,以这200GB数据为基础进行Oracle数据库性能测试,其中读IO占比60%,写IO占比40%。测试结果如下:


在稳定运行一段时间之后,获得测试成绩,其中峰值TPM(每分钟事务交易量)接近58万,平均TPM超过50万;峰值TPS(每秒事务交易量)超过1万,平均TPS在9000左右;平均延迟在100ms以内

受限于两块PCIeSSD的性能瓶颈,尽管CPU利用率还未达到最佳成本模型(普遍认为CPU利用率为60%~70%时,获得最佳经济性),但这几乎已经是数据库的最大性能。为了获得整个R930平台的最佳性能表现,企事录设计了一个混合负载环境,首先验证Oracle数据库服务器在VMware vSphere虚拟化环境下的性能表现,以与物理环境下的性能成绩比较。

在vSphere虚拟化环境中,两块英特尔 DC P3700 PCIe SSD以直通方式供Oracle数据库服务器使用,提供数据库存储。写入100GB测试数据样本,并使用Swingbench进行压力测试,稳定运行一段时间之后,其测试结果如下图:


在Oracle数据库服务器的配置为64 vCPU,128GB内存,100GB测试数据样本,读/写负载比例分别为60/40时,稳定运行一段时间之后,其获得的峰值TPM为534927,略低于物理环境中的579415TPM,平均TPM相差无几。同时,通过对PCIe SSD的监控数据表明,PCIe SSD的性能几乎已经发挥出最佳性能

同时,在通过vCenter服务器的监控显示,Oracle数据库虚机的CPU的平均利用率在60%~70%之间,R930服务器的CPU综合利用率不到40%如下图所示:


在vCenter服务器监控界面,R930整台服务器的综合CPU利用率约为37%

在保障Oracle数据库服务器性能需求的基础之上,企事录实验室在R930服务器构建的虚拟化环境中引入了一个新的测试方案——RAWC,一个用于评估VDI(虚拟桌面架构)的测试方案。需要注意的是,在实际环境中,关键业务应用尽量不要与其他应用混合,以规避资源争用以及数据损坏或泄露等风险,此处仅为企事录实验室出于性能(容量)目的的探索性测试。


企事录设计的混合负载模型,使用VMware vSphere虚拟化套件,在R930上同时部署两个测试环境,包括模拟关键业务数据库的Oracle数据库服务器(配备64vCPU与128GB内存),以及VDI解决方案(基于VMware Horizon View 6,以及RAWC测试方案)。注意:此方案为探索性方案,仅用于测试环境,不代表也不建议实际环境参考

经过测试,在保证Oracle数据库性能的基础之上,基于R930四路服务器在RAWC测试中,能够满足80个虚拟桌面的性能需求。经企事录估算,如果R930增加更多内存容量,虚拟桌面数量还有进一步提升的空间。

需要注意的是,这仅是一个探索性测试方案,考量的仅仅是R930服务器的计算性能(CPU和内存的配置),CPU和内存的配置的不同将极大地影响测试结果。同时,另外一种重要的影响因素在于网络,整个测试方案基本上排除了网络的影响因素(都在同一台物理机上,没有经过外部网络),而在实际环境中,不管是Oracle还是RAWC测试,网络都将是一大重要影响因素。

虽然在实际环境中,将关键业务数据库与VDI应用部署在同一台服务器上的做法并不可取,但企事录认为,这种探索是值得的,能够进一步发挥高端服务器的性能优势和RAS(Reliability、Availability、Serviceability,即可靠性、可用性和易维护性),尽管这可能需要一段时间的观察、评估和总结,但值得一试。

北京企事录技术服务有限公司

专注于企业级产品、技术的传播推广,加速促进新产品、新解决方案的落地实施。企事录公众号为您分析介绍企业IT、互联网基础设施及架构方面值得关注的技术趋势,欢迎大家关注!


长按,选择“识别图中二维码”

投诉
喜欢 (1882)

评论

帐  号: 密码: (新用户注册)
验 证 码:
表  情:
内  容: