天翼云新一代 V5 云主机,Kvm 之生,Xen 之死!
天翼云发布了新一代 V5 云主机,基于 intel 最新发布的 Intel® Xeon Skylake V5 CPU 的物理机及 KVM 虚拟化提供的全新云主机系列。计算性能较上一代(V4 CPU+Xen 虚拟化)提升 15%左右,可以更高效的进行单、双精度浮点运算,适用于对计算性能有强需求的各种场景。
这里重点要提的是采用了虚拟化平台 KVM!曾经的真爱!
记得 2012 年刚到云公司的时候,领导布置安排了在自己的笔记本上部署 KVM 虚拟化平台的活,于是,按照网上的教程一步一步的完成了部署,并开通了虚拟机。
那时候,一切都是刚起步,阿里云依然在默默的埋头研发自己的公有云平台,而我们的资源池已然上线,采用的是 cloudstack+vmware/xen 相对成熟的商用平台。
但采用 openstack 作为云操作系统,大规模部署 KVM 虚拟化平台,提供低成本的云服务,是我们当时的梦想。
KVM 开源代码用 c 语言编写,读懂不太容易,为此公司还招聘了 c 语言高手和有 kvm 测试经验的测试人员。
可一切都是在美好中开始,也在美好中快速结束。
时光飞逝!云计算以超乎人们想象的速度高速发展!
今天,似乎又回到了起点,华为的合营资源池采用的正是 6 年前我们构想的 openstack+kvm 的架构。
废话少说,现在的问题是为何华为、阿里、还有 aws 将经过十几年运行检验的成熟可靠的 xen 架构转向 kvm 架构?
新旧架构的更替往往比我们想想的要快!
让我们来扒一扒 xen 为何而死掉?
为什么 Xen 会死掉?
新 10 年来,CPU 已经从单核逐步走向了双核、四核、甚至是几十核心。NUMA 技术,TB 级内存也基本成为现代服务器的标配,众多厂商和 Linux 社区在内存和 CPU 调度和管理上做了大量的工作,而 Xen Hypervisor 采用独立的 CPU 和内存调度管理、核心实现还停留在 Linux 2.4 时代。经过了 10 年的发展后,根本无力去同步这么多的更新,我们今天会发现 Xen 已经落后的太多了,比如:
1. Xen 只能提供 2M 物理页面,而 DPDK 需要 1G 的连续物理内存,这是 DPDK 不能支持 Xen 的最主要原因。
2. KSM 是内核中的一种内存共享机制,在 2.6.36 版本的内核中开始引入,说白了就是一种内存共享机制,有助于腾出更多的可用物理内存,提高物理内存的使用率,Xen 显然不支持。
3.多核(>128 CPU)调度: 虽然宣称能支持最大 192+ core, 但是实际我们发现如果在 128 core 的 4P 服务器上创建大规格虚拟机并在其中使用高精度时钟,导致虚拟机频繁陷入陷出调度 cpu,Xen 就会出现严重问题,这显然是 Xen 没有经过大规模商业实践的表现。
4.我们再来看看数据中心的情况,AWS 新一代的 C5 已经进入 25GE 核心交换时代了。Xen 其实在处理 10GE 转发的时候就已经惨不忍睹,而且更重要的是,没有进一步的技术优化空间,Xen 社区其实 10 年前就知道相关问题了,一直都在做些不痛不痒的优化,不去从根本上解决问题,一副好牌在手,最终却出局了......
Xen 何去何从
AWS 转用 KVM 后 Xen 项目计划进军嵌入式应用程序
思杰(Citrix)高级技术总监表示:甲骨文都已经走 KVM 路线了,Xen 如果能圈住甲骨文和亚马逊的话,还是可行的。而现在,Xen 已经被逼上绝境了。但 Xen 是一个可重用技术组件,很高兴地看到 Xen 在新领域里成长,例如边缘计算、汽车、航空和航天等新使用案例。
Xen 具灵活性、小巧体积和独立于操作系统等特征,Xen 非常适合上述不断发展的领域。即将上线的边缘设备达数十亿,管理程序的寿命可能还是很长的,管理程序的未来也可能是美好的。
科普一下什么是 DPDK?
简单说,DPDK 在网卡驱动之上,socket 接口之下,提供了一种应用直接访问网卡的接口。基于 DPDK 实现用户态网络协议栈,就成为可能。并且用户态协议栈可以避免中断,避免不必要的上下文切换,可以作到真正的 zero-copy。这些在云计算,大数据场景下越发重要。
版权声明: 本文为 InfoQ 作者【天翼云开发者社区】的原创文章。
原文链接:【http://xie.infoq.cn/article/c2c8e9e2e465d06b0015059b4】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论