云络宣布,已经基于最先进的云和DevOps技术,设计、创建了一个新系统,并交付给一家来自硅谷的中国创业公司。云络会一直进行7*24全天候管理、监测并改进该系统。

该系统是由云平台Heroku平行迁移过来的,目的是使其拥有PaaS平台的所有优势,并在AWS平台上采用HA-VPC和OpsWorks功能,另外同时增加DevOps、自动创建、自动扩展、HA冗余以及热门的Docker技术。

鉴于该技术的先进性,及在大规模运用的同时所产生的技术整合的挑战(尤其是整合VPC、Docker和OpsWorks技术),云络的工程师们在研发和测试阶段花了几个月的时间,为所有这些建立了世界级的标准和流程,并将所有的培训、文档、监测整合到在一起,进行长期管理。

技术层面上,该系统基于VPC,再结合公网dual/HA设置、NAT实例、私网。之所以特别具有挑战性,是因为我们需要稳定的NAT Inbound功能,而不是典型的Outbound功能,这就大大增加了难度,因为OpsWorks只使用动态的内部IP地址,迫使我们同步NAT系统和动态Chef托管主机文件。

VM由OpsWorks实现,采用的是AWS AMI,并整合所有。OpsWorks功能强大,但它还未能完全兼容AWS,这就使得有些工作变得富有挑战性,比如在EIPs、EBS、ELB、IAM等方面。此外,由于部分改变了Opsworks的一些行为,我们还有很多小细节方面需要去学习和测试,以使其能够按理想状态运转。值得高兴的是外部集成的Chef recipes和repos功能如预期一般,而整体部署的一体化流程也和我们之前宣传的一样运行完整。

Docker运行在上述技术基础之上,并被部署在系统的一个核心VM中,担当创建、仓库和调节的作用。每个EC2云主机都基于简单的CentOS镜像,可以运行5-10个Docker容器。Docker是一个非常新的技术,还不适合做产品运维,特别是自动启动、服务更新、SSH接入、日志管理、监控、安全、网络等方面。因为仍需建立和测试大量的解决方案和新程序。

为了打造一个真正世界级的基础设施,许多来自AWS和第三方公司的服务被采用,这些服务包括ElastiCache,logging,New Relic等。目前手头正在进行的工作有HA NAT实例间的故障切换,这是通过OpsWorks IP关注的;还有在允许可靠的outbound链接到其它的云服务时,不论是否在AWS上,都要处理inbound ssh和监控的链接。

总的来说,Docker是一个非常成功的系统,已经平滑地走向了产品阶段,因为它灵活的未来增长性、稳定性和成功而被安装使用。云络期待这方面的新一代技术,以及未来基于AWS、VPC、OpsWorks、Docker等建立更多更成功的系统。