能够做到这么快,要归功于“订单预测系统” 。【订单预测系统工作原理】刘海锋讲解了订单预测系统的工作原理:一个商圈,将会在双十一购买多少手机、电池、尿布、啤酒这类标准品,是可以通过大数据来预测的。而京东的库房是分级的。有后端的仓储和前端的仓储。通过预测,京东会提前把一些商品前置到前端仓(FDC),这样在用户下单之后就可以瞬间从仓库发出,就近送到用户手里。
“自残式”演习:大规模故障模拟演练验证技术团队可靠性的最好方式,莫过于真枪实弹的技术演习。Chaos Monkey,是很多平台都在使用的故障演习模式,简单说来就是随即关闭生产环境中的实例,然后检查系统是否能经受故障考验。刘海锋把这个英语词汇改成了更接地气的中文名称——响尾蛇。总之,就是在双十一真正的考验来临之前,用一种“自残”的方式来检查系统的可靠性。
刘海锋介绍,京东的“响尾蛇”行动玩法如下:把运维人员分为两组,一组资深的运维工程师在会议室里,负责模拟故障。而在会议室外面,是负责解决问题的小组。对于将要出现什么问题,会议室外面的小组是毫不知情的。模拟故障五花八门,从机器到网络,到模块,到服务,到中间件和数据库,甚至整个机房消失。应急小组都必须给出合理的处置方法,拼死保证业务不出现问题。
刘海锋说,“由于这种演练具有一定的破坏性,所以我们都是在半夜一点到三点之间进行。”军演机器人:全链路压力测试所谓压力测试,就是在真实模拟无数人访问京东并作出各种请求的情况下, 测试系统能否正常运作。虽然各个环节的工程师都会对自己的系统进行压力测试,但是毕竟这种测试是分散的,导致最终容易在各个业务的接口处产生问题。
而且,普通的压力测试,很难模拟真实用户的访问行为。为此,刘海锋专门让团队开发了“军演压力测试机器人”。这个机器人,就是模拟我们雇佣一亿人同时访问我们网站的行为。这套程序分布在全国各地,对我们的业务做全链路的读写混合压力测试。如同军演一样,全链路的压力测试并不如想象般容易实现。例如,这样的演习不能使用真正的银行支付,不能影响真正的库存数量,不能动用真的物流。
所以,和演习相关的所有上下游业务,都要设计一套虚拟系统。在这套“军事演习”里,最重要的步骤就是“黄金链路压力测试”。所谓黄金链路,就是普通用户使用京东的“标准流程”,包括:登录,搜索,浏览,购物,结算,支付。这个链路,是双十一用户体验的最主要体现。京东的工程师们不断对这个链路进行测试,就可以发现很多存在的问题。
【黄金链路压力测试流程】以上,就是京东保障正在看文章的你“剁手顺利”的五大法宝。仅仅是24小时的买买买,背后却涉及无数风险控制手段和资源调度模型。正如刘海锋所说,双十一是电商企业整体技术能力的一个缩影,各个电商在保障的过程中都会有一些插曲,正是这些小问题,让中国的电商行业不断地成长。SDCC,中国软件开发者大会。
“双十一”背后,阿里的技术到底有多“牛”?
关于题主的这个问题,我觉得用客观的数据最能说明双11背后阿里云的技术实力2018年天猫双11单日成交额高达2135亿,2018年天猫双11购物狂欢节21秒破10亿元,比去年快7秒;1小时47分26秒破千亿元,比去年快7个多小时。同时,从我查阅的数据来看,2018年天猫双11还刷新了很多纪录。比如说物流订单整整超过10亿,还有通过指纹和刷脸方式完成的支付占比竟然超过一般,高达到60.3%。
另外,不只是淘宝天猫,中国邮政、茅台、银泰、居然之家、猫晚、众安在线、天猫、淘宝、支付宝、盒马鲜生、饿了么、菜鸟、高德等众多企业都在阿里云提供的云计算服务下,即便面临业务高峰也稳如磐石。 就连双11前夕的天猫双11晚会,也依托依托阿里云技术,在网播时创下了带宽峰值记录,完美保障了优酷2500万用户的体验。
不仅CDN为中国1/3以上的互联网流量提供加速,视频云也在海外为Lazada提供直播服务。更惊喜的是,今年天猫双11也是国内首次大规模IPv6商业应用实践,云、网、端以及应用全面支持IPv6,不得不给阿里云的技术点个赞。 而每年天猫双11狂欢能够稳健流畅进行的背后,都是靠阿里云的核心技术在支撑。计算能力:在极限情况下也能够虚拟机的计算能力和物理机保持一致,譬如阿里云的神龙服务器,就能够虚拟化损耗降为0;实例存储:可以将单机的IOPS提高到百万级,堪称业内首个达到该水准的,满足大计算、重IO的高端用户场景;CloudDBA产品:无节约成本,提升用户体验;大数据:很多新零售产品就是基于大数据,完成了向智能化的转变,充分了解消费者的需求,帮助商家定向制造出更棒的商品。