科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网网络频道庞俊英:阿里巴巴的SDN网络

庞俊英:阿里巴巴的SDN网络

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

阿里集团技术保障部从2010年在飞天集群规模使用定制TOR交换机开始,不断的尝试和探索Software Defined Everything。本文介绍SDN在阿里集团网络运维方面的实践及未来研发思考。

来源:ZDNet网络频道【原创】 2014年5月5日

关键字: 阿里巴巴 SDN 软件定义网络

  • 评论
  • 分享微博
  • 分享邮件

(阿里技术保障部资深专家庞俊英)行业对软件定义网络的理解千人千面,普通认为SDN诞生于校园网,发扬光大于拥有中大型数据中心的互联网公司。阿里集团技术保障部从2010年在飞天集群规模使用定制TOR交换机开始,不断的尝试和探索Software Defined Everything。本文介绍SDN在阿里集团网络运维方面的实践及未来研发思考。

每年双十一网购狂欢节,一次次刷新世界交易、支付峰值,对基础设施的要求和运维压力都是巨大的,如何在大规模、低成本的要求下,还要达到高可靠性、高稳定性、弹性调度、快速交付是系统网络平台部面临的挑战,也是尝试SDN的驱动力。

阿里巴巴对SDN的理解不是简单的转发面和控制面分离,也不是自己做个“SDN交换机”这么简单,阿里集团的SDN架构专注于系统性达到电子商务、云计算的特定场景应用的相关特性对操作系统、数据库、网络、服务器、数据中心的需求,提升系统、网络整体运营能力。让业务不再感知网络变化、拥有无物理尺度调度业务池。

先梳理下大规模互联网公司数据中心网络运维都遇到哪些问题:

1、快速交付问题;
2、大量的变更问题;
3、网络故障处理对业务影响的问题、
4、千差万别的厂家CLI、版本、设备型号;
5、网络规划永远赶不上业务的变化;
6、网络流量流向无序;

一言概之,网络在其他团队看来就是个黑洞,网工就是些不靠谱地人,业务要自己监控网络运行状态,网工颜面扫地。

阿里技术团队针对上述问题做了如下工作:

一、自动化

1、交付:网络集群(万台规模)交付:1小时;
2、变更:封装各个厂家CLI,提升变更效率;

二、业务拓扑

无论是运营商、银行、企业或是互联网公司长期以来网络运维关注的管道级网络拓扑。业务与网络之间的对应关系停留在资深网络工程师的脑袋中。

千万不要认为下图就是一张普通的拓扑图,一个VIP对应的全部Realserver所在网络物理位置和机房的全部信息都一目了解,这个业务IP带来的多少流量,此流量单位成本一切变成那么清晰。网络规划不再是拍拍脑袋,抓抓爪子,按按计算器,SDN理想的业务级调度有理有据。

三、专家系统

英剧“black mirror”带给我们的冲击是什么?对,大数据分析后是可以复活一个人。每天在技术保障部产生的运维日志、网络log,告警信息经过数据挖掘,引入机器学习从Data转发成information对网络运维网络事件做到Re-active和Pro-active,我们不再需要资深网式运维网络。这其中有着巨 大的想象空间,我们在路上。

四、定制Openflow特性的交换机

不是用了OF switch才叫运用了SDN,但Controller与switch/router要说话,我们选择尝试Openflow协议,2013年阿里巴巴加入ONF,共同推进产业对标准接口的支持及推动网络产业的开放程度。

五、虚拟网络及虚拟网络操作系统

网络操作系统和网络硬件天生是个封闭系统,行业中有了交换套片后,国内涌现出一批杰出的网络设备供应商。虽然生产交换机公司不再是高富帅,但网络操作系统仍然是个封闭系统。“路由器丢包是太阳黑子活动频繁引起的”真不是个网络笑话,它的确是厂家给出的故障分析报告。Laas开发工程师一想到网络中的VLAN/网关/IP脑仁都痛。我们要做的是Network as a Service,交换机要跟服务器装机一样的标准化,网络的管理和使用要像自来水一样方便快捷。因此我们思考将网络硬件与网络操作系统分离,抽象出虚拟网络操作系统。

六、虚拟光网络也是我们重点关注的技术之一,Google B4是个过去式。

人说SDN落地最大的阻碍是CCIE,是资深网络工程师。阿里网工就要将技术做深做透,革掉传统网络运维习惯。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章