Nick McKeown:可编程转发平面将在此驻足 原创

在大会中,来自美国国家工程院院士、斯坦福大学教授Nick McKeown分享了“可编程转发平面将在此驻足”的主题演讲。其中讲到,我们可以看到在网络当中5G网络趋势,这些都会影响到我们网络的发展。

2018年11月14日-16日,“GNTC全球网络技术大会”在南京火热开幕。作为全球规模最大的网络技术盛会之一,本届GNTC将聚焦更多热门技术领域,吸引更多国际组织、产业权威专家,通过1次测试活动、1场颁奖典礼、2场全体大会、7场专题峰会及数十场Workshop,为现场观众奉上一场精彩绝伦的网络技术盛宴。

Nick McKeown:可编程转发平面将在此驻足

美国国家工程院院士、斯坦福大学教授 Nick McKeown

在大会中,来自美国国家工程院院士、斯坦福大学教授Nick McKeown分享了“可编程转发平面将在此驻足”的主题演讲。其中讲到,“我们可以看到在网络当中5G网络趋势,这些都会影响到我们网络的发展,我相信随着软件发展包括对软件一个编程和持有相信我们可以做到以前做不到的事情,比如说可以快速部署一个网络协议,可以精准监控转发层。”

以下是Nick McKeown现场演讲实录:

Nick McKeown:我们有一个说法就是很多时候技术也有一定障碍,有的时候技术可能在我们这个连接之间会有一些连接中断,我们现在是时候要进入5G时代了。


大家早上好,我非常高兴来到这里,我是第一次来到南京,对我来讲非常高兴来到这里,今天来发言。今天开始的时候会请大家回答我一个问题,大家可能有一点时差可能有点困了,如果大家去写这个软件的话,作为你工作部分请大家举手,如果你是使用变成请举手,这里面包括我们的条码的一个编辑还有其他一些内容,可以想象一下大家有一个新的岗位,这个时候新岗位是一个非常激动人心的领域,我们将会对一个设备进行编成,我们要选择两个设备,一个设备是一个固定式的,这个时候无法对编成进行调控,这个时候是可编成的,我们希望选用哪一个呢?同样速度同样计算能力而且成本是一样的,你会选择哪一个去使用,非常明显当然大家会选择,知道自己一个解决方案会改变,创新就是要义所在,我一定会选择可编程的一个设备,我说这个之前的话会跟大家说一下我们如何走到今天这一步。现在我们都会能够想当然认为,有很多人他们都可以编成他们自己网络的行为,基本上每个数据中心在全世界各地,他们都是基于软件的,这些软件当然是由我们这样一个数据中心的来创造的。大家可能对中国情况比较熟悉,在美国以及现在在欧洲也会有这样一个趋势。


网络的一个拥有者会控制这个网络的控制层,以前这个数据的控制层来讲是由我们一个业主方来控制的,控制整个网络,这是无法避免一个结果,我们必然要这样做,因为涉及到控制和成本的问题,很多人都会记得在我们电脑行业早期的时候是一个什么,当时会有非常大的IBM公司做控制器,有专利硬件,专利控制系统,专利这样一个软件,后来这个微处理器出来了,就很大一个变化,因为微处理器需要一个开放的界面,这样人们能够进行编成,能够设计不同一个操作系统,有不同操作系统有不同界面,就可以生产多方面的应用。我们网络行业在不断发展,我们有路由器,专有硬件,专有运营系统,一个结耦或者说一个拆散正在出现,很多像高通还有(英文)以及其他的公司他们会出现商业化所谓的芯片,像我们的这个SDK还有像(英文)还有开放的界面,他们可以实现多个控制层,我们可以看到有新的这样一些应用,新的特征可以出现,这些都是交换芯片,他们可以运用大的网络这是在过去十年当中大家对这点非常熟悉,我们控制层也会越来越多,一下子回忆过去20年细节就很难了。


大家觉得对(英文)如果不出生的话我们仍然会有一个(英文)的东西,一方面我们推动有(英文)的系统,大家觉得通过开元方式建设自己的系统,包括(英文)服务器,这个时候能够让我们进行结耦,我们之前这样一个交换芯片,同时一个成本,我们数据中心一个成本的要义也是驱动因素之一。最后一点我们商业化推广的半导体的交换芯片,如果每个这个行业进展我们无法构建交换机的芯片。


从服务层我们可以看到,这是我们过去服务器的样子,有一个CPU有很多应用垂直整合,有(英文)出来,会进行结合,我们可以看到CPU加上(英文)运行系统以及整个运行都是垂直的整合,现在都是由白整,现在是有X8U加(英文)这是一个现在的架构。他们为什么要这样做呢?原因很明确,就大家不要忘掉就是成本一个降低。数据中心如果我们在构建大的数据中心,在全世界各地很有可能大概有50万左右一个服务器,对于这样一个服务器的对于我们这个交换机基本上是20比1,在我们数据中心这个量有25000个交换机,如果每个交换机我们是一万美金的话,大概交换机这一项就有25000美金费用。2000美金做一个交换机,总的交换成本就会变成5000万。有些公司可能已经有很多软件开发人员可以在自己基础设施之上架构自己的软件,这就是每个数据中心在做的事情。他们不仅仅为了省钱,也希望运用控制的问题,软件怎么控制,集中我们的这样控制层更容易来做一些,对公司来讲自己也会做一些控制器交换机,这些想法跟他们有不同的想法,他们需要买更多的盒子,这个时候必须简化,尽可能做到该集中的集中,该分开的分开,他们有一个差异化的网络,阿里巴巴的网络以及腾讯、亚马逊的网络不一样的,他们都会构建自己的软件,主要也会是通过这种方式他们控制他的一个流量,流量一个工程,提高一个使用率。原来低于50%,现在接近百分之百的利用率。


所有设备都是朝着这个方向去发展,我们之前也可以看到,对于这个解耦如何在我们整个网络行业当中将会不断的出现。实际上我们可以看到在网络当中5G网络趋势,这些都会影响到我们网络的发展,我相信随着软件发展包括对软件一个编程和持有我们相信我们可以做到以前做不到的事情比如说我可以快速部署一个网络协议,我可以精准监控转发层,我可以能够尝试新的想法,我现在自己有软件了,可以把我们的网络定制符合我们的需求,可以拥有一个知识很全,这样我不需要跟其他企业进行分享,这些听上去都非常好,所有这些我们之前所提到一些东西都还不是真正的事实,为什么呢?如果我能够快速去部署一下新的协议,如果希望精准监控我的转发层正在做什么,我希望综合功能整合嵌入到工程当中,希望控制能够大量数据包,需要能够改变我们数据包一个处理的方式,我们也被告知,这些事是不可能的,因为成本太高了,或者说速度太慢,电力消耗太多这是我们一个动画,显示出一个路由器或者交换机有一个驱动,会有这个控制交换机的操作系统,还有(英文)等等其他一些不同的一个架构。当我们数据包进来以后,他进入一个固定的线路,会是有不同的颜色来代表在不同一个线路当中处理一个速度和方式,这基本上是我们所有路由器工作方式,希望有一个新的能力,对于数据包处理能力我们首先第一个要做的事情就是要能够写软件,这是非常容易的部分,第二个部分将一个新的管路当中一个环节。这个时候你就需要要去构建一个新的芯片,给大家举一个例子,2010年的时候(英文)和(英文)共同的合作来发布了一个(英文)的标准,(英文)是一个新的方式,非常的简单,可以去分辨不同的客户而且在一个虚拟中心区分辨,是最具有利润,而且是最值得投资的网络领域。四年之后思科才出现了,这就是我们需要改变这个架构。要去增加这样一个新的能力,实际上是一个非常昂贵的代价,在自己网络当中会去设备厂商那里面他说我喜欢这些特点,那应该怎么做呢?他们需要去找那些软件的团队,说在这里几周之内就能完成,或者找一些贵的厂家,再回来说我们还是可以做的,但是需要几年的时间。你要花几年的时间才能增加这样一个新的功能和特点。


与此同时,如果能找到其他解决方案,并不是效果很好,也许你对这个方案不再感兴趣了,你感兴趣的话就要替代所有硬件。基本问题就是这样组建的设备相当于是一种从底层到上面的设计,由下而上的设计,通过芯片设计师也许从来没有运营过一个网络,确定这样子的特点,无论在中文还是英文里面都是含糊不情的含义。这就是我们运行网络的方法。实际上我们还有另外一个头脑风暴的方式,这个固定功能,可编程的交换器比固定交换器的速度要慢10-100倍。在这里的话,我并不宣传思科或者任何一种解决方案,这个时候我们就是能够看到很多的机会要去创新我们的网络这个才是我们最关注的。


在这里面SDN第二部分就是当人们组建了一个网络的设备的时候,他们要去控制他的转发层。实际上这个设计的流程是由下而上,从上至下的,我们要去学习我们所想要的行为,比如说一种语言,如果说一种语言模糊不情去界定我们所想要的行为,然后他就会说在一个芯片上去运营,在CPU或者在任何上面去,无论是交换机或者是什么上面去运营,这是我们的目标,为什么现在就会发生呢?我想说现在就在发生是因为我们行业很顾忌其他人,但是没有真正走出拥抱和追赶高科技行业。


这里面我们用一些(英文)语言去编成,把他们组合到一起,放到CPU里面,用CPU的指令,并且我们还使用具体一个领域,当你想变成CPU的时候会有一个编辑语言,放到一个说明器里面,对于这个任务而言是完美的。因为它是可编程的,可以改变他,找到自己新的应用,比如说自动驾驶汽车里面,与此同时在过去就是我们的信号处理,你也是写一个高层的语言编辑到一个电子处理器里面,你的这个高层语言就确定了它的语言,具体底层流程会有一个指令,知道这个模型知道这个功能的想法,我们现在有雷达还有视频的编辑,编码,你可以写一个变成放到USB里面,我们过去是用这样的模式。


现在在这个机器学习里面也是这样的,你可以用(英文),如果能够用TPU的话也可以用这个来编程。组网是怎么样的?我们没有一个具体的处理器,也就是说有一个结构集来帮助我们优化整个的编程和处理器,我们知道有NPU这样的处理器但是目前的话还是具有一定的风险,在这个过程当中会有一些具体特点的设计,在过去十年里面我的目标一直都是想要改变这一点,我真的相信我们能够创造一个解决方案来创造组网,让行业里面全面应用,很多技术商也可以提供这个方案,并且速度是非常快的一种创新。


目前的方法就是P4的语言大家都听说过,而且有人已经用过,是在一个底层架构里面,是用独立的协议,这里是一个协议,大家之前已经见过了左手边是可编辑的数据集,你可以看到用什么样的模型来去处理,每一个阶段里面所有路径都是可以被识别出来的,而且之前已经预定好的目标或者是项目,而且没有任何一个阶段,他们都不知道,他们都是记忆的序列,这个就是绿色的三角形,我给大家举一个例子,从左手边有一个路径但是(英文)是用不同颜色去显示的话,第一部分的话我们一旦意识到的话就去分解,然后同时放到这个处理器和记忆里面去,这个时候相当于结耦了一个TTL。所做的就是通过这样的记忆匹配再加上第一阶段行动就能够创造出一个新的数据集,在这些极端里面因为序列都是独立的项目,独立的序列这个编程,我们在整个路径当中就可以实现同时进行,此前这个阶段在处理下一个阶段了,与此同时能够处理多种语言包,数据包原来过去的一种比如说过去的话我们有15、20、25不同阶段,最终的话所有这些都会回发到数据包里面,对于IPV4也是一样的,大家原来已经看过很多P4编码例子,中间的话能够告诉我们数据包的页面是什么样子的,左手边上是绿色的,告诉我们这个编程如何找到这些页眉,有什么样的内容,在整个流程集里面去处理的。


这里是一个这样一个芯片的例子,我并不是这里来卖芯片的,只是给大家展示一个已经存在的例子,当然我们还会有很多这样子的案例,这样子的一个芯片与这个固定功能芯片价格功能是差不多的,我们有IPV4路径的话,就不用担心你所做的路径,因为你可以去选择上乘的这个页眉,现在我们的情况就是当大家建立起一个系统的时候,比如说这里是一个系统的例子,你知道鉴定最主要的原因是有多种情况,我们是否能够证明可编辑这种交换器的芯片,速度以及功能于固定功能交换器的芯片是一模一样的呢,因为人们都会有先进为主的方法,我们就问过见过这个组建设备的人,看一下他们是否能够告诉我们,就做了这样一个对比,左手边是一个可编辑的芯片,右手边是非常流行的一个固定功能的芯片,他们基本上性能是一样的,速度还有这个容量都是一样的。我们对他们进行一个对比。


首先来看一下这个4D,4D这个速度基本上都是一样,我们可以看到速度是最快的,我们看一下这个功率稍微低一点,如果有一个固定功能设备的话,你需要在所有的这个特点上都需要消耗能耗,如果说你要编辑它的话,所有功能和特点都需要进行编程,就会耗能,就是为什么这个功耗会稍微低一点。这个固定功能设备的话眼上延时是比较低一点的,那是因为他们走的同样一个路径,而不是常规的CPU,我们总是觉得可编辑就是与CPU挂钩,但是实际上你可以去解决这些问题。


另外一点非常有意思的事情,因为是统一的,所以偶尔有的时候也会解决其他的问题,因为在这个路径当中很容易改变行为,人们很容易抱怨的行为,可变功能交换器的话需要很长的时间,因为它是如此之复杂,你需要很多这种按纽,去改变,有了这种可编程芯片的话只是用图片去改变,并不是对于这个具体的芯片,在未来化像(英文)还有一些其他的可编辑的设备都是一样的,他们可以速度做到非常快,基本上可以做到在50秒之内完成一个新的项目的下载。


通过这种统一进来实现这种简化和快速,我们看一下怎么去应用,首先人们做的第一件事情就是我在过去的几年我观察到了,首先他们希望能够让自己的生活更加的简单,他们不喜欢复杂,他们不喜欢组网太过复杂的特点,如果是编程的话如果实现这一点呢?固定功能芯片上基本上会有45个特点,你知道没有人愿意去买它,事实上你只希望用到其他一部分的功能或者是特点,你就把他们划掉在思科里面把不用那些特点的话,在文件里面删掉,就会有自己主要一个项目。


比如说在我这里就是称作为我的P4,你不知道在未来的话有什么样的功能,这就是它的复杂性减轻了,并且消耗的能力也会更少,因为我们要学习在未来使用要是哪一点。他们所增加一些新的特点有一些是可以预测的,比如说一些新的包裹,新的这种渠道或者是新的一些变迁包来进行特殊的处理,或者是一些新的方法来进行一些数据路线在一些数据中心或者是财务中心,我们可以看到会有一些资源的路径,会有一些财务中心的话,他们是用这样子的功能。


另外基于我们一个交换器的一个状况有一种新的对于交通堵塞控制,还有其他一个方式。另外载荷均衡器,这个是在很多大型数据中心非常欢迎,我们可以看到它要么是一个硬件式的,载荷平衡器成本很高,外部一个索引的诉求,然后这个时候我们能够选择哪一个服务器进行响应。这样一个载荷的平衡器,到底要把这样一个数据包裹索引需求交给谁,哪一个服务器去处理,很多附在会有软件平衡载荷,他们做的工作是一样的,会有这样一个服务器进行平衡,我们网页服务器进行一个应答,索引,我们5-7%的服务器都可以帮助我们客户生成收益而不是进行载荷一个过渡的集中,我们这个时候可以意识到载荷平衡其实就是更加智慧化的路由而以,是基于我们服务器状况进行一个载荷,我们就可以设计这样一个载荷平衡器,可以是我们硬件软件化,像我们P4的就是这样的。另外还有我们的防火墙。


最后一个例子就是我们的远程遥感,我们在早期的时候这个项目还有一个很大的可能性,遥测技术我们之前没有这样一个固定式遥测技术,我们有可编程的能力的话,这个时候就需要我们遥测的技术,我们一些专业人员来讲他们更多了解自己的行业跟背景,想象一下对于网络(英文)怎么样进行做的,我们会有(英文)会有其他一些SMP,同样一个特性,我25年前做研究生学习的时候也是一样的,对于我们一个ISB来讲也会是没有太多一些变化,所以我们有这样一个数据包进入到我的网络,当为什么有的时候会有数据包无法能够通过呢?我们能够问一下,哪一个数据包所采用一个通路。在网络当中问这样的问题是不可以的实现,你可以问一下哪一个数据包从哪一个通道走的,当时告诉我对安全角度来讲,我希望能够高度关注为什么到达这样一个位置,数据包运行原则是什么,每一个交换机都知道,为什么没有告诉我呢?对于这个数据包来讲我是特定按照这样一个标准。


这是一个非常明显的,看上去一个实际的情况。告诉我对于网络功能是什么,包括性能的表现,到底我的数据包花多长时间来排队,在我们这样一个交换机来讲排队等待多长的时间,有的时候数据比较高,很大的问题,我不能换一个交换机,尤其我们排队的情况,可能这个时候我就知道哪一个交换机有比较多的问题,我会转发这样一个数据,你到底需要跟谁分享数据包排队的情况,如果我能够知道哪一个是没问题,哪一个有问题的,绿色是没问题的,其他的有问题这个时候交换机一个通路可以通过绕路其他的交换机保证数据通路,这个时候就是到底采取哪一个通路,什么样通信的准则,排队的情况以及跟谁能够分享我畅通的通路,有的时候在我们网络运行过程当中,这些问题都非常重要。我们标记我们一个数据包,标记这样的话对于所有的交换机都会知道你这个问题的答案。一个特定方式就是我们之前说遥测的网络,实际上是非常灵活的,我们进行标记,通过的时候进行标记,然后我们在每一个交换机经过的时候进行一次标注,这样之后的话我们就能够进行实际化一个在线,能够知道一个通路的情况,会有很多监控系统这样一个方式,在(英文)展台那边也会有一个展示。通过这个来讲大家都能够进行参与,都有一个开元式的标准,这是一个时间在我们整个交换机当中分布的情况,每纳秒每一个数据包在一个交换机包是多少,是50毫秒,现在可能有7个量级的减少我们现在做的就是能够去把这样的数据分享给外部的世界。这样他们就知道自己可以做到这一点,有可编程的能力知道哪一个信息特别是我想要知道的,现在我们很多一些方式就会是让我们能够可能从规模的角度得以应用。


P4的一个语言以及P4(英文)是一个开元的平台,能够开发出我们这样一个语言,我们可以开发出共同一个语言,这是P4语言联盟,可以做智慧交换机等等,我们非常大概4个小时就知道我们怎么去写一个简单的程序,很多人没有写过变成语言可能通过我们的培训在一天时间之内就可以了解网络的特征自写编程,这是我们合作伙伴非常广泛行业参与,如果大家想要了解,大家可以到我们的网站上(英文)界面,最后我想说一下,我们确实可能有现有这样一个明政,但是数据量太多,对于我们交换量来讲有同样一个能力,在我们固定功能交换机和我们可编程交换机芯片进行选择的话,如果把两者进行选择和比较,我当然会选择可编程交换机芯片硅谷他们一些供应商正在提供这样一个可能性。从这一点来讲这一路没有返回的回程票,16纳秒是一个速度,第一次我们实现这一点我们相信对每一个处理器处理能够都能够达到这样的水平,我认为这样一个好消息,这样的话我们就能够实现更好处理速度,如果有这样的可能的话还是建议大家选择我们可编程处理芯片,你的一个好的想法就是你不需要能够告诉其他人说到这一点,我相信大家也能够自己尝试。

来源:至顶网网络频道

0赞

好文章,需要你的鼓励

2018

11/14

12:09

分享

点赞

邮件订阅
白皮书