“超过5分钟不能做交易就是一个非常大的事故,如果在5分钟之内找不到问题就没有时间做应急,上万台服务器靠肉眼是看不过来的,必须依靠工具来监控。”中信建投证券信息技术部总监陶剑峰在接受至顶网采访时曾这样表述。
其实,这就是金融证券行业在实际业务场景中对应用性能要求的真实写照。可以想见,在如此严苛的业务需求下,传统的应用性能管理(APM)平台和产品显然很难满足以上的场景需要,而需要能够更加高效和智能的技术手段才能胜任。
“秒级”快速定位的本领
众所周知,金融证券行业经常会遇到实时高频发的业务需求,股民的操作对时延要求非常苛刻,正所谓“一秒钟几十万上下”其实并不夸张。在这样的业务场景下,“5分钟”业务中断确实能造成重大事故。那么,面对如此严苛的业务挑战,到底什么样的应用性能管理产品和工具才能应对呢?
中信建投证券信息技术部总监 陶剑峰
对此,陶剑峰给出了答案:“基于证券业务场景中的问题,我们和博睿数据很早就展开了合作,他们的方案首先是非常的产品化,开箱即用,对业务系统没有影响,而且博睿数据的产品提供的是高度标准化的监测产品,这让他们的产品可以在各个行业中都得到很好的应用。”
另外,陶剑峰特别强调,“博睿数据的应用性能检测产品的优点是能够把监控指标量化,形成精确的度量,能够在秒级发生问题的时候同样以秒级的效率去找到问题,这才能让我们的应急措施马上定位到故障点,比如哪台服务器有问题,是需要重启还是扩容,我认为博睿数据的核心价值就是能够帮助快速定位问题。”
“而以前在没有博睿数据产品时,当客户说我们行情系统慢,我们就去和客户解释说和友商相比我们并不慢,但没有一个可度量、比较客观的第三方数据去做支撑。“陶剑峰说这其实是我们与博睿数据合作的一个重要契机。
那么,为什么博睿数据的产品与用户实际业务需求能够如此高的实现契合呢?博睿数据COO吴静涛对此表示,“因为业务场景不一样,所以客户需求也不完全一样,比如对于券商来说主要是行情、交易系统,对银行来说可能是网银、手机银行,电信行业可能是一些电商客户平台,所以每个应用场景都不一样。而博睿数据的产品和服务能够更好适应不同场景,依靠的就是以客户为中心的产品理念和基于行业需求的自主研发能力,同时还包括从行业头部客户着手不断向相关市场拓展的高效市场运营策略。”
鱼和熊掌能否兼得
一般来说,一款产品的标准化往往意味着定制化能力的缺失,两者很难实现兼顾。而在陶剑峰看来,一款产品的高度标准化其实也意味着其可以实现高度定制化,如果能够在各个行业中通用,又能快速满足各个行业用户的个性化要求,那这款产品才真正具备生命力。
而博睿数据产品的另一大亮点,就在于其实现了这种标准化与定制化的兼顾。 陶剑峰指出,“在与博睿数据的合作中,其产品在实现高度标准化的同时,也考虑到了我们非常多的个性化问题。”
博睿数据COO 吴静涛
对此,吴静涛也做了进一步解释,“博睿数据的DateView统一智能运维数据平台实际上内嵌了非常多的场景,在高度产品化的基础上尽可能的集成了各种各样的场景,其中包括很多行业的特色需求,如果客户需要这些功能时可以通过拖拽的方式去实现,这种行业定制的产品模式,既保证了核心版本的稳定性,同时又能够更好满足行业客户的个性化需求。而像与中信建投证券这样的头部客户的合作中,很多个性化需求都具备非常典型的行业可复制性,这也是博睿数据产品能够不断强化的一大优势。”
打通数据链DNA 实现端到端应用性能监控保障
对于应用性能监控,陶剑峰举了一个非常形象的例子:这就像是对水质量的一种监控,当出现水质下降时,首先肯定要从源头开始调查,然后再看哪一段是否被污染了,整体上应该是一个连贯的过程,而对于应用监控来说也应该做到全链路,端到端的监控。
另外,陶剑峰也表示,“以前博睿数据把产品分为三块,包括客户端的监测,服务端的监测和网络的监测,相对比较独立,这就造成每一块的数据不容易串联起来,结果还是很难最终定位到问题点。现在,博睿数据将数字体验管理DEM、网络性能管理NPM、应用性能管理APM整个数据链进行了打通,通过DateView统一智能运维数据平台可以对全链路的数据进行监控,这说起来似乎比较容易,其实我清楚他们在这方面付出了非常大的努力。”而陶剑峰所说的数据链打通,就是博睿数据最新推出的服务可达的数据链DNA(DEM+NPM+APM)产品组合。
就像陶剑峰说的一样,这三款产品的整合看似容易,实则并不那么容易,而对于这三款产品的整合难度,吴静涛也给出了自己的理解:
第一,信息整合。首先,各个厂商的APM实际是不一样的,数据采集方式、数据格式也都不一样。如果全都采用博睿数据的产品,那么在数据整合过程中会比加入其他厂商或者多厂商合作本身带来一些优势,这就是数据整合的一个复杂过程。
第二,关联分析。对于应用来讲,在访问DB的过程当中,客户端的IP已经流失了,而是APP服务器发起的,如何把整个全过程都串联起来去做分析,其中有的一段可能用了UserID,有的用的是Username,甚至有的一段是购物车的简称,或者是EMC的号码,所以这其中包含了非常多的关联可能性,所以这种关联的过程是技术含量非常高的部分。
第三,业务洞察。因为AI本身用不同的算法会产生不同的结果,不同的术语也会获得完全不同的效果,这其实是见仁见智的事情,如何真正做到把数据和信息整合,并与关联分析和业务洞察全部集成打通,其实目前来看市场中还没有像博睿数据这样的一个厂商,能够全部做到这些。
好文章,需要你的鼓励
Blackwell GPU的生产制造工作量达到Hopper GPU的两倍有余,但带来的收入仅增加至约1.7倍。
由AMD驱动的El Capitan超级计算机(现位于美国劳伦斯利弗莫尔国家实验室(LLNL))成为世界上速度最快的超级计算机。