扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
作者:ZDNet China 2007年5月14日
关键字: 网络管理
ServersCheck是一个非常强力的监控工具,让IT管理员们可以监控服务器以及全面的基础健康状态。
很长时间以来,我一直在寻找一个产品,它的价格不是非常昂贵,又能够完全以图形,表格等提供给我非常直观的操作状态,而且界面还要很漂亮。另外,我也希望这个产品能够提供在必要时进行深度挖掘的能力。最终,我找到了ServersCheck 7.0,我想它就是我所需要的产品。
安装和配置
下载乐软件后,你就可以开始“ Start Configuration(开始配置)”向导选项,从而正式开始。
图A ServersCheck的欢迎屏幕
在公司里,可以使用配置向导来完成ServersCheck的初始安装。在默认状态下,ServersCheck服务将以localsystem帐户的上下文来运行。虽然这种方式对本地运行的服务来说很好,但是该服务将无法存取其他电脑——如果该服务试图获取其他电脑上的任何东西,该服务就必须获得能够跨越其他系统的信任方才可以。
在如图B所示的屏幕上,你应当输入某个账号的用户名和密码,而该帐号应当拥有在你计划监控的每一个系统上的管理权限。
图B 管理权限
在许多公司里——特别是在一些大公司里——对需要监控的每一个基础设施,常常不是一个人负责的。举例来说,在许多公司里,管理服务器的人,一般并不是在发现数据中心过热时需要报告的唯一人选。
通过使用团队,(图C),你可以让ServersCheck在发现问题时向多个人发出通知。通过建立面向不同问题的不同团队,你可以确保通知只发向最合适的人选,这一点可以保证你的SLA正常运作。
图C 建立团队
虽然你可以单独的一台一台向ServersCheck中添加服务器,但是这么做实在相当无趣。在绝大多数具有良好IP地址预定义策略的公司里,服务器一般都会被赋予特定范围的地址。在ServersCheck的配置中,你可以定义一个起始和终止地址,然后ServersCheck会寻找在该地址范围内存在的每一台设备。另外,ServersCheck还提供给你一个机会,可以自动为任何一个被它定位的设备建立一个“Ping规则”。一个Ping规则很简单,就是简单的定期向被监控的设备发送Ping数据包,以确定它正常在线。一旦该设备无法完成Ping测试,ServersCheck就会向指定的团队发出警报。
ServersCheck可以使用公司的SMTP服务器,也可以使用自带的SMTP服务器。如图D所示,你在配置页所指定的信息,将决定ServersCheck是否可以使用自带的SMTP服务器。我推荐你应该尽自己一切可能,使用ServersCheck的内置SMTP服务器。毕竟,如果不这么做的话,万一公司的SMTP服务器也坏了,到时你又该怎么办呢?又该如何通知系统管理员呢?
图D 指派SMTP服务器
ServersCheck并不一定需要在所安装的服务器上进行管理。你可以使用任意网页浏览器来访问ServersCheck服务器,然后进行配置方面的修改。而且正如你可能所期望的那样,ServersCheck的配置由一个用户名和口令所保护。在配置精灵完成后,你可以添加其他用户。
生效
完成了配置向导之后,进入主屏幕,你在这里可以看到ServersCheck的初始化仪表板视图(图E)。在本截图中,你可以看到一个单独的监控服务器——本地系统。如果在配置向导进行的过程中,ServersCheck定位过其他服务器的话,那么那些服务器也会一并列出在这个屏幕上。
图E 仪表板
注意,图E中展示了非常丰富的信息。巨大的绿色圆形,提示了在被监控的设备上一切都很正常,并且ServersCheck甚至还计算出了你的“当前服务级别”。还有,ServersCheck报告了多个通断情形,以及哪些情形是“可疑的”(橘色)。在窗口下半部,注意和被监控设备相关联的标尺。这些标尺让你可以一目了然的了解该设备的健康状态。
一旦你拥有了相关设备合理数量的信息之后,你就可以开始执行趋势分析了。一个趋势分析会非常有助于计划未来对磁盘空间的需求,确定未来在CPU性能方面会否有问题,以及其他很多。要建立一份趋势报告,只要选中你打算出具报告的被监控项目,然后给报告取个名字,然后选好应当被包含在分析中的时间和日期即可。
在图F中的图形展示了在我的GoodLink服务器上的CPU活动状态。该服务器的利用率并不算特别高,但是该图形指出,其不规则的状态值得研究。
图F CPU活动状态
在主屏幕中,如果你点击了一台设备,ServersCheck就会提供你有关该设备的一系列信息。在如图G所示的屏幕里,你可以看到本地系统CPU正运行在1%的繁忙度,而75%的内存空闲可用。你也可以看到,在屏幕的底部的图形上,该信息随着时间的变化趋势。
图G 设备信息
对于每一台你监控的设备,你都可以添加大量的规则,以确认该设备的监控情况。你可以执行一个常见的Ping检查,运行一个Tracert以确认被用于访问该设备的路径,以及对该设备的特定方面进行监控。比方说,如果你是在运行一个网页服务器,一个Ping检查能够告诉你该服务器正常在线,而绝大多数合理监控的程序将能够允许你查看网页服务器的服务,从而确认它正常工作。但是,你怎么才能知道你的内容页面也在正常工作呢?
简单!在你的网页服务器上,建立一个“傻瓜”页面,该页面将仅用于被监控;然后建立一条ServersCheck规则,不断查看在访问该页面时,是否返回了特定的文本。如果该文本正常返回,就说明你的网页服务器在内容提供方面也是一切正常的。
多久应当执行一次新检查呢?对于某些检查来说,你希望状态更新非常迅速,但是对其他的检查来说,较长的时间间隔也是很合理的。要留意,不要因为太过频繁的执行检查,而导致对系统或者网络造成过载。
对我来说,我一般执行新检查,是选择监控一个特定的服务器服务,以确认不会消耗太多的CPU时间。在这个例子里,如图H所示,该服务运行在本地服务器上,所以信任就不再像其他情况下那么重要。记住,对于远程检查而言,你必须对一个帐户提供信任,且该账户应当拥有获取指定信息的相关权限。
图H 建立一个监控规则
在精灵的最后屏幕上,你可以指定具体授权发布警报的情形,以及该警报是如何发布的。注意,ServersCheck提供了一系列的警报选择。我推荐你不要单纯依靠电子邮件。毕竟,万一你的互联网连接中断了的话,你让软件用什么方法来通知你呢?
随着时间的推移,你很可能会在身边的环境里添加更多服务器,并需要将它们也加入ServersCheck。你应当提供设备名称,IP地址,说明文字,操作系统版本,设备类型,以及一个可用于扫描新设备的用户帐号以及密码。
注意最小服务级别入口(图I)。这个入口是用于测量某个设备上出现问题的紧急程度。举例来说,如果你进行了10个检查,其中一个失败,那么你的服务级别就是90%。如果该服务器仅有80%的服务级别,你一般不会把它认做是“当机”。
图I 最小服务级别
通过你提供的信任,新设备被扫描完毕,并返回正确监控的选项。在我的示例里,我已经添加了一个Windows域控制器,于是Windows健康检查就可以用了,包括了CPU监控,内存监控,以及磁盘空间监控等。你可以另外执行TCP检查,从而确定特定的TCP端口能继续保持被新设备访问。最后,你可以查看特定服务,以确认它们依旧正常可用。
如果你的某个系统出了问题,仪表板会揭示出来。在图J中,本地系统的“details(细节)”选项,显示出“Error: Query returned zero processes(错误:查询返回零个进程)”。在这个例子里,我是试图扫描一个不存在于该服务器上的服务,但是这个例子的确可以让你看出,让ServersCheck找出哪里有了错误是多么的简单。
图J 错误报告
当你为一台设备增加检查时,它们会出现在该设备的“device view(设备视图)”中。如果一台服务器当机了,你碰到了问题,ServersCheck就会变成红色,从而让你知道这一切。注意,在图K中,名为AIS的服务器现在正处于当机状态,在窗口前面中央的位置指出了这个事实。同时,饼图也改变了,反映出设备当机的状态。
图k 一台服务器当机了
底线
在我的测试中,我发现ServersCheck非常易于使用,而且它明确提供了我所希望的视觉线索。通过使用ServersCheck,我们可以在我们的IT设备当中竖起一块大型显示器,然后追踪我们所有设备的状态。
(责任编辑:陈毅东)
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。