扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
来源:it168 2008年10月30日
关键字:Windows 2008 负载均衡 NLB
1、安装网络负载平衡并重新启动群集主机之后,出现一条消息:"系统已检测到有一个 IP 地址与网络上的其他系统发生冲突..."
- 原因:网络上已存在相同的 IP 地址。
- 解决方案:选择一个新的 IP 地址,或者删除重复的地址。
- 原因:您在主机上配置了不同的群集操作模式("单播"或"多播"),这样会使两个不同的 MAC 地址映射到同一个 IP 地址。
- 解决方案:确保将所有主机配置为具有相同的群集操作模式。
- 原因:将 NLB 绑定到网络适配器之前,已经配置了群集的 IP 地址。
- 解决方案:从 TCP/IP 属性中删除群集的 IP 地址,在相应的适配器上启用 NLB,然后配置群集的 IP 地址。
- 原因:您已将群集的 IP 地址添加到尚未启用 NLB 的网络适配器中。
- 解决方案:从不正确适配器的 TCP/IP 属性中删除群集的 IP 地址,在相应的适配器上启用 NLB,然后配置群集的 IP 地址。
2、使用 ping 从外部网络访问群集的 IP 地址时没有响应。
验证是否可以使用 ping 从路由器之外的计算机访问群集主机的专用 IP 地址。如果该测试失败,并且您使用了多个网络适配器,则此问题与 NLB 无关。如果您对专用 IP 地址和群集 IP 地址使用了一个网络适配器,请考虑以下原因:
- 原因:如果您使用了多播支持,您可能会发现路由器无法通过使用地址解析协议 (ARP) 将主要 IP 地址解析为多播媒体访问控制 (MAC) 地址。
- 解决方案:验证是否可以使用 ping 从群集子网上的客户端访问群集,以及是否可以从路由器之外的计算机访问群集主机的专用 IP 地址。如果这些测试都工作正常,则可能是路由器出现了故障。您应该能够通过向路由器中添加静态 ARP 条目来避开此问题。还可以关闭 NLB 多播支持,并使用单播网络地址(在没有集线器的情况下)。
- 原因:在多播或单播模式中使用 NLB 时,路由器需要接受代理 ARP 响应(在 Ethernet 框架中用不同网络源地址接收的 IP 到网络地址的映射)。
- 解决方案:确保您的路由器打开了代理 ARP 支持。还可以设置静态 ARP 条目以保持禁用路由器中的代理 ARP 支持。
- 原因:群集的 Internet 控制消息协议 (ICMP) 被路由器或防火墙阻止。
- 解决方案:允许 ICMP 通讯通过路由器或防火墙。请注意,这可能会使您的系统暴露于其他的安全风险。
3、使用 ping 从一台群集主机访问另一台主机的专用 IP 地址时没有响应。
- 原因:在多播或单播模式中使用 NLB 时,路由器需要接受代理 ARP 响应(在 Ethernet 框架中用不同网络源地址接收的 IP 到网络地址的映射)。
- 解决方案:确保您的路由器打开了代理 ARP 支持。还可以设置静态 ARP 条目以保持禁用路由器中的代理 ARP 支持。
- 原因:群集的 Internet 控制消息协议 (ICMP) 被路由器或防火墙阻止。
- 解决方案:允许 ICMP 通讯通过防火墙或路由器。请注意,这可能会使您的系统暴露于其他的安全风险。
尝试使用网络负载平衡管理器连接到群集中的某个主机时,收到错误"不能访问主机"。
- 原因:主机的 Internet 控制消息协议 (ICMP) 被路由器或防火墙阻止,或者在主机的网络适配器上被禁用。
- 解决方案:在主机的网络适配器上启用 ICMP 或者允许 ICMP 通讯通过防火墙或路由器。请注意,这可能会使您的系统暴露于其他的安全风险。还可以使用 NLB 管理器的 /noping 选项。
4、使用 Telnet 或尝试从群集主机浏览群集之外的计算机时,没有响应。
- 原因:验证是否可以使用 ping 访问群集之外的计算机。如果此测试成功,则可能没有在 TCP/IP 属性中首先列出主机的专用 IP 地址。
- 解决方案:如果 ping 未能访问群集之外的计算机,请参考以下问题(在此疑难解答主题的前面部分进行了描述):
- 使用 ping 从外部网络访问群集的 IP 地址时没有响应。
- 使用 ping 从另一群集主机访问主机专有的 IP 地址时没有响应。
从群集之外的计算机调用网络负载平衡远程控制命令时,一个或多个群集主机中没有响应。
- 原因:没有将远程控制命令发送到群集的 IP 地址。
- 解决方案:必须将命令发送到群集的主要 IP 地址,可以在"网络负载平衡属性"对话框中指定该操作。确保将远程命令发送到正确的 IP 地址。
- 原因:Internet 协议安全 (IPSec) 对远程控制通讯进行了加密。如果 NLB 远程控制命令是从配置了 IPSec(以便 IPSec 对远程控制通讯进行加密)的计算机发送的,则这些命令将无法正常运行。
- 解决方案:禁用 IPSec。
- 原因:防火墙未正确保护 NLB UDP 控制端口。默认情况下,会将远程控制命令发送到群集 IP 地址上的 UDP 端口 1717 和 2504。
- 解决方案:确保这些端口尚未被路由器或防火墙错误阻止。还可以通过修改相应的 NLB 参数来更改端口号。
5、使用主机的专用 IP 地址将其指定为远程控制命令的目标时,没有应答。但是,按其优先级 (ID) 指定主机正常运行。
- 原因:没有主机具有专用 IP 地址。
- 解决方案:为每个主机指定一个专用 IP 地址。有关详细信息,请参阅配置网络负载平衡主机参数。
6、拒绝某些用户(并非所有用户)连接群集。
- 原因:正在进行负载平衡的应用程序没有响应。
- 解决方案:这是一个应用程序特定的问题,与 NLB 无关。请参考您的应用程序文档来更正此问题。您可能需要停止并重新启动应用程序。
- 原因:如果群集配置为单播模式,则某个交换机可能已经知道了 NLB 网络适配器的 MAC 地址。
- 解决方案:清除该交换机的端口到 MAC 地址的映射。
- 原因:在一个或多个主机上,未将群集的 IP 地址添加到 TCP/IP 中。
- 解决方案:如果没有使用 NLB 管理器配置您的群集,则必须使用群集的 IP 地址手动配置 TCP/IP。
- 原因:某个主机正在由于使用了 drainstop 或 stop 命令而离开群集,因此聚合未正常完成。
- 解决方案:等待聚合完成。
7、无法通过使用 net config 和 Windows Management Instrumentation (WMI) 查看或更改网络负载平衡的属性。
- 原因:若要查看或更改"网络负载平衡属性",必须是 Administrators 组的成员。
- 解决方案:以运行 NLB 的计算机上的本地 Administrators 组成员的用户身份登录。
8、由服务器或客户端重设的到群集 IP 地址的 TCP 连接数量异常。
- 原因:在 NLB 主机上启用了 HTTP keep-alive 值,并且启用了 keep-alive 值的客户端正在连接群集。
- 解决方案:禁用 HTTP keep-alive 值。有关 HTTP keep-alive 值和 Internet 信息服务 (IIS) 的详细信息,请参阅 IIS 文档集。
若要从桌面上查看 IIS 文档集,请安装 IIS,然后单击"开始",再单击"运行",然后在"打开"文本框中键入以下命令:
%windir%\help\iisrv.chm
- 原因:服务器上的系统资源不足,从而导致 TCP 拒绝连接。
- 解决方案:释放系统资源,例如,通过添加额外的系统内存或者关闭不必要的应用程序。
- 原因:群集已被分为两个单独聚合的群集,这样导致多个节点要求获得每个连接的所有权。
- 解决方案:删除这两个群集,然后重新创建一个群集。
9、当进行引起聚合的更改(如添加主机、删除主机或排出主机)时,虚拟专用网络 (VPN) 调用失败。
- 原因:当使用 NLB 对 VPN 通讯进行负载平衡时,您必须将用于管理处理 VPN 通讯(对于 PPTP/GRE 为 TCP 端口 1723;对于 IPSEC/L2TP 为 UDP 端口 500)的端口的端口规则配置为使用"单一"或"网络"关联。
- 解决方案:将用于管理端口 500 和 1723 的端口规则配置为使用"单个"或"网络"关联。有关详细信息,请参阅网络负载平衡管理器属性。
群集主机启动后便开始聚合,但它们从未完成聚合。
- 原因:在不同的群集上输入了不同数量的端口规则或者输入了不兼容的端口规则。这将会阻止聚合。
- 解决方案:在每个群集主机上,打开"网络负载平衡属性"对话框,并验证所有主机都具有相同的端口规则。
- 原因:网络适配器或电缆已损坏。
- 解决方案:使用 ping 命令测试连接性。输入主机的完全限定的域名。还可以通过使用 ping 命令按 IP 地址搜索域控制器以及按名称和 IP 地址搜索其他网络服务器,了解有关此问题的详细信息。
- 原因:某个交换机或集线器上的双工设置不匹配。
- 解决方案:确认每个交换机和集线器中的双工设置配置正确。
- 原因:网络上已经存在为其中一个主机使用的专用 IP 地址。
- 解决方案:选择一个新的 IP 地址,或者删除重复的地址。
- 原因:您的群集包含运行 Windows 2000 的主机。
- 解决方案:您的群集必须在所有主机上都运行 Windows Server 2008。仅当滚动升级到 Windows Server 2008 时,才支持包含运行 Windows Server 2003 和 Windows Server 2008 的主机的 NLB 群集环境。不支持长期在同一个群集中混合使用 Windows Server 2003 和 Windows Server 2008。
- 原因:在主机上配置了不同的群集操作模式(单播和多播)。
- 解决方案:使用 NLB 管理器确保将所有主机配置为具有相同的群集操作模式。
注: 还可以查看 Windows 事件日志以检查错误和警告。
10、群集移入和移出已聚合状态。
- 原因:由于网络适配器或电缆已损坏或者其他网络问题导致网络间歇性连接,因此检测信号丢失。
- 解决方案:使用 ping 命令测试连接性。输入主机的完全限定的域名。还可以通过使用 ping 命令按 IP 地址搜索域控制器以及按名称和 IP 地址搜索其他网络服务器,了解有关此问题的详细信息。
群集主机启动后,网络负载平衡报告聚合已完成,但是存在多个默认主机。
- 原因:群集主机已成为不同子网的成员,因此无法在同一个网络上访问所有主机。
- 解决方案:确保所有群集主机可以彼此通信。
- 原因:正在使用三层交换机。
- 解决方案:在主机和三层交换机之间放置一个两层交换机。
- 原因:冗余交换机的中断导致群集分为两个群集,从而创建两个默认的主机。
- 解决方案:删除这两个群集,然后创建一个群集。
- 原因:您的交换机已配置为拒绝广播数据包。
- 解决方案:将您的交换机配置为可接受广播数据包(请注意这可能会引入某些安全风险)或者将 NLB 群集配置为可使用多播模式。
- 原因:一个主机无法发送或接收检测信号。
- 解决方案:使用 ping 命令测试每个主机的连接性。输入主机的完全限定的域名。
- 原因:某个主机插入了交换机的错误端口中。
- 解决方案:使用交换机上的正确端口。
11、网络负载平衡未应用负载平衡,默认主机处理所有网络流量。
- 原因:缺少端口规则。默认情况下,NLB 会将端口规则不管理的所有传入网络通讯引导至默认主机,这样可确保您不希望进行负载平衡的应用程序行为正常。
- 解决方案:若要对群集上的应用程序进行负载平衡,请在每个群集主机上为该应用程序处理的 TCP/IP 端口创建端口规则。
- 原因:向单个主机群集中添加了第二个主机,但第二个主机配置不正确。群集从不聚合并且初始主机继续处理所有通讯。
- 解决方案:仔细查看(如果需要,请进行更正)第二个主机上的每个设置,例如群集 IP 地址、专用 IP 地址和端口规则。
- 原因:如果群集配置为单播模式,则某个交换机可能已经知道了 NLB 网络适配器的 MAC 地址。
- 解决方案:清除该交换机的端口到 MAC 地址的映射。
- 原因:代理服务器正在向处于"单个"关联模式的群集中发送使用单个 IP 地址的所有连接。
- 解决方案:将代理服务器配置为使用多个 IP 地址。
12、在群集主机之间意外交换通讯,并且断开了 TCP 连接。
- 原因:单播网络地址导致交换集线器出现问题。如果使用交换集线器使群集主机互连,则必须使用 NLB 多播支持。否则,在多个交换机端口上使用同一个单播网络时,交换机可能行为异常。
- 解决方案:确认已在"网络负载平衡属性"对话框中选中了多播支持。如果不希望使用多播支持,则可以用集线器或同轴电缆而不是用交换机使群集主机互连。
13、没有在群集主机之间对网络通讯均匀地进行负载平衡。
- 原因:网络通讯来自于有限数量的 IP 地址,可能是由于代理服务器上的设置引起的。
- 解决方案:将代理服务器配置为使用多个 IP 地址。
14、对 Microsoft Internet Security and Acceleration (ISA) Server 使用网络负载平衡时,一个群集主机记录被引导至另一个主机的专用 Internet 协议 (IP) 地址的被阻止的数据包。
- 原因:将其中一个群集主机配置为主机优先级标识符等于 1。
- 解决方案:不要将任何群集主机配置为主机优先级标识符等于 1。使用大于 1 的数字。有关详细信息,请参阅配置网络负载平衡主机参数。
15、无法在 64 位版本的环境中创建网络负载平衡群集。
- 原因:可能没有为您的环境运行相应的 NLB 版本。在 64 位版本计算机上使用 32 位版本的 NLB 时,NLB 无法形成群集。由于 32 位 NLB 组件(nlb.exe、wlbs.exe 和 nlbmgr.exe)看上去在 64 位版本环境中正常运行,因此可能会检测不到此问题。
- 解决方案:如果您计划使用 64 位版本计算机环境,则必须使用 64 位 NLB 版本。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
去集群 更超群——大容量网络演进之路
2019 IBM 中国论坛
H3C 2019 Navigate 领航者峰会
助推数据中心网络现代化转型 打造灵活可靠基础架构平台