> 文章列表 > Windows 服务监控工具

Windows 服务监控工具

Windows 服务监控工具

在任何企业中,Windows 服务都是面向业务的应用程序的核心组件。这些 Windows 服务的有效运行对于防止网络和应用程序停机至关重要。这使得 Windows 服务监视成为任何网络管理策略的关键部分。

Windows 服务监视使管理员能够确保关键 Windows 服务的可用性,从而确保最佳网络性能。它还允许管理员在服务失败或中断关键应用程序时自动执行操作或发送警报。Windows 服务监视可帮助管理员预见性能异常,并采取必要的措施来有效管理网络基础结构。

为什么 Windows 服务监视器很重要

许多在Windows NT,2000或更高版本上运行的软件应用程序作为Windows服务运行,作为后台进程运行,没有直接用户界面和登录用户(例如作为服务器)。它们通常自动启动,因此应保持运行。如果这些重要服务中的任何一个发生故障,许多用户和外部服务会立即受到影响,因此确保这些服务持续运行是大多数系统管理员的关键要求。

因此,Windows服务监视变得至关重要,因此需要企业部署适当的Windows服务监视工具来完成这项工作。

Windows 服务监控挑战

在这里插入图片描述

  • 识别相互依赖的服务
  • 缺乏对 Windows 服务级别拓扑的可见性
  • 确定要监控的服务优先级
  • 需要即时故障通知
  • 监视正确的自定义 Windows 服务

识别相互依赖的服务

Windows 应用程序不是单个组件,而是多个功能性 Windows 服务的组合。这些应用程序依赖于服务,而服务依赖于其他服务才能顺利执行。从属的 Windows 服务可以在同一设备或不同设备上运行。

鉴于此,当 Windows 服务进入休眠状态或遇到性能异常时,它会影响其其他依赖的 Windows 服务,使它们全部停止。这会干扰依赖于它们的 Windows 应用程序的性能,从而影响整体网络性能。因此,识别相互依赖的服务并主动监视它们对于防止延迟和停机至关重要。

解决方案:若要识别依赖服务并映射它们影响的应用程序和设备,可以使用矩阵模型。这可以通过三个简单的步骤完成:

  • 绘制一个矩阵,将 Windows 应用程序和服务视为元素(为方便可以使用 Excel 工作表)。
  • 找出每个 Windows 应用程序和服务的重叠次数。
  • 服务和应用程序之间重叠的最高频率表明它们的关键依赖关系。

使用此模型,还可以映射从属的 Windows 应用程序和设备,以分析潜在的中断并防止它们。

缺乏对 Windows 服务级别拓扑的可见性

由于服务故障而导致的 Windows 应用程序故障会降低应用程序的性能并损害网络运行状况。这会导致垃圾数据的积累和队列长度的增加,最终导致 CPU 温度飙升或损坏一个或多个依赖设备的其他硬件组件。简而言之,Windows 服务故障可能会导致设备故障或停机。

在这种情况下,管理员需要对服务级别地形有更广阔的了解。缺少地形可见性可能会通过创建狭窄的孤立视图来影响 Windows 服务监视,从而阻止您看到更大的图景。这最终可能导致不良的故障管理实践和停机时网络恢复时间延长。

解决方案:这里显而易见的解决方案是可视化。业务级可视化通过根据所需的业务运营对网络进行分组,帮助了解 Windows 服务级别的拓扑。对服务进行分组时,将清楚地了解在 Windows 服务失败时将失败的依赖 Windows 服务和应用程序。这样管理员可以预测家属的故障并采取预防措施来防止它们,这也将防止网络中断。

确定要监控的服务优先级

在混合网络基础结构中,并非所有 Windows 服务都需要始终监视。在某些情况下,频繁轮询可能会增加监视工具的工作负荷,而在其他情况下,不频繁的监视可能会导致服务器中断。换句话说,一些关键的 Windows 服务需要更频繁地监视,而一些琐碎的服务可以不那么频繁地监视。不同的 Windows 服务需要不同的轮询间隔,具体取决于 Windows 应用程序及其影响的相应因素。

通过分析后果并确定正确的轮询间隔来确定要监视的 Windows 服务的优先级可能很困难。应在考虑每个服务的依赖因素(包括服务、应用程序、进程和设备)后做出决定。对网络中的众多 Windows 服务执行此分析是一项艰巨的任务。

解决方案:通过研究用户行为、数据使用模式和业务趋势等历史数据,利用数据增长趋势。执行此操作的最有效方法是分析与 Windows 服务运行状况和性能相关的报告。管理员还可以安排报告以定期了解数据模式,并调用轮询频率。

需要即时故障通知

在网络服务器上运行的所有 Windows 应用程序中,有些应用程序有助于业务运营的关键功能。这些应用程序的运行状况至关重要,由其依赖的 Windows 服务的运行状况决定。当负责运行这些关键应用程序的服务发生故障时,相应的应用程序也将失败,从而导致性能异常或停机。

在这种情况下,不立即解决中断问题将影响整体网络性能,使整个业务功能面临风险。为了让现场团队及时收到有关这些情况的通知以防止业务损失,即时问题检测和解决是当务之急。

解决方案:为了处理这些危急情况,建议使用带有ITSM 工具的开箱即用集成系统,该工具可以为现场团队提供详细的工单,其中包含与 Windows 服务故障及其相关详细信息相关的大量数据。这些问题发生后,这些工单可以立即交付给现场团队,以解决中断问题并最大限度地减少停机时间。

监视正确的自定义 Windows 服务

企业使用的任何 Windows 应用程序都具有解决特定业务问题的某些功能,这些功能由服务器的默认或传统 Windows 服务补充。但是,仍然可以在自定义Windows服务的帮助下利用其他一些服务器功能。

除了执行其唯一定义的目标外,自定义服务还与传统 Windows 服务和其他网络设备交互,因此它们还会影响全球正常运行时间和网络性能。确定要监控的正确定制服务和传统服务的优先级可能是一项具有挑战性的任务。

解决方案:此处的解决方案是选择支持主动监视自定义服务的工具。该工具应该能够监视传统和自定义Windows服务,并显示它们之间的交互。这样,管理员就可以找到有助于全球网络可用性的服务并对其进行检查。

自动化Windows服务监控软件

OpManager 的Windows服务监控软件允许管理员在本地或网络上的多个服务器上监控Windows服务,支持通过WMI监视器监视Windows服务,并且不需要在每台远程计算机上安装代理。

OpManager 自动化Windows服务监控软件功能:

  • 故障识别和报警发布
  • 使用工作流自动进行故障排除

故障识别和报警发布

OpManager 的Windows服务监视器会在任何Windows服务进入休眠状态时生成警报并立即通知管理员。 在OpManager上配置通知配置文件,并通过电子邮件,短信或Slack通知将警报发送给管理员。这种快速发送故障通知有助于加快故障排除过程,从而有助于最大限度地减少停机时间。

使用工作流自动进行故障排除

OpManager的Windows服务监视器为管理员节省了手动故障排除的麻烦。一旦确定了故障, OpManager的工作流程可以帮助您自动执行故障排除过程,而无需任何手动干预。当服务失败时重新启动服务或重新启动服务器可以通过OpManager的工作流程完全自动化。

除了监控系统级服务(如HTTP,LDAP,SMTP等)之外,OpManager的Windows服务监视器默认支持监视以下Windows服务。

在这里插入图片描述

OpManager的Windows服务监视器监视以下服务的可用性和响应时间

警报器 FTP 网络登录
DHCP 服务器 IAS 打印服务
域名解析服务器 IIS RPC
磁盘管理 Messenger 电话通讯
事件日志 MySQL 远程登录

OpManager 的Windows服务监控功能监控Windows服务的可用性,并生成有关它们的广泛报告。其Windows服务监控工具可立即通知故障,并帮助加快故障排除过程,从而最大限度地减少停机时间。该工具还通过自动化某些工作流程使网络管理员免于手动故障排除的麻烦。OpManager的可视化功能可帮助管理员查看业务拓扑的全局,防止潜在的服务休眠,确保理想的网络运行状况。

手机铃声库