加载中 ...

网络监控至关重要

2019-08-08 16:08:08 来源:沈阳小程序开发 作者:沈阳软件开发

如果您在技术平台,技术系统,后台IT系统或产品平台上工作超过一天,您可能在最近的事故,失败或危机中听到过这样的问题。我们没有及早发现它。“如果你的年龄与我们的年龄相近,或者比我们年龄大,那么你可能早就记得你听过多少次这个问题。答案通常很简单,通常是因为服务,组件,应用程序或系统未被不正确地监视或监视。这个答案的结尾通常会添加一句话,“这个问题永远不会再发生。”

如果您在技术平台,技术系统,后台IT系统或产品平台上工作超过一天,您可能在最近的事故,失败或危机中听到过这样的问题。我们没有及早发现它。“如果你的年龄与我们的年龄相近,或者比我们年龄大,那么你可能早就记得你听过多少次这个问题。答案通常很简单,通常是因为服务,组件,应用程序或系统未被不正确地监视或监视。并且这个答案的结尾经常添加一句话,“这个问题永远不会再发生。”1-1Q0031952011H.png即使这个问题再也不会发生,虽然根据我们的经验,这个问题经常会再次发生,但很可能会出现类似的问题。同样的问题会再次出现,并且可能会执行后分析过程,然后“再次”采取一些行动来正确监控服务。虽然问题“为什么我们没有及早找到它“有一些用处,它没有一些更好的那些有价值。例如,”我们的过程中有哪些问题,导致我们找不到合适的监测方法?这些问题在汇海上得到了解决。“你可能认为这两个问题是相似的,但情况并非如此。第一个问题”为什么我们没有及早找到它“指的是此问题此刻,它没有帮助,至少可以推动正确的行动来解决我们刚刚遇到的错误。另一方面,第二个问题解决了人和过程的问题,这就是为什么他们经历了刚刚发生的事件或其他类似的事件,没有适当的监控。如果你愿意,你可以回想一下故障与我们在第8章讨论的问题之间的关系。问题可能导致故障,也可能与多个故障有关。我们解决的第一个问题是故障,不是问题。我们提出的第一个问题,问题就解决了。 应该问两个问题,但是如果你只能问一个问题而只能得到一个问题的答案,那么我们认为你应该解决问题,而不是失败。我们认为,不通过监控发现问题的最常见原因是大多数系统的设计都不是为了监控。事实上,大多数系统都是在考虑进行监控之前设计和实施的。通常,负责确定系统或应用程序是否正常工作的团队不是定义系统行为或设计它的团队。最常见的结果是,应用程序执行的监视由无法确定应用程序是否正在执行正确的团队来确定。这将导致监控系统无法捕获关键的成功或失败指标,而不是公司的内部监控系统可以在影响客户的关键问题之前识别他们的期望;这样的监控系统肯定注定要失败。值得注意的是,设计能够监控并不仅仅意味着要了解如何正确监控系统的成功或失败。旨在监控的是在应用程序或系统内部构建监视功能,而不是围绕它们构建。它不仅要记录发生的故障,进一步确定故障的主题,甚至从应用程序的角度提出潜在的问题或疑虑。可以监视的所谓系统能够评估所有服务的响应时间。当响应时间超过正常水平时,有必要与某些人进行交互或提醒他们。该系统还可以评估在一段时间内记录的错误的频率。如果此频率发生很大变化,或者如果发生错误,它也会提醒合适的人。使用统计过程控制图,可以从过去30个相似日期的相同时间段的数据获得平均值。如果错误率或响应时间超出平均值的标准偏差,则发出警报,以便实现上述两种方法。这里,“类似”日期可以是周一至周一,周六至周六。当公司成功实施了旨在监控的架构设计原则时,他们开始提出第三个问题。 在实施该系统之前,通常在建筑评审委员会(ARB)或联合应用设计(JAD)会议上,最好问这个问题。问题通常是“我们如何知道这个系统是否正常运行,我们怎么知道它什么时候表现不好?”对于第三个问题,正确答案需要包括我们前面提到的统计过程控制方案中的要素。任何一个正确的答案都告诉我们应用程序日志中没有错误。请记住,我们希望系统不仅告诉我们系统行为不符合预期,还要告诉我们系统行为何时异常。这是两件完全不同的事情。应该注意的是,让操作团队开发一组应用程序监视指示器,只需查找SNMP警报,或遍历日志以查找软件开发人员描述的重要字符串。这些是监控方法,但它们与我们上面的监控非常不同。我们所讨论的监控不仅仅是关于CPU使用率,负载,内存使用情况等。当然,这并不是说这些指标并不重要,只是监控这些指标并不足以确保您的应用程序运行正常。我们使用网站建设监控问题的第二个常见原因是我们开发监控系统的方法与我们开发其他系统的方法不同。通常我们不会设计我们的监控系统,也不会以系统的方式进行开发。在大多数情况下,我们依靠生产环境的失败和危机来成熟我们的监控系统,这通常会在没有明显原因的情况下修补监控系统。当被问及要监控什么时,我们可能会提供所有典型的答案,从应用程序日志到系统资源的使用,甚至发誓我们还会监控过去发生的各种主要故障。标志。我们几乎从不回答我们正在根据设计和实施我们的平台或服务的标准制定我们的监控系统。接下来,我们将提出一个解决这个常见问题的框架。

“沈阳软件公司”的新闻页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与

我们联系删除或处理,客服QQ:55506560,稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同

其观点或证实其内容的真实性。