当单维度信息无法提供足够的信息时,传统告警平台首先想到了使用规则来破局,即“如果A和B同时发生了,则触发告警C”。 的确,规则是个有效的方法,是解决眼下问题的最快途径。然而,事实是否真如此一般呢?A和B各自发生了多少次才能触发C?A和B之间有没有发生的先后次序?A和B发生相隔的时间限度是多少?其实,规则会产生大量的分叉和条件组合,于是我们不难看出规则的诸多问题: l 规则看似简单,实操中却会发现内容十分复杂; l 规则维护的成本昂贵,有着相当的隐性成本; l 在简单环境中,规则能够适用,但在复杂环境中是不可预测的。 而随着IT技术的日益发展,系统的规模和复杂度也今非昔比,大量规则的维护如同噩梦一般,让运维人员越陷越深,难以自拔。 监控告警破局之术:AI驱动,打造新一代告警平台