标签:调度策略 eve 深度 使用 info 服务器 性能 image nbsp
我的工程实践选题是《风扇调度》,这是一个系统工具,主要用于分布式系统的性能和功耗调优。
在分布式系统中,任何一个硬件的功耗都是及其重要的,包括风扇,如何使得风扇的调度既可以保证系统的正常运行,又能使系统的功耗尽量的低,这是一个很重要的课题。
一、用例图
如下图所示,这是风扇调度的用例图。其实现的主要功能是:在保证系统正常运行,NPU不掉频的情况下,尽力保证系统的低功耗。首先我们将系统的运行情况分类,对不同的运行情况采取不同策略的方法进行应对。比如正常情况,比如在分布式训练不同的模型的情况,比如环境温度不正常的情况,每一种情况都有它的特殊性,应该有不同的风扇调度方案。
二、High level use case
下面对于每个用例范围的High level use case进行分析:
1.普通情况风扇调度
这应该是一种常规情况,而且是服务器的常态,这种情况下服务器没有高负载,一般情况下也不需要风扇进行特殊的调度策略,只需要风扇处于一个较低的值,不使得温度出现极大的抖动即可。
2.分布式训练
具有NPU的服务器经常进行分布式训练,那么不同的分布式训练模型应该具有不同的特点,在这里将其分解成三类模型:
a.深度神经网络训练
b.传统机器学习训练
c.其他训练方法
对于不同的训练模型应该具备不同的特点,针对其特点对风扇调度进行优化。
3.环境温度不确定情况
这是一种特殊的极端情况,在正常的机房中应该不会遇到,但是我们无法保证这种情况不发生,所以在这种极端情况发生的情况下,我们应该考虑如何应对。
三、Expanded use case
这里的扩展用例主要针对于不同的算法:
1.使用强化学习的算法对调度方案进行优化;
2.使用深度学习将计算模型分类,对不同类型的计算模型采取不同的策略。
标签:调度策略 eve 深度 使用 info 服务器 性能 image nbsp
原文地址:https://www.cnblogs.com/logan233/p/11785960.html