标签:timer 提交 key 工作项 方式 指针 ref 低功耗 如何
转自:https://www.cnblogs.com/coryxie/archive/2013/03/01/2951243.html
本文介绍Linux运行时I/O设备的电源管理框架。属于Linux内核文档的翻译。
原文:http://www.kernel.org/doc/Documentation/power/runtime_pm.txt
翻译:CoryXie <wenxue.xie@windriver.com>
对I/O设备的运行时电源管理(运行时PM)的支持,是在电源管理的核心(PM core)下借助于以下方式实现的:
下面描述在“struct dev_pm_ops” 中存在的运行时PM回调函数,设备运行时PM字段“struct dev_pm_info”,以及运行时PM核心辅助函数。
在“struct dev_pm_ops”中有三个设备运行时PM回调函数:
struct dev_pm_ops {
...
int (*runtime_suspend)(struct device *dev);
int (*runtime_resume)(struct device *dev);
int (*runtime_idle)(struct device *dev);
...
};
->runtime_suspend(), -> runtime_resume()和 ->runtime_idle()回调函数会被PM核心针对下列类型执行:
这就允许设备类型覆盖总线类型或类所提供的回调函数,如果有必要的话。
下面的文档中,总线类型,设备类型和类的回调函数都被称为子系统级的回调函数(subsystem-level callbacks)。
默认情况下,回调函数是在进程上下文中,允许中断的情况下被调用的。然而,子系统可以使用pm_runtime_irq_safe()辅助函数告诉PM核心,设备的 -> runtime_suspend()和 -> runtime_resume()回调函数应该在禁止中断的原子上下文中被调用(-> runtime_idle()仍然使用默认的方式调用)。这意味着,这些回调例程不得block 或者sleep;但同时也意味着在第4节末尾列出的同步辅助函数(synchronous helper functions),可以在中断处理程序或原子上下文中被使用。
子系统的挂起回调函数(suspend callback)_完全_负责_恰当地处理设备的挂起。它可以(但不是必须)包括执行自己的设备驱动程序的->runtime_suspend()回调(从PM核心的角度看,并不是必须要设备驱动实现 ->runtime_suspend()回调函数,只要子系统级的挂起回调函数知道怎么去处理设备就行)。
特别的,如果为了能够适当地工作,驱动程序需要远程唤醒功能(即,设备请求使其电源状态变化的硬件机制,如PCI PME), 而device_run_wake()返回“false”的设备,则->runtime_suspend()应该返回-EBUSY。另一方面,对于device_run_wake()返回“true”的设备,且在子系统级挂起回调的执行过程中该设备进入了低功耗状态,我们期望设备的远程唤醒就已经被启动。一般情况下,所有在运行时被设置进入低功耗状态的输入设备应该启用远程唤醒。
子系统级的恢复回调函数(resume callback)要_完全_负责_处理设备的恢复,这可能(但不一定)包括执行自己的设备驱动程序的 ->runtime_resume()回调(从PM核心的角度看,并不是必须要在设备驱动程序中实现->runtime_resume()回调函数,只要子系统级的恢复回调知道怎样能处理设备就行)。
每当设备看起来空闲的时候【这是通过两个计数器来向PM核心指示的,设备使用计数(usage counter),以及设备的“活跃子设备”(active children)计数】,子系统级的空闲回调函数(idle callback)就会被PM核心执行。
子系统级的空闲回调(idle callback)执行的操作是完全依赖于子系统本身的,但期望和建议的操作是,检查设备是否可以挂起(即挂起该设备的所有必要条件是否满足),且在这种情况下,为该设备排队一个挂起请求(queue up a suspend request)。这个回调函数返回的值将被PM核心忽略。
在第4节所述的PM核心所提供的辅助函数,保证对总线类型的运行时PM回调满足以下约束:
此外,由PM核心提供的辅助函数遵循以下规则:
执行->runtime_resume()请求,将取消任何对同一设备的等待中的(pending)或已被调度的(scheduled)回调执行请求,除了已被调度的自动挂起(autosuspend)。
以下是在‘struct dev_pm_info‘中的设备的运行时PM字段,定义在include / linux/ pm.h:
用于调度(延迟的)挂起和自动休眠(suspend and autosuspend)请求的定时器。
定时器到期时间,单位是jiffies(如果这异于零,则定时器正在运行,并将于该时间到期;否则定时器未运行)。
用于请求排队的工作结构(即pm_wq中工作项)。
等待队列,当任何辅助函数需要等待另一个完成的时候使用。
用于同步。
设备的使用计数。
“活跃的(active)”的子设备的个数。
如果置位,child_count的值将被忽略(但仍然要被更新)
用于禁用辅助函数(如果该值等于零,它们正常工作),它的初始值是1(即运行时PM最初对所有设备都是禁用的)
如果该值被设置,就表明有致命错误(在第2节中所述的回调函数返回的错误代码之一),因此辅助函数直到这个标志被清除之前将无法正常工作,这是失败的回调函数返回的错误代码。
如果该值被设置,则->runtime_idle()正在被执行。
如果该值被设置,则有挂起的请求(即有工作项被排队在pm_wq中)
挂起的请求类型(如果request_pending被设置时有效)。
当设备正在执行-> runtime_suspend()的时候,如果->runtime_resume()将要运行,而等待挂起操作完成并不实际,就会设置该值;这里的意思是“一旦你挂起完成,我就开始恢复”。
如果设备能够生成运行时唤醒事件,该值就被设置。
设备的运行时PM状态; 此字段的初始值是RPM_SUSPENDED,这意味着PM核心认为每个设备最初都处于‘挂起‘,不论其实际的硬件状态如何。
表示该设备不使用运行时PM回调(参见第8节),它只可能会被辅助函数pm_runtime_no_callbacks()修改。
表示->runtime_suspend()和->runtime_resume()回调函数将在持有自旋锁并禁止中断的情况下被调用。
表明该设备的驱动程序支持延迟的自动休眠功能(见第9节),它只可能被辅助函数pm_runtime{_dont}_use_autosuspend()修改。
表明PM核心应该在定时器到期时尝试进行自动休眠(autosuspend),而不是一个常规的挂起(normal suspend)。
延迟时间(以毫秒为单位),可用于自动休眠功能。
所有上述字段都是“structdevice”的成员“power”中的成员。
以下的运行时PM辅助函数被定义在drivers/base/power/runtime.c以及 include/linux/pm_runtime.h中:
初始化dev_pm_info结构中的设备运行时PM字段。
确保设备的运行时PM在该设备从设备层次删除后将被禁用。
执行子系统级的设备空闲回调,返回0成功,或失败的错误代码,其中的-EINPROGRESS 表示->runtime_idle()已经在执行。
对设备执行子系统级的挂起回调;返回0表示成功;如果设备的运行时PM状态已经是“挂起”则返回1;或失败时返回错误代码,其中,-EAGAIN或-EBUSY意味着企图在未来再次挂起设备是安全的。
与pm_runtime_suspend()相同,除了考虑了自动休眠延迟时间;如果pm_runtime_autosuspend_expiration()说该延迟尚未到期,那么就会调度适当时间的自动休眠功能,并返回0。
对设备执行子系统级的恢复回调;返回0表示成功;如果设备的运行时PM状态已经是“活跃的(active)”就返回1;或失败时错误代码,其中-EAGAIN意味着在未来试图恢复设备可能是安全的;但应附加对‘power.runtime_error’进行检查。
对设备提交一个执行子系统级的空闲回调的请求(请求由一个pm_wq的工作项代表);返回0表示成功,或如果请求没有排队成功就返回错误代码。
调度子系统级的挂起回调函数,使其在设备的自动休眠延迟(autosuspend delay)过期时执行;如果延迟已过期,则工作项立即被排队。
调度在未来执行设备的子系统级的挂起回调,其中“delay”是在pm_wq上排队挂起回调工作项之前等待的时间,以毫秒为单位(如果“delay”是零,工作项马上进行排队);返回0表示成功;如果该设备的运行时PM状态已经是“挂起”时返回1;或在当请求没有被调度(或 “delay”为0时被排队)时返回错误代码;如果->runtime_suspend()的执行已经被调度但尚未到期,则“delay”的新值将被用来作为等待的时间。
对设备提交一个执行子系统级恢复回调的请求(该请求由一个pm_wq中的工作项代表);成功返回0;如果设备的运行时PM状态已经是”活跃的(active)“则返回1;或当请求没有被排上队时返回错误代码。
递增设备的使用计数。
递增设备的使用计数,运行pm_request_resume(dev),并返回其结果。
递增设备的使用计数,运行pm_runtime_resume(dev),并返回其结果。
递减设备的使用计数。
设备的使用计数减1,如果结果是0,则运行pm_request_idle(dev)并返回其结果。
设备的使用计数减1,如果结果是0,则运行pm_request_autosuspend(dev)并返回其结果。
设备的使用计数减1,如果结果是0,则运行pm_runtime_idle(dev)并返回其结果。
设备的使用计数减1,如果结果是0,则运行pm_runtime_suspend(dev)并返回其结果。
设备的使用计数减1,如果结果是0,则运行pm_runtime_autosuspend(dev)并返回其结果。
使能运行时PM的辅助函数,使其能运行第2节中所描述的设备的总线类型的运行时PM回调。
防止运行时PM辅助函数运行设备的子系统级的运行时PM回调,确保设备的所有等待中的运行时PM操作已完成或取消;如果有一个恢复请求正在等待,且为了满足该请求而执行设备的子系统级的恢复回调是必要的,则返回1;否则返回0。
设置/取消设备的power.ignore_children标志。
清除设备的“power.runtime_error”标志,设置设备的运行时PM状态为”活跃的(active)“,并更新其父设备的”活跃子设备“计数(唯一有效的使用此函数的条件是,如果“power.runtime_error”被设置,或者“power.disable_depth”大于零);如果设备的父设备是不活跃的,且其“power.ignore_children”标志没有设置,该函数就会失败并返回错误代码。
清除设备的“power.runtime_error”标志,设置设备的运行时PM状态为“挂起”,并恰当更新其父设备的“活跃的子设备”计数(此函数唯一有效的使用条件是,如果“power.runtime_error”被设置,或“power.disable_depth”大于零)。
如果该设备的运行时PM状态为“挂起”且其“power.disable_depth”字段等于0,返回true;否则返回false。
设置设备的power.runtime_auto标志,并递减其使用计数(用于/sys/devices/.../power/control接口,实际上允许使设备在运行时被电源管理)。
取消设置设备的power.runtime_auto标志,并递增其使用计数(用于/sys/devices/.../power/control接口,实际上禁止设备在运行时被电源管理)。
设置设备的power.no_callbacks标志,并从/sys/devices/.../power中删除运行时PM属性(或防止设备在注册时添加他们)。
设置设备的power.irq_safe标志,造成运行时PM挂起和恢复回调在禁止中断的情况下被调用(但不包括空闲回调)。
设置power.last_busy字段为当前时间。
设置power.use_autosuspend标志,使能自动休眠延迟。
清除power.use_autosuspend标志,禁用自动休眠延迟。
设置power.autosuspend_delay的值为“delay”(以毫秒为单位),如果“delay”是负的,则防止运行时挂起。
基于power.last_busy和power.autosuspend_delay计算当前自动休眠延迟的到期时间;如果延迟时间是1000毫秒或更大,则到期时间四舍五入精确到秒(rounded up);如果延迟时间已经过期或power.use_autosuspend没有设置,则返回0;否则返回以jiffies计的过期时间。
从中断上下文中执行以下辅助函数是安全的:
如果pm_runtime_irq_safe()为设备调用,则以下辅助函数也可以在中断上下文中使用:
最初,所有设备的运行时PM被禁用,这意味着第4节中描述的大部分的运行时PM辅助函数将返回-EAGAIN,直到为设备调用pm_runtime_enable()之后。
此外,所有设备的运行时PM的初始状态都是‘挂起(suspended)‘,但它不一定反映实际的物理设备状态。因此,如果设备最初是活跃的(即,它能够处理I/O),其运行时PM状态必须在pm_runtime_set_active()的帮助之下,在为设备调用pm_runtime_enable()之前,被改变为“活跃”。
然而,如果该设备有父设备且其父设备的运行时PM是启用的,为设备调用pm_runtime_set_active()会影响其父设备,除非其父设备的“power.ignore_children”标志位被设置。也就是说,在这种情况下,使用PM核心的辅助函数,父设备不能在运行时被挂起,只要子设备的状态是“活跃的”,即使子设备的运行时PM还是禁用的(即pm_runtime_enable ()尚未对该子设备调用,或对该子设备已调用pm_runtime_disable())。出于这个原因,一旦pm_runtime_set_active()被为设备调用,pm_runtime_enable()也应该被尽早调用;否则其运行时PM状态应该在pm_runtime_set_suspended()的帮助下改回为“挂起”。
如果设备的默认初始运行时PM状态(即“挂起”)反映了实际设备状态,它的总线类型或它的驱动程序的->probe()回调函数将可能需要使用在第4节描述的PM核心的辅助函数唤醒它。在这种情况下,应使用pm_runtime_resume()。当然,为达此目的,在此之前,设备的运行时PM应通过调用pm_runtime_enable()被启动。
如果设备的总线类型或驱动程序的->probe()回调运行pm_runtime_suspend()或pm_runtime_idle()或与之对应的异步函数(asynchronous counterparts),他们将失败返回-EAGAIN,因为该设备的使用计数已经被驱动程序核心递增,然后再执行->probe()。尽管如此,可能仍然比较想要设备在->probe()完成后尽快被挂起,所以驱动那时候会核心采用pm_runtime_put_sync()来调用子系统级的设备空闲回调。
此外,在__device_release_driver()中,驱动核心可以防止运行时PM回调与总线通知(notifier)回调竞争,这是必要的,因为一些子系统使用通知(notifier)来进行影响运行时PM的操作。这是通过在driver_sysfs_remove()和BUS_NOTIFY_UNBIND_DRIVER通知之前调用pm_runtime_get_sync()来实现该目的的。如果设备已经处于挂起状态,这将恢复该设备,并会防止在这些例程正在执行时再次被挂起。
为了让总线类型和驱动程序在其->remove()例程中调用pm_runtime_suspend()将设备放到挂起状态,在__ ??device_release_driver()中驱动程序核心在运行BUS_NOTIFY_UNBIND_DRIVER通知后执行pm_runtime_put_sync()。这就需要总线类型和驱动程序避免其->remove()回调函数与运行时PM直接竞争,但也让驱动程序在处理设备的移除过程中有更多的灵活性。
通过将/sys/devices/.../power/control属性值改变为“on”,用户空间可以有效地禁止设备驱动程序进行运行时电源管理,这会导致pm_runtime_forbid()被调用。原则上,也可以使用这个机制有效地关闭运行时设备电源管理,直到用户空间打开它。也就是说,在初始化时,驱动程序可以确保设备的运行时PM状态是“活跃的(active)”,并调用pm_runtime_forbid()。应该指出的是,如果用户空间已经有意改变/sys/devices/.../power/control 的值为“自动”,让驱动在运行时进行设备的电源管理,驱动程序这样用pm_runtime_forbid()可能会让用户空间产生混淆。
运行时PM和系统休眠(即,系统挂起和休眠,也被称为挂起到RAM和挂起到磁盘)以多种方式互相交互。如果系统休眠开始时设备处于活跃状态,那么一切都简单。但如果设备已挂起,会发生什么呢?
对于运行时PM和系统休眠,设备可能有不同的唤醒设置。例如,远程唤醒可能会在运行时PM中启用,但不允许系统休眠时启用(device_may_wakeup(dev)返回“false”)。当发生这种情况时,子系统级系统挂起回调(system suspend callback)负责改变设备的唤醒设定(它可能将这个责任交给设备驱动器的系统挂起例程)。为了做到这一点,可能需要先恢复设备,再挂起它。如果驱动程序对运行时挂起和系统休眠使用不同的电源级别或其他设置,也是如此。
在系统恢复时,设备一般应恢复到全功率状态,即使他们在系统休眠开始前已经被挂起。这有几个原因,包括:
如果系统睡眠开始前设备已经被挂起,那么它的运行时PM状态将必须被更新,以反映实际的系统睡眠后的状态。做到这一点的方法是:
子系统可能希望通过使用PM核心提供的一套通用的,定义在driver/base/power/generic_ops.c中的电源管理回调函数,以节省代码空间:
调用此设备的驱动程序提供的->runtime_idle()回调函数(如果有定义的话),并在该回调返回值是0或者回调没有定义的情况下,调用pm_runtime_suspend()。
调用此设备的驱动程序提供的 ->runtime_suspend()回调函数,并返回其结果,或如果该回调函数没有定义时返回-EINVAL。
调用此设备的驱动程序提供的->runtime_resume()回调函数,并返回其结果,或如果该回调函数没有定义时返回-EINVAL。
如果该设备未在运行时被挂起,调用此设备的驱动程序提供的->suspend()回调函数,并 返回其结果,或如果该回调函数没有定义时返回-EINVAL。
调用此设备的驱动程序提供的->resume()回调函数,且如果成功的话,改变设备的运行时PM状态为“活跃的”。
如果该设备未在运行时被挂起,调用此设备的驱动程序提供的-> freeze ()回调函数,并 返回其结果,或如果该回调函数没有定义时返回-EINVAL。
如果该设备未在运行时被挂起,调用此设备的驱动程序提供的-> thaw ()回调函数,并 返回其结果,或如果该回调函数没有定义时返回-EINVAL。
如果该设备未在运行时被挂起,调用此设备的驱动程序提供的-> poweroff ()回调函数,并返回其结果,或如果该回调函数没有定义时返回-EINVAL。
调用此设备的驱动程序提供的-> restore()回调函数,且如果成功的话,改变设备的运行时PM状态为“活跃的”。
这些函数可以被赋值给系统级dev_pm_ops结构体的下列回调函数指针:
如果子系统希望同时使用所有的这些函数,可以简单地将GENERIC_SUBSYS_PM_OPS宏(定义在include/linux/pm.h)赋值给其dev_pm_ops结构的指针。
希望使用相同的函数作为系统挂起(system suspend), 冻结(freeze),断电(poweroff)以及运行时挂起(run-time suspend),以及类似的,系统恢复(system resume),解冻(thaw),恢复(restore)和运行时恢复(run-timeresume)等回调函数的设备驱动程序,可以在定义在include/linux/pm.h中的UNIVERSAL_DEV_PM_OPS宏的帮助下做到这一点(可能是其最后一个参数设置为NULL)。
改变设备的电源状态并不是免费的,它也需要时间和能耗。只有当有理由认为设备将保持在这种状态下大量的时间时,才应将设备置入低功耗状态。一个通常的启发式说法,一直没有怎么用的设备很可能继续保持在未使用状态,按照这个建议,驱动程序不应该允许设备在运行时挂起,直到他们处于非活跃状态已经有一段最低限度的时间。即使该启发式说法最终并非最佳,它仍然会阻止设备在低功耗和全功率状态之间迅速“反弹”。
术语“自动休眠(autosuspend)”是一个历史遗留下来的名字。这并不意味着该设备就会自动挂起(子系统或驱动程序仍然需要调用适当的PM例程),然而这意味着运行时挂起(run-time suspends)将自动被延迟,直到所需的一段时间空闲后。
不活跃(Inactivity)是根据power.last_busy字段来确定的。驱动程序应该在进行I/O后调用pm_runtime_mark_last_busy()来更新这个字段,通常是在刚要调用pm_runtime_put_autosuspend()之前。所需的空闲时间长度是一个策略问题。子系统可以在最初调用pm_runtime_set_autosuspend_delay()设置该长度,但设备注册后该长度应由用户空间控制,使用/sys/devices/.../power/autosuspend_delay_ms属性。
为了使用自动休眠(autosuspend),子系统或驱动程序必须调用pm_runtime_use_autosuspend()(最好是在注册设备之前),此后他们应该使用各种*_autosuspend()辅助函数,来代替非自动休眠的对应函数(non-autosuspend counterparts):
驱动程序可以继续使用非自动休眠功能辅助函数,他们会表现正常,而不把自动休眠延迟考虑进来。同样,如果power.use_autosuspend字段没有被设置,则自动休眠的辅助函数,使用起来就像是非自动休眠的对应函数(non-autosuspend counterparts)。
该实现非常适合用于异步中断上下文中。然而,这样的使用不可避免地涉及到竞争,这是由于PM核心不能同步 ->runtime_suspend()回调与I/O请求的到来。该同步必须由驱动程序使用其私有锁来完成。这里是一个原理性的伪代码示例:
最重要的一点是,在foo_io_completion()要求自动休眠之后,foo_runtime_suspend()回调可能与foo_read_or_write()竞争。因此foo_runtime_suspend()必须检查是否有任何挂起的I/O请求(在持有私有锁的情况下),然后才允许挂起进行。
此外,power.autosuspend_delay字段可以由用户空间在任何时间改变。如果驱动程序关心这个,它可以在持有其私有锁的情况下在->runtime_suspend()回调内调用pm_runtime_autosuspend_expiration()。如果该函数返回非零值,那么该延误尚未过期,则该回调应该返回-EAGAIN。
标签:timer 提交 key 工作项 方式 指针 ref 低功耗 如何
原文地址:https://www.cnblogs.com/sky-heaven/p/10346448.html