CPU 进入 IDLE 都做了啥?

2022-01-27 14:08:29 浏览数 (1)

cpuidle framework

每一个 CPU 核心都会有一个 idle 进程,idle 进程是当系统没有调度 CPU 资源的时候,会进入 idle 进程,而 idle 进程的作用就是不使用 CPU,以此达到省电的目的。

在ARM64架构中,当CPU Idle时,会调用WFI指令(wait for interrupt),关掉CPU的Clock以便降低功耗,当有外设中断触发时,CPU又会恢复回来。

cpuidle core 是 cpuidle framework 的核心模块,负责抽象出 cpuidle device、cpuidle driver 和 cpuidle governor 三个实体,如下所示:

cpuidle core 抽象出了 cpuidle device、cpuidle driver 和 cpuidle governor 三个数据结构。

数据结构

cpuidle_device

针对每个CPU核都对应一个struct cpuidle_device结构,主要字段介绍如下

代码语言:javascript复制
struct cpuidle_device {
 //该cpu核是否注册进内核中
 unsigned int  registered:1;
 //该cpu核是否已经使能
 unsigned int  enabled:1;
 unsigned int  use_deepest_state:1;
 //对应的cpu number
 unsigned int  cpu;

 //该cpu核上一次停留在cpuidle状态的时间(us)
 int   last_residency;
 //记录每个cpuidle状态的统计信息,包括是否使能、进入该cpuidle状态的次数,停留在该cpuidle状态的总时间(us)
 struct cpuidle_state_usage states_usage[CPUIDLE_STATE_MAX];
  ......
};

对应的注册接口是 cpuidle_register_device。

cpuidle_driver

cpuidle driver用于驱动一个或多个CPU核,关键字段描述如下:

代码语言:javascript复制
struct cpuidle_driver {
 const char  *name;
 struct module   *owner;
 int                     refcnt;

 //用于驱动注册时判断是否需要设置broadcast timer
 unsigned int            bctimer:1;
 //用于描述cpuidle的状态,需要按照功耗从大到小来排序,具体有多少个cpuidle状态
 struct cpuidle_state states[CPUIDLE_STATE_MAX];
  ......
};

代码语言:javascript复制
//CPU有多种不同的idle级别。这些idle级别有不同的功耗和延迟,从而可以在不同的场景下使用
//主要包括exit_latency、power_usage、target_residency。这些特性是governor制定idle策略的依据
struct cpuidle_state {
 char  name[CPUIDLE_NAME_LEN];
 char  desc[CPUIDLE_DESC_LEN];

 unsigned int flags;
 //CPU从该idle state下返回运行状态的延迟,单位为us。它决定了CPU在idle状态和run状态之间切换的效率,如果延迟过大,将会影响系统性能;
 unsigned int exit_latency; /* in US */
 //CPU在该idle state下的功耗,单位为mW
 int  power_usage; /* in mW */
 //期望的停留时间,单位为us。进入和退出idle state是需要消耗额外的能量的,如果在idle状态停留的时间过短,节省的功耗少于额外的消耗,则得不偿失。governor会根据该字段,结合当前的系统情况(如可以idle多久),选择idle level;
 unsigned int target_residency; /* in US */
 bool  disabled; /* disabled on all CPUs */

 //进入该state的回调函数
 int (*enter) (struct cpuidle_device *dev,
   struct cpuidle_driver *drv,
   int index);

 //CPU长时间不需要工作时(称作offline),可调用该回调函数。
 int (*enter_dead) (struct cpuidle_device *dev, int index);
  ......
};

对应的注册接口是 cpuidle_register_driver。

cpuidle_governor

governor 结构主要提供不同的回调函数,最终由 menu_governor 填充,主要字段如下:

代码语言:javascript复制
struct cpuidle_governor {
 char   name[CPUIDLE_NAME_LEN];
 struct list_head  governor_list;
 //governor的级别,正常情况下,kernel会选择系统中rating值最大的governor作为当前governor
 unsigned int  rating;

  //在设备驱动注册和注销的时候调用
 int  (*enable)  (struct cpuidle_driver *drv,
     struct cpuidle_device *dev);
 void (*disable)  (struct cpuidle_driver *drv,
     struct cpuidle_device *dev);

 //根据当前系统的运行状况,以及各个idle state的特性,选择一个state(即决策)
 int  (*select)  (struct cpuidle_driver *drv,
     struct cpuidle_device *dev,
     bool *stop_tick);
 //通过该回调函数,可以告知governor,系统上一次所处的idle state是哪个
 void (*reflect)  (struct cpuidle_device *dev, int index);
};

对应的注册接口是 cpuidle_register_governor。

流程

我们先看下设备和驱动的注册过程:

注册之后便将设备和驱动建立起连接关系了,最终 cpuidle framework 的用户便可通过接口来调用下层的接口,进而完成具体的硬件操作。

下面看下 CPU 进入 idle 状态的流程图:

可以看出,最终是通过 PSCI 来实现 CPU 的 suspend。

PSCI

PSCI, Power State Coordination Interface,由ARM定义的电源管理接口规范,通常由Firmware来实现,而Linux系统可以通过smc/hvc指令来进入不同的Exception Level,进而调用对应的实现。

PSCI 支持如下功能:

  • CPU hotplug (on/off)
  • CPU idle (suspend/resume)
  • System suspend/resume
  • System shutdown and reset

每个功能和ATF之间的调用接口如下所示:

0 人点赞