Linux 内核启动流程之 start_kernel

2023-01-03 19:19:30 浏览数 (1)

上次我们写过了 Linux 启动详细流程,这次单独解析 start_kernel 函数。

原来的文章如下:

Linux 内核入口分析

手把手教你分析 Linux 启动流程

如下请参考注释:

Linux kernel-6.1/init/main.c

代码语言:javascript复制
asmlinkage __visible void __init __no_sanitize_address start_kernel(void)
{
 char *command_line;
 char *after_dashes;

 set_task_stack_end_magic(&init_task);/*设置任务栈结束魔术数,用于栈溢出检测*/
 smp_setup_processor_id();/*跟 SMP 有关(多核处理器),设置处理器 ID*/
 debug_objects_early_init();/* 做一些和 debug 有关的初始化 */
 init_vmlinux_build_id();

 cgroup_init_early();/* cgroup 初始化,cgroup 用于控制 Linux 系统资源*/

 local_irq_disable();/* 关闭当前 CPU 中断 */
 early_boot_irqs_disabled = true;

 /*
  * Interrupts are still disabled. Do necessary setups, then
  * enable them.
  * 中断关闭期间做一些重要的操作,然后打开中断
  */
 boot_cpu_init();/* 跟 CPU 有关的初始化 */
 page_address_init();/* 页地址相关的初始化 */
 pr_notice("%s", linux_banner);/* 打印 Linux 版本号、编译时间等信息 */
 early_security_init();
 
 /* 系统架构相关的初始化,此函数会解析传递进来的
 * ATAGS 或者设备树(DTB)文件。会根据设备树里面
 * 的 model 和 compatible 这两个属性值来查找
 * Linux 是否支持这个单板。此函数也会获取设备树
 * 中 chosen 节点下的 bootargs 属性值来得到命令
 * 行参数,也就是 uboot 中的 bootargs 环境变量的
 * 值,获取到的命令行参数会保存到 command_line 中
 */
 setup_arch(&command_line);
 setup_boot_config();
 setup_command_line(command_line);/* 存储命令行参数 */
 
 /* 如果只是 SMP(多核 CPU)的话,此函数用于获取
 * CPU 核心数量,CPU 数量保存在变量 nr_cpu_ids 中。
 */
 setup_nr_cpu_ids();
 setup_per_cpu_areas();/* 在 SMP 系统中有用,设置每个 CPU 的 per-cpu 数据 */
 smp_prepare_boot_cpu(); /* arch-specific boot-cpu hooks */
 boot_cpu_hotplug_init();

 build_all_zonelists(NULL);/* 建立系统内存页区(zone)链表 */
 page_alloc_init();/* 处理用于热插拔 CPU 的页 */

 /* 打印命令行信息 */ 
 pr_notice("Kernel command line: %sn", saved_command_line);
 /* parameters may set static keys */
 jump_label_init();
 parse_early_param();/* 解析命令行中的 console 参数 */
 after_dashes = parse_args("Booting kernel",
      static_command_line, __start___param,
      __stop___param - __start___param,
      -1, -1, NULL, &unknown_bootoption);
 print_unknown_bootoptions();
 if (!IS_ERR_OR_NULL(after_dashes))
  parse_args("Setting init args", after_dashes, NULL, 0, -1, -1,
      NULL, set_init_arg);
 if (extra_init_args)
  parse_args("Setting extra init args", extra_init_args,
      NULL, 0, -1, -1, NULL, set_init_arg);

 /* Architectural and non-timekeeping rng init, before allocator init */
 random_init_early(command_line);

 /*
  * These use large bootmem allocations and must precede
  * kmem_cache_init()
  */
 setup_log_buf(0);/* 设置 log 使用的缓冲区*/
 vfs_caches_init_early(); /* 预先初始化 vfs(虚拟文件系统)的目录项和索引节点缓存*/
 sort_main_extable();/* 定义内核异常列表 */
 trap_init();/* 完成对系统保留中断向量的初始化 */
 mm_init();/* 内存管理初始化 */

 ftrace_init();

 /* trace_printk can be enabled here */
 early_trace_init();

 /*
  * Set up the scheduler prior starting any interrupts (such as the
  * timer interrupt). Full topology setup happens at smp_init()
  * time - but meanwhile we still have a functioning scheduler.
  */
 sched_init();/* 初始化调度器,主要是初始化一些结构体 */

 if (WARN(!irqs_disabled(),
   "Interrupts were enabled *very* early, fixing itn"))
  local_irq_disable();/* 检查中断是否关闭,如果没有的话就关闭中断 */
 radix_tree_init();/* 基数树相关数据结构初始化 */
 maple_tree_init();

 /*
  * Set up housekeeping before setting up workqueues to allow the unbound
  * workqueue to take non-housekeeping into account.
  */
 housekeeping_init();

 /*
  * Allow workqueue creation and work item queueing/cancelling
  * early.  Work item execution depends on kthreads and starts after
  * workqueue_init().
  */
 workqueue_init_early();

 rcu_init();/* 初始化 RCU,RCU 全称为 Read Copy Update(读-拷贝修改) */

 /* Trace events are available after this */
 trace_init();/* 跟踪调试相关初始化 */

 if (initcall_debug)
  initcall_debug_enable();

 context_tracking_init();
 /* init some links before init_ISA_irqs() */
 
 /* 初始中断相关初始化,主要是注册 irq_desc 结构体变
 * 量,因为 Linux 内核使用 irq_desc 来描述一个中断。
 */
 early_irq_init();
 init_IRQ();/* 中断初始化 */
 tick_init();/* tick 初始化 */
 rcu_init_nohz();
 init_timers();/* 初始化定时器 */
 srcu_init();
 hrtimers_init();/* 初始化高精度定时器 */
 softirq_init();/* 软中断初始化 */
 timekeeping_init();
 time_init();/* 初始化系统时间 */

 /* This must be after timekeeping is initialized */
 random_init();

 /* These make use of the fully initialized rng */
 kfence_init();
 boot_init_stack_canary();

 perf_event_init();
 profile_init();
 call_function_init();
 WARN(!irqs_disabled(), "Interrupts were enabled earlyn");

 early_boot_irqs_disabled = false;
 local_irq_enable();/* 使能中断 */

 kmem_cache_init_late();/* slab 初始化,slab 是 Linux 内存分配器 */

 /*
  * HACK ALERT! This is early. We're enabling the console before
  * we've done PCI setups etc, and console_init() must be aware of
  * this. But we do want output early, in case something goes wrong.
  */
 /* 初始化控制台,之前 printk 打印的信息都存放
  * 缓冲区中,并没有打印出来。只有调用此函数
  * 初始化控制台以后才能在控制台上打印信息。
  */
 console_init();
 if (panic_later)
  panic("Too many boot %s vars at `%s'", panic_later,
        panic_param);

 lockdep_init();

 /*
  * Need to run this when irqs are enabled, because it wants
  * to self-test [hard/soft]-irqs on/off lock inversion bugs
  * too:
  */
 locking_selftest();/* 锁自测 */ 

 /*
  * This needs to be called before any devices perform DMA
  * operations that might use the SWIOTLB bounce buffers. It will
  * mark the bounce buffers as decrypted so that their usage will
  * not cause "plain-text" data to be decrypted when accessed.
  */
 mem_encrypt_init();

#ifdef CONFIG_BLK_DEV_INITRD
 if (initrd_start && !initrd_below_start_ok &&
     page_to_pfn(virt_to_page((void *)initrd_start)) < min_low_pfn) {
  pr_crit("initrd overwritten (0xlx < 0xlx) - disabling it.n",
      page_to_pfn(virt_to_page((void *)initrd_start)),
      min_low_pfn);
  initrd_start = 0;
 }
#endif
 setup_per_cpu_pageset();
 numa_policy_init();
 acpi_early_init();
 if (late_time_init)
  late_time_init();
 sched_clock_init();
 /* 测定 BogoMIPS 值,可以通过 BogoMIPS 来判断 CPU 的性能
 * BogoMIPS 设置越大,说明 CPU 性能越好。
 */
 calibrate_delay();
 pid_idr_init();
 anon_vma_init();/* 生成 anon_vma slab 缓存 */ 
#ifdef CONFIG_X86
 if (efi_enabled(EFI_RUNTIME_SERVICES))
  efi_enter_virtual_mode();
#endif
 thread_stack_cache_init();
 cred_init();/* 为对象的每个用于赋予资格(凭证) */
 fork_init();/* 初始化一些结构体以使用 fork 函数 */
 proc_caches_init();/* 给各种资源管理结构分配缓存 */
 uts_ns_init();
 key_init();/* 初始化密钥 */
 security_init();/* 安全相关初始化 */
 dbg_late_init();
 net_ns_init();
 vfs_caches_init();/* 虚拟文件系统缓存初始化 */
 pagecache_init();
 signals_init();/* 初始化信号 */
 seq_file_init();
 proc_root_init();/* 注册并挂载 proc 文件系统 */
 nsfs_init();
 /* 初始化 cpuset,cpuset 是将 CPU 和内存资源以逻辑性
 * 和层次性集成的一种机制,是 cgroup 使用的子系统之一
 */
 cpuset_init();
 cgroup_init();/* 初始化 cgroup */
 taskstats_init_early();/* 进程状态初始化 */
 delayacct_init();

 poking_init();
 check_bugs();/* 检查写缓冲一致性 */

 acpi_subsystem_init();
 arch_post_acpi_subsys_init();
 kcsan_init();

 /* Do the rest non-__init'ed, we're now alive */
 /* 调用 rest_init 函数 */
 /* 创建 init、kthread、idle 线程 */
 arch_call_rest_init();

 prevent_tail_call_optimization();
}

0 人点赞