[apue] 使用 Ctrl+S停止输出而不用挂起前台进程

2022-08-19 10:25:59 浏览数 (1)

之前一直知道使用 Ctrl Z 挂起前台进程来阻止进程运行,之后可以再通过 shell 的作业控制 (jobs / fg N) 来将后台进程切换为前台,从而继续运行。

最近学到一种新的方法,对于不停有 console 输出的前台进程,可以使用 Ctrl S 来 STOP 一个进程的输出,从而暂停进程。

之后可以通过 Ctrl Q 或输入任意字符来重启 (START) 进程输出,从而继续运行。

看到这个方法,立即想到写个脚本验证一下:

deadloop.sh

代码语言:javascript复制
1 #! /bin/sh
2 var=1
3 while :
4 do
5   echo this is $var
6   var=$(($var 1))
7   usleep 100000
8 done

这个脚本每 100 毫秒输出一条日志 “this is N”,其中 N 为日志序号,可以帮我们确定在一次暂停与重启之间,是否有输出丢失。

运行过程中按下 Ctrl S,输出果然暂停了:

代码语言:javascript复制
>./deadloop.sh 
this is 1
this is 2
this is 3
this is 4

再按下 Ctrl Q 则输出继续,直到按下 Ctrl Z 挂起进程:

代码语言:javascript复制
>./deadloop.sh 
this is 1
this is 2
this is 3
this is 4
this is 5
this is 6
this is 7
this is 8
this is 9
this is 10
this is 11
^Z
[1]   Stopped                 ./deadloop.sh
>

首先可以看到重启后的输出序号与重启前的可以接上,所以中间并没有输出丢失,也就是说是进程被暂停了,而不只是输出停止了。

其次在按下 Ctrl Z 时终端会回显 ^Z,而按下 Ctrl S 或 Ctrl Q 时,终端没有任何回显。

于是重点对比按下 Ctrl S 时与 Ctrl Z 时进程的状态,来看这两种暂停方式的区别。

通过 ps 命令查看下两种暂停时进程的状态:

Ctrl S

代码语言:javascript复制
>ps xfo pid,ppid,pgid,sid,tpgid,suid,euid,user,stat,tty,command
  PID  PPID  PGID   SID TPGID  SUID  EUID USER     STAT TT       COMMAND
 6653  6652  2786  2786    -1   500   500 yunhai   S    ?         _ gnome-pty-helper
 6655  6652  6655  6655  6655   500   500 yunhai   Ss   pts/0     _ /bin/bash
12539  6652 12539 12539 16673   500   500 yunhai   Ss   pts/1     _ /bin/bash
16673 12539 16673 12539 16673   500   500 yunhai   S    pts/1     |   _ /bin/sh ./deadloop.sh
12797  6652 12797 12797 13349   500   500 yunhai   Ss   pts/2     _ /bin/bash
15959  6652 15959 15959 16766   500   500 yunhai   Ss   pts/3     _ /bin/bash
16766 15959 16766 15959 16766   500   500 yunhai   R    pts/3         _ ps xfo pid,ppid,pgid,sid,tpgid,suid,euid,user,stat,tty,command

Ctrl Z

代码语言:javascript复制
>ps xfo pid,ppid,pgid,sid,tpgid,suid,euid,user,stat,tty,command
  PID  PPID  PGID   SID TPGID  SUID  EUID USER     STAT TT       COMMAND
 6653  6652  2786  2786    -1   500   500 yunhai   S    ?         _ gnome-pty-helper
 6655  6652  6655  6655  6655   500   500 yunhai   Ss   pts/0     _ /bin/bash
12539  6652 12539 12539 16717   500   500 yunhai   Ss   pts/1     _ /bin/bash
16673 12539 16673 12539 16717   500   500 yunhai   T    pts/1     |   _ /bin/sh ./deadloop.sh
16688 16673 16673 12539 16717   500   500 yunhai   T    pts/1     |   |   _ usleep 100000
16717 12539 16717 12539 16717   500   500 yunhai   R    pts/1     |   _ ps xfo pid,ppid,pgid,sid,tpgid,suid,euid,user,stat,tty,command
12797  6652 12797 12797 13349   500   500 yunhai   Ss   pts/2     _ /bin/bash
15959  6652 15959 15959 15959   500   500 yunhai   Ss   pts/3     _ /bin/bash

可以看到最大的不同是,通过 Ctrl Z 停止的进程状态为挂起 ('T'),而通过 Ctrl S 停止的进程状态为运行 ('S ')。

另一方面,我们启动 stap 探测进程间信号的收发,可以在 Ctrl Z 停止进程时收到以下的输出:

stap_signal.sh

代码语言:javascript复制
22       events/3         16688 usleep           20     SIGTSTP         
22       events/3         16673 deadloop.sh      20     SIGTSTP         
16673    deadloop.sh      12539 bash             17     SIGCHLD         
16688    usleep           16673 deadloop.sh      17     SIGCHLD  

也就是说可以观察到向前台进程发送的 SIGTSTP 信号。而在使用 Ctrl S 时并无特别的信号被侦测到 (仅 usleep 进程结束时向父进程发送的 SIGCHILD)。

注意:此处的 SIGCHLD 并不表示 deadloop.sh 与 usleep 结束,而是挂起时向父进程发送的通知。关于这一点,可以参考我之前写的一篇文章:

[apue] 等待子进程的那些事儿

在暂停期间,通过 pstack 命令查看两种方式暂停的进程堆栈信息:

Ctrl S

代码语言:javascript复制
>pstack 16673
#0  0x00119424 in __kernel_vsyscall ()
#1  0x007a7cd3 in __write_nocancel () from /lib/libc.so.6
#2  0x007411b4 in _IO_new_file_write () from /lib/libc.so.6
#3  0x00742a90 in _IO_new_do_write () from /lib/libc.so.6
#4  0x00741c80 in _IO_new_file_overflow () from /lib/libc.so.6
#5  0x00744b2a in __overflow () from /lib/libc.so.6
#6  0x0073e0b5 in putc () from /lib/libc.so.6
#7  0x080aebb0 in echo_builtin ()
#8  0x08070c51 in ?? ()
#9  0x08072e41 in ?? ()
#10 0x08073aa0 in execute_command_internal ()
#11 0x080747a4 in execute_command ()
#12 0x08076d89 in ?? ()
#13 0x08073a02 in execute_command_internal ()
#14 0x080747a4 in execute_command ()
#15 0x08076d89 in ?? ()
#16 0x08073a02 in execute_command_internal ()
#17 0x080747a4 in execute_command ()
#18 0x080750e4 in ?? ()
#19 0x08073bc4 in execute_command_internal ()
#20 0x080747a4 in execute_command ()
#21 0x08060857 in reader_loop ()
#22 0x0805fed9 in main ()

Ctrl Z

代码语言:javascript复制
>pstack 16673
#0  0x00119424 in __kernel_vsyscall ()
#1  0x00776673 in __waitpid_nocancel () from /lib/libc.so.6
#2  0x080830f2 in ?? ()
#3  0x0808432e in wait_for ()
#4  0x08074635 in execute_command_internal ()
#5  0x08076dcd in ?? ()
#6  0x08073a02 in execute_command_internal ()
#7  0x080747a4 in execute_command ()
#8  0x080750e4 in ?? ()
#9  0x08073bc4 in execute_command_internal ()
#10 0x080747a4 in execute_command ()
#11 0x08060857 in reader_loop ()
#12 0x0805fed9 in main ()

前者停止在了 write 系统调用,后者停止在了 waitpid 系统调用。

所以前者应该是在输出时被暂停的,而后者是在等待 usleep 子进程返回时被挂起的。

大家可以体会一下这两处方式在细微处的差别。

最后,可以使用 Ctrl S 停止前台进程的前提是 必需打开终端的 IXON 标志,使用之前的小工具:

[apue] 一个查看当前终端标志位设置的小工具

可以查看终端的输入 flag 是否已经打开了这个标志:

代码语言:javascript复制
>./term
input flag 0x00006f02
    BRKINT
    ICRNL
    IMAXBEL
    IXANY
    IXON
output flag 0x00000005
    ONLCR
    OPOST
control flag 0x000004bf
    CREAD
    CSIZE
    CS6
    CS7
    CS8
    HUPCL
local flag 0x00008a3b
    ECHO
    ECHOE
    ECHOK
    ICANON
    IEXTEN
    ISIG

一般终端都是打开的。如果再打开 IXANY 标志位,则使用任意键都可以重启被停止的输出,而不一定要使用 Ctrl Q。

最后,还有一个隐藏的前提,就是被暂停的进程在前台有频繁的输出,否则 Ctrl S 也无用武之地。

例如,使用下面的命令启动脚本:

代码语言:javascript复制
>./deadloop.sh > deadloop.log

则无法通过 Ctrl S 的方法暂停这个进程。 

总结一下,今天学到一个新的方法去暂停运行中的前台进程,可能对于运维老鸟来说已经是手到擒来,对我却是完全的新鲜,

所以花了些时间研究下,感觉 linux 博大精深,不起眼处可能就藏着一些好东西,值得挖掘!

0 人点赞