一、问题

2022-09-08 20:13:44 浏览数 (1)

本文为joshua317原创文章,转载请注明:转载自joshua317博客 https://www.joshua317.com/article/265

一、问题

通过jenkins执行shell脚本时,脚本中是通过nohup java -jar &的方式启动,显示执行成功,但是服务却没启动,脚本如下:

代码语言:javascript复制
#! /bin/bash
nohup java -Xms800m -Xmx800m -XX:PermSize=256m -XX:MaxPermSize=512m -XX:MaxNewSize=512m -jar /usr/local/joshua317-test-core-1.0-SNAPSHOT.jar &

也就是说当通过Jenkins构建完后推送到业务服务器,在执行脚本时,脚本中的 nohup 命令无法正常退出,构建前台任务就卡住了,或者是nohup总是无效。

二、排查

1.在业务服务器上直接执行脚本,可以正常运行,说明脚本的问题不大,但是一旦结合jenkins进行发布,虽然jenkins显示成功,但是shell脚本并没有执行。

2.找一个简单的脚本进行测试

代码语言:javascript复制
#! /bin/bash
echo "hello" >> /usr/local/test.txt

/usr/local/test.txt中有内容,说明脚本是可以执行成功,同时也说明jenkins在执行带有nohup脚本的时候出现了问题。也就是说构建命令中如果带有 nohup xxx & 触发构建后并构建成功后,虽然但在构建任务的输出中却显示没有问题,也没有任何报错,但是并没有执行shell脚本。

三、原因

jenkins默认会在构建完成后,杀掉构建过程中由shell命令触发的衍生进程。 jenkins根据BUILD_ID识别某个进程是否为构建过程的衍生进程,故修改BUILD_ID后,jenkins就无法识别是否为衍生进程,则此进程能在后台保留运行。 结论就是Jenkins程序只负责运行伪命令行nuhup 命令,并不保证是否成功运行 nuhup后面的命令。

四、解决

(1)使用 BUILD_ID=xxx ,其中xxx可以是任意内容(只要不是原来的BUILD_ID内容即可),同时需要把nohup输出内容重定向到文件里面,如"/usr/local/nohup.out"

代码语言:javascript复制
#! /bin/bash
BUILD_ID=dontKillMe
nohup java -Xms800m -Xmx800m -XX:PermSize=256m -XX:MaxPermSize=512m -XX:MaxNewSize=512m -jar /usr/local/joshua317-test-core-1.0-SNAPSHOT.jar  > /usr/local/nohup.out 2>&1 &

(2)使用at now代替nohup命令。

代码语言:javascript复制
#! /bin/bash
#so "at now" will run even if java -jar fails
set  e 
#Run java app in background
echo "java -jar /usr/local/joshua317-test-core-1.0-SNAPSHOT.jar" | at now

set -e : 执行的时候如果出现了返回值为非零,整个脚本 就会立即退出

set e: 执行的时候如果出现了返回值为非零将会继续执行下面的脚本

五、扩展

1.Jenkins里执行shell脚本时,要注意使用全路径

代码语言:javascript复制
/bin/sh /usr/local/service/start.sh

2.shell脚本文件的第一行要声明是shell脚本

代码语言:javascript复制
#! /bin/bash
....

3.使用jenkins执行shell脚本时,如果有nohup命令时,需要加上BUILD_ID=dontKillMe以及nohup后面

需要后面加上2>&1 &

注意:BUILD_ID=后面可以是其他内容,比如BUILD_ID=joshua317

代码语言:javascript复制
#! /bin/bash
BUILD_ID=dontKillMe
nohup java -Xms800m -Xmx800m -XX:PermSize=256m -XX:MaxPermSize=512m -XX:MaxNewSize=512m -jar /usr/local/joshua317-test-core-1.0-SNAPSHOT.jar  > /usr/local/nohup.out 2>&1 &

4.如果遇到[Build step 'Send files or execute commands over SSH' changed build result to UNSTABLE] 基本上是因为shell脚本写的有问题。

5.关于nohup后面加上的说明

(1)命令结尾没有 "&",则变成 "java -jar xxx.jar" ,表示在当前shell窗口,可按CTRL C打断程序运行,或者直接关闭窗口,则程序直接退出 命令结尾添加 "&" ,则变成 "java -jar xxx.jar &",表示在当窗口关闭时,程序才会中止运行。&代表让该命令在后台执行。

代码语言:javascript复制
java -jar /usr/local/joshua317-test-core-1.0-SNAPSHOT.jar &

(2)命令 "nohup java -jar xxx.jar &"部分,表示不挂断运行命令,当账户退出或终端关闭时,程序仍然运行。注意,该作业的所有输出被重定向到nohup.out的文件中。

命令 “nohup java -jar xxx.jar > nohup.out &” 部分,表示不挂断运行命令,当账户退出或终端关闭时,程序仍然运行,并且该作业的所有输出被重定向到nohup.out的文件中。“ > nohup.out ” 该命令就是指定日志输出的文件。 ">>"表示将输出以追加的方式重定向到nohup.out中。

代码语言:javascript复制
nohup java -jar /usr/local/joshua317-test-core-1.0-SNAPSHOT.jar > /usr/local/nohup.out &

#或者
nohup java -jar /usr/local/joshua317-test-core-1.0-SNAPSHOT.jar >> /usr/local/nohup.out &

(3)标准输入文件(stdin):stdin的文件描述符为0,Unix程序默认从stdin读取数据。 标准输出文件(stdout):stdout 的文件描述符为1,Unix程序默认向stdout输出数据。 标准错误文件(stderr):stderr的文件描述符为2,Unix程序会向stderr流中写入错误信息。 屏蔽输出,起到禁止输出作用:/dev/null 是一个特殊的文件,写入到它的内容都会被丢弃;如果尝试从该文件读取内容,那么什么也读不到。但是 /dev/null 文件非常有用,将命令的输出重定向到它,会起到"禁止输出"的效果。“> /usr/local/nohup.out 2>&1” :表示将 stdout 和 stderr 合并后重定向到"/usr/local/nohup.out"中。

代码语言:javascript复制
nohup java -jar /usr/local/joshua317-test-core-1.0-SNAPSHOT.jar > /usr/local/nohup.out 2>&1 &
或者
nohup java -jar /usr/local/joshua317-test-core-1.0-SNAPSHOT.jar >> /usr/local/nohup.out 2>&1 &
或者
nohup java -jar /usr/local/joshua317-test-core-1.0-SNAPSHOT.jar > /dev/null 2>&1 &

6.linux的at一次性定时任务的使用

使用at只能执行一次性任务;使用at命令需要开启atd进程。

(1)安装at命令:

查看是否开启atd进程:

代码语言:javascript复制
ps -ef | grep atd

如果没有需要安装at命令

代码语言:javascript复制
yum -y install at

(2)设置自动启动at命令

代码语言:javascript复制
chkconfig --level 35 atd on

(3)启动atd进程

代码语言:javascript复制
service atd start

如果在使用at命令后,报如下错误:

Can't open /var/run/atd.pid to signal atd. No atd running?意思是atd进程没有运行,需要执行启动atd进程命令:service atd start

(4)简单的使用

代码语言:javascript复制
#1.显示版本信息
at -V
#2.查看延时任务列表
at -l 
#3.查看任务内容
at -c 任务号
#4.删除任务
at -r 任务号
#5. now  时间,时间以minutes、hours、days或weeks为单位,比如“now  5 days”代表命令在5天之后的此时此刻执行
#(1)立即执行
at now
#(2)一分钟后执行
at now  1min
#(3)五天后执行
at now  5 days
#(4)设置5天后晚上00:00执行
at 00:00  5 days
#(5)设置在2022年7月20号凌晨01:00执行
at 01::00 2022-7-20

#6.管道方式执行一次任务
echo hello>/usr/local/at.txt|at now

本文为joshua317原创文章,转载请注明:转载自joshua317博客 https://www.joshua317.com/article/265

0 人点赞