您的位置:首页 > 汽车 > 新车 > shell编程:集群多主机一键启停服务脚本

shell编程:集群多主机一键启停服务脚本

2025/1/8 21:22:26 来源:https://blog.csdn.net/m0_60125201/article/details/141137379  浏览:    关键词:shell编程:集群多主机一键启停服务脚本

本文任务

一、Kafka服务批量启动函数封装

二、Kafka服务批量停止函数封装

三、Kafka服务状态批量检测函数封装

四、Kafka服务一键启停脚本主函数体实现

五、进一步抽象脚本,改进为通用的一键启停其他服务的脚本

核心知识点

知识点1:一键启停多主机集群服务实现

知识点2:服务状态检测的多种方式实现

知识点3:脚本内容抽象封装技巧

解决的问题

问题1:进程在,但是部分主机服务已僵死

问题2:一键管理你的生产环境服务。包括启动、停止、状态获取

问题3:服务运行报告生成,更细粒度检测你的集群服务稳定性

1 kafka一键启停脚本

1.1 脚本骨架搭建

function service_start
{
}
function service_stop
{
}
function service_status
{
}
function usage
{
}
case $1 instart)....;;stop)....;;status)....;;*)usage;;
esac

1.2 服务状态

service_status 函数的目的是检查给定主机上的 Kafka 服务是否正在运行。

这个函数会尝试通过 SSH 连接到指定的主机,并使用 jps | grep -w Kafka 命令来查找 Kafka 进程。该函数会进行五次尝试。

如果在每次尝试中都成功找到 Kafka 进程(返回码为0),则最终结果是 Kafka 在运行状态;否则就认为 Kafka 并未运行。

HOST_LIST="node01 node02 node03"
function service_status
{status_idx=0result=0while [ $status_idx -lt 5 ];dossh -o StrictHostKeyChecking=no $1 "jps | grep -w Kafka" &>/dev/nullif [ $? -eq 0 ];thenresult=`expr $result + 1`fistatus_idx=`expr $status_idx + 1`doneif [ $result -eq 5 ];thenreturnfireturn 99
}case $1 instart)service_start;;stop)service_stop;;status)for host in $HOST_LIST;doservice_status $hostif [ $? -eq 0 ];thenecho "kafka in $host is RUNNING"elseecho "kafka in $host is STOPPED"fidone;;*)usage;;
esac

1.3 服务启动

  • 遍历 HOST_LIST,即 "node01 node02 node03" 中的每个节点。
  • 对于每个主机 ($host):
    • 打印开始启动 Kafka 的信息。
    • 使用 service_status 函数检查 Kafka 是否已经在运行。
    • 如果 Kafka 已经在运行,则打印一条信息表明 Kafka 已在该主机上运行。
    • 如果 Kafka 没有运行:
      • 通过 SSH 在远程主机上执行启动 Kafka 的命令。
      • 然后进入一个五次的循环,每次循环使用 service_status 检查 Kafka 是否已经启动。
      • 如果 Kafka 还未运行(service_status 返回非零),则等待 3 秒后重新检查,直至五次尝试结束或 Kafka 启动成功。
      • 如果五次尝试后 Kafka 仍未启动成功,则提示需要登录到对应的主机检查问题。
HOST_LIST="node01 node02 node03"
function service_start
{for host in $HOST_LIST;doecho "-------Now Begin To Start Kafka In host:$host-------"service_status $hostif [ $? -eq 0 ];thenecho "kafka in $host is already RUNNING"elseecho "Now Kafka is STOPPED,start it...."ssh -o StrictHostKeyChecking=no $host "/opt/source/kafka/bin/kafka-server-start.sh -daemon /opt/source/kafka/config/server.properties"index=0while [ $index -lt 5 ];doservice_status $hostif [ $? -ne 0 ];thenecho "Kafka in $host is starting...Please wait...."sleep 3index=`expr $index + 1`continueelseecho "OK ... kafka in $host is RUNNING"breakfidoneif [ $index -eq 5 ];thenecho "sorry...kafka broker start failed...please login $host to check"fifidone
}
case $1 instart)service_start;;stop)service_stop;;status)for host in $HOST_LIST;doservice_status $hostif [ $? -eq 0 ];thenecho "kafka in $host is RUNNING"elseecho "kafka in $host is STOPPED"fidone;;*)usage;;
esac

1.4 服务停止

是由启动模块修改而来,流程基本一样,只修改了stop字样和判断方式

  • 如果返回值不等于 0(即 $? -ne 0),表示 Kafka 服务已经停止,打印一条消息说明 Kafka 已经是停止状态。
HOST_LIST="node01 node02 node03"
function service_stop
{
for host in $HOST_LIST;doecho "-------Now Begin To Stop Kafka In host:$host-------"service_status $hostif [ $? -ne 0 ];thenecho "kafka in $host is already STOPPED"elseecho "Now Kafka is RUNNING,stop it...."ssh -o StrictHostKeyChecking=no $host "/opt/source/kafka/bin/kafka-server-stop.sh"index=0while [ $index -lt 5 ];doservice_status $hostif [ $? -eq 0 ];thenecho "Kafka in $host is starting...Please wait...."sleep 3index=`expr $index + 1`continueelseecho "OK ... kafka in $host is STOPPING"breakfidoneif [ $index -eq 5 ];thenecho "sorry...kafka broker stop failed...please login $host to check"fifidone
}

1.5 服务用法

function usage
{
cat << EOF
Usage1: sh $0 start   # start kafka
Usage2: sh $0 stop    # stop kafka
Usage3: sh $0 status  # kafka status
EOF
}

2 通用一键启停服务脚本

2.1 检测服务状态是否正常

systemctl status <service>: 在使用 systemd 的系统中,这个命令用来查看服务的状态。
ps, top, htop: 这些命令可以用来查看系统运行的进程,从而判断某个服务是否活跃。
netstat 或 ss: 用于检查网络端口和连接,判断服务相关的端口是否在监听。
curl : 对于提供 HTTP 接口的服务,可以通过这些命令测试服务响应。

2.2 通用脚本

1.将原有的Kafka一键启动脚本改造为能够启停任何服务的通用脚本。

2.通过抽象监测进程、启动和停止服务的指令,使脚本具有更好的灵活性。

3.引入变量来保存状态监测、启动和停止服务的指令,便于根据需要更改。

STATUS_CMD="jps | grep -w Kafka"
START_CMD="/opt/source/kafka/bin/kafka-server-start.sh -daemon /opt/source/kafka/config/server.properties"
STOP_CMD="/opt/source/kafka/bin/kafka-server-stop.sh"
SERVICE_NAME="Kafka"ssh -o StrictHostKeyChecking=no $host $START_CMD &> /dev/null
ssh -o StrictHostKeyChecking=no $host $STOP_CMD &> /dev/null
ssh -o StrictHostKeyChecking=no $1 $STATUS_CMD &>/dev/null
#将脚本中的kafka改为$SERVICE_NAME

如果需要启动别的服务,只需要修改前面定义的即可。

例如:启停zookeeper服务。

STATUS_CMD="jps | grep -w QuorumPeerMain"
START_CMD="/opt/source/zookeeper/bin/zkServer.sh start"
STOP_CMD="/opt/source/zookeeper/bin/zkServer.sh stop"
SERVICE_NAME="Zookeeper"

启停nginx:

SELF_PID=$$   #本脚本的pid
STATUS_CMD="ps -ef |grep nginx |grep -v grep |grep -v $SELF_PID"   #去除干扰项
START_CMD="/usr/sbin/nginx"
STOP_CMD="/usr/sbin/nginx -s stop"
SERVICE_NAME="Nginx"

2.3 最终转化脚本成果展示

#!/bin/bash
#
HOST_LIST="node01 node02 node03"
SELF_PID=$$
STATUS_CMD=""
START_CMD=""
STOP_CMD=""
SERVICE_NAME=""
function service_start
{for host in $HOST_LIST;doecho "-------Now Begin To Start $SERVICE_NAME In host:$host-------"service_status $hostif [ $? -eq 0 ];thenecho "$SERVICE_NAME in $host is already RUNNING"elseecho "Now $SERVICE_NAME is STOPPED,start it...."ssh -o StrictHostKeyChecking=no $host $START_CMD &> /dev/nullindex=0while [ $index -lt 5 ];doservice_status $hostif [ $? -ne 0 ];thenecho "$SERVICE_NAME in $host is starting...Please wait...."sleep 3index=`expr $index + 1`continueelseecho "OK ... $SERVICE_NAME in $host is RUNNING"breakfidoneif [ $index -eq 5 ];thenecho "sorry...$SERVICE_NAME broker start failed...please login $host to check"fifidone
}
function service_stop
{
for host in $HOST_LIST;doecho "-------Now Begin To Stop $SERVICE_NAME In host:$host-------"service_status $hostif [ $? -ne 0 ];thenecho "$SERVICE_NAME in $host is already STOPPED"elseecho "Now $SERVICE_NAME is RUNNING,stop it...."ssh -o StrictHostKeyChecking=no $host $STOP_CMD &> /dev/nullindex=0while [ $index -lt 5 ];doservice_status $hostif [ $? -eq 0 ];thenecho "$SERVICE_NAME in $host is stoping...Please wait...."sleep 3index=`expr $index + 1`continueelseecho "OK ... $SERVICE_NAME in $host is STOPPING"breakfidoneif [ $index -eq 5 ];thenecho "sorry...$SERVICE_NAME broker stop failed...please login $host to check"fifidone
}
function service_status
{status_idx=0result=0while [ $status_idx -lt 5 ];dossh -o StrictHostKeyChecking=no $1 $STATUS_CMD &>/dev/nullif [ $? -eq 0 ];thenresult=`expr $result + 1`fistatus_idx=`expr $status_idx + 1`doneif [ $result -eq 5 ];thenreturnfireturn 99
}
function usage
{
cat << EOF
Usage1: sh $0 start   # start $SERVICE_NAME
Usage2: sh $0 stop    # stop $SERVICE_NAME
Usage3: sh $0 status  # $SERVICE_NAME status
EOF
}
case $1 instart)service_start;;stop)service_stop;;status)for host in $HOST_LIST;doservice_status $hostif [ $? -eq 0 ];thenecho "$SERVICE_NAME in $host is RUNNING"elseecho "$SERVICE_NAME in $host is STOPPED"fidone;;*)usage;;
esac

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com