在運維工作中,為保證業務的正常運行,我們需要定時查看指定的進程是否還存在,一旦進程退出了,說明服務可能存在問題,運維工程師就可以在第一時間處理問題。今天就跟大家分享一個實用的shell腳本——時刻檢查你的進程狀態。
在對進程進行監控時,我們一般需要得到該進程的 ID,進程 ID 是進程的唯一標識,但是有時可能在服務器上不同用戶下運行著多個相同進程名的進程。


下面的函數 GetPID 給出了獲取指定用戶下指定進程名的進程 ID 功能(目前只考慮這個用戶下啟動一個此進程名的進程),它有兩個參數為用戶名和進程名,它首先使用 ps 查找進程信息,同時通過 grep 過濾出需要的進程,最后通過 sed 和 awk 查找需要進程的 ID 值(此函數可根據實際情況修改,比如需要過濾其它信息等)。
對進程進行監控
function GetPID #User #Name { PsUser=$1 PsName=$2 pid=`ps -u $PsUser|grep $PsName|grep -v grep|grep -v vi|grep -v dbxn |grep -v tail|grep -v start|grep -v stop |sed -n 1p |awk '{print $1}'` echo $pid }
示例演示:
1、源程序(例如查找用戶為 root,進程名為 TestApp 的進程 ID)
PID=`GetPID root TestApp` echo $PID
2、結果輸出
11426 [dyu@xilinuxbldsrv shell]$
3、結果分析
從上面的輸出可見:11426 為 root 用戶下的 TestApp 程序的進程 ID。
4、命令詳解
1)ps: 查看系統中瞬間進程信息。 參數:
- -u< 用戶識別碼 > 列出屬于該用戶的程序的狀況,也可使用用戶名稱來指定
- -p< 進程識別碼 > 指定進程識別碼,并列出該進程的狀況
- -o 指定輸出格式
2)grep: 用于查找文件中符合字符串的當前行。 參數:
- -v 反向選擇,亦即顯示出沒有 ‘搜尋字符串’ 內容的那一行
3)sed: 一個非交互性文本編輯器,它編輯文件或標準輸入導出的文件,一次只能處理一行內容。 參數:
- -n 讀取下一個輸入行,用下一個命令處理新的行而不是用第一個命令
- p 標志 打印匹配行
4)awk:一種編程語言,用于在 linux/unix 下對文本和數據進行處理。除了在命令行中使用,它更多是作為腳本來使用。 參數:
- -F fs or –field-separator fs :指定輸入文件折分隔符,fs 是一個字符串或者是一個正則表達式,如 -F:。
PS:有時有可能進程沒有啟動,下面的功能是檢查進程 ID 是否存在,如果此進程沒有運行輸出:
The process does not exist. # 檢查進程是否存在 if [ "-$PID" == "-" ] then { echo "The process does not exist." } fi
同樣是運維,為啥優秀的同學月入2w,你卻天天米湯?因為…


一名優秀的運維,不僅要能英勇善戰走在最前線,面對運維事故化險為夷;還需要我們實現業務系統的實時監控,預防運維事故于未然。
我可以不懼生死于運維事故抗爭到底,但是防患于未然,不確定因素那么多,真的太難了~
其實,月入2w與你只差一個全方位的監控系統!
推薦一個實用運維工具——王教授。不僅可以接入多來源的各式監控匯聚一圖展示,還可對資源使用中出現的異常、未來可能出現的風險以告警的形式手機通知到個人,最大程度減小了運維事故的發生。
綁定云賬號AcessKey隨時查看到賬戶下所有資產狀況,獲取及時的云資源變化情況、問題提醒。
服務器 CPU 使用率偏
云數據庫存在慢查詢
“掌握”全局監控,進階高級運維!有需要的運維同學歡迎點擊文末王教授二維碼查看詳情!
網站崩潰找不到原因?平臺搭建無從下手?熱門技術不想落伍?想要變強找不到資料?
加入[IT拯救聯盟],讓大牛和同伴拯救你,帶你裝x帶你飛。定期干貨分享、大牛專業解答、實用IT工具優選…..
版權聲明:本文內容由互聯網用戶自發貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發現本站有涉嫌抄襲侵權/違法違規的內容, 請發送郵件至 舉報,一經查實,本站將立刻刪除。