Linux를 실행하는 동안 때때로 충돌하는 경향이있는 몇 가지 프로세스 (게임 서버)가 있는데, 이는 100 % CPU를 사용합니다.
프로세스 목록의 CPU 사용량을 이름으로 확인하는 프로그램이나 스크립트를 찾고 있는데 30 초 동안 X 시간 이상 100 %이면 프로세스를 종료하십시오. 나는 ps-watcher를 시도했지만 이것을 달성하는 방법을 결정할 수 없었습니다.
100 % 사용량으로 프로세스를 종료하면 정상 작동 중에 짧은 시간 동안 프로세스가 종료되므로 작동하지 않습니다.
나는 또한 내가 원하는 것을하는 것처럼 보이는이 스크립트를 찾았지만 하나의 프로세스로 제한됩니다 : 링크
어떤 도움이라도 대단히 감사합니다!
답변
monit을 사용해보십시오 .
다음과 같은 구성을 사용하여 작업을 수행 할 수 있습니다.
check process gameserver with pidfile /var/run/gameserver.pid
start program = "/etc/init.d/gameserver start" with timeout 60 seconds
stop program = "/etc/init.d/gameserver stop"
if cpu > 80% for 2 cycles then alert
if cpu > 95% for 5 cycles then restart
if totalmem > 200.0 MB for 5 cycles then restart
if loadavg(5min) greater than 10 for 8 cycles then stop
if failed port 12345 type tcp with timeout 15 seconds
then restart
if 3 restarts within 5 cycles then timeout
이 구성에 대한 자세한 내용은 monit ‘s documentation 에서 찾을 수 있습니다 .
답변
이것은 내가 찾고 있던 것이었고, 얼마 동안 그것을 사용했습니다 (약간 변경되었습니다). 최근에는 작업에 버그가 있었지만 앱 (게임 서버)을 계속 실행해야합니다.
잘못된 PID를 죽이고 있었기 때문에 최상위 PID가 죽인 부분을 인용했습니다.
여기 내 스크립트의 최신 초안이 있습니다. 지금까지 가장 많은 과부하를 찾아서 효과적으로 죽입니다 (또한 작업이 수행 될 때마다 정보를 이메일로 보냅니다).
#!/bin/bash
## Note: will kill the top-most process if the $CPU_LOAD is greater than the $CPU_THRESHOLD.
echo
echo checking for run-away process ...
CPU_LOAD=$(uptime | cut -d"," -f4 | cut -d":" -f2 | cut -d" " -f2 | sed -e "s/\.//g")
CPU_THRESHOLD=300
PROCESS=$(ps aux r)
TOPPROCESS=$(ps -eo pid -eo pcpu -eo command | sort -k 2 -r | grep -v PID | head -n 1)
if [ $CPU_LOAD -gt $CPU_THRESHOLD ] ; then
# kill -9 $(ps -eo pid | sort -k 1 -r | grep -v PID | head -n 1) #original
# kill -9 $(ps -eo pcpu | sort -k 1 -r | grep -v %CPU | head -n 1)
kill -9 $TOPPROCESS
echo system overloading!
echo Top-most process killed $TOPPROCESS
echo load average is at $CPU_LOAD
echo
echo Active processes...
ps aux r
# send an email using mail
SUBJECT="Runaway Process Report at Marysol"
# Email To ?
EMAIL="myemail@somewhere.org"
# Email text/message
EMAILMESSAGE="/tmp/emailmessage.txt"
echo "System overloading, possible runaway process."> $EMAILMESSAGE
echo "Top-most process killed $TOPPROCESS" >>$EMAILMESSAGE
echo "Load average was at $CPU_LOAD" >>$EMAILMESSAGE
echo "Active processes..." >>$EMAILMESSAGE
echo "$PROCESS" >>$EMAILMESSAGE
mail -s "$SUBJECT" "$EMAIL" < $EMAILMESSAGE
else
echo
echo no run-aways.
echo load average is at $CPU_LOAD
echo
echo Active processes...
ps aux r
fi
exit 0
이 작은 스크립트는 프로세스를 죽이는 것이 마음에 들지 않으면 이메일만으로도 정보를 유지하는 데 도움이됩니다.
답변
다음은 자신의 요구에 맞는 힌트를 얻는 데 도움이되는 샘플 BASH 스크립트입니다.
#!/bin/bash
CPU_LOAD=$(uptime | cut -d"," -f4 | cut -d":" -f2 | cut -d" " -f2 | sed -e "s/\.//g")
CPU_THRESHOLD=700
if [ $CPU_LOAD -gt $CPU_THRESHOLD ] ; then
kill -9 $(ps -eo pid | sort -k 1 -r | grep -v PID | head -n 1)
fi
exit 0
$ CPU_THRESHOLD의 값은 시스템에있는 (CPU) 코어 수에 따라 달라집니다. 이 주제에 대한 자세한 설명은 http://blog.scoutapp.com/articles/2009/07/31/understanding-load-averages 에서 찾을 수 있습니다 .
원하는 시간 (분)마다 / etc / inittab 또는 cronjob에서 스크립트를 호출 할 수 있습니다. $ CPU_LOAD가 $ CPU_THRESHOLD보다 큰 경우 예제 스크립트는 최상위 프로세스를 종료합니다.