태그 보관물: kill

kill

X 시간 후에 CPU 사용량이 많은 프로세스를 종료 하시겠습니까? [닫은]

Linux를 실행하는 동안 때때로 충돌하는 경향이있는 몇 가지 프로세스 (게임 서버)가 있는데, 이는 100 % CPU를 사용합니다.

프로세스 목록의 CPU 사용량을 이름으로 확인하는 프로그램이나 스크립트를 찾고 있는데 30 초 동안 X 시간 이상 100 %이면 프로세스를 종료하십시오. 나는 ps-watcher를 시도했지만 이것을 달성하는 방법을 결정할 수 없었습니다.

100 % 사용량으로 프로세스를 종료하면 정상 작동 중에 짧은 시간 동안 프로세스가 종료되므로 작동하지 않습니다.

나는 또한 내가 원하는 것을하는 것처럼 보이는이 스크립트를 찾았지만 하나의 프로세스로 제한됩니다 : 링크

어떤 도움이라도 대단히 감사합니다!



답변

monit을 사용해보십시오 .

다음과 같은 구성을 사용하여 작업을 수행 할 수 있습니다.

check process gameserver with pidfile /var/run/gameserver.pid
  start program = "/etc/init.d/gameserver start" with timeout 60 seconds
  stop program  = "/etc/init.d/gameserver stop"
  if cpu > 80% for 2 cycles then alert
  if cpu > 95% for 5 cycles then restart
  if totalmem > 200.0 MB for 5 cycles then restart
  if loadavg(5min) greater than 10 for 8 cycles then stop
  if failed port 12345 type tcp with timeout 15 seconds
    then restart
  if 3 restarts within 5 cycles then timeout

이 구성에 대한 자세한 내용은 monit ‘s documentation 에서 찾을 수 있습니다 .


답변

이것은 내가 찾고 있던 것이었고, 얼마 동안 그것을 사용했습니다 (약간 변경되었습니다). 최근에는 작업에 버그가 있었지만 앱 (게임 서버)을 계속 실행해야합니다.

잘못된 PID를 죽이고 있었기 때문에 최상위 PID가 죽인 부분을 인용했습니다.

여기 내 스크립트의 최신 초안이 있습니다. 지금까지 가장 많은 과부하를 찾아서 효과적으로 죽입니다 (또한 작업이 수행 될 때마다 정보를 이메일로 보냅니다).

#!/bin/bash

## Note: will kill the top-most process if the $CPU_LOAD is greater than the $CPU_THRESHOLD.
echo
echo checking for run-away process ...

CPU_LOAD=$(uptime | cut -d"," -f4 | cut -d":" -f2 | cut -d" " -f2 | sed -e "s/\.//g")
CPU_THRESHOLD=300
PROCESS=$(ps aux r)
TOPPROCESS=$(ps -eo pid -eo pcpu -eo command | sort -k 2 -r | grep -v PID | head -n 1)

if [ $CPU_LOAD -gt $CPU_THRESHOLD ] ; then
  # kill -9 $(ps -eo pid | sort -k 1 -r | grep -v PID | head -n 1) #original
  # kill -9 $(ps -eo pcpu | sort -k 1 -r | grep -v %CPU | head -n 1)
  kill -9 $TOPPROCESS
  echo system overloading!
  echo Top-most process killed $TOPPROCESS
  echo load average is at $CPU_LOAD
  echo
  echo Active processes...
  ps aux r

  # send an email using mail
  SUBJECT="Runaway Process Report at Marysol"
  # Email To ?
  EMAIL="myemail@somewhere.org"
  # Email text/message
  EMAILMESSAGE="/tmp/emailmessage.txt"
  echo "System overloading, possible runaway process."> $EMAILMESSAGE
  echo "Top-most process killed $TOPPROCESS" >>$EMAILMESSAGE
  echo "Load average was at $CPU_LOAD" >>$EMAILMESSAGE
  echo "Active processes..." >>$EMAILMESSAGE
  echo "$PROCESS" >>$EMAILMESSAGE
  mail -s "$SUBJECT" "$EMAIL" < $EMAILMESSAGE

else
 echo
 echo no run-aways.
 echo load average is at $CPU_LOAD
 echo
 echo Active processes...
 ps aux r
fi
exit 0

이 작은 스크립트는 프로세스를 죽이는 것이 마음에 들지 않으면 이메일만으로도 정보를 유지하는 데 도움이됩니다.


답변

다음은 자신의 요구에 맞는 힌트를 얻는 데 도움이되는 샘플 BASH 스크립트입니다.

#!/bin/bash

CPU_LOAD=$(uptime | cut -d"," -f4 | cut -d":" -f2 | cut -d" " -f2 | sed -e "s/\.//g")
CPU_THRESHOLD=700

if [ $CPU_LOAD -gt $CPU_THRESHOLD ] ; then
  kill -9 $(ps -eo pid | sort -k 1 -r | grep -v PID | head -n 1)
fi

exit 0

$ CPU_THRESHOLD의 값은 시스템에있는 (CPU) 코어 수에 따라 달라집니다. 이 주제에 대한 자세한 설명은 http://blog.scoutapp.com/articles/2009/07/31/understanding-load-averages 에서 찾을 수 있습니다 .

원하는 시간 (분)마다 / etc / inittab 또는 cronjob에서 스크립트를 호출 할 수 있습니다. $ CPU_LOAD가 $ CPU_THRESHOLD보다 큰 경우 예제 스크립트는 최상위 프로세스를 종료합니다.


답변