Code

Make ps column count in zombie detection less restrictive. Thanks to Andrew Elwell...
[nagiosplug.git] / plugins / check_procs.c
index 0cd9153cbc5fcf6335ad8ff2e14d270c61e90694..f5dc45df532d7efc23d61d686e16acd2e23d3c10 100644 (file)
@@ -1,26 +1,44 @@
 /******************************************************************************
-
- This program is free software; you can redistribute it and/or modify
- it under the terms of the GNU General Public License as published by
- the Free Software Foundation; either version 2 of the License, or
- (at your option) any later version.
-
- This program is distributed in the hope that it will be useful,
- but WITHOUT ANY WARRANTY; without even the implied warranty of
- MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
- GNU General Public License for more details.
-
- You should have received a copy of the GNU General Public License
- along with this program; if not, write to the Free Software
- Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
-
- $Id$
+*
+* Nagios check_procs plugin
+*
+* License: GPL
+* Copyright (c) 1999-2006 nagios-plugins team
+*
+* Last Modified: $Date$
+*
+* Description:
+*
+* This file contains the check_procs plugin
+*
+*  Checks all processes and generates WARNING or CRITICAL states if the specified
+*  metric is outside the required threshold ranges. The metric defaults to number
+*  of processes.  Search filters can be applied to limit the processes to check.
+*
+* License Information:
+*
+* This program is free software; you can redistribute it and/or modify
+* it under the terms of the GNU General Public License as published by
+* the Free Software Foundation; either version 2 of the License, or
+* (at your option) any later version.
+*
+* This program is distributed in the hope that it will be useful,
+* but WITHOUT ANY WARRANTY; without even the implied warranty of
+* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+* GNU General Public License for more details.
+*
+* You should have received a copy of the GNU General Public License
+* along with this program; if not, write to the Free Software
+* Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
+*
+* $Id$
+* 
 ******************************************************************************/
 
 const char *progname = "check_procs";
+const char *program_name = "check_procs";  /* Required for coreutils libs */
 const char *revision = "$Revision$";
-const char *copyright = "2000-2004";
+const char *copyright = "2000-2006";
 const char *email = "nagiosplug-devel@lists.sourceforge.net";
 
 #include "common.h"
@@ -65,7 +83,7 @@ enum metric metric = METRIC_PROCS;
 
 int verbose = 0;
 int uid;
-int ppid;
+pid_t ppid;
 int vsz;
 int rss;
 float pcpu;
@@ -85,16 +103,17 @@ main (int argc, char **argv)
        char *input_line;
        char *procprog;
 
+       pid_t mypid = 0;
        int procuid = 0;
-       int procppid = 0;
+       pid_t procpid = 0;
+       pid_t procppid = 0;
        int procvsz = 0;
        int procrss = 0;
        int procseconds = 0;
        float procpcpu = 0;
        char procstat[8];
-       char procetime[MAX_INPUT_BUFFER];
+       char procetime[MAX_INPUT_BUFFER] = { '\0' };
        char *procargs;
-       char *temp_string;
 
        const char *zombie = "Z";
 
@@ -107,12 +126,12 @@ main (int argc, char **argv)
        int warn = 0; /* number of processes in warn state */
        int crit = 0; /* number of processes in crit state */
        int i = 0;
-
        int result = STATE_UNKNOWN;
 
        setlocale (LC_ALL, "");
        bindtextdomain (PACKAGE, LOCALEDIR);
        textdomain (PACKAGE);
+       setlocale(LC_NUMERIC, "POSIX");
 
        input_buffer = malloc (MAX_INPUT_BUFFER);
        procprog = malloc (MAX_INPUT_BUFFER);
@@ -123,6 +142,9 @@ main (int argc, char **argv)
        if (process_arguments (argc, argv) == ERROR)
                usage4 (_("Could not parse arguments"));
 
+       /* get our pid */
+       mypid = getpid();
+
        /* Set signal handling and alarm timeout */
        if (signal (SIGALRM, popen_timeout_alarm_handler) == SIG_ERR) {
                usage4 (_("Cannot catch SIGALRM"));
@@ -163,7 +185,7 @@ main (int argc, char **argv)
                cols = sscanf (input_line, PS_FORMAT, PS_VARLIST);
 
                /* Zombie processes do not give a procprog command */
-               if ( cols == (expected_cols - 1) && strstr(procstat, zombie) ) {
+               if ( cols < expected_cols && strstr(procstat, zombie) ) {
                        cols = expected_cols;
                }
                if ( cols >= expected_cols ) {
@@ -172,25 +194,19 @@ main (int argc, char **argv)
                        strip (procargs);
 
                        /* Some ps return full pathname for command. This removes path */
-                       temp_string = strtok ((char *)procprog, "/");
-                       while (temp_string) {
-                               strcpy(procprog, temp_string);
-                               temp_string = strtok (NULL, "/");
-                       }
+                       strcpy(procprog, base_name(procprog));
 
                        /* we need to convert the elapsed time to seconds */
                        procseconds = convert_to_seconds(procetime);
 
                        if (verbose >= 3)
-                               printf ("%d %d %d %d %d %.2f %s %s %s %s\n", 
+                               printf ("proc#=%d uid=%d vsz=%d rss=%d pid=%d ppid=%d pcpu=%.2f stat=%s etime=%s prog=%s args=%s\n", 
                                        procs, procuid, procvsz, procrss,
-                                       procppid, procpcpu, procstat, 
+                                       procpid, procppid, procpcpu, procstat, 
                                        procetime, procprog, procargs);
 
                        /* Ignore self */
-                       if (strcmp (procprog, progname) == 0) {
-                               continue;
-                       }
+                       if (mypid == procpid) continue;
 
                        if ((options & STAT) && (strstr (statopts, procstat)))
                                resultsum |= STAT;
@@ -249,7 +265,7 @@ main (int argc, char **argv)
        /* If we get anything on STDERR, at least set warning */
        while (fgets (input_buffer, MAX_INPUT_BUFFER - 1, child_stderr)) {
                if (verbose)
-                       printf (_("STDERR: %s"), input_buffer);
+                       printf ("STDERR: %s", input_buffer);
                result = max_state (result, STATE_WARNING);
                printf (_("System call sent warnings to stderr\n"));
        }
@@ -343,7 +359,7 @@ process_arguments (int argc, char **argv)
 
                switch (c) {
                case '?':                                                                       /* help */
-                       usage2 (_("Unknown argument"), optarg);
+                       usage5 ();
                case 'h':                                                                       /* help */
                        print_help ();
                        exit (STATE_OK);
@@ -412,7 +428,7 @@ process_arguments (int argc, char **argv)
                                uid = pw->pw_uid;
                        }
                        user = pw->pw_name;
-                       asprintf (&fmt, _("%s%sUID = %d (%s)"), (fmt ? fmt : ""), (options ? ", " : ""),
+                       asprintf (&fmt, "%s%sUID = %d (%s)", (fmt ? fmt : ""), (options ? ", " : ""),
                                  uid, user);
                        options |= USER;
                        break;
@@ -432,19 +448,19 @@ process_arguments (int argc, char **argv)
                                break;
                        else
                                args = optarg;
-                       asprintf (&fmt, _("%s%sargs '%s'"), (fmt ? fmt : ""), (options ? ", " : ""), args);
+                       asprintf (&fmt, "%s%sargs '%s'", (fmt ? fmt : ""), (options ? ", " : ""), args);
                        options |= ARGS;
                        break;
                case 'r':                                       /* RSS */
                        if (sscanf (optarg, "%d%[^0-9]", &rss, tmp) == 1) {
-                               asprintf (&fmt, _("%s%sRSS >= %d"), (fmt ? fmt : ""), (options ? ", " : ""), rss);
+                               asprintf (&fmt, "%s%sRSS >= %d", (fmt ? fmt : ""), (options ? ", " : ""), rss);
                                options |= RSS;
                                break;
                        }
                        usage4 (_("RSS must be an integer!"));
                case 'z':                                       /* VSZ */
                        if (sscanf (optarg, "%d%[^0-9]", &vsz, tmp) == 1) {
-                               asprintf (&fmt, _("%s%sVSZ >= %d"), (fmt ? fmt : ""), (options ? ", " : ""), vsz);
+                               asprintf (&fmt, "%s%sVSZ >= %d", (fmt ? fmt : ""), (options ? ", " : ""), vsz);
                                options |= VSZ;
                                break;
                        }
@@ -452,7 +468,7 @@ process_arguments (int argc, char **argv)
                case 'P':                                       /* PCPU */
                        /* TODO: -P 1.5.5 is accepted */
                        if (sscanf (optarg, "%f%[^0-9.]", &pcpu, tmp) == 1) {
-                               asprintf (&fmt, _("%s%sPCPU >= %.2f"), (fmt ? fmt : ""), (options ? ", " : ""), pcpu);
+                               asprintf (&fmt, "%s%sPCPU >= %.2f", (fmt ? fmt : ""), (options ? ", " : ""), pcpu);
                                options |= PCPU;
                                break;
                        }
@@ -639,8 +655,8 @@ convert_to_seconds(char *etime) {
                (minutes * 60) +
                seconds;
 
-       if (verbose >= 3) {
-               printf("seconds: %d\n", total);
+       if (verbose >= 3 && metric == METRIC_ELAPSED) {
+                       printf("seconds: %d\n", total);
        }
        return total;
 }
@@ -654,61 +670,55 @@ print_help (void)
        printf ("Copyright (c) 1999 Ethan Galstad <nagios@nagios.org>");
        printf (COPYRIGHT, copyright, email);
 
-       printf(_("\
-Checks all processes and generates WARNING or CRITICAL states if the specified\n\
-metric is outside the required threshold ranges. The metric defaults to number\n\
-of processes.  Search filters can be applied to limit the processes to check.\n\n"));
+       printf ("%s\n", _("Checks all processes and generates WARNING or CRITICAL states if the specified"));
+  printf ("%s\n", _("metric is outside the required threshold ranges. The metric defaults to number"));
+  printf ("%s\n", _("of processes.  Search filters can be applied to limit the processes to check."));
 
+  printf ("\n\n");
+  
        print_usage ();
 
-       printf(_("\n\
-Required Arguments:\n\
- -w, --warning=RANGE\n\
-   Generate warning state if metric is outside this range\n\
- -c, --critical=RANGE\n\
-   Generate critical state if metric is outside this range\n"));
-
-       printf(_("\n\
-Optional Arguments:\n\
- -m, --metric=TYPE\n\
-   Check thresholds against metric. Valid types:\n\
-   PROCS   - number of processes (default)\n\
-   VSZ     - virtual memory size\n\
-   RSS     - resident set memory size\n\
-   CPU     - percentage cpu\n"));
+       printf ("%s\n", _("Required Arguments:"));
+  printf (" %s\n", "-w, --warning=RANGE");
+  printf ("   %s\n", _("Generate warning state if metric is outside this range"));
+  printf (" %s\n", "-c, --critical=RANGE");
+  printf ("   %s\n", _("Generate critical state if metric is outside this range"));
+
+       printf ("%s\n", _("Optional Arguments:"));
+  printf (" %s\n", "-m, --metric=TYPE");
+  printf ("  %s\n", _("Check thresholds against metric. Valid types:"));
+  printf ("  %s\n", _("PROCS   - number of processes (default)"));
+  printf ("  %s\n", _("VSZ     - virtual memory size"));
+  printf ("  %s\n", _("RSS     - resident set memory size"));
+  printf ("  %s\n", _("CPU     - percentage cpu"));
 /* only linux etime is support currently */
 #if defined( __linux__ )
-       printf(_("\
-   ELAPSED - time elapsed in seconds\n"));
+       printf ("  %s\n", _("ELAPSED - time elapsed in seconds"));
 #endif /* defined(__linux__) */
        printf (_(UT_TIMEOUT), DEFAULT_SOCKET_TIMEOUT);
 
-       printf(_("\
- -v, --verbose\n\
-   Extra information. Up to 3 verbosity levels\n"));
-
-       printf(_("\n\
-Optional Filters:\n\
- -s, --state=STATUSFLAGS\n\
-   Only scan for processes that have, in the output of `ps`, one or\n\
-   more of the status flags you specify (for example R, Z, S, RS,\n\
-   RSZDT, plus others based on the output of your 'ps' command).\n\
- -p, --ppid=PPID\n\
-   Only scan for children of the parent process ID indicated.\n\
- -z, --vsz=VSZ\n\
-   Only scan for processes with vsz higher than indicated.\n\
- -r, --rss=RSS\n\
-   Only scan for processes with rss higher than indicated.\n"));
-
-       printf(_("\
- -P, --pcpu=PCPU\n\
-   Only scan for processes with pcpu higher than indicated.\n\
- -u, --user=USER\n\
-   Only scan for processes with user name or ID indicated.\n\
- -a, --argument-array=STRING\n\
-   Only scan for processes with args that contain STRING.\n\
- -C, --command=COMMAND\n\
-   Only scan for exact matches of COMMAND (without path).\n"));
+       printf (" %s\n", "-v, --verbose");
+  printf ("    %s\n", _("Extra information. Up to 3 verbosity levels"));
+
+       printf ("%s\n", "Optional Filters:");
+  printf (" %s\n", "-s, --state=STATUSFLAGS");
+  printf ("   %s\n", _("Only scan for processes that have, in the output of `ps`, one or"));
+  printf ("   %s\n", _("more of the status flags you specify (for example R, Z, S, RS,"));
+  printf ("   %s\n", _("RSZDT, plus others based on the output of your 'ps' command)."));
+  printf (" %s\n", "-p, --ppid=PPID");
+  printf ("   %s\n", _("Only scan for children of the parent process ID indicated."));
+  printf (" %s\n", "-z, --vsz=VSZ");
+  printf ("   %s\n", _("Only scan for processes with vsz higher than indicated."));
+  printf (" %s\n", "-r, --rss=RSS");
+  printf ("   %s\n", _("Only scan for processes with rss higher than indicated."));
+       printf (" %s\n", "-P, --pcpu=PCPU");
+  printf ("   %s\n", _("Only scan for processes with pcpu higher than indicated."));
+  printf (" %s\n", "-u, --user=USER");
+  printf ("   %s\n", _("Only scan for processes with user name or ID indicated."));
+  printf (" %s\n", "-a, --argument-array=STRING");
+  printf ("   %s\n", _("Only scan for processes with args that contain STRING."));
+  printf (" %s\n", "-C, --command=COMMAND");
+  printf ("   %s\n", _("Only scan for exact matches of COMMAND (without path)."));
 
        printf(_("\n\
 RANGEs are specified 'min:max' or 'min:' or ':max' (or 'max'). If\n\
@@ -722,18 +732,17 @@ the specified threshold ranges. The process count can be filtered by\n\
 process owner, parent process PID, current state (e.g., 'Z'), or may\n\
 be the total number of running processes\n\n"));
 
-       printf(_("\
-Examples:\n\
- check_procs -w 2:2 -c 2:1024 -C portsentry\n\
-   Warning if not two processes with command name portsentry. Critical\n\
-   if < 2 or > 1024 processes\n\n\
- check_procs -w 10 -a '/usr/local/bin/perl' -u root\n\
-   Warning alert if > 10 processes with command arguments containing \n\
-   '/usr/local/bin/perl' and owned by root\n\n\
- check_procs -w 50000 -c 100000 --metric=VSZ\n\
-   Alert if vsz of any processes over 50K or 100K\n\
- check_procs -w 10 -c 20 --metric=CPU\n\
-   Alert if cpu of any processes over 10%% or 20%%\n\n"));
+       printf ("%s\n", _("Examples:"));
+  printf (" %s\n", "check_procs -w 2:2 -c 2:1024 -C portsentry");
+  printf ("  %s\n", _("Warning if not two processes with command name portsentry."));
+  printf ("  %s\n\n", _("Critical if < 2 or > 1024 processes"));
+  printf (" %s\n", "check_procs -w 10 -a '/usr/local/bin/perl' -u root");
+  printf ("  %s\n", _("Warning alert if > 10 processes with command arguments containing"));
+  printf ("  %s\n\n", _("'/usr/local/bin/perl' and owned by root"));
+  printf (" %s\n", "check_procs -w 50000 -c 100000 --metric=VSZ");
+  printf ("  %s\n\n", _("Alert if vsz of any processes over 50K or 100K"));
+  printf (" %s\n", "check_procs -w 10 -c 20 --metric=CPU");
+  printf ("  %s\n\n", _("Alert if cpu of any processes over 10%% or 20%%"));
 
        printf (_(UT_SUPPORT));
 }
@@ -741,8 +750,8 @@ Examples:\n\
 void
 print_usage (void)
 {
-       printf ("\
-Usage: %s -w <range> -c <range> [-m metric] [-s state] [-p ppid]\n\
-                  [-u user] [-r rss] [-z vsz] [-P %%cpu] [-a argument-array]\n\
-                  [-C command] [-t timeout] [-v]\n", progname);
+  printf (_("Usage:"));
+       printf ("%s -w <range> -c <range> [-m metric] [-s state] [-p ppid]\n", progname);
+  printf (" [-u user] [-r rss] [-z vsz] [-P %%cpu] [-a argument-array]\n");
+  printf (" [-C command] [-t timeout] [-v]\n");
 }